压缩字符串

标签: 双指针 字符串

难度: Medium

给你一个字符数组 chars ,请使用下述算法压缩:

从一个空字符串 s 开始。对于 chars 中的每组 连续重复字符

  • 如果这一组长度为 1 ,则将字符追加到 s 中。
  • 否则,需要向 s 追加字符,后跟这一组的长度。

压缩后得到的字符串 s 不应该直接返回 ,需要转储到字符数组 chars 中。需要注意的是,如果组长度为 1010 以上,则在 chars 数组中会被拆分为多个字符。

请在 修改完输入数组后 ,返回该数组的新长度。

你必须设计并实现一个只使用常量额外空间的算法来解决此问题。

示例 1:

输入:chars = ["a","a","b","b","c","c","c"]
输出:返回 6 ,输入数组的前 6 个字符应该是:["a","2","b","2","c","3"]
解释:"aa" 被 "a2" 替代。"bb" 被 "b2" 替代。"ccc" 被 "c3" 替代。

示例 2:

输入:chars = ["a"]
输出:返回 1 ,输入数组的前 1 个字符应该是:["a"]
解释:唯一的组是“a”,它保持未压缩,因为它是一个字符。

示例 3:

输入:chars = ["a","b","b","b","b","b","b","b","b","b","b","b","b"]
输出:返回 4 ,输入数组的前 4 个字符应该是:["a","b","1","2"]。
解释:由于字符 "a" 不重复,所以不会被压缩。"bbbbbbbbbbbb" 被 “b12” 替代。

提示:

  • 1 <= chars.length <= 2000
  • chars[i] 可以是小写英文字母、大写英文字母、数字或符号

Submission

运行时间: 19 ms

内存: 16.1 MB

class Solution:
    def compress(self, chars: List[str]) -> int:
        write,cnt=0,0
        for i in range(len(chars)+1):
            if i==0:
                cnt+=1
            elif i==len(chars) or chars[i-1]!= chars[i]:
                chars[write]=chars[i-1]
                write+=1
                if cnt>1:
                    for c in str(cnt):
                        chars[write]=c 
                        write+=1
                cnt = 1
            else:
                cnt += 1
            
        return write

Explain

该题解使用了一种单趟扫描的方法来压缩字符串。整体思路是维护一个写指针`write`和一个计数器`cnt`来跟踪连续字符的个数。遍历输入字符数组`chars`,对于每个字符,如果它与前一个字符相同,则增加计数器`cnt`。如果不同或到达数组末尾,就将前一个字符和它的计数(如果`cnt`大于1)写入数组。这种方法确保了在不需要额外数组的情况下,直接在原数组上操作,从而满足空间复杂度的要求。

时间复杂度: O(n)

空间复杂度: O(1)

class Solution:
    def compress(self, chars: List[str]) -> int:
        write, cnt = 0, 0  # 初始化写指针和计数器
        for i in range(len(chars) + 1):  # 包括最后一个字符之后的虚拟位置
            if i == 0:  # 第一个字符,开始计数
                cnt += 1
            elif i == len(chars) or chars[i - 1] != chars[i]:  # 遇到不同字符或到达数组末尾
                chars[write] = chars[i - 1]  # 将字符写入
                write += 1
                if cnt > 1:  # 如果计数超过1,写入数字
                    for c in str(cnt):  # 数字可能有多位,逐个写入
                        chars[write] = c
                        write += 1
                cnt = 1  # 重置计数器
            else:  # 相同字符,增加计数
                cnt += 1
        return write  # 返回新的长度

Explore

该算法通过在循环中包含一个虚拟的数组结束位置来处理最后一组连续字符。循环的条件是 `i` 小于 `len(chars) + 1`。当 `i` 等于 `len(chars)` 时,表示已经到达数组的虚拟结束位置,此时前一个字符是数组的最后一个字符。算法会检查并处理这最后一组字符,确保它们被正确统计并写入。这样可以保证最后一组连续字符,无论它们的长度如何,都能被正确处理和记录。

写指针 `write` 在算法中用于指示当前应该写入压缩数据的位置。它从数组的起始位置开始,并随着字符的写入逐渐向右移动。每次遇到一组连续字符结束时,算法使用 `write` 指针在 `chars` 数组中直接写入该字符及其计数(如果计数大于1)。这种方式允许算法在原地修改数组,避免了使用额外的空间来存储压缩后的结果,从而实现了空间复杂度为 O(1) 的要求。

当字符的重复次数为10或更多时,算法通过将数字转换为字符串,然后逐个字符地将其写入 `chars` 数组中来处理这种情况。例如,如果一个字符重复了25次,算法首先将25转换为字符串 '25',然后将 '2' 和 '5' 分别写入 `chars` 数组中 `write` 指针指示的位置。这个过程确保了无论数字的位数如何,都能被正确地分解并逐个字符地存储。