删除有序数组中的重复项 II

标签: 数组 双指针

难度: Medium

给你一个有序数组 nums ,请你 原地 删除重复出现的元素,使得出现次数超过两次的元素只出现两次 ,返回删除后数组的新长度。

不要使用额外的数组空间,你必须在 原地 修改输入数组 并在使用 O(1) 额外空间的条件下完成。

说明:

为什么返回数值是整数,但输出的答案是数组呢?

请注意,输入数组是以「引用」方式传递的,这意味着在函数里修改输入数组对于调用者是可见的。

你可以想象内部操作如下:

// nums 是以“引用”方式传递的。也就是说,不对实参做任何拷贝
int len = removeDuplicates(nums);

// 在函数里修改输入数组对于调用者是可见的。
// 根据你的函数返回的长度, 它会打印出数组中 该长度范围内 的所有元素。
for (int i = 0; i < len; i++) {
    print(nums[i]);
}

示例 1:

输入:nums = [1,1,1,2,2,3]
输出:5, nums = [1,1,2,2,3]
解释:函数应返回新长度 length = 5, 并且原数组的前五个元素被修改为 1, 1, 2, 2, 3。 不需要考虑数组中超出新长度后面的元素。

示例 2:

输入:nums = [0,0,1,1,1,1,2,3,3]
输出:7, nums = [0,0,1,1,2,3,3]
解释:函数应返回新长度 length = 7, 并且原数组的前七个元素被修改为 0, 0, 1, 1, 2, 3, 3。不需要考虑数组中超出新长度后面的元素。

提示:

  • 1 <= nums.length <= 3 * 104
  • -104 <= nums[i] <= 104
  • nums 已按升序排列

Submission

运行时间: 44 ms

内存: 15 MB

class Solution:
    def removeDuplicates(self, nums: List[int]) -> int:
        l = 0
        for i in range(len(nums)):
            if l < 2 or nums[i] != nums[l-2]:
                nums[l] = nums[i]
                l += 1
        return l

Explain

这个题解使用双指针的方法来解决问题。指针 l 表示新数组的长度,初始为0。遍历原数组,对于每个元素,如果 l < 2(表示新数组中元素个数少于2个)或者当前元素与新数组倒数第二个元素不同,就将当前元素复制到新数组的 l 位置,并将 l 后移一位。这样可以确保新数组中相同元素最多出现两次。

时间复杂度: O(n)

空间复杂度: O(1)

class Solution:
    def removeDuplicates(self, nums: List[int]) -> int:
        l = 0  # 表示新数组的长度
        for i in range(len(nums)):
            # 如果新数组元素少于2个,或者当前元素与新数组倒数第二个元素不同
            if l < 2 or nums[i] != nums[l-2]:
                nums[l] = nums[i]  # 将当前元素复制到新数组的 l 位置
                l += 1  # 新数组长度加 1
        return l  # 返回新数组的长度

Explore

在有序数组中,相同的元素是连续排列的。题目要求让相同元素最多出现两次。当新数组的长度 l 达到2或以上时,只检查当前元素与倒数第二个元素的关系可以确保不会超过两次重复。如果当前元素与倒数第二个元素不同,那么它一定不会与最后一个元素相同,因此可以安全地添加到新数组中。而如果只与最后一个元素比较,我们就无法知道该元素之前是否已经出现了两次,因此不能确保遵循题目的要求。

`l` 指针代表新数组的长度并用于确定复制元素的位置。将 `l` 初始化为0是合适的,因为这样可以从数组的起始位置开始填充,同时允许算法正确处理空数组或极小数组的情况。没有更优的初始值选择,因为任何大于0的初始值都将导致数组起始部分未被正确填充,从而得到错误的结果。

该算法可以正确处理原数组为空或只包含一个元素的情况。如果数组为空,循环不会执行,`l` 的值保持为0,返回0,这是正确的。如果数组只有一个元素,由于 `l < 2` 的条件总是成立,该元素会被复制到新数组的起始位置,然后 `l` 递增为1,正确地反映了新数组的长度。因此,算法能够正确处理这些边界情况。

在原地修改过程中,元素被过多复制确实可能稍微影响效率,尤其是当数组中的重复元素非常多时。为了减少不必要的复制,可以在复制前增加一个检查:仅当当前元素与其应复制位置的元素不同时才执行复制操作。这样可以避免当新旧位置元素相同时的冗余复制,稍微提升效率。