验证二叉树的前序序列化

标签: 栈树字符串二叉树

难度: Medium

序列化二叉树的一种方法是使用 前序遍历 。当我们遇到一个非空节点时，我们可以记录下这个节点的值。如果它是一个空节点，我们可以使用一个标记值记录，例如 #。

例如，上面的二叉树可以被序列化为字符串 "9,3,4,#,#,1,#,#,2,#,6,#,#"，其中 # 代表一个空节点。

给定一串以逗号分隔的序列，验证它是否是正确的二叉树的前序序列化。编写一个在不重构树的条件下的可行算法。

保证每个以逗号分隔的字符或为一个整数或为一个表示 null 指针的 '#' 。

你可以认为输入格式总是有效的

例如它永远不会包含两个连续的逗号，比如 "1,,3" 。

注意：不允许重建树。

示例 1:

输入: preorder = "9,3,4,#,#,1,#,#,2,#,6,#,#"
输出: true

示例 2:

输入: preorder = "1,#"
输出: false

示例 3:

输入: preorder = "9,#,#,1"
输出: false

提示:

1 <= preorder.length <= 10⁴
preorder 由以逗号 “，” 分隔的 [0,100] 范围内的整数和 “#” 组成

Submission

运行时间: 24 ms

内存: 16.1 MB

class Solution:
    def isValidSerialization(self, preorder: str) -> bool:
        arr = preorder.split(',')
        self.n = len(arr)
        self.pos = 0
        self.res = True

        def dfs():
            if self.pos == self.n:
                self.res = False
                return
            # print(self.pos, arr[self.pos])
            if arr[self.pos] == '#':
                self.pos += 1
                return
            self.pos += 1
            dfs()
            dfs()
        
        dfs()
        return self.res and self.pos == self.n

Explain

该题解使用深度优先搜索（DFS）的思路来验证二叉树的前序序列化是否正确。通过递归遍历序列化字符串，模拟前序遍历的过程。对于每个节点，如果遇到 '#'，表示该节点为空，直接返回；否则递归遍历该节点的左右子树。在遍历过程中，使用 pos 变量记录当前遍历的位置，并在递归结束后判断是否正好遍历完整个序列化字符串。

时间复杂度: O(n)

空间复杂度: O(n)

class Solution:
    def isValidSerialization(self, preorder: str) -> bool:
        arr = preorder.split(',')  # 将序列化字符串按逗号分割成数组
        self.n = len(arr)  # 数组的长度
        self.pos = 0  # 当前遍历的位置
        self.res = True  # 结果标志，初始为 True

        def dfs():
            if self.pos == self.n:  # 如果已经遍历完整个数组
                self.res = False  # 将结果标志设为 False，表示序列化字符串无效
                return
            if arr[self.pos] == '#':  # 如果当前位置为 '#'，表示空节点
                self.pos += 1  # 将位置向后移动一位
                return
            self.pos += 1  # 将位置向后移动一位，表示当前节点非空
            dfs()  # 递归遍历左子树
            dfs()  # 递归遍历右子树
        
        dfs()  # 执行深度优先搜索
        return self.res and self.pos == self.n  # 返回结果，需要结果标志为 True 且遍历位置正好到达数组末尾

Explore

在二叉树的前序序列化中，'#'代表一个空节点。在前序遍历的过程中，空节点表示没有子节点，因此遇到'#'后，不需要考虑进一步的子节点遍历，可以直接返回。这符合前序遍历中遇到叶节点（空节点）时的处理逻辑。

如果在递归遍历过程中序列化字符串提前结束，这表示序列化字符串不是一个有效的前序遍历序列。在算法实现中，一旦发现遍历位置`pos`已经等于数组长度`n`但仍需要继续遍历更多节点，应立即将结果标志`res`设为`False`并终止递归，因为这表明序列化字符串不完整或格式错误。

为了确保序列化字符串被完全遍历，算法在递归结束后需要检查`pos`是否等于`n`。这是因为一个有效的前序序列化字符串应当在遍历结束时刚好用完所有节点。如果`pos`不等于`n`，则表示序列化字符串中还有未处理的部分，这通常指示着输入格式错误或数据冗余。返回结果时，应同时考虑结果标志`res`是否为`True`和`pos == n`是否成立。

在前序遍历的序列化字符串中，任何数字节点都表示一个非空的树节点。处理这样的节点时，首先将`pos`指针向后移动以跳过该节点，然后递归地遍历其左子树和右子树。每个数字节点都应当后续跟有两个子节点的信息（可以是数字也可以是'#'）。这样的处理确保了每个非空节点都能正确地按前序逻辑遍历其两个子节点，从而维护遍历的完整性和正确性。