隐藏个人信息

标签: 字符串

难度: Medium

给你一条个人信息字符串 s ,可能表示一个 邮箱地址 ,也可能表示一串 电话号码 。返回按如下规则 隐藏 个人信息后的结果:

电子邮件地址:

一个电子邮件地址由以下部分组成:

  • 一个 名字 ,由大小写英文字母组成,后面跟着
  • 一个 '@' 字符,后面跟着
  • 一个 域名 ,由大小写英文字母和一个位于中间的 '.' 字符组成。'.' 不会是域名的第一个或者最后一个字符。

要想隐藏电子邮件地址中的个人信息:

  • 名字域名 部分的大写英文字母应当转换成小写英文字母。
  • 名字 中间的字母(即,除第一个和最后一个字母外)必须用 5 个 "*****" 替换。

电话号码:

一个电话号码应当按下述格式组成:

  • 电话号码可以由 10-13 位数字组成
  • 后 10 位构成 本地号码
  • 前面剩下的 0-3 位,构成 国家代码
  • 利用 {'+', '-', '(', ')', ' '} 这些 分隔字符 按某种形式对上述数字进行分隔

要想隐藏电话号码中的个人信息:

  • 移除所有 分隔字符
  • 隐藏个人信息后的电话号码应该遵从这种格式:
    • "***-***-XXXX" 如果国家代码为 0 位数字
    • "+*-***-***-XXXX" 如果国家代码为 1 位数字
    • "+**-***-***-XXXX" 如果国家代码为 2 位数字
    • "+***-***-***-XXXX" 如果国家代码为 3 位数字
  • "XXXX" 是最后 4 位 本地号码
 

示例 1:

输入:s = "LeetCode@LeetCode.com"
输出:"l*****e@leetcode.com"
解释:s 是一个电子邮件地址。
名字和域名都转换为小写,名字的中间用 5 个 * 替换。

示例 2:

输入:s = "AB@qq.com"
输出:"a*****b@qq.com"
解释:s 是一个电子邮件地址。
名字和域名都转换为小写,名字的中间用 5 个 * 替换。
注意,尽管 "ab" 只有两个字符,但中间仍然必须有 5 个 * 。

示例 3:

输入:s = "1(234)567-890"
输出:"***-***-7890"
解释:s 是一个电话号码。
共计 10 位数字,所以本地号码为 10 位数字,国家代码为 0 位数字。
因此,隐藏后的电话号码应该是 "***-***-7890" 。

提示:

  • s 是一个 有效 的电子邮件或者电话号码
  • 如果 s 是一个电子邮件:
    • 8 <= s.length <= 40
    • s 是由大小写英文字母,恰好一个 '@' 字符,以及 '.' 字符组成
  • 如果 s 是一个电话号码:
    • 10 <= s.length <= 20
    • s 是由数字、空格、字符 '('')''-''+' 组成

Submission

运行时间: 26 ms

内存: 16.2 MB

class Solution:
    def maskPII(self, s: str) -> str:
        if s[0].isalpha():
            a, b = s.split('@')
            a = a.lower()
            b = b.lower()
            s = a[0] +'*****' + a[-1] 
            return s + '@' + b
        else:
            n = len(s)
            num = []
            for i in range(n):
                if s[i].isdigit():
                    num.append(s[i])
            l = len(num)
            if l == 10:
                return '***-***-' + ''.join(num[6:])
            else:
                x = l % 10
                return '+' + '*' * x + '-***-***-' + ''.join(num[6 + x:])




Explain

该题解首先通过检查字符串s的第一个字符是字母还是数字来判断输入s是电子邮件地址还是电话号码。对于电子邮件,将其按'@'分割成名字和域名两部分,然后将这两部分转换为小写。名字的中间字母替换为五个星号,最后重组成新的电子邮件格式返回。对于电话号码,遍历字符串s,提取出所有数字形成一个新的数字列表。根据这个数字列表的长度,确定国家代码的存在并构造相应格式的电话号码。

时间复杂度: O(n)

空间复杂度: O(n)

# 类定义

class Solution:
    def maskPII(self, s: str) -> str:
        # 检查是电子邮件还是电话号码
        if s[0].isalpha():
            # 电子邮件处理
            a, b = s.split('@')  # 分割名字和域名
            a = a.lower()  # 转小写
            b = b.lower()  # 转小写
            s = a[0] + '*****' + a[-1]  # 名字中间用五个星号替换
            return s + '@' + b  # 重组并返回
        else:
            # 电话号码处理
            num = [ch for ch in s if ch.isdigit()]  # 提取数字
            l = len(num)  # 数字长度
            if l == 10:
                return '***-***-' + ''.join(num[6:])  # 格式化美国电话号码
            else:
                x = l % 10
                return '+' + '*' * x + '-***-***-' + ''.join(num[6 + x:])  # 国际电话号码格式化

Explore

在题解中,通过提取数字字符构建新的数字列表来处理电话号码。这种方法会自动忽略所有非数字字符,包括可能的非法字符。因此,即便输入字符串包含非法字符,只要它们不是数字,就不会影响电话号码的解析。这种处理方式确保了程序的健壮性,能够适应不规范的输入格式。

使用五个星号来替换名字中间的字符是一个常见的隐私保护措施。这个数量的星号足以隐藏原始名字的大部分细节,同时也保留了名字的首尾字符,这有助于保持一定的个人标识,而不至于完全无法识别。这种处理方式在很多服务中被广泛采用,用以平衡隐私保护和用户识别。

题解中并没有直接处理数字长度不符合10-13位的情况。一种可能的处理方式是,如果数字长度超出或少于这个范围,可以返回一个错误信息或特定的提示,说明电话号码格式不正确。然而,从题解的代码看,它似乎设计为默认处理所有输入,即使长度不符合标准,也会尝试按照最接近的格式化方法处理。这可能引导出一种灵活但可能不精确的结果。

题解中通过遍历整个输入字符串,并判断每个字符是否为数字来提取电话号码中的数字。这种方法自然会忽略所有非数字字符,包括可能的分隔符和非法字符。只要字符不是数字,就不会被包含在最终的数字列表中。这样的处理保证了只有数字被提取出来,从而能有效地应对各种复杂或不规范的输入格式。