独特的电子邮件地址

标签: 数组哈希表字符串

难度: Easy

每个 有效电子邮件地址 都由一个 本地名 和一个域名组成，以 '@' 符号分隔。除小写字母之外，电子邮件地址还可以含有一个或多个 '.' 或 '+' 。

例如，在 alice@leetcode.com中， alice 是 本地名 ，而 leetcode.com 是域名。

如果在电子邮件地址的 本地名 部分中的某些字符之间添加句点（'.'），则发往那里的邮件将会转发到本地名中没有点的同一地址。请注意，此规则 不适用于域名 。

例如，"alice.z@leetcode.com” 和 “alicez@leetcode.com” 会转发到同一电子邮件地址。

如果在 本地名 中添加加号（'+'），则会忽略第一个加号后面的所有内容。这允许过滤某些电子邮件。同样，此规则 不适用于域名 。

例如 m.y+name@email.com 将转发到 my@email.com。

可以同时使用这两个规则。

给你一个字符串数组 emails，我们会向每个 emails[i] 发送一封电子邮件。返回实际收到邮件的不同地址数目。

示例 1：

输入：emails = ["test.email+alex@leetcode.com","test.e.mail+bob.cathy@leetcode.com","testemail+david@lee.tcode.com"]
输出：2
解释：实际收到邮件的是 "testemail@leetcode.com" 和 "testemail@lee.tcode.com"。

示例 2：

输入：emails = ["a@leetcode.com","b@leetcode.com","c@leetcode.com"]
输出：3

提示：

1 <= emails.length <= 100
1 <= emails[i].length <= 100
emails[i] 由小写英文字母、'+'、'.' 和 '@' 组成
每个 emails[i] 都包含有且仅有一个 '@' 字符
所有本地名和域名都不为空
本地名不会以 '+' 字符作为开头

Submission

运行时间: 19 ms

内存: 16.1 MB

class Solution:
    def numUniqueEmails(self, emails: List[str]) -> int:
        unique_emails = set()
        
        for email in emails:
            local_name, domain_name = email.split('@')
            
            # 处理本地名部分
            processed_local_name = self.process_local_name(local_name)
            
            # 构建处理后的电子邮件地址
            processed_email = processed_local_name + '@' + domain_name
            
            # 将处理后的电子邮件地址添加到集合中
            unique_emails.add(processed_email)
        
        return len(unique_emails)
    
    def process_local_name(self, local_name: str) -> str:
        # 移除加号后面的内容
        processed_local_name = local_name.split('+')[0]
        
        # 移除点号
        processed_local_name = processed_local_name.replace('.', '')
        
        return processed_local_name

Explain

该题解通过处理字符串数组中的每个电子邮件地址来确定不同的地址数。具体步骤如下：1. 分割每个电子邮件地址为本地名和域名。2. 对本地名应用两个规则：先以 '+' 为分界符分割字符串，取第一部分；然后移除所有的 '.'。3. 重新组合处理后的本地名和原始域名形成新的电子邮件地址。4. 使用集合存储所有独特的电子邮件地址，最后返回集合的大小，即不同地址的数量。

时间复杂度: O(nk)

空间复杂度: O(nk)

class Solution:
    def numUniqueEmails(self, emails: List[str]) -> int:
        unique_emails = set()
        
        for email in emails:
            local_name, domain_name = email.split('@')  # 根据 '@' 分割本地名和域名
            
            # 处理本地名部分
            processed_local_name = self.process_local_name(local_name)
            
            # 构建处理后的电子邮件地址
            processed_email = processed_local_name + '@' + domain_name
            
            # 将处理后的电子邮件地址添加到集合中
            unique_emails.add(processed_email)
        
        return len(unique_emails)
    
    def process_local_name(self, local_name: str) -> str:
        # 移除加号后面的内容
        processed_local_name = local_name.split('+')[0]
        
        # 移除点号
        processed_local_name = processed_local_name.replace('.', '')
        
        return processed_local_name

Explore

在处理本地名时，使用了`split('+')[0]`方法。这个方法会在找到第一个'+'符号时停止分割，并返回一个列表，其中第一个元素是加号之前的所有内容。这样就确保了无论本地名中含有多少个加号，只处理第一个加号之前的部分。

域名部分按照电子邮件标准，其内部的'.'字符是有意义的，用于区分不同级别的域。例如，'example.com'与'example.org'代表不同的域名。因此，在处理电子邮件地址时保持域名的完整性是必要的，以确保电子邮件可以正确地被送达到指定的地址。

虽然使用正则表达式是一种可能的方法，但在本场景中，使用`replace()`方法更为简单和直接。因为需要从字符串中删除所有的'.'，`replace()`方法可以直接实现这一功能，且执行速度快，代码易于理解。正则表达式虽然功能强大，但在这种简单的替换操作中，它可能会引入不必要的复杂性和性能开销。

题解中未显式处理'@'字符缺失或多于一个的情况，这可能是一个潜在的问题点。在实际应用中，应该在解析电子邮件地址之前验证其格式。如果'@'字符缺失或不唯一，可以认为是无效的电子邮件地址，应当排除或报错。在更健壮的实现中，应加入异常处理机制来处理这些特殊情况，确保程序的稳定性和准确性。