统计打字方案数

标签: 哈希表数学字符串动态规划

难度: Medium

Alice 在给 Bob 用手机打字。数字到字母的对应如下图所示。

为了打出一个字母，Alice 需要按对应字母 i 次，i 是该字母在这个按键上所处的位置。

比方说，为了按出字母 's' ，Alice 需要按 '7' 四次。类似的， Alice 需要按 '5' 两次得到字母 'k' 。
注意，数字 '0' 和 '1' 不映射到任何字母，所以 Alice 不使用它们。

但是，由于传输的错误，Bob 没有收到 Alice 打字的字母信息，反而收到了 按键的字符串信息 。

比方说，Alice 发出的信息为 "bob" ，Bob 将收到字符串 "2266622" 。

给你一个字符串 pressedKeys ，表示 Bob 收到的字符串，请你返回 Alice 总共可能发出多少种文字信息 。

由于答案可能很大，将它对 10⁹ + 7 取余后返回。

示例 1：

输入：pressedKeys = "22233"
输出：8
解释：
Alice 可能发出的文字信息包括：
"aaadd", "abdd", "badd", "cdd", "aaae", "abe", "bae" 和 "ce" 。
由于总共有 8 种可能的信息，所以我们返回 8 。

示例 2：

输入：pressedKeys = "222222222222222222222222222222222222"
输出：82876089
解释：
总共有 2082876103 种 Alice 可能发出的文字信息。
由于我们需要将答案对 10⁹ + 7 取余，所以我们返回 2082876103 % (10⁹ + 7) = 82876089 。

提示：

1 <= pressedKeys.length <= 10⁵
pressedKeys 只包含数字 '2' 到 '9' 。

Submission

运行时间: 94 ms

内存: 24.8 MB

MX = 10005
MOD = 10 ** 9 + 7
f = [1, 1, 2, 4]
g = [1, 1, 2, 4]
for _ in range(10 ** 5 - 3):
    f.append((f[-1] + f[-2] + f[-3]) % MOD)
    g.append((g[-1] + g[-2] + g[-3] + g[-4]) % MOD)

class Solution:
    def countTexts(self, pressedKeys: str) -> int:
        ans = 1
        for ch, s in groupby(pressedKeys):
            m = len(list(s))
            ans = ans * (g[m] if ch in "79" else f[m]) % MOD
        return ans

Explain

题解采用了动态规划的思路。首先，根据题意，数字键2-9上的字母可以有不同的按键次数（比如2对应的字母可以通过按1次、2次或3次得到），而数字7和9可以按4次。因此，为了计算任意长度m的数字序列所能代表的文本信息数，我们预先计算了两个动态规划数组f和g。数组f存储了按键次数最多为3的情况下，长度为m的序列的组合数；数组g存储了按键次数最多为4的情况下的组合数。这种预计算保证了后续计算的效率。在解决方案的主函数中，使用groupby函数来聚合连续的相同数字，然后根据这些数字的数量和种类，利用预先计算的f或g数组来快速得到结果。

时间复杂度: O(n)

空间复杂度: O(n)

MX = 10005
MOD = 10 ** 9 + 7
# 初始化动态规划数组f和g
f = [1, 1, 2, 4]
g = [1, 1, 2, 4]
# 预计算所有长度至10**5的组合数
for _ in range(10 ** 5 - 3):
    f.append((f[-1] + f[-2] + f[-3]) % MOD)
    g.append((g[-1] + g[-2] + g[-3] + g[-4]) % MOD)

class Solution:
    def countTexts(self, pressedKeys: str) -> int:
        ans = 1
        # 使用groupby处理连续的相同数字，计算可能的文本信息数
        for ch, s in groupby(pressedKeys):
            m = len(list(s))
            # 根据数字是'7'或'9'选择g数组，否则选择f数组
            ans = ans * (g[m] if ch in "79" else f[m]) % MOD
        return ans

Explore

在动态规划数组f和g中，只初始化前四个元素的原因是这些值是基础的，无法通过递推公式直接计算得到。数组f用于计算按键次数最多为3次的组合数，所以需要初始化f[1], f[2], f[3]。数组g用于计算按键次数最多为4次的组合数，因此需要初始化g[1], g[2], g[3], g[4]。这些初始值是递推计算其他所有元素的基础。

数组f和g的递推公式基于组合数的动态规划思想。对于数组f，因为它涵盖最多3次按键的情况，每个新的元素f[i]是由前三个元素的和计算得出的，即f[i] = (f[i-1] + f[i-2] + f[i-3]) % MOD。对于数组g，由于涵盖最多4次按键的情况，每个新的元素g[i]是由前四个元素的和计算得出的，即g[i] = (g[i-1] + g[i-2] + g[i-3] + g[i-4]) % MOD。这些公式确保了可以从已知的较小情况推导出更大的情况。

数字'7'和'9'在电话按键上与其他数字不同，因为它们各自可以代表4个不同的字母（如'7'对应'PQRS'，'9'对应'WXYZ'），而其他数字（如'2'到'6'和'8'）最多只能代表3个字母。因此，在处理组合数时，'7'和'9'需要考虑的最大按键次数为4，使用数组g来计算可能的组合数；而其他数字的最大按键次数为3，使用数组f来计算。这种区分确保了计算的准确性和适应性。

在使用Python的groupby函数聚合连续相同的数字时，groupby产生的是一个迭代器，每个元素是一个组的键和组内元素的迭代器。为了得到每个组的长度，需要将每个组的迭代器转换成列表并计算其长度。这种转换确实有性能消耗，特别是在组很大时，因为需要存储整个组的数据到内存中。在性能敏感的应用中，可以考虑其他方法来计算长度，如直接使用迭代计数等策略来减少内存消耗和提升处理速度。