统计打字方案数

标签: 哈希表 数学 字符串 动态规划

难度: Medium

Alice 在给 Bob 用手机打字。数字到字母的 对应 如下图所示。

为了 打出 一个字母,Alice 需要  对应字母 i 次,i 是该字母在这个按键上所处的位置。

  • 比方说,为了按出字母 's' ,Alice 需要按 '7' 四次。类似的, Alice 需要按 '5' 两次得到字母  'k' 。
  • 注意,数字 '0' 和 '1' 不映射到任何字母,所以 Alice  使用它们。

但是,由于传输的错误,Bob 没有收到 Alice 打字的字母信息,反而收到了 按键的字符串信息 。

  • 比方说,Alice 发出的信息为 "bob" ,Bob 将收到字符串 "2266622" 。

给你一个字符串 pressedKeys ,表示 Bob 收到的字符串,请你返回 Alice 总共可能发出多少种文字信息 。

由于答案可能很大,将它对 109 + 7 取余 后返回。

示例 1:

输入:pressedKeys = "22233"
输出:8
解释:
Alice 可能发出的文字信息包括:
"aaadd", "abdd", "badd", "cdd", "aaae", "abe", "bae" 和 "ce" 。
由于总共有 8 种可能的信息,所以我们返回 8 。

示例 2:

输入:pressedKeys = "222222222222222222222222222222222222"
输出:82876089
解释:
总共有 2082876103 种 Alice 可能发出的文字信息。
由于我们需要将答案对 109 + 7 取余,所以我们返回 2082876103 % (109 + 7) = 82876089 。

提示:

  • 1 <= pressedKeys.length <= 105
  • pressedKeys 只包含数字 '2' 到 '9' 。

Submission

运行时间: 94 ms

内存: 24.8 MB

MX = 10005
MOD = 10 ** 9 + 7
f = [1, 1, 2, 4]
g = [1, 1, 2, 4]
for _ in range(10 ** 5 - 3):
    f.append((f[-1] + f[-2] + f[-3]) % MOD)
    g.append((g[-1] + g[-2] + g[-3] + g[-4]) % MOD)

class Solution:
    def countTexts(self, pressedKeys: str) -> int:
        ans = 1
        for ch, s in groupby(pressedKeys):
            m = len(list(s))
            ans = ans * (g[m] if ch in "79" else f[m]) % MOD
        return ans

Explain

题解采用了动态规划的思路。首先,根据题意,数字键2-9上的字母可以有不同的按键次数(比如2对应的字母可以通过按1次、2次或3次得到),而数字7和9可以按4次。因此,为了计算任意长度m的数字序列所能代表的文本信息数,我们预先计算了两个动态规划数组f和g。数组f存储了按键次数最多为3的情况下,长度为m的序列的组合数;数组g存储了按键次数最多为4的情况下的组合数。这种预计算保证了后续计算的效率。在解决方案的主函数中,使用groupby函数来聚合连续的相同数字,然后根据这些数字的数量和种类,利用预先计算的f或g数组来快速得到结果。

时间复杂度: O(n)

空间复杂度: O(n)

MX = 10005
MOD = 10 ** 9 + 7
# 初始化动态规划数组f和g
f = [1, 1, 2, 4]
g = [1, 1, 2, 4]
# 预计算所有长度至10**5的组合数
for _ in range(10 ** 5 - 3):
    f.append((f[-1] + f[-2] + f[-3]) % MOD)
    g.append((g[-1] + g[-2] + g[-3] + g[-4]) % MOD)

class Solution:
    def countTexts(self, pressedKeys: str) -> int:
        ans = 1
        # 使用groupby处理连续的相同数字,计算可能的文本信息数
        for ch, s in groupby(pressedKeys):
            m = len(list(s))
            # 根据数字是'7'或'9'选择g数组,否则选择f数组
            ans = ans * (g[m] if ch in "79" else f[m]) % MOD
        return ans

Explore

在动态规划数组f和g中,只初始化前四个元素的原因是这些值是基础的,无法通过递推公式直接计算得到。数组f用于计算按键次数最多为3次的组合数,所以需要初始化f[1], f[2], f[3]。数组g用于计算按键次数最多为4次的组合数,因此需要初始化g[1], g[2], g[3], g[4]。这些初始值是递推计算其他所有元素的基础。

数组f和g的递推公式基于组合数的动态规划思想。对于数组f,因为它涵盖最多3次按键的情况,每个新的元素f[i]是由前三个元素的和计算得出的,即f[i] = (f[i-1] + f[i-2] + f[i-3]) % MOD。对于数组g,由于涵盖最多4次按键的情况,每个新的元素g[i]是由前四个元素的和计算得出的,即g[i] = (g[i-1] + g[i-2] + g[i-3] + g[i-4]) % MOD。这些公式确保了可以从已知的较小情况推导出更大的情况。

数字'7'和'9'在电话按键上与其他数字不同,因为它们各自可以代表4个不同的字母(如'7'对应'PQRS','9'对应'WXYZ'),而其他数字(如'2'到'6'和'8')最多只能代表3个字母。因此,在处理组合数时,'7'和'9'需要考虑的最大按键次数为4,使用数组g来计算可能的组合数;而其他数字的最大按键次数为3,使用数组f来计算。这种区分确保了计算的准确性和适应性。

在使用Python的groupby函数聚合连续相同的数字时,groupby产生的是一个迭代器,每个元素是一个组的键和组内元素的迭代器。为了得到每个组的长度,需要将每个组的迭代器转换成列表并计算其长度。这种转换确实有性能消耗,特别是在组很大时,因为需要存储整个组的数据到内存中。在性能敏感的应用中,可以考虑其他方法来计算长度,如直接使用迭代计数等策略来减少内存消耗和提升处理速度。