预测赢家

标签: 递归 数组 数学 动态规划 博弈

难度: Medium

给你一个整数数组 nums 。玩家 1 和玩家 2 基于这个数组设计了一个游戏。

玩家 1 和玩家 2 轮流进行自己的回合,玩家 1 先手。开始时,两个玩家的初始分值都是 0 。每一回合,玩家从数组的任意一端取一个数字(即,nums[0]nums[nums.length - 1]),取到的数字将会从数组中移除(数组长度减 1 )。玩家选中的数字将会加到他的得分上。当数组中没有剩余数字可取时,游戏结束。

如果玩家 1 能成为赢家,返回 true 。如果两个玩家得分相等,同样认为玩家 1 是游戏的赢家,也返回 true 。你可以假设每个玩家的玩法都会使他的分数最大化。

示例 1:

输入:nums = [1,5,2]
输出:false
解释:一开始,玩家 1 可以从 1 和 2 中进行选择。
如果他选择 2(或者 1 ),那么玩家 2 可以从 1(或者 2 )和 5 中进行选择。如果玩家 2 选择了 5 ,那么玩家 1 则只剩下 1(或者 2 )可选。 
所以,玩家 1 的最终分数为 1 + 2 = 3,而玩家 2 为 5 。
因此,玩家 1 永远不会成为赢家,返回 false 。

示例 2:

输入:nums = [1,5,233,7]
输出:true
解释:玩家 1 一开始选择 1 。然后玩家 2 必须从 5 和 7 中进行选择。无论玩家 2 选择了哪个,玩家 1 都可以选择 233 。
最终,玩家 1(234 分)比玩家 2(12 分)获得更多的分数,所以返回 true,表示玩家 1 可以成为赢家。

提示:

  • 1 <= nums.length <= 20
  • 0 <= nums[i] <= 107

Submission

运行时间: 48 ms

内存: 16.3 MB

class Solution:
    def predictTheWinner(self, nums: List[int]) -> bool:
        n = len(nums)

        @cache
        def dfs(l,r):
            if l > r:
                return 0
            return max(nums[l] - dfs(l + 1,r),nums[r] - dfs(l,r - 1))
        
        return dfs(0,n - 1) >= 0

Explain

这个题解使用记忆化搜索(递归+记忆化)的方法来解决问题。定义函数 dfs(l,r) 表示当剩下的数组索引范围为 [l,r] 时,当前玩家与另一个玩家的分数之差的最大值。在每一步中,当前玩家可以选择 nums[l] 或 nums[r],然后轮到另一个玩家在剩下的数组范围内进行选择。玩家 1 会选择最大化分数差值的方案,因此最终结果只要大于等于 0,就说明玩家 1 可以获胜。

时间复杂度: O(n^2)

空间复杂度: O(n^2)

class Solution:
    def predictTheWinner(self, nums: List[int]) -> bool:
        n = len(nums)

        @cache
        def dfs(l,r):
            if l > r:
                return 0
            # 当前玩家选择 nums[l] 或 nums[r],然后轮到另一个玩家在剩下的数组范围内进行选择
            # 当前玩家会选择最大化分数差值的方案
            return max(nums[l] - dfs(l + 1,r),nums[r] - dfs(l,r - 1))
        
        # 判断最终结果是否大于等于 0,如果是则说明玩家 1 可以获胜
        return dfs(0,n - 1) >= 0

Explore

当 l 大于 r 时,意味着数组中没有剩余的元素可以选择。在这种情况下,当前玩家无法进行任何操作,因此无法增加或减少分数差值。返回 0 是表示在这种边界条件下,没有分数可以被加到任一玩家的总分上,因此分数差维持不变。

记忆化是通过存储已经计算过的结果来避免重复计算,从而提高算法效率的技术。在这个场景中,@cache 装饰器会自动存储每一对 (l, r) 的 dfs 函数的结果。这意味着每个子问题只解决一次,而不是每次递归调用时都重新计算。这种方式显著减少了递归的调用次数,从而加速整体的计算过程。记忆化存储的信息是每一对 (l, r) 索引范围内,当前玩家与另一个玩家的分数之差的最大值。

这种计算形式是基于博弈理论中的最优策略选择。当前玩家面临选择数组端点 nums[l] 或 nums[r] 的决策。选择 nums[l] 后,剩余数组范围变为 [l+1, r],而选择 nums[r] 后,剩余范围变为 [l, r-1]。在每一种选择后,分数差值的计算考虑了当前选择的值减去对手在剩余数组范围内的最优选择(即 dfs 返回的值)。这样的计算确保当前玩家在任一步骤都尽可能扩大分数差,从而在游戏中保持优势或实现逆转。