二进制表示中质数个计算置位

标签: 位运算 数学

难度: Easy

给你两个整数 left 和 right ,在闭区间 [left, right] 范围内,统计并返回 计算置位位数为质数 的整数个数。

计算置位位数 就是二进制表示中 1 的个数。

  • 例如, 21 的二进制表示 10101 有 3 个计算置位。

示例 1:

输入:left = 6, right = 10
输出:4
解释:
6 -> 110 (2 个计算置位,2 是质数)
7 -> 111 (3 个计算置位,3 是质数)
9 -> 1001 (2 个计算置位,2 是质数)
10-> 1010 (2 个计算置位,2 是质数)
共计 4 个计算置位为质数的数字。

示例 2:

输入:left = 10, right = 15
输出:5
解释:
10 -> 1010 (2 个计算置位, 2 是质数)
11 -> 1011 (3 个计算置位, 3 是质数)
12 -> 1100 (2 个计算置位, 2 是质数)
13 -> 1101 (3 个计算置位, 3 是质数)
14 -> 1110 (3 个计算置位, 3 是质数)
15 -> 1111 (4 个计算置位, 4 不是质数)
共计 5 个计算置位为质数的数字。

提示:

  • 1 <= left <= right <= 106
  • 0 <= right - left <= 104

Submission

运行时间: 57 ms

内存: 16.2 MB

class Solution:
    def countPrimeSetBits(self, left: int, right: int) -> int:
        z = {2, 3, 5, 7, 11, 13, 17, 19, 23, 29}
        nums = []
        for i in range(left, right+1):
            if i.bit_count() in z:
                nums.append(i)
        return len(nums)     

Explain

该题解通过迭代区间[left, right]中的每个整数,利用内建的bit_count方法计算每个数字的二进制表示中1的个数。随后检查这个计数是否存在于一个预定义的质数集合中。如果存在,说明该整数的计算置位位数是一个质数,因此将这个整数加入到列表nums中。最后,返回列表nums的长度,即为计算置位位数为质数的整数个数。

时间复杂度: O(n)

空间复杂度: O(n)

class Solution:
    def countPrimeSetBits(self, left: int, right: int) -> int:
        # 定义质数集合
        z = {2, 3, 5, 7, 11, 13, 17, 19, 23, 29}
        # 用于存储符合条件的整数
        nums = []
        # 遍历指定区间内的所有数字
        for i in range(left, right+1):
            # 计算每个数字的二进制表示中1的数量并检查是否为质数
            if i.bit_count() in z:
                # 如果是质数,加入列表
                nums.append(i)
        # 返回计算置位为质数的数字个数
        return len(nums)

Explore

质数集合 z 的确定基于二进制表示中可能的最大‘1’的个数。由于一个整数的最大二进制位数限定于该整数的比特长度,对于一般的32位整数,其最大1的个数不会超过32。因此,我们只需考虑小于等于32的质数。在这个题解中,质数集合只列出到29,因为32位整数中1的最大个数为32,而30、31、32都不是质数。如果要处理更大范围的整数,可能需要扩展质数集合至更大的质数。

题解中存储符合条件的整数列表并不是最优的方式,主要因为这增加了额外的空间需求。更优的方法是直接计数符合条件的整数数量。可以通过设置一个计数器,每当发现一个整数的计算置位为质数时,直接增加这个计数器的值,而不是将整数存入列表。这样可以减少空间消耗,只使用一个整数变量进行计数,从而使算法的空间复杂度从O(n)降低到O(1)。

在算法中,处理边界值主要依赖于Python的整数类型,它提供了自动的整数扩展功能,可以处理非常大的整数而不会导致整型溢出。对于极小值(如接近0)的处理,Python的整数同样可以很好地处理。但是,如果right非常大,比如接近32位或64位整数的最大值,虽然不会溢出,但是遍历这样广泛的范围可能会造成性能问题,因为算法的时间复杂度与区间[left, right]的大小成线性关系。在实际应用中可能需要对输入范围进行限制或优化算法以处理大范围的数据。