H 指数

难度: Medium

给你一个整数数组 citations ，其中 citations[i] 表示研究者的第 i 篇论文被引用的次数。计算并返回该研究者的 h 指数。

根据维基百科上 h 指数的定义：h 代表“高引用次数” ，一名科研人员的 h 指数是指他（她）至少发表了 h 篇论文，并且至少有 h 篇论文被引用次数大于等于 h 。如果 h 有多种可能的值，h 指数 是其中最大的那个。

示例 1：

输入：citations = [3,0,6,1,5]
输出：3 
解释：给定数组表示研究者总共有 5 篇论文，每篇论文相应的被引用了 3, 0, 6, 1, 5 次。
     由于研究者有 3 篇论文每篇 至少 被引用了 3 次，其余两篇论文每篇被引用 不多于 3 次，所以她的 h 指数是 3。

示例 2：

输入：citations = [1,3,1]
输出：1

提示：

n == citations.length
1 <= n <= 5000
0 <= citations[i] <= 1000

Submission

运行时间: 21 ms

内存: 16.4 MB

class Solution:
    def hIndex(self, citations: List[int]) -> int:
        citations.sort(reverse=True)
        n = len(citations)
        res = 0
        for i in range(n):
            if citations[i] >= i+1:
                res = max(res, i+1)
        return res

Explain

该题解的思路是先将引用次数数组按降序排序，然后从前往后遍历。对于每个位置 i，如果该位置的引用次数 citations[i] 大于等于 i+1，说明至少有 i+1 篇论文的引用次数大于等于 i+1，更新结果 res 为 i+1。最终返回 res 即为所求的 h 指数。

时间复杂度: O(nlogn)

空间复杂度: O(logn) 或 O(n)

class Solution:
    def hIndex(self, citations: List[int]) -> int:
        citations.sort(reverse=True)  # 将引用次数数组按降序排序
        n = len(citations)
        res = 0
        for i in range(n):
            if citations[i] >= i+1:  # 如果该位置的引用次数大于等于位置索引+1
                res = max(res, i+1)  # 更新结果为当前位置索引+1
        return res  # 返回最终的 h 指数结果

Explore

在计算h指数时，将引用次数数组按降序排序是为了更方便地找到满足条件的最大h值。按照降序排序后，我们可以从左向右检查每篇论文的引用次数是否满足至少有i+1篇论文的引用次数大于等于i+1。这样排序后的数组直接反映了引用次数的顺序，使得算法可以直接通过遍历数组来确定h指数，而不需要额外的数据结构或复杂的计算。

在判断citations[i] >= i+1时，使用i+1而不是i是因为数组的索引是从0开始的，而h指数的定义是至少有h篇论文引用次数不少于h。因此，当我们在位置i（从0开始计数）检查时，实际上我们是在检查是否有i+1篇论文满足条件。如果使用i，那么对于位置0（第一篇论文），我们将无法正确地检查是否有至少1篇论文的引用次数大于等于1，从而导致算法错误。

即使数组中存在重复的引用次数，该方法仍然有效并且不会影响最终计算出的h指数。算法通过降序排序后，重复的引用次数会连续出现，算法在遍历时会考虑到这些连续的相同值。由于h指数的定义是至少有h篇论文的引用次数不少于h，重复的引用次数只会增加满足条件的论文数量，不会导致h指数计算错误。

如果citations数组为空，按照题解中的逻辑确实会在实际应用中引发错误，因为代码试图对一个空数组进行排序和遍历，这可能导致运行时错误。解决这个问题的方法是在代码开始处加入一个检查，如果数组为空，则直接返回0。这样可以确保算法在处理空数组时的正确性和鲁棒性。