问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

h-index:学术界的“成绩单”与“双刃剑”

创作时间:
作者:
@小白创作中心

h-index:学术界的“成绩单”与“双刃剑”

引用
1
来源
1.
https://help.ivysci.com/guide/h-index.html

在学术界,h-index是一个衡量学者学术生产力和影响力的重要指标。它不仅能够反映学者的长期学术贡献,还具有一定的客观性和稳定性。然而,h-index也存在一些局限性,比如不同学科之间的可比性较弱,以及容易被人为操纵等问题。本文将详细介绍h-index的定义、计算方法、价值以及局限性,帮助读者更好地理解这一学术评价指标。

什么是 h-index?

h-index是对学者论文生产力和研究影响力的粗略概括。论文生产力通过论文数量来量化,研究影响力则通过学者的出版物被引用的次数来量化。因为h指数较高的研究人员一般会发表更多同行认为重要的论文,所以h-index有助于确立一些学者的在邻域内的核心地位。

说白了,h指数就像是一张“学术成绩单”,能够大概地反映出研究者的学术贡献和影响力。

h-index最初是由J. E. Hirsch在《美国国家科学院院刊》[1]的一篇文章中给出定义的,即引用次数≥h的论文数量。因此,h-index=3意味着作者至少发表过三篇文章,且其中每篇至少被引用三次。

h-index也可以通过绘制文章的引用次数图来进行简单的表述。然后根据图表对角线与引用数据的截距确定h指数。


(图片来自于 Wikipedia)

我们先来看看一下大牛的h-index:


(爱因斯坦、霍金、牛顿的h-index)

如何计算你的 h-index

第1步:在表格中列出你目前发表的所有文章。

第2步:收集每篇文章被引用的次数。

第3步:根据论文被引用的次数进行排序。

第4步:现在可以通过查找列表中排名大于引用次数的条目来得出h指数。

举例来说,如果一个学者有四篇论文,它们的引用次数分别为10、8、5和3,那么在按照引用次数排序后,我们从前往后查找。第一篇论文引用次数为10,大于其序号1;第二篇论文引用次数为8,大于其序号2;第三篇论文引用次数为5,大于其序号3;但第四篇论文的引用次数为3,小于其序号4。

因此,该学者的h-index=3,表示他至少有3篇论文分别被引用了至少3次。

下面是一个表格示例,其中的文章按引用次数排序,可以得到h-index=3。

如果你论文数量足够大,不方便手动计算,那么有例如Scopus、Web of Science和Google Scholar等学术平台可以提供引用次数数据并自动计算h-index。

下图就是著名物理学家杨振宁在Scopus和Google Scholar上的h-index。

我们会发现,Google Scholar的h-index通常会偏高。因为Google Scholar包含的出版物数量通常更多,不知名的期刊,未被Scopus或者SCI索引的期刊,学位论文都算,那可不就要高一点。

所以,建议你去Google Scholar查一下你的h-index,天底下最大的了。

h-index 的价值

  1. 一般只有学者持续产出高质量学术成果时,h-index才会增加。如果研究者在h-index=3之后发表了另一篇被引用了4次的论文,那么H指数就会增加到4。但是,如果添加的论文引用次数较少,h-index则不会增加。这就体现出了h指数对研究者长期学术贡献的认可,而不是仅仅看重某一篇或几篇论文的短期影响。

  2. h-index相对不容易受到极端值的影响。比如,如果一篇排名最高的文章被引用了1000次,这并不会改变研究者的h-index。这是因为h-index计算的是至少有h篇论文分别被引用了至少h次,极端的高引用次数并不会改变这个阈值。

  3. h-index永远不会大于作者发表的论文数量。要拥有20的h-index,作者必须至少发表了20篇文章,并且每篇文章至少被引用了20次。这进一步强调了h-index对研究者长期、持续贡献的要求,而不是仅仅依赖少量高被引论文,或者是刷很多无意义没人看的文章。

虽然我们不需要天天盯着自己的h-index,但是h指数的提升的确值得庆祝。至于它是值得开一瓶茅台,还是点一杯9.9块的咖啡,这取决于你自己。总之,一个很高的h-index是值得放在你的CV里的。当然,即使你不放,基金或者招聘委员通常也都会去查。

H-index 能代表学术成就吗?

答案肯定是否定的!人们意识到了h-index的缺陷,也有很多人尝试解决缺陷,就连Hirsch本人近期也指出了他认为的h-index的几点不足[2]:

1.它忽略了科研人员除了与h-index有关的其他研究

2.不同学科领域之间的h-index可比性较弱

根据2014年的一项研究[3],对2307位高被引研究人员进行分析后发现,不同学科领域的h值存在显著差异。临床医学和化学领域的研究者通常拥有较高的h-index,而数学和计算机领域的研究者则相对较低。这种差异在很大程度上是由于不同学科的研究特性、引用习惯以及学术规模等因素所致,因此直接使用h指数进行跨学科的比较并不准确;

3.h-index在计算过程中忽略了作者间的贡献差异以及自引现象的影响

在学术研究中,第一作者与其他作者的贡献量往往存在显著差异,而不同合作者之间的科研水平也可能大相径庭。然而,h指数的计算并未考虑到这些因素,从而可能导致对某些研究者的评价出现偏差。

4.h-index不考虑引用的质量

一篇Nature的文章引用和一篇硕士论文的引用都算一个,甚至自己引自己也算一个,所以如果你想拼命提升自己的h-index,那只要号召自己的同门和亲朋好友多引用自己的文章即可,这就导致h-index一定程度上是可以刷的,这种虚假的数据看起来可能很好笑。毕竟即使你的h-index和爱因斯坦一样,你还是少一个广义相对论这样的大作。

5.h-index加剧了内卷

要想提升h-index,要做的事情就是两个:1.发更多的文章2.让更多的人引用自己的文章。如果这个数据不是自然增长,因为对科研的热爱,通过做更好的研究,发表更好的文章,而是拼命的刷数据,那么你也是可以刷的。就好像我前面提到的,你可以呼朋唤友,搞学术圈子,做"学术交流",卷死其他人,那么很显然就本末倒置了。

学术圈子里,像h-index一样被人追求的另外一个指标大概就是所谓影响因子了。所谓有人的地方就有江湖,有指标就有人刷。尽管学界不断尝试提出各种替代性的评价标准,但至今仍未有哪个指标能够完全取代h-index。想要实现科学评价体系完全摆脱人为偏见,纯粹以客观量化的方式评价研究的价值和学者的贡献,这无疑是一个近乎乌托邦的追求,好在这也正是科学家的追求,毕竟如果不量化,那么我的本科学弟也可以是学术大牛,如果他老爸是个大人物的话。

References:

[1]Hirsch JE. An index to quantify an individual's scientific research output[J]. Proc. Natl. Acad. Sci. U.S.A., 2005, 102(46) : 16569–16572.

[2]Hirsch JE. Superconductivity, what the H? the emperor has no clothes[J]. Int. J. Mod. Phys. B, 2023, 38(07).

[3]Malesios CC, Psarakis S. Comparison of the h-index for different fields of research using bootstrap methodology[J]. Qual Quant, 2012, 48(1) : 521–545.

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号