2025高被引科学家公布,又是一顶新的帽子,2020年“高被引科学家”


图源:Unsplash

撰文|张天祁

11月,科睿唯安(Clarivate)发布了2025年度“全球高被引科学家”(Highly Cited Researchers)榜单。



科睿唯安每年都会根据过去十一年的滚动引文分析数据,编制一份动态更新的高被引科学家名单。今年的榜单共有 7131 次高被引科学家上榜,对应 6868 位获奖科学家,其中部分科学家在多个领域同时入选。

入选者的评价,是基于其在 Web of Science 核心合集中发表的高被引论文。科睿唯安下属的科学信息研究所(ISI)以各学科近十一年中被引次数进入前 1% 的论文作为初筛门槛,再从这些论文的作者群体中进行后续遴选。最终入选者的数量,在全球科研人员中大约占比千分之一[1]。

和前几年相比,今年的评估格外强调科研诚信的重要性。ISI不仅继续参考引文计数,更将科研诚信指标提升至前所未有的权重,构建了一套更为复杂、严格的过滤机制。

01 标准趋严,中国科学家比例减少

按照 2025 年更为严格的遴选标准重新统计后,美国依旧在高被引科学家数量上占据首位,而且在整体增速放缓的背景下逆势上扬。今年共有 2670 名美国科学家入选,占比 37.4%。这一数字较上一年增加 1 个百分点,也是自 2018 年以来,美国份额首次出现回升。

中国内地虽然以1406人次继续保持全球第二的位置,但其全球份额从2024年的20.4%下降至19.7% 。需要注意的是,自 2018 年以来,中国内地科学家的占比原本呈持续增长态势,增长幅度超过一倍,这次是多年增长后的首次下滑。

来自中国内地的8家机构进入排名前50,中国科学院第一,清华大学第四。最引人注目的数据变动来自中国科学院。今年,中国科学院在榜单上虽然以258人次继续领跑全球机构榜单,但较2024年的308人次大幅减少了50人次,降幅高达16%[2]。

科睿唯安在分析报告中指出,今年榜单的中美在高被引科学家份额上的逆转,很大程度上来自遴选标准的收紧。今年,在高被引科学家的遴选中,第一阶段和第二阶段的审核标准明显收紧,同时执行过程也更加规范化,以确保榜单结果的可靠性。报告直言“从结果上看,它们(标准收紧)对中国内地的影响大于对美国的影响”[3]。

影响主要集中在几个方面,首先是对超级高产作者(hyper-prolific authors)的处理,这些作者的存在一直是各类高被引科学家榜单受到诟病的关键。早在 2018 年的研究就指出,2000 至 2016 年间,一些作者每年发表论文超过 72 篇,平均不到五天就产出一篇[4]。

而这类作者出现在中国的比例相当高,例如,2016 年中国就出现了全球最多的高产作者。尽管高产不一定等同于造假,但在如此违背科研规律的产出速度背后,往往潜藏着“论文工厂”或挂名等学术不端风险。

研究者发现,部分高产作者将大量论文集中发表在《晶体学报E》(Acta Crystallographica Section E)等特定期刊上,这些期刊在一定程度上成了他们积累论文数和引用量的工具。而这些批量生产的超级高产作者们,过去常被收录进高被引科学家报告。甚至一年生产超过100多篇论文的作者,也同样曾被科睿唯安列入全球高被引科学家榜单[5]。

而在今年的遴选中,超高产作者被列为需要剔除的类别。按过去五年的发表记录,共有 432 位潜在入选者被认定达到了统计意义上的“极端发表量”,从数据库中剔除。从分布上看,这一作者群体绝大多数任职机构位于中国内地,美国位列其后,而其他国家因类似原因被排除的案例均未超过 10 人。

撤稿问题,过去也是这类高被引科学家榜单的争议所在。过去,即使一些高被引论文即便已经撤回,作者仍然登上各类榜单。今年年初的一项基于 Scopus 的高被引科学家数据库研究发现,在 217097 名长期高被引科学家中,有 7083 人(3.3%)至少有 1 次撤稿。

在这项反映学术不端的数据上,中国内地的数据显得尤为刺眼,高被引科学家职业生涯累计撤稿率为 8.2%,最近一年撤稿率也达到了6.7%。拥有高被引科学家最多的前20个国家中,中国内地是除印度之外撤稿问题最为严重的地区,两项撤稿率指标均高居第二位[6]。

今年,ISI 分析师在筛选时,将 2024 年因科研诚信问题被剔除的研究者所署名的高被引论文直接排除在统计之外。分析师团队还表示“如果发现潜在候选人的论文因学术不端行为(例如抄袭、图像篡改和伪造同行评审)而被撤稿,我们将不予评选”[7]。

02 高被引科学家,新的帽子?

除了学术不端和超高产作者问题,今年的榜单还强化了对“异常合作引用模式”,也就是小圈子内的互相引用,以及“过度自引”的筛查算法,旨在更有效地识别通过引用操作获取不当影响力的情况。

科睿唯安的分析报告中提到,今年会筛查高被引论文中自引次数异常的情况,并对每个领域的这些极端案例进行单独识别和评估。同时,也关注近期产出异常高的论文,这类论文往往学术内容上增量有限,但作者自引比例极高。

至于小圈子抱团相互引用,也是筛查的重点。如果一位研究者超过一半的引用都来自固定的合作团队,这往往说明其学术影响主要在内部循环,而没有真正扩散到更大的学术共同体,不符合榜单的初衷。因此,榜单在算法上针对这类情况做了额外的识别与过滤。

今年共有约 2400 名研究者被排除在最终名单之外。尽管增幅较上一年有所放缓,但排除人数的上升趋势仍十分明显:2022 年约 500 人,2023 年突破 1000 人,2024 年已超过 2000 人。这一变化,也在一定程度上印证了筛查标准正不断收紧。

科睿唯安此次收紧筛选标准,有着两方面的原因。

一方面,学术出版环境中噪声与污染日益加剧,榜单必须提高门槛以维护数据的可靠性。另一方面,则是因为这份榜单早已演变为科研评价体系中的“硬通货”,高被引科学家也成了新的“帽子”。它不再仅仅关乎科学家的个人声誉,更是和大学排名等指标绑定,成了校方极力追求的目标。

2023年,《西班牙国家报》曾经报道过一则学术丑闻。西班牙科尔多瓦大学的高被引科学家拉斐尔·卢克(Rafael Luque),受到沙特阿拉伯的一所大学招揽,把自己的主要工作机构更改为沙特国王大学,而没有告知他实际所在的科尔多瓦大学,最终受到学校停薪13年的惩罚[8]。

拉斐尔·卢克的案例并非个例。报道显示,多位高被引科学家都收到过类似的招揽信息,不需要实际在沙特工作,只需在科睿唯安高被引科学家的数据库中,将自己的主要工作机构改成沙特的某所大学,就能收获数万美元的奖金。

沙特阿拉伯各家大学之所以热衷招揽高被引科学家,主要的目的就是冲大学排名。

比如,在上海软科世界大学学术排名(ARWU)中,高被引科学家对学校排名影响很关键,尤其是对于排名靠后,高被引科学家少的机构,一名高被引科学家可以把大学排名提升100甚至200名。科尔多瓦大学仅仅是由于拉斐尔·卢克暗中修改了第一工作机构,就从理论上的684位到690位这个区间,跌到了837位到848位这个区间,国内的排名也下降了10位。

在大量“挂名”科学家的支撑下,2023年沙特阿拉伯拥有 112 位高被引科学家,其占比(0.45%)比德国、法国等传统科研强国高出五到十倍,显得格外突出。而在这 112 人中,有 12 位将中国登记为第二机构,为各国之最。实际上他们的科研工作主要仍在中国进行,只是在榜单上挂名沙特机构。

把时间范围拉长,在2014到2022年期间,中国科学家仍然是挂名沙特的主力群体。而真正出自沙特的高被引科学家,大概只占四成左右,其余的大多是重金聘请来装点门面的“海外雇佣兵”[9]。

ISI 分析主管大卫·彭德尔伯里(David Pendlebury)对高被引科学家榜单等指标被如此追捧感到十分惊讶。他回忆起 ISI 创始人、论文影响因子发明者尤金·加菲尔德(Eugene Garfield)曾多次提醒,不应过度依赖这些指标。

“我们必须应对学术文献中日益增长的污染潮,也就是普遍存在的通过操控发表和引用指标获取不当优势的现象。我们必须防范这种指标操控,确保这些指标的稳健性和可靠性,这也是为什么我们必须引入各种筛查和过滤机制。”彭德尔伯里说[10]。

03 数学领域回归榜单

今年的另一大变化是,数学领域回归高被引科学家榜单。2023年,科睿唯安曾宣布将整个数学领域从其高被引科学家名单中剔除。

2023 年,科睿唯安发布在线声明,解释将数学家排除在最新高被引科学家名单之外的原因。声明指出,公司关注的是“通过操控论文发表和引用来提升自身地位和收益的策略,尤其是有针对性地引用近期发表的论文”。

公司进一步解释称,数学领域因规模较小,更容易受到这种操控的影响。“平均论文发表量和引用量本就不高,因此即便是微小的增长,也可能显著扭曲整个领域的呈现和分析。”

科睿唯安分析师戴维·彭德尔伯里(David Pendlebury)透露,这种异常最早可追溯至2016年。监测数据显示,在分数阶微分方程等特定细分领域,少数作者通过高频次地互相引用,人为制造了数据繁荣,导致真正的学术贡献者反而被挤出了榜单。

西班牙维戈大学数学家多明戈·多坎波(Domingo Docampo)的研究显示,2008 至 2010 年间,加州大学洛杉矶分校(UCLA)和普林斯顿大学等传统数学强校发表的高被引论文最多,分别为 28 篇和 27 篇。但到 2021 至 2023 年,一些数学传统较弱的机构取而代之,其中不少位于中国、沙特阿拉伯和埃及[11]。

多坎波进一步分析发现,论文互引的小圈子具有明显规律:许多高被引论文的主要引用者往往来自与被引作者同属机构。例如,2021 至 2023 年,中国医科大学(台湾)与沙特阿卜杜勒阿齐兹国王大学在此期间共贡献了 66 篇高被引论文,但前者甚至没有数学专业。同时,这两个机构也发表了数百篇引用这些“高被引”论文的文章。研究还指出,这些引用论文中,相当一部分刊登在审稿规范较弱的掠夺性期刊上,更容易出现异常引用行为[12]。

为了将数学重新纳入该名单,科睿唯安咨询了多坎波。多坎波和他的同事开发了一种独立于科睿唯安方法的算法, 用于根据引用文献的质量评估引文。“我们请他用他的算法分析我们今年提名的数学领域人士,两种算法的结果一致”[13]。

参考文献:


nginx