西谚有云:不想当将军的士兵不是好士兵,在学术界我们也可以说,不想当PI的博士不是好博士。更高的学术职级通常意味着更多的学术资源和研究自由,但是晋升的机会永远是有限的,因此所有的大学和研究机构都想有一套最好的标准来筛选出那些最优秀、最有想法的年轻人,把机会给他们可能获得更高的回报。虽然全世界的标准制定者都宣称自己的那套办法是最科学、最客观的,然而研究表明,绝大部分的标准依然还是围着论文打转,那么论文工厂的欣欣向荣也就是顺理成章的事了。



图源:pixabay.com

近期发表在Nature上的一篇论文进行了一项迄今为止最大规模的学术晋升标准研究,研究者对全球190所大学的314项政策和58个政府机构的 218 项政策进行汇总分析,包含了121个国家和地区,时间跨度从2016年到2023年,主要聚焦于正教授的晋升标准。研究发现,虽然许多政策都将研究影响、社会服务、国际合作和学术诚信等考察项目引入了评价体系,然而最重要的因素依然是论文:97%的政策纳入了论文评价指标,92% 的政策规定了严格的定量指标,包括发表数量、期刊影响因子、引用量、专利数量等,甚至包括研究人员在作者名单中的排名顺序,都可能获得额外加分。[1]



532项政策中的不同评估标准

图源:Nature(2025).

https://doi.org/10.1038/s41586-024-08422-9

分析显示,亚洲的大学优先考虑研究成果和影响,但对知名度、更广泛的社会参与度和专业经验的重视程度低于欧洲大学。与欧洲机构相比,拉丁美洲的大学不太看重论文产出、知名度和参与度,大洋洲的机构则更注重研究成果和影响。他们观察到,虽然美英德等高收入国家近年来在不断强调对学者的研究质量进行更深入准确的评估而不是仅仅依靠论文指标,但是这只是很少的一些大学的个别领域的做法。而在大部分中等收入国家,论文指标是绝对的“硬标准”,相比于充分评价科学家的真实能力和成果,用指标当标准,简单、高效,最重要的是,也更具有“客观性”——就像貌似公平的高考一样,一切拿分数说话最简单。

研究人员也同意这种看法:当“符合标准”成为目标后,这些标准往往就很难再起到证明某些事情的能力,因为它很快就会被扭曲和操纵,这又被称“坎贝尔定律”或者“古德哈特定律”。[2]既然论文指标直接关系到研究人员的职业生涯和发展前景,通过某种方式“优化”这个指标简直就是顺理成章的事。相比于大多说老老实实卷成果、卷学术的科学家,相当一部分的人选择走捷径:发表数量、期刊影响因子、引用量,这三大指标都可能成为操纵的目标,其中期刊影响因子当然是最困难的,那个甚至连期刊本身都很难精确控制,但是其余两个都是“人力可为”的。

此前知社曾转载过西班牙国家报的相关报道,西班牙最古老的大学萨拉曼卡大学的新任校长胡安•曼努埃尔•科尔查多(Juan Manuel Corchado)就热衷于刷引用量,他利用自我引用、会议论文、关系引用以及作为编辑的职权组织了一个“引用卡特尔”,在几年内给自己刷了45000个引用,用这个指标将自己塑造成了全球顶级AI专家,并以此谋得了校长之职。(参考阅读:西班牙顶尖大学新任校长当选十天即遭调查



9月27日,萨拉曼卡大学校长胡安·科尔查多出席新学年开学典礼。

图源:USAL

这种方式效果虽然令人瞠目结舌,但却是门槛颇高:没有一定的行政级别带来的权力和大量的人脉关系,相关操作很难奏效。对于更多的普通科学家来说,付钱给论文工厂帮忙发论文可能是更简单的选择。

长期关注学术诚信问题的公益组织撤稿观察最近组织了一场小型研讨会,出席的成员都是著名的“学术侦探”:伊丽莎白•比克、戴维•比姆勒、多萝西•毕晓普、纪尧姆•卡巴纳克,他们曾指出过数以千计的论文问题,带来了不少的撤稿和更正声明,但是按照他们的看法,他们做到的这些事实在是微不足道,因为伪造论文的生意规模之大,远超人们的想象。



图源:David Parkins

如果获得一篇包含自己名字的论文呢?办法真的很多:有一篇论文马上就能发表,付钱把你的名字加上去就好了;胡乱凑一份手稿,发给编辑和评审都是“自己人”的刊物,保证发表;或者更专业一点的,在原始数据中加点料,P个图片,就很容易得出想要的结论,然后找到恰好能忽略这个问题的编辑帮你发出去。



图源:不可描述

自从2013年首次确认出售作者署名的案例后,包含上述各种手法的论文工厂迎来了爆炸式增长,一项估计表明,问题可能早得多——2000 年至 2022 年间发表的至少 40 万篇论文显示出论文工厂痕迹(见《自然》 第 623 卷,第 466-467 页;2023 年)。而在同一时期,即便是目前最全面的撤稿观察数据库中,也只记录了55000 篇论文被撤回或更正,要注意的是,许多撤回和更正可能只是正常学术活动的一部分而不是论文工厂的原因。[3]

学术侦探们认为,最原始的驱动力显然来自上述的国际通行评价标准:论文指标的权重太大了,发得多就比发的少的人更容易晋升,而其中的风险却是不对等的:做成了能晋升,做不成顶多白扔点钱,因为很少有类似买论文这种学术不端的人被彻底砸掉饭碗,从大学到出版商,对于调查问题论文的行动都非常缓慢而且不情不愿,原因是一旦证实,对自己的声誉没什么好处。“图片女王” 伊丽莎白•比克表示,她在2014年到2015年间曾公开指出5800篇论文中的图片存在明显的重复,但是直到十年之后的2024年,只有一半论文被更正或撤回。



图源:pixabay.com

从研究领域来说,某些特定的领域特别容易造假,如人类癌症中的非编码 RNA 和晶体学——大量不同的 RNA 组合和晶体结构可能都需要被研究,但是科学资源总是有限的,因此伪造更容易发生,据不完全统计,在化学领域,因学术不端而被撤回的论文中有 44% 发表在晶体学领域。

从不同国家的角度来看,中国的撤稿问题相当严重。截止2023年底,中国在国际刊物上的撤稿数量上大幅度领先,数量达到17541篇,远远超过第二名美国的3006篇。而这只是单独完成单位归属中国的数量,如果将联合发表的论文纳入统计,撤稿观察数据库中通过Crossref存档的 50002 篇撤稿论文中,约有 54% 涉及至少一家中国研究机构,是美国撤稿数量的五倍多。而且撤稿原因存在明显差异,中国的撤稿问题与论文工厂有关的比例高得多。

然而作为撤稿问题的另一面,中国国内学术刊物的撤稿率却低的出奇:截至 2021 年,中国国内学术期刊中仅检索到 404 篇撤稿,仅占撤稿观察数据库同时记录的 15726 篇国际刊物撤稿量的 2.6%。[4]

大语言模型(LLM)的快速发展让学术侦探们感到忧心,利用这种先进的工具,从制作论文,到避开抄袭检测和图片修饰检测,AI同样会帮助论文工厂迅速提高“生产效率”,同时在互联网上以各种令人眼花缭乱的方式寻找客户,这些技术因素都会帮助论文工厂同步进化。

总体而言,他们认为,通过各种方式提醒人们论文工厂的存在,揭露其种种操作手段,尽最大努力指出问题论文都是在治标而不是治本:只要论文指标依然是学术界获得晋升和奖励的敲门砖,人们就永远有足够的动力去操纵相关指标,如果想要从根本上解决问题,就需要学术界发生结构性转变,这种转变要求所有利益相关者之间的有效对话和协同行动,共同寻找评估和筛选、奖励优秀科学家的新方法和新模式。虽然这并不容易,但是依然属于“人力可为”的范围之内:魔高一尺出现时就是需要道高一丈的时候了。

对此您怎么看?不妨留言与大家讨论。

参考文献:

1.https://www.nature.com/articles/d41586-025-00143-x

2. https://www.nature.com/articles/s41586-024-08422-9

3. https://www.nature.com/articles/d41586-025-00212-1

4. https://www.nature.com/articles/s41562-024-02099-w

ad1 webp
ad2 webp
ad1 webp
ad2 webp