在循证医学时代,医疗决策的科学性和可靠性高度依赖于健全的证据生态系统。这一系统涵盖了从原始研究到系统评价,再到临床指南的整个链条。然而,近年来,学术不端行为导致的论文撤稿事件频发,这无疑给医疗证据的可信度蒙上了阴影。研究撤稿试验对医疗证据生态系统的影响具有重要的现实意义。

2025年4月23日,《BMJ》(IF=93.6)发表了一项大规模实证研究,揭示撤稿试验如何在证据合成、临床指南以及循证医学实践中引发“污染链”。


原文链接:https://www.bmj.com/content/389/bmj-2024-082068

研究方法

研究流程

研究者从Retraction Watch数据库中检索了一批被撤稿的随机对照试验(RCTs),检索时间截至2024年11月5日。然后,使用前向引用检索*来确定包含这些撤稿试验的系统评价和meta分析。研究者在排除撤稿试验后重新分析了数据,以量化撤稿试验对系统评价和meta分析结果的影响。最后,研究者通过全面的文献检索来确定可能会受到影响的相关临床指南。

注:*前向引用(即被引用)指的是某项研究被后续研究引用。

数据来源

研究数据由3部分构成:撤稿试验、包含撤稿试验的证据综合研究以及使用受污染证据的临床指南。

主要数据来源:从Retraction Watch数据库中检索标记为“Clinical Study”和“Research Article”的撤稿记录,限制在健康科学领域。检索截止日期为2024年11月5日。两名研究者独立审查撤稿试验的标题和摘要,随后进行全文审查,以确认其是否为符合标准的RCTs。

补充数据来源:通过Google Scholar和Scopus进行前向引用检索,以识别包含撤稿试验的系统评价和meta分析。通过关键词筛选和全文审查,确定哪些系统评价进行了定量证据合成。

对于那些结论因撤稿试验而受到歪曲的系统评价,通过Scopus、Google Scholar以及相关数据库(如Guidelines International Network [GIN]和TRIP数据库)进行文献检索,识别可能受影响的临床指南。

撤稿试验选择标准

纳入标准:被撤稿的人类RCTs,不限制撤稿原因。

排除标准:非随机对照试验、未在人类中进行的试验、非英文发表的试验等。

Meta分析的复现与更新

三名证据合成方法学家独立对包含撤稿试验的meta分析进行了复现,首先使用原始数据和方法复现结果,然后排除撤稿试验后重新分析数据。随后,在排除撤稿试验后,评估对meta分析结果的影响,包括效应量的方向、统计显著性以及效应量大小的变化。

结局

主要结局:根据复现结果,评估撤稿试验对效应值和方向的影响,以及P值的显著性。

次要结局:评估受撤稿试验严重影响的证据评价,这些证据评价可能会污染临床指南。“受到重大影响”定义为:同时改变了效应值方向和P值显著性的试验,或者改变了效应值方向而P值仍然显著的试验。

研究结果

研究者从Retraction Watch数据库中检索到12,542条记录,最终纳入1330项撤稿试验、847项系统评价和meta分析。


图. 撤稿试验的选择流程图

撤稿试验的特征

(1)中位撤稿时间为试验发表后的21.3个月(四分位距[IQR] 12.1-89.8)。

(2)249项(18.7%)试验有注册信息,34项(2.6%)由行业资助。

(3)36.4%(n=484)为单中心试验,11.0%(n=146)为多中心试验,52.6%(n=700)未报告相关信息。

(4)仅27.8%的撤稿试验在数据共享声明中明确声明了数据可用。

(5)大多数撤稿(85.0%;n=1131)由期刊发起,仅9.2%(n=123)由作者发起。

(6)70.8%(n=942)的撤稿原因涉及数据相关问题,12.9%(n=172)被标记为来自论文工厂。

撤稿试验对证据的影响

在排除撤稿试验后,8.4%(95%CI 6.8%-10.1%)的meta分析方向改变,16.0%(14.2%-17.9%)的meta分析P值显著性发生改变,3.9%(2.5%-5.2%)的meta分析方向和显著性均改变,15.7%(13.5%-17.9%)的meta分析效应量大小变化超过50%。


图. 撤稿试验对证据的影响

撤稿试验对临床指南的影响

68项系统评价的结论因撤稿试验而受到歪曲,这些系统评价被用于157项指南或声明。

类型包括:

o临床指南:89项(57%)

o共识声明:42项(27%)

o立场声明:12项(8%)

o实践公告:9项(6%)

o委员会意见:5项(3%)

证据污染链

为阐明撤稿试验如何影响证据生态系统,研究者构建了一个简化的证据污染链,如下图所示:


图. 撤稿试验的证据污染链

在4条潜在的污染途径中,从撤稿试验到证据综合研究再到临床指南的路径最为关键。通过前向引用检索进行定量分析发现:在1330项撤稿试验中,有312项(23.5%)试验污染了来自847篇系统评价的4095项meta分析,其中受到实质性影响的218项meta分析(来自68篇系统评价)被进一步引用至157份英文指南。这意味着平均每篇撤稿试验会污染3篇系统评价中的13项meta分析,而每篇受污染的系统评价又会进一步影响至少3份临床指南。

总结与讨论

本研究通过大规模实证调查,评估了撤稿试验对医疗证据生态系统的影响。结果表明,平均每项撤稿试验可能“污染”约3项系统评价,而每项被污染的系统评价又可能进一步影响至少3项临床实践指南。

在纳入撤稿试验的meta分析中,排除撤稿试验后,8.4%的meta分析效应量方向发生改变,15.7%的效应量大小变化超过50%,16.0%的P值显著性发生改变。这些变化可能导致完全不同的结论。

这是在证据生态系统中建立撤稿试验“污染链”的首次尝试。研究的优势在于:通过全面检索获得具有广泛代表性的样本,并对每项meta分析进行细致复核,这些严谨方法显著增强了研究结果的可信度。此外,研究采用严格的数据收集与分析流程,有力保障了研究结果的可靠性。

局限性包括:(1)研究未纳入患者或公众代表,这可能对后续成果传播产生不利影响;(2)基于四大文献数据库的检索可能遗漏部分临床指南;(3)研究仅关注成对meta分析,撤稿试验对网状meta分析结果的影响及其对相关临床指南的后续传导效应仍需进一步探究;(4)无法确保已识别所有被系统评价纳入的撤稿试验;(5)研究仅聚焦撤稿的随机试验,而部分非随机干预研究若被撤稿同样会造成证据污染。

参考文献:BMJ.2025;389:e082068.


ad1 webp
ad2 webp
ad1 webp
ad2 webp