生物医学论文虚假引文激增 AI被指是主因

对250万篇生物医学论文的深入审查发现，同行评审研究中的虚假参考文献问题已演变为系统性挑战。自2023年初以来，这类不实引文的出现率呈现出惊人的上升趋势，增幅超过十一倍。

哥伦比亚大学与其他合作机构的研究团队在《柳叶刀》期刊上发布了一份关于生物医学论文引文的详尽分析报告。该研究由马克西姆・托帕兹主导，通过检索公共文献数据库PubMed Central，对2023年1月至2026年2月期间发表的近247万篇论文进行了数据收集与分析。

研究人员共计核查了近一亿条参考文献，其中有4046条被识别为伪造，这些伪造引文分布在2810篇论文中。判断引文为伪造的标准是，如果参考文献中提及的标题无法在PubMed、Crossref、OpenAlex、谷歌学术这四个重要的数据库中被检索到，则被认定为不实引用。

数据显示出明确的趋势：在2023年全年，虚假参考文献的比例相对平稳，大约每万篇论文中包含4条伪造文献。然而，从2024年中期开始，这一数字迅速飙升：到2025年底，每万篇论文的虚假引文数升至51.3条；进入2026年前七周，更是进一步增长至56.9条，与2023年的基准水平相比，增长了超过十二倍。

研究团队分析认为，这一现象可能与自2022年末开始广泛应用的大型语言模型，例如ChatGPT，有着显著的关联。由于论文从提交到最终发表通常需要100至200天的时间，人工智能生成的内容直到2024年中期才在PubMed Central中大量涌现。不过，研究人员也承认不能排除其他潜在因素，例如论文代写服务的泛滥以及文献索引规则的变化等。

这些虚假参考文献具有高度的隐蔽性：它们的内容与论文主题紧密相关，格式规范无误，署名看似真实研究者，并且发表年份也显得合理。在一篇泌尿外科领域的论文中，随机抽取的30条参考文献中有18条被证实为伪造，且所有这些伪造引文都精准地对应了该领域细分的外科研究方向。

研究还揭示了论文代写团伙进行规模化操作的线索：在同一外科期刊中，11篇论文出现了两位相同的作者，这些论文涉及CRISPR诊断和肠道微生物组等不同领域，合计包含了15条虚假参考文献。

本次核查发现，高达98.4%的问题论文出版商尚未对这些情况采取任何处理措施。其中，综述类论文受到的影响尤为严重，其参考文献的伪造率比其他类型的论文高出57%。研究人员对此表示深切忧虑，指出综述文章常常是制定临床诊疗指南的重要依据。一旦这些指南引用了含有虚假参考文献的论文，整个诊疗决策背后的证据链将面临严重破坏的风险。

尽管科研界已开始着手应对这一问题，但当前的措施并不统一。例如，预印本平台arXiv已加强了对稿件中包含大型语言模型生成的不实内容（包括虚构文献）的惩罚力度，违规作者将被禁止发布一年。然而，对2025年神经信息处理系统大会（NeurIPS）录用论文的分析表明，即便是在顶尖的人工智能学术会议上，识别伪造引文也并非易事。

开源自动引文核查系统CiteAudit被认为是目前一种可行的应对方案，但相关测试也暴露出商业化大型语言模型在识别自身生成的虚假参考文献方面存在困难。

研究团队提出四项具体的改进建议：在同行评审前实施自动化的参考文献核验；在论文数据库中增加科研诚信元数据；对已发表的论文进行回溯性筛查；以及在科研诚信数据库中专门设立“虚假参考文献”分类。值得一提的是，在此次研究过程中，研究人员也利用Claude模型辅助进行了代码编写和语法校对工作。