Research Article

如何验证AI生成的研究结论:面向科学家的链式验证(CoVe)方法

了解链式验证(CoVe)如何消除AI研究中的幻觉。PapersFlow验证管道与OpenAI Prism方法的详细比较。

AI在研究中的幻觉是对学术诚信的严重威胁。PapersFlow的链式验证(CoVe)管道将论断分解为原子级子论断,并逐一对照原始来源进行验证,而OpenAI Prism等工具仅依赖模型精度本身。

AI在学术研究中的前景令人振奋:更快的文献综述、自动化的综合分析、跨学科连接的智能发现。但在表面之下潜藏着一个每位使用AI工具的研究人员都必须面对的问题——幻觉。

AI在研究中的幻觉并非小事。一个虚假的引用出现在同行评审论文中,可能引发撤稿、损害职业生涯,并侵蚀对整个领域的信任。随着OpenAI Prism和PapersFlow等AI工具更深入地融入研究工作流程,问题已不再是是否使用AI,而是如何验证其输出。

2025年初,一篇计算生物学预印本在同行评审中被标记,原因是其包含三个根本不存在的引用。这些论文有看似合理的标题、真实的作者名字,甚至可信的期刊名称——但它们从未被发表过。生成这篇文献综述的AI工具完全编造了它们。

这不是孤立事件。来自各学科的研究人员已记录了AI工具生成以下内容的案例: 使用真实作者名字但标题虚构的论文 将真实论文标题归属于错误作者 引用正确的论文但为其捏造从未提出的论断 将过时的发现呈现为当前共识

Read next

  • Explore more on ai-verification
  • Explore more on hallucination
  • Explore more on cove
  • Explore more on research-integrity
  • Explore more on openai-prism

Related articles

Explore PapersFlow

Frequently Asked Questions

什么是AI研究工具中的链式验证(CoVe)?
链式验证是一个系统化的管道,AI生成的论断被分解为原子级子论断,每个子论断独立对照原始文献进行验证,与多个学术数据库交叉引用,并在纳入最终结果之前进行置信度评分。
AI在学术写作中的幻觉有多常见?
研究表明,即使是最先进的语言模型,其引用幻觉率也在1-5%之间。在一篇包含200多个参考文献的文献综述中,这意味着如果没有验证管道,可能会有2-10个虚构或错误归属的引用通过审查。
OpenAI Prism是否验证其研究引用?
OpenAI Prism主要依赖GPT-5.2的内部精度来确保引用正确性。它没有实施像链式验证那样的多步骤验证管道,这意味着幻觉引用或错误归属的引用可能在到达最终输出之前未被发现。
PapersFlow如何防止引用幻觉?
PapersFlow使用多步骤DeepScan管道:探索步骤从双重来源(Semantic Scholar + OpenAlex)查找论文,质量过滤器移除不可靠来源,CoVe步骤对照原文验证每个论断,合成步骤仅使用已验证的论断。人在回路检查点允许研究人员在任何阶段进行干预。

Related Articles