HuggingFace Daily Papers(社区热门论文)
69
Source or It Didn't Happen: 一个用于检测引用幻觉的多智能体框架
AI 摘要
针对大语言模型在科学写作中生成看似合理但无法验证的虚假引用问题,研究团队构建了一个名为CiteTracer的级联多智能体检测器。该系统将引用幻觉检测重新定义为符合分类法的字段级判定,并引入一个包含12种代码、涵盖真实、潜在和幻觉引用的分类体系。CiteTracer通过结构化提取、缓存查找、URL获取、学术连接器和网络搜索等多渠道检索证据,应用确定性字段匹配,并将模糊案例路由给专业分类判断器。在包含2450个合成引用和957个来自真实会议投稿的伪造引用基准测试中,CiteTracer在合成集上达到97.1%的整体准确率,在真实集上检测出97.1%的伪造引用。相关代码已开源。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文arxiv.org