HuggingFace Daily Papers(社区热门论文)
57
基于前缀一致性的可靠思维链方法
AI 摘要
本研究提出“前缀一致性”作为一种可靠性信号,用于改进大语言模型在推理任务中的自一致性方法。该方法通过截断思维链的中间部分并重新生成后续内容,发现正确答案的思维链更倾向于重现原答案。利用这一差异,前缀一致性对候选答案进行加权聚合,无需依赖词元概率或自评分提示。在五个推理模型和四个数学科学基准测试中,该方法在多数情况下成为最佳正确性预测指标,并以中位数4.6倍、最高21倍更少的词元消耗,达到了标准多数投票法的稳定准确率。相关代码已开源。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文arxiv.org