HuggingFace Daily Papers（社区热门论文）

FineVerify：用于智能体搜索的细粒度自验证框架

2026-05-30 08:00·16天前

AI 摘要

FineVerify是一种提升智能体搜索任务表现的自验证框架。它通过将问题分解为可验证的子问题，对采样出的候选答案进行逐一验证，并选择聚合得分最高的答案。在四个智能体搜索基准测试中，该框架效果显著：仅用四个采样轨迹，就能将GPT-5-mini的准确率提升8.2个百分点，将Gemini-3-flash平均提升5.6%。使用12个样本时，它能使GPT-5-mini在BrowseComp-Plus上超越前沿模型GPT-5。此外，该框架还能生成可解释的验证轨迹，有助于审查基准测试错误。相关代码与数据已开源。

该来源未收录可展示正文，站内仅提供摘要。

智能体arXiv推理论文/研究

阅读原文

HuggingFace Daily Papers（社区热门论文）

FineVerify：用于智能体搜索的细粒度自验证框架

2026-05-30 08:00·16天前

AI 摘要

该来源未收录可展示正文，站内仅提供摘要。

阅读原文arxiv.org

智能体arXiv推理论文/研究