HuggingFace Daily Papers（社区热门论文）

InterLV-Search：交错多模态智能体搜索基准测试

2026-05-08 08:00·38天前

AI 摘要

现有基准测试未能充分评估视觉证据在交错搜索轨迹中的作用。为此，研究团队推出InterLV-Search基准，专门评估语言与视觉证据在搜索过程中反复交错使用的智能体能力。该基准包含2,061个示例，涵盖主动视觉证据搜寻、受控离线及开放网络交错多模态搜索三个层级，并首次引入涉及多实体比较的多模态多分支样本。实验表明，当前最先进的多模态智能体在此任务上整体准确率仍低于50%，在视觉证据定位、搜索控制和多模态证据整合方面面临显著挑战。基准数据与评估代码已开源。

该来源未收录可展示正文，站内仅提供摘要。

智能体多模态搜索论文/研究

阅读原文

HuggingFace Daily Papers（社区热门论文）

InterLV-Search：交错多模态智能体搜索基准测试

2026-05-08 08:00·38天前

AI 摘要

该来源未收录可展示正文，站内仅提供摘要。

阅读原文arxiv.org

智能体多模态搜索论文/研究