HuggingFace Daily Papers(社区热门论文)
62
HyperEyes:面向并行多模态搜索代理的双粒度效率感知强化学习
AI 摘要
针对现有多模态搜索代理顺序处理实体导致效率低下的问题,本文提出HyperEyes。它将视觉定位与检索融合为单一原子操作,支持对多实体进行并行搜索,并将推理效率作为核心训练目标。其训练采用双阶段策略:首先通过并行适配数据合成流程进行冷启动监督;随后运用双粒度效率感知强化学习框架,在宏观层面通过动态收紧参考的轨迹级奖励抑制冗余工具调用,在微观层面利用策略蒸馏注入密集的令牌级纠正信号。研究还构建了人工标注基准IMEB以同时评估搜索能力与效率。实验表明,HyperEyes-30B在六个基准上以平均减少5.3倍工具调用轮次的代价,在准确率上超越最强开源代理9.9%。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文arxiv.org