HuggingFace Daily Papers(社区热门论文)
54
PREPING:无需任务的代理记忆构建
AI 摘要
PREPING 框架旨在解决智能体在新环境中的冷启动问题,使其无需观察目标任务,仅通过自我生成的合成练习构建程序记忆。其核心是提议者记忆,一个结构化控制状态,用于引导练习。系统包含提议者、求解器和验证器:提议者生成合成任务,求解器执行,验证器筛选轨迹存入记忆并提供反馈。在 AppWorld、BFCL v3 和 MCP-Universe 上的实验表明,PREPING 显著优于无记忆基线,性能与基于离线或在线经验的强剧本方法竞争,且部署成本更低。分析显示,优势主要来自提议者对可行性、冗余性和覆盖度的控制,结合选择性记忆更新,而非单纯数据量。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文arxiv.org