谷歌推出基于 Gemini Enterprise Agent Platform 的 Agentic RAG 框架
企业级 RAG 的新标杆,多 agent 架构加上‘足够上下文’检查,准确度提升 34%。做知识库问答的产品经理和架构师都应该认真看。
Google Research 与 Google Cloud 合作推出跨语料库检索(Cross-Corpus Retrieval)框架,作为 Gemini Enterprise Agent Platform 的 Agentic RAG。该多智能体工作流将复杂企业查询分解为子任务,通过规划、重写和路由,迭代搜索多个数据源直至获得充分上下文,再生成可靠回答。与标准 RAG 相比,在事实性数据集上准确率最高提升 34%;在多个领域特定内部数据集上也实现了更好的接地与推理准确性。
利用 Gemini 企业智能体平台的智能体RAG 解锁可靠应答
跳转到主要内容
探索我们关注的众多领域
探索所有研究领域
应用 AI 与科学
地球 AI 健康 AI 科学 AI 可持续性与危机韧性
基础机器学习与算法
算法与理论 信息检索 机器智能 机器感知 自然语言处理
人员、系统与量子 AI
人机交互与可视化 网络 量子 AI 负责任 AI 反滥用 软件工程 软件系统
了解更多
出版物 项目 构建协作生态系统
数据集 访问高质量数据集以加速你的研究。 工具与服务 探索我们最新的 AI 模型与产品。
开源 发现开源代码并与社区协作。 共同塑造未来
查看所有项目
教师项目 通过与大学教师的有意义互动,参与学术研究社区。 学生项目 通过广泛的项目支持下一代研究人员。
全球地点 在我们的全球办公室与研究实验室找到你的位置。 将发现转化为实际影响力
人员 我们的研究人员通过基础研究和应用研究推动计算机科学的进步。
团队 协作团队应对世界上最具挑战性的 AI 问题。
研究 探索我们关注的众多领域
探索所有研究领域
应用 AI 与科学
地球 AI 健康 AI 科学 AI 可持续性与危机韧性
基础机器学习与算法
算法与理论 信息检索 机器智能 机器感知 自然语言处理
人员、系统与量子 AI
人机交互与可视化 网络 量子 AI 负责任 AI 反滥用 软件工程 软件系统
了解更多
出版物 项目
资源 构建协作生态系统
数据集 访问高质量数据集以加速你的研究。 工具与服务 探索我们最新的 AI 模型与产品。 开源 发现开源代码并与社区协作。
会议与活动
职业机会 共同塑造未来
查看所有项目
教师项目 — 通过有意义地接触大学教师群体,参与学术研究社区。 学生项目 — 通过广泛的计划安排,支持下一代研究人员。 办公地点 — 在我们遍布全球的办公室和研究实验室中找到属于你的位置。
博客
关于 将发现转化为真实世界的影响力
人员 — 我们的研究人员通过基础研究与应用研究共同推动计算机科学的进步。 团队 — 协作小组解决世界上最具挑战性的 AI 问题。
Google Research
Google AI — 了解我们所有的 AI 技术 Google DeepMind — 探索 AI 的前沿 Google Labs — 尝试我们的 AI 实验
研究
资源
会议与活动
职业机会
博客
关于
搜索
1. 首页 2. 博客 借助 Gemini Enterprise Agent Platform 的 Agentic RAG 实现可靠响应
2026 年 6 月 5 日
Cyrus Rashtchian,研究科学家,以及 Da-Cheng Juan,工程经理,Google Research
我们推出全新的 agentic RAG 框架。基于 Google Research 与 Google Cloud 的合作,我们的多智能体工作流超越了标准 RAG,通过分解复杂的企业查询并迭代搜索足够上下文,从而生成可靠的响应。
快速链接 RAG Engine 跨语料库检索
分享 [Twitter] [Facebook] [LinkedIn] [邮件] 复制链接 ×
当前的单步检索增强生成(RAG)系统并非为现代业务工作流中多来源、多跳查询而设计。例如,如果查询是“项目X所用的服务器规格是什么?”,系统可能会找到关于项目X的文档,但这些文档可能只提到了一个服务器ID。它不会知道要拿着那个ID去另一个数据库中执行第二次搜索来找到规格参数。结果就是,因为信息分散在不同的数据“孤岛”上,需要更深入的探索才能发现事实,系统只能给出部分答案或“未找到”的响应。
于是,“智能体式RAG”应运而生,它能够进行规划、推理,并与数据源进行迭代交互,从而支持处理复杂查询,提升可靠性和准确性。
今天,我们很高兴地介绍谷歌Gemini企业智能体平台上托管的、由智能体式RAG驱动的跨语料库检索版本。与其他多智能体RAG框架一样,我们的框架也使用多个智能体协同工作,以可靠地回答复杂查询。与其他多智能体框架不同的是,我们的框架融入了足够的上下文,以确认是否存在足够的信息来生成准确的答案。与标准RAG相比,我们的框架在真实性数据集上的准确率提升了高达34%。我们还使用专有的内部数据集对系统进行了评估,发现在多个领域特定任务上,我们实现了更好的接地性和更优的推理准确性。 多智能体架构的工作原理:规划、重写和路由
不妨将多智能体RAG理解为一个组织有序的研究部门,而不是一个单一的搜索引擎。在一个“单体式”或“香草式”RAG系统中,检索组件只是查看你的问题,并试图在LLM生成回复之前找到匹配的文档。
而在多智能体框架中,系统将任务分解为专门的职能角色:
1. **编排器**评估你的复杂请求,并判断“这不是一步就能完成的任务”,然后将工作委托给各智能体。 2. **规划智能体**规划出信息路径。例如,如果你询问某个项目的预算及其时间线,规划智能体会决定:“首先,我们需要查询财务数据库,然后检查项目管理日志。” 3. **查询重写器**将你的请求转化为多条搜索查询。它会将“项目X进展如何?”改写为“项目X第三季度状态报告”和“项目X团队的关键阻碍因素”。 4. **搜索分发智能体**接收这些精炼后的查询,并将其发送到多个检索源,以收集信息片段。 5. 最后,一个大语言模型聚合所有上下文,生成最终回复。
视频 1
播放静音循环视频 暂停静音循环视频
取消静音视频 静音视频
*演示一个标准的智能体 RAG 系统。该系统包含多个智能体,但不包括迭代检索或专门的跨语料库支持。*
**我们的智能体 RAG 与其他方案有何不同**
我们新推出的智能体 RAG 框架的关键区别在于**持久性**。与其他 RAG 解决方案相比,我们的框架之所以高效,是因为它知道自己何时缺少信息,并持续搜索直到上下文完整。这可以防止 AI 在首次搜索无果时“猜测”,或简单地回答“我没有足够的信息”。虽然在某些情况下这是一种合理的回应,但有时信息确实存在,我们只是需要找到它。
例如,想象一位医生询问患者的用药、饮食和过敏情况:
*“约翰·杜在膝关节手术后出院时的用药和饮食限制是什么?住院期间他是否有过过敏反应?不要包括仅在住院或急诊期间使用的药物,除非是肝素静脉输液或替奈普酶。”*
作为回应,我们的框架启动多个专门智能体。我们在下图中概述了解决方案,随后将进行更详细的描述。
视频 2
播放静音循环视频 暂停静音循环视频
取消静音视频 静音视频
*展示我们的多智能体 RAG 解决方案,其中包括一个“充分上下文智能体”,以及在回答查询之前迭代检索更多信息的能力。*
**阶段 1:编排**
The Root Agent 解析医生的请求,并将任务分派给子 Agent。Planner Agent 识别出需要检查三个不同的领域:药房、营养和临床记录。Query Rewriter 将长请求拆解成简单、可搜索的问题,从而使检索器能够更准确地找到相关内容。 阶段 2:搜索(标准步骤)
RAG Agent 一次性搜索患者记录中的所有查询分支。它找到了药物和饮食信息,但在最明显的文件中未能找到任何关于过敏的记录。在标准或“Vanilla”RAG 系统中,流程可能在此结束,给出一个不完整的答案。 阶段 3:Sufficient Context Agent(新的研究创新)
将 Sufficient Context Agent 想象成一条装配线末端的质量检查员。它在允许生成响应之前检查三个具体结果: 1. 检索到的片段
Sufficient Context Agent 评估 RAG Agent 从数据库中拉取的实际文本块。在医生的例子中,这些可能是从“出院小结”和“营养记录”中找到的具体段落。它阅读这些内容,以判断回答查询所需的信息是否存在于这些句子中。 2. 中间草稿
系统还会创建一个“粗略草稿”响应。然后 Sufficient Context Agent 审查提示词、草稿和检索到的片段,以评估模型是否拥有提供全面且有依据答案所需的一切。如果提示词要求三项内容(药物、饮食、过敏),但片段仅包含其中两项的信息,Sufficient Context Agent 会将其标记为“context insufficient”。 3. 缺失内容分析
这是最关键的部分。Sufficient Context Agent 精确识别出缺少的内容。它不仅仅输出“信息不足”,而是生成一个具体的“原因”和“反馈”日志。例如:
发现:“我们拥有药物清单和低钠饮食指导。”
缺口:“我们缺少源文档中关于住院期间过敏反应或不良事件的信息。”
Sufficient Context Agent 将所找到的内容与原始请求进行对比,并询问:“我们回答过敏问题了吗?”如果没有,它会发出“Insufficient Context”信号,并提供具体反馈:“你找到了药物和饮食信息,但遗漏了过敏信息。回去专门搜索‘皮疹’或‘不良事件’。”在多源场景下,它还可以请求更多信息,或判断该来源是否与查询无关。
阶段 4:迭代
由于 Sufficient Context Agent 的反馈,Query Rewriter 创建了一个针对“皮疹”的新搜索。然后,RAG Agent 深入挖掘它第一次忽略的文件,找到了缺失的信息。
阶段 5:综合(最终答案)
Sufficient Context Agent 最后一次检查数据。现在它已经拥有了药物、饮食和过敏信息,因此判断可以停止搜索。最后,Synthesis Agent 为医生撰写一份清晰准确的摘要。
实验与结果
我们在基于 FRAMES 论文的 FramesQA 上评估了智能体 RAG。一个示例性的多跳问题是:“截至 2024 年 6 月,在收视率最高的两部电视剧季终集中,哪一集时长最长,长了多少?”RAG 系统……