OpenRouter 推出 Advisor 工具：让低成本模型可随时调用强模型增强生成

2026-06-10 02:00·6天前

精选理由

OpenRouter 开放了跨模型顾问调用，让便宜模型在关键节点求助昂贵模型，这会让 agent 开发重心从选一个万能模型转向编排一组模型，值得所有做 agent 架构的人试一下。

AI 摘要

OpenRouter 发布 advisor 服务器工具，允许一个快速、便宜的模型在生成过程中咨询一个更强大的模型。具体而言，可用 GPT-4o Mini 处理日常例行工作，在关键时刻调用 Claude Fable 解决真正重要的问题，从而实现成本和质量的动态平衡。

AI 翻译 · 中文

Advisor: Give Any Model a Lifeline to a Smarter One — OpenRouter Blog

Advisor: Give Any Model a Lifeline to a Smarter One

Kenny Rogers · 6/10/2026

此页面内容 67倍价格差距，按需咨询服务器端执行，一次工具调用命名顾问与其他顾问工具的比较计费开始使用

将 `openrouter:advisor` 添加到你的工具数组中，你的模型便可以在生成过程中向更强模型求助。当执行模型遇到困难决策、陷入停滞，或想在完成前获得一次正确性检查时，它会携带提示词调用顾问。顾问思考后，将指引作为工具结果返回，执行模型则利用更优信息继续推进。

两个角色都是开放的：OpenRouter 上的任何模型都可以作为执行模型，任何提供商的任何模型都可以作为顾问模型。你可以让 Gemini 执行模型咨询 Claude，或让 GPT 执行模型咨询 DeepSeek。你来选择配对组合。

在聊天室中试用，或阅读文档获取完整 API 参考。

```json { "model": "openai/gpt-4o-mini", "messages": [{ "role": "user", "content": "Design a rate limiter for a distributed API gateway." }], "tools": [ { "type": "openrouter:advisor", "parameters": { "model": "anthropic/claude-fable-5" } } ] } ```

67 倍价格差距，按需咨询

Claude Fable 5 每百万输入 token 收费 10 美元。GPT-4o Mini 每百万输入 token 收费 0.15 美元。两者相差 67 倍。

大多数请求并不需要前沿级别的推理。中档模型可以毫无问题地处理工作量的主体。但其中 10-20% 涉及架构决策、模糊边界情况或多步推理链的请求，正是较便宜模型容易出错的地方。

顾问工具有选择性地填补了这一差距。你的快速模型主导运行。当它遇到真正困难的问题时，会调用帮助。你只需为那些需要前沿思维的时刻支付前沿模型价格。

在一个包含 50 次工具调用的智能体编码会话中，可能只有 2-3 次是顾问咨询。其余调用都按迷你模型价格运行。这样你既将每次会话的成本降了下来，同时又保持了较高的质量上限。

服务器端执行，一次工具调用

顾问在生成过程中于服务器端执行。你的模型像调用其他工具一样调用它：传入一条提示词，描述它需要什么帮助，然后收到顾问的文本作为工具结果。模型随后根据收到的建议自行写出最终答案。顾问是咨询师，不是代笔者。

有四件事值得了解：

任何模型，无论来自哪家提供商，都可以担任顾问。在工具配置中使用参数 `model`（模型目录中的任何模型都适用）将其固定，或者让执行器按需选择。使用 `~anthropic/claude-fable-latest` 可始终解析到最新的 Fable 模型。

顾问拥有自己的工具。为其配置 `openrouter:websearch`，它就能在回应之前基于最新信息源给出建议。顾问作为一个拥有独立工具循环的子智能体运行，然后仅返回最终的指导意见。

递归机制已被阻止。顾问不能调用自身。深度标头和自引用检查可以防止无限嵌套，并且每个请求的咨询次数设有上限以控制成本。

顾问具备记忆能力。在后续请求中重放对话记录（包含顾问的工具调用及结果），每位顾问就能重建其先前的咨询内容，从而使后续问题能够基于顾问已给出的建议进行。记忆按顾问独立管理（你的安全审查员和架构师各自维护自己的线索），并且适用于 Chat Completions、Responses 和 Anthropic Messages。详情见完整说明。

命名顾问

对于复杂工作流，你可以配置一组专家列表。每位顾问添加一条 `openrouter:advisor` 条目，各自拥有名称、模型、指令和工具集：

```json { "tools": [ { "type": "openrouter:advisor", "parameters": { "name": "security-reviewer", "model": "anthropic/claude-fable-5", "instructions": "你是一名安全工程师。找出漏洞。" } }, { "type": "openrouter:advisor", "parameters": { "name": "architect", "model": "openai/gpt-5.5", "instructions": "你是一名系统架构师。优先考虑简洁性和可扩展性。" } } ] } ```

执行器会为每位顾问看到一个独立的工具，并可根据任务仅通过提示词调用合适的那个。认证流程审查会路由到 Claude Fable 并启用安全角色；架构问题则发送给 GPT-5.5。名称可使用字母、数字、空格、下划线和连字符（例如“Lead Architect”可用），且必须在所有条目中唯一。某个条目可以省略名称，使其作为默认顾问。

建议也可以流式输出。在 advisor 条目中设置 `"stream": true`，你就可以在 advisor 撰写时增量地接收建议。在 Responses API 中，这意味着在建议传输过程中会出现 `response.outputtext.delta` 事件；完成的输出项仍然包含完整文本，因此忽略 delta 的消费者看不出任何区别。（Chat Completions 会忽略该标志，而 Messages-API 的流式支持将很快跟进。）

这与其他 advisor 工具的比较

一些提供商在其自有 API 中提供了类似的 advisor 概念，但这局限于它们自己的模型家族：执行者和 advisor 都必须来自同一供应商，通常有固定的组合矩阵，有时还需要经过测试阶段。OpenRouter 的 advisor 消除了这些限制，并在此基础上增加了几个功能：

双方面均可使用任意模型、任意提供商。执行者和 advisor 都可以是目录中数百个模型中的任意一个：一个廉价的开源权重执行者向前沿模型咨询，一个 Gemini 执行者向 Claude 咨询，或者一个 Claude 执行者从其自有模型家族之外向 GPT-5.5 寻求第二意见。

一个命名 advisor 列表。在单个请求中配置多个专家，每个专家拥有自己的模型、指令和工具集，并让执行者将每个问题路由到合适的专家。单一供应商版本只提供一个未命名的 advisor。

拥有自己工具的 advisor。将 `openrouter:websearch` 交给一个 advisor，它会在回答前基于最新来源来提供建议。

适用于多种 API 格式，无需测试阶段。同一工具可通过 Chat Completions、Responses 和 Anthropic Messages 工作（三者均具有跨请求记忆），并且已普遍可用。无需 beta 头文件，无需请求账户团队访问权限。

如果你已经通过我们的兼容 API 接口使用某个提供商的本地 advisor，切换到 `openrouter:advisor` 即可打开完整目录，无需更改请求的其他部分。

计费

Advisor 的 token 按照 advisor 模型的费率计费，与执行者分开。如果你的执行者是 GPT-4o Mini（每百万 token $0.15/$0.60），而 advisor 是 Claude Fable 5（每百万 token $10/$50），则每个模型的 token 按各自价格收费。两者都会显示在你的活动页面上。

开始使用

在你的 tools 数组中加入一行：

{ "type": "openrouter:advisor", "parameters": { "model": "anthropic/claude-fable-5" } } 模型决定何时使用它。大多数请求不会触发咨询；那些触发的将会因此变得更好。请阅读完整文档以了解参数、命名 advisor、子智能体工具等更多信息。

智能体产品更新

OpenRouter：Announcements（RSS）

精选75