Advisor：让任何模型在生成过程中求助更强的模型

2026-06-11 02:00·5天前

精选理由

让 GPT-4o Mini 在关键时刻请教 Claude，用 1/10 的成本得到相近质量，这种跨模型顾问把“模型路由”做成了开箱即用的工具，做 agent 的值得试。

AI 摘要

OpenRouter 推出 advisor 服务器工具，允许快速、便宜的模型在生成过程中向更强模型咨询。用户可用 GPT-4o Mini 处理常规任务，在关键环节调用 Claude Fable 进行更高质量的推理。

AI 翻译 · 中文

将 `openrouter:advisor` 添加到你的 tools 数组中，你的模型便能在生成过程中向更强的模型求助。当执行模型遇到艰难决策、陷入困境、或在完成前希望做一次合理性检查时，它会带着提示词调用顾问。顾问进行思考，将指导意见作为工具结果返回，执行模型则带着更好的信息继续运行。

`openrouter:advisor`

两个角色都是开放的：OpenRouter 上的任意模型都可以作为执行模型，任意提供商的任意模型都可以作为顾问。让 Gemini 执行模型去咨询 Claude，或者让 GPT 执行模型去咨询 DeepSeek。你可以自由搭配组合。

在聊天室中试用，或阅读文档获取完整 API 参考。

```json { "model": "openai/gpt-4o-mini", "messages": [{ "role": "user", "content": "为分布式 API 网关设计一个速率限制器。" }], "tools": [ { "type": "openrouter:advisor", "parameters": { "model": "anthropic/claude-fable-5" } } ] } ```

67倍价格差距，选择性咨询

Claude Fable 5 每百万输入 token 花费 10 美元。GPT-4o Mini 每百万输入 token 花费 0.15 美元。这就是 67 倍的差距。

大多数请求不需要前沿级别的推理。中档模型可以毫无问题地处理大部分工作负载。但涉及架构决策、模糊边缘情况或多步骤推理链的那 10-20% 场景，正是较便宜模型容易出问题的地方。

顾问工具有选择性地弥补了这一差距。你的快速模型主导运行。当它遇到真正困难的问题时，它会请求帮助。你只需在为需要前沿思考的时刻支付前沿价格。

在一个包含 50 次工具调用的智能体编码会话中，可能只有 2-3 次是顾问咨询。其余调用都按照 mini 模型的价格运行。你在降低每次会话成本的同时，保持了高质量的上限。

服务器端执行，一次工具调用

该顾问在生成过程中于服务器端运行。你的模型像调用其他工具一样调用它：传入描述所需帮助的提示词，取回顾问的文本作为工具结果。模型随后根据建议自行撰写最终答案。顾问是咨询师，而非代笔人。

提示词

四件值得知道的事：

任何模型，无论来自哪个提供商，都可以担任顾问。在工具配置中使用 parameters.model 固定它（模型目录中的任何模型都可用），或让执行器每次调用时自行选择。使用 ~anthropic/claude-fable-latest 始终解析为最新的 Fable。

parameters.model

~anthropic/claude-fable-latest

顾问拥有自己的工具。为其提供 openrouter:web_search，它将在响应前基于最新来源提供建议。它作为一个带有自身工具循环的子智能体运行，然后仅返回最终指导。

openrouter:web_search

递归被阻止。顾问不能调用自身。深度标头和自引用检查防止无限嵌套，且每次请求的咨询次数设有上限以控制成本。

顾问会记住。在后续请求中重放对话记录（包含顾问工具调用及其结果），每个顾问会重建其先前的咨询，因此后续问题可基于顾问已说过的内容。记忆是按顾问独立的（你的安全审查员和架构师各自拥有自己的线程），并适用于 Chat Completions、Responses 和 Anthropic Messages 格式。完整详情。

顾问具备记忆功能。在后续请求中重放对话记录（包括顾问的工具调用及其结果），每位顾问即可重构其先前的咨询内容，因此后续问题可基于顾问已给出的答复进行构建。记忆机制是针对每位顾问独立运作的（你的安全审查员和架构师各自保留自己的对话线索），并且适用于 Chat Completions、Responses 以及 Anthropic Messages 接口。此为完整详情。

命名顾问

对于复杂工作流，你可以配置一个专家名册。每配置一位顾问，就在 `openrouter:advisor` 中添加一个条目，每个条目包含其自己的名称、模型、指令和工具集：

```json { "tools": [ { "type": "openrouter:advisor", "parameters": { "name": "security-reviewer", "model": "anthropic/claude-fable-5", "instructions": "You are a security engineer. Find vulnerabilities." } }, { "type": "openrouter:advisor", "parameters": { "name": "architect", "model": "openai/gpt-5.5", "instructions": "You are a systems architect. Prioritize simplicity and scalability." } } ] } ```

执行器会为每位顾问看到一个独立的工具，只需输入一段提示词即可调用适合当前任务的工具。身份验证流程审查会路由到使用安全人员角色的 Claude Fable；架构类问题则发送给 GPT-5.5。名称可以使用字母、数字、空格、下划线和短横线（例如“Lead Architect”有效），并且所有条目中的名称必须唯一。某个条目可以省略名称，从而作为默认顾问使用。

提示词

名称

顾问的回复也可以流式输出。在顾问条目中设置 `"stream": true`，即可在顾问撰写回复时逐步获取其建议。在 Responses API 中，这意味着在建议输出过程中会触发 `response.output_text.delta` 事件；完成后的输出项仍然包含完整文本，因此忽略增量事件的消费者不会察觉到任何差异。（Chat Completions 会忽略该标记，Messages-API 的流式支持将作为快速跟进功能提供。）

`"stream": true`

`response.output_text.delta`

此功能与其他顾问工具的比较

一些提供商在其自有API中提供了类似的顾问概念，但仅限于其模型家族内部：执行者和顾问都必须来自同一家供应商，通常使用固定的配对矩阵，有时还处于测试版限制之下。OpenRouter 的顾问消除了这些限制，并在此基础之上增加了一些功能：

任何模型、任何提供商，双方皆可。执行者和顾问都可以是目录中数百个模型中的任意一个：一个廉价的开源权重执行者向前沿模型咨询，一个 Gemini 执行者向 Claude 咨询，或者一个 Claude 执行者从其自家模型家族之外从 GPT-5.5 获取第二意见。

一份具名顾问名册。在单次请求中配置多个专家，每个专家拥有自己的模型、指令和工具集，并让执行者将每个问题路由到正确的专家。单一供应商版本只提供一个未命名的顾问。

配备自有工具的顾问。向顾问提供 `openrouter:web_search`，它便会在响应之前基于实时来源提供建议。

openrouter:web_search

跨API格式均可使用，无测试版限制。同一工具可经由 Chat Completions、Responses 和 Anthropic Messages 工作（三者均支持跨请求记忆），且已全面可用。无需测试版标头，无需账户团队访问请求。

如果您已通过我们的兼容API皮肤之一使用供应商原生顾问，切换到 `openrouter:advisor` 即可解锁完整目录，而无需更改请求的其余部分。

openrouter:advisor

计费

顾问 token 按顾问模型的费率计费，与执行者分开。如果您的执行者是 GPT-4o Mini（$0.15/$0.60 per M tokens），而顾问是 Claude Fable 5（$10/$50 per M tokens），则各模型的 token 按各自价格计费。两者都会显示在您的活动页面上。

开始使用

在您的 tools 数组中加入一行：

{ "type": "openrouter:advisor", "parameters": { "model": "anthropic/claude-fable-5" } }

模型自行决定何时使用它。大多数请求不会触发咨询；而那些触发了的请求则会因此变得更好。阅读完整文档以了解参数、具名顾问、子智能体工具等更多信息。

智能体产品更新

OpenRouter：Announcements（RSS）

精选69

Advisor：让任何模型在生成过程中求助更强的模型

2026-06-11 02:00·5天前

精选理由

让 GPT-4o Mini 在关键时刻请教 Claude，用 1/10 的成本得到相近质量，这种跨模型顾问把“模型路由”做成了开箱即用的工具，做 agent 的值得试。

AI 摘要

AI 翻译 · 中文

`openrouter:advisor`

在聊天室中试用，或阅读文档获取完整 API 参考。

67倍价格差距，选择性咨询

Claude Fable 5 每百万输入 token 花费 10 美元。GPT-4o Mini 每百万输入 token 花费 0.15 美元。这就是 67 倍的差距。

服务器端执行，一次工具调用

提示词

四件值得知道的事：

parameters.model

~anthropic/claude-fable-latest

openrouter:web_search

递归被阻止。顾问不能调用自身。深度标头和自引用检查防止无限嵌套，且每次请求的咨询次数设有上限以控制成本。

命名顾问

提示词

名称

`"stream": true`

`response.output_text.delta`

此功能与其他顾问工具的比较

配备自有工具的顾问。向顾问提供 `openrouter:web_search`，它便会在响应之前基于实时来源提供建议。

openrouter:web_search

如果您已通过我们的兼容API皮肤之一使用供应商原生顾问，切换到 `openrouter:advisor` 即可解锁完整目录，而无需更改请求的其余部分。

openrouter:advisor

计费

开始使用

在您的 tools 数组中加入一行：

{ "type": "openrouter:advisor", "parameters": { "model": "anthropic/claude-fable-5" } }

智能体产品更新

阅读原文openrouter.ai