Advisor:让任何模型在生成过程中求助更强的模型
让 GPT-4o Mini 在关键时刻请教 Claude,用 1/10 的成本得到相近质量,这种跨模型顾问把“模型路由”做成了开箱即用的工具,做 agent 的值得试。
OpenRouter 推出 advisor 服务器工具,允许快速、便宜的模型在生成过程中向更强模型咨询。用户可用 GPT-4o Mini 处理常规任务,在关键环节调用 Claude Fable 进行更高质量的推理。
将 `openrouter:advisor` 添加到你的 tools 数组中,你的模型便能在生成过程中向更强的模型求助。当执行模型遇到艰难决策、陷入困境、或在完成前希望做一次合理性检查时,它会带着提示词调用顾问。顾问进行思考,将指导意见作为工具结果返回,执行模型则带着更好的信息继续运行。
`openrouter:advisor`
两个角色都是开放的:OpenRouter 上的任意模型都可以作为执行模型,任意提供商的任意模型都可以作为顾问。让 Gemini 执行模型去咨询 Claude,或者让 GPT 执行模型去咨询 DeepSeek。你可以自由搭配组合。
在聊天室中试用,或阅读文档获取完整 API 参考。
```json { "model": "openai/gpt-4o-mini", "messages": [{ "role": "user", "content": "为分布式 API 网关设计一个速率限制器。" }], "tools": [ { "type": "openrouter:advisor", "parameters": { "model": "anthropic/claude-fable-5" } } ] } ```
67倍价格差距,选择性咨询
Claude Fable 5 每百万输入 token 花费 10 美元。GPT-4o Mini 每百万输入 token 花费 0.15 美元。这就是 67 倍的差距。
大多数请求不需要前沿级别的推理。中档模型可以毫无问题地处理大部分工作负载。但涉及架构决策、模糊边缘情况或多步骤推理链的那 10-20% 场景,正是较便宜模型容易出问题的地方。
顾问工具有选择性地弥补了这一差距。你的快速模型主导运行。当它遇到真正困难的问题时,它会请求帮助。你只需在为需要前沿思考的时刻支付前沿价格。
在一个包含 50 次工具调用的智能体编码会话中,可能只有 2-3 次是顾问咨询。其余调用都按照 mini 模型的价格运行。你在降低每次会话成本的同时,保持了高质量的上限。
服务器端执行,一次工具调用
该顾问在生成过程中于服务器端运行。你的模型像调用其他工具一样调用它:传入描述所需帮助的提示词,取回顾问的文本作为工具结果。模型随后根据建议自行撰写最终答案。顾问是咨询师,而非代笔人。
提示词
四件值得知道的事:
任何模型,无论来自哪个提供商,都可以担任顾问。在工具配置中使用 parameters.model 固定它(模型目录中的任何模型都可用),或让执行器每次调用时自行选择。使用 ~anthropic/claude-fable-latest 始终解析为最新的 Fable。
任何模型,无论来自哪个提供商,都可以担任顾问。在工具配置中使用 parameters.model 固定它(模型目录中的任何模型都可用),或让执行器每次调用时自行选择。使用 ~anthropic/claude-fable-latest 始终解析为最新的 Fable。
parameters.model
~anthropic/claude-fable-latest
顾问拥有自己的工具。为其提供 openrouter:web_search,它将在响应前基于最新来源提供建议。它作为一个带有自身工具循环的子智能体运行,然后仅返回最终指导。
顾问拥有自己的工具。为其提供 openrouter:web_search,它将在响应前基于最新来源提供建议。它作为一个带有自身工具循环的子智能体运行,然后仅返回最终指导。
openrouter:web_search
递归被阻止。顾问不能调用自身。深度标头和自引用检查防止无限嵌套,且每次请求的咨询次数设有上限以控制成本。
递归被阻止。顾问不能调用自身。深度标头和自引用检查防止无限嵌套,且每次请求的咨询次数设有上限以控制成本。
顾问会记住。在后续请求中重放对话记录(包含顾问工具调用及其结果),每个顾问会重建其先前的咨询,因此后续问题可基于顾问已说过的内容。记忆是按顾问独立的(你的安全审查员和架构师各自拥有自己的线程),并适用于 Chat Completions、Responses 和 Anthropic Messages 格式。完整详情。
顾问具备记忆功能。在后续请求中重放对话记录(包括顾问的工具调用及其结果),每位顾问即可重构其先前的咨询内容,因此后续问题可基于顾问已给出的答复进行构建。记忆机制是针对每位顾问独立运作的(你的安全审查员和架构师各自保留自己的对话线索),并且适用于 Chat Completions、Responses 以及 Anthropic Messages 接口。此为完整详情。
命名顾问
对于复杂工作流,你可以配置一个专家名册。每配置一位顾问,就在 `openrouter:advisor` 中添加一个条目,每个条目包含其自己的名称、模型、指令和工具集:
```json { "tools": [ { "type": "openrouter:advisor", "parameters": { "name": "security-reviewer", "model": "anthropic/claude-fable-5", "instructions": "You are a security engineer. Find vulnerabilities." } }, { "type": "openrouter:advisor", "parameters": { "name": "architect", "model": "openai/gpt-5.5", "instructions": "You are a systems architect. Prioritize simplicity and scalability." } } ] } ```
执行器会为每位顾问看到一个独立的工具,只需输入一段提示词即可调用适合当前任务的工具。身份验证流程审查会路由到使用安全人员角色的 Claude Fable;架构类问题则发送给 GPT-5.5。名称可以使用字母、数字、空格、下划线和短横线(例如“Lead Architect”有效),并且所有条目中的名称必须唯一。某个条目可以省略名称,从而作为默认顾问使用。
提示词
名称
顾问的回复也可以流式输出。在顾问条目中设置 `"stream": true`,即可在顾问撰写回复时逐步获取其建议。在 Responses API 中,这意味着在建议输出过程中会触发 `response.output_text.delta` 事件;完成后的输出项仍然包含完整文本,因此忽略增量事件的消费者不会察觉到任何差异。(Chat Completions 会忽略该标记,Messages-API 的流式支持将作为快速跟进功能提供。)
`"stream": true`
`response.output_text.delta`
此功能与其他顾问工具的比较
一些提供商在其自有API中提供了类似的顾问概念,但仅限于其模型家族内部:执行者和顾问都必须来自同一家供应商,通常使用固定的配对矩阵,有时还处于测试版限制之下。OpenRouter 的顾问消除了这些限制,并在此基础之上增加了一些功能:
任何模型、任何提供商,双方皆可。执行者和顾问都可以是目录中数百个模型中的任意一个:一个廉价的开源权重执行者向前沿模型咨询,一个 Gemini 执行者向 Claude 咨询,或者一个 Claude 执行者从其自家模型家族之外从 GPT-5.5 获取第二意见。
一份具名顾问名册。在单次请求中配置多个专家,每个专家拥有自己的模型、指令和工具集,并让执行者将每个问题路由到正确的专家。单一供应商版本只提供一个未命名的顾问。
配备自有工具的顾问。向顾问提供 `openrouter:web_search`,它便会在响应之前基于实时来源提供建议。
openrouter:web_search
跨API格式均可使用,无测试版限制。同一工具可经由 Chat Completions、Responses 和 Anthropic Messages 工作(三者均支持跨请求记忆),且已全面可用。无需测试版标头,无需账户团队访问请求。
如果您已通过我们的兼容API皮肤之一使用供应商原生顾问,切换到 `openrouter:advisor` 即可解锁完整目录,而无需更改请求的其余部分。
openrouter:advisor
计费
顾问 token 按顾问模型的费率计费,与执行者分开。如果您的执行者是 GPT-4o Mini($0.15/$0.60 per M tokens),而顾问是 Claude Fable 5($10/$50 per M tokens),则各模型的 token 按各自价格计费。两者都会显示在您的活动页面上。
开始使用
在您的 tools 数组中加入一行:
{ "type": "openrouter:advisor", "parameters": { "model": "anthropic/claude-fable-5" } }
{ "type": "openrouter:advisor", "parameters": { "model": "anthropic/claude-fable-5" } }
模型自行决定何时使用它。大多数请求不会触发咨询;而那些触发了的请求则会因此变得更好。阅读完整文档以了解参数、具名顾问、子智能体工具等更多信息。