OpenRouter 推出 Advisor 工具:让低成本模型可随时调用强模型增强生成
OpenRouter 开放了跨模型顾问调用,让便宜模型在关键节点求助昂贵模型,这会让 agent 开发重心从选一个万能模型转向编排一组模型,值得所有做 agent 架构的人试一下。
OpenRouter 发布 advisor 服务器工具,允许一个快速、便宜的模型在生成过程中咨询一个更强大的模型。具体而言,可用 GPT-4o Mini 处理日常例行工作,在关键时刻调用 Claude Fable 解决真正重要的问题,从而实现成本和质量的动态平衡。
Advisor: Give Any Model a Lifeline to a Smarter One — OpenRouter Blog
Advisor: Give Any Model a Lifeline to a Smarter One
Kenny Rogers · 6/10/2026
此页面内容 67倍价格差距,按需咨询 服务器端执行,一次工具调用 命名顾问 与其他顾问工具的比较 计费 开始使用
将 `openrouter:advisor` 添加到你的工具数组中,你的模型便可以在生成过程中向更强模型求助。当执行模型遇到困难决策、陷入停滞,或想在完成前获得一次正确性检查时,它会携带提示词调用顾问。顾问思考后,将指引作为工具结果返回,执行模型则利用更优信息继续推进。
两个角色都是开放的:OpenRouter 上的任何模型都可以作为执行模型,任何提供商的任何模型都可以作为顾问模型。你可以让 Gemini 执行模型咨询 Claude,或让 GPT 执行模型咨询 DeepSeek。你来选择配对组合。
在聊天室中试用,或阅读文档获取完整 API 参考。
```json { "model": "openai/gpt-4o-mini", "messages": [{ "role": "user", "content": "Design a rate limiter for a distributed API gateway." }], "tools": [ { "type": "openrouter:advisor", "parameters": { "model": "anthropic/claude-fable-5" } } ] } ```
67 倍价格差距,按需咨询
Claude Fable 5 每百万输入 token 收费 10 美元。GPT-4o Mini 每百万输入 token 收费 0.15 美元。两者相差 67 倍。
大多数请求并不需要前沿级别的推理。中档模型可以毫无问题地处理工作量的主体。但其中 10-20% 涉及架构决策、模糊边界情况或多步推理链的请求,正是较便宜模型容易出错的地方。
顾问工具有选择性地填补了这一差距。你的快速模型主导运行。当它遇到真正困难的问题时,会调用帮助。你只需为那些需要前沿思维的时刻支付前沿模型价格。
在一个包含 50 次工具调用的智能体编码会话中,可能只有 2-3 次是顾问咨询。其余调用都按迷你模型价格运行。这样你既将每次会话的成本降了下来,同时又保持了较高的质量上限。
服务器端执行,一次工具调用
顾问在生成过程中于服务器端执行。你的模型像调用其他工具一样调用它:传入一条提示词,描述它需要什么帮助,然后收到顾问的文本作为工具结果。模型随后根据收到的建议自行写出最终答案。顾问是咨询师,不是代笔者。
有四件事值得了解:
任何模型,无论来自哪家提供商,都可以担任顾问。在工具配置中使用参数 `model`(模型目录中的任何模型都适用)将其固定,或者让执行器按需选择。使用 `~anthropic/claude-fable-latest` 可始终解析到最新的 Fable 模型。
顾问拥有自己的工具。为其配置 `openrouter:websearch`,它就能在回应之前基于最新信息源给出建议。顾问作为一个拥有独立工具循环的子智能体运行,然后仅返回最终的指导意见。
递归机制已被阻止。顾问不能调用自身。深度标头和自引用检查可以防止无限嵌套,并且每个请求的咨询次数设有上限以控制成本。
顾问具备记忆能力。在后续请求中重放对话记录(包含顾问的工具调用及结果),每位顾问就能重建其先前的咨询内容,从而使后续问题能够基于顾问已给出的建议进行。记忆按顾问独立管理(你的安全审查员和架构师各自维护自己的线索),并且适用于 Chat Completions、Responses 和 Anthropic Messages。详情见完整说明。
命名顾问
对于复杂工作流,你可以配置一组专家列表。每位顾问添加一条 `openrouter:advisor` 条目,各自拥有名称、模型、指令和工具集:
```json { "tools": [ { "type": "openrouter:advisor", "parameters": { "name": "security-reviewer", "model": "anthropic/claude-fable-5", "instructions": "你是一名安全工程师。找出漏洞。" } }, { "type": "openrouter:advisor", "parameters": { "name": "architect", "model": "openai/gpt-5.5", "instructions": "你是一名系统架构师。优先考虑简洁性和可扩展性。" } } ] } ```
执行器会为每位顾问看到一个独立的工具,并可根据任务仅通过提示词调用合适的那个。认证流程审查会路由到 Claude Fable 并启用安全角色;架构问题则发送给 GPT-5.5。名称可使用字母、数字、空格、下划线和连字符(例如“Lead Architect”可用),且必须在所有条目中唯一。某个条目可以省略名称,使其作为默认顾问。
建议也可以流式输出。在 advisor 条目中设置 `"stream": true`,你就可以在 advisor 撰写时增量地接收建议。在 Responses API 中,这意味着在建议传输过程中会出现 `response.outputtext.delta` 事件;完成的输出项仍然包含完整文本,因此忽略 delta 的消费者看不出任何区别。(Chat Completions 会忽略该标志,而 Messages-API 的流式支持将很快跟进。)
这与其他 advisor 工具的比较
一些提供商在其自有 API 中提供了类似的 advisor 概念,但这局限于它们自己的模型家族:执行者和 advisor 都必须来自同一供应商,通常有固定的组合矩阵,有时还需要经过测试阶段。OpenRouter 的 advisor 消除了这些限制,并在此基础上增加了几个功能:
双方面均可使用任意模型、任意提供商。执行者和 advisor 都可以是目录中数百个模型中的任意一个:一个廉价的开源权重执行者向前沿模型咨询,一个 Gemini 执行者向 Claude 咨询,或者一个 Claude 执行者从其自有模型家族之外向 GPT-5.5 寻求第二意见。
一个命名 advisor 列表。在单个请求中配置多个专家,每个专家拥有自己的模型、指令和工具集,并让执行者将每个问题路由到合适的专家。单一供应商版本只提供一个未命名的 advisor。
拥有自己工具的 advisor。将 `openrouter:websearch` 交给一个 advisor,它会在回答前基于最新来源来提供建议。
适用于多种 API 格式,无需测试阶段。同一工具可通过 Chat Completions、Responses 和 Anthropic Messages 工作(三者均具有跨请求记忆),并且已普遍可用。无需 beta 头文件,无需请求账户团队访问权限。
如果你已经通过我们的兼容 API 接口使用某个提供商的本地 advisor,切换到 `openrouter:advisor` 即可打开完整目录,无需更改请求的其他部分。
计费
Advisor 的 token 按照 advisor 模型的费率计费,与执行者分开。如果你的执行者是 GPT-4o Mini(每百万 token $0.15/$0.60),而 advisor 是 Claude Fable 5(每百万 token $10/$50),则每个模型的 token 按各自价格收费。两者都会显示在你的活动页面上。
开始使用
在你的 tools 数组中加入一行:
{ "type": "openrouter:advisor", "parameters": { "model": "anthropic/claude-fable-5" } } 模型决定何时使用它。大多数请求不会触发咨询;那些触发的将会因此变得更好。请阅读完整文档以了解参数、命名 advisor、子智能体工具等更多信息。