智能体表面的演进:使用 Claude Managed Agents 构建
Claude Managed Agents 把代理部署的复杂基础设施打包成了 API,让团队从原型到上线只需几天而不是几个月,尤其凭证隔离和延迟优化对生产环境很关键,想部署可靠代理的团队可以认真看看。
Anthropic 推出 Claude Managed Agents,一套可组合 API 套件,用于构建和部署生产级智能体。该产品从早期简单 API 演进至 Claude Agent SDK,再到将智能体调度层与代码执行沙箱解耦的 Managed Agents。通过只追加日志的会话机制,Managed Agents 解决了托管伸缩、会话持久化、文件系统管理、执行隔离、凭证安全与可观测性等生产部署挑战。团队借助该方案可在数天内完成从原型到生产环境的转化,无需自建基础设施。
智能体界面的演进:使用 Claude Managed Agents 进行构建
随着模型智能与智能体框架的持续演进,Claude Managed Agents 让团队能够在生产环境中可靠地大规模构建和部署智能体。以下是团队使用它的原因和方式。
类别:智能体 产品:Claude 平台 日期:2026 年 6 月 10 日 阅读时间:5 分钟
分享 复制链接 https://claude.com/blog/building-with-claude-managed-agents
将一个智能体投入生产,需要的不仅仅是一个好的提示词。智能体需要一个地方来运行它编写的代码、访问你数据的凭据、可观测的会话,以及随使用量扩展的基础设施。在 Applied AI 团队,我们工作在产品、研究和基于 Claude 构建的客户之间的交汇点——我们反复看到同样的模式:基础设施是将原型与生产级智能体区分开来的关键。团队常常将开发周期浪费在安全、状态管理、权限分配和框架调优上。
Claude Managed Agents 是我们用于构建和部署生产级智能体的一套可组合 API,它将针对性能调优的智能体框架与生产基础设施配对,使团队能够在几天内(而非几个月内)从原型走向发布。在这篇文章中,我们将介绍 Anthropic 智能体构建模块的演进、我们为什么构建 Claude Managed Agents,以及团队如今如何在实际生产中使用它。
智能体架构的演进
当我们于 2023 年向开发者开放 Claude 时,API 设计得刻意简单:输入 token,输出 token。你发送一个提示词,Claude 返回一个补全结果,而你则自行构建框架和底层基础设施。
多年来,API 逐渐变得更加丰富,但其底层契约从未改变:一次请求,一次模型回合,由你的应用程序决定下一步做什么。在很长一段时间里,这就足够了。总结文档、分类支持工单、重写一段文本——这类任务恰好适合单次回合完成。
然而,随着时间的推移,人们希望交给 Claude 的任务不再局限于单次回合。他们希望 Claude 能从头到尾完成一项任务,查询信息,据此采取行动,观察变化,然后决定下一步做什么。他们还希望 Claude 能在其工作所依赖的系统中运行,比如代码库、内部维基或工单系统。
使用 API,将 Claude 变成智能体意味着要构建自己的循环:询问模型要做什么,运行工具,将结果反馈回去,然后重复。你需要负责构建和部署智能体框架,随着模型的发展,这个框架可能需要进行调优。对于需要完全定制的智能体来说,这种方法是有意义的。对于更可预测且不太复杂的智能体工作负载,随着模型和产品的发展而优化工具框架变得繁琐。
Claude Code 是我们在 2025 年推出的智能体编码工具,它让 Claude 能够直接与你的代码库交互,其中包含了我们自己版本的该工具框架:循环、工具执行、子智能体、上下文管理以及使其成为高效智能体的丰富能力。开发者自然希望在自己的跨领域智能体中也拥有类似的工具框架机制。
为了让团队能够在 Claude Code 工具框架之上构建智能体,我们发布了 Claude Agent SDK。Claude Agent SDK 为开发者提供了工具,让他们能够在运行 Claude Code 的同一机制上构建自己的智能体,而无需维护自行开发的循环。对许多团队来说,这时智能体才变得实用:该工具框架已经针对 Claude 进行了调优,包含了基础设施原语,并且随着 Claude Code 的改进而不断改进。
不过,即使有了工具框架,在生产环境部署智能体仍可能面临诸多挑战,原因如下:
托管与扩展。智能体在哪里运行?一个进程在多小时任务中能存活多久?当使用量增长时,什么来扩展它?
会话管理。智能体的历史记录和进度保存在哪里?一次运行能否在中断后无缝恢复?你能否返回并检查之前会话中发生了什么?
文件系统管理。做实际工作意味着产生工件:编辑代码、写入文件、构建输出。智能体从哪里获得一个工作空间来操作?运行之间该工作空间会发生什么?
执行隔离。Claude 编写的代码必须在某处执行。如果出错,影响范围有多大?在生产环境中,你实际上会信任什么样的边界?
凭据。智能体需要访问你的系统。它如何在不向自己生成的代码暴露专有信息的情况下获得这种访问权限?
可观测性。当一个智能体自主工作一小时并做出了令人惊讶的事情时,你能否重建它采取的每一步?
借助 Agent SDK,上述生产基础设施的许多元素都通过 Claude Code 的机制提供。智能体拥有一个真实的文件系统进行工作,会话状态持久化在本地或外部存储上,可观测性则通过 OpenTelemetry 导出到你已运行的任何监控栈中。
然而,随着团队越来越多地构建从本地开发转移到生产环境的智能体,他们需要一种方法以可管理的基础设施进行大规模部署。随着模型及其配套框架变得更加先进——运行时间更长、执行更多代码、接触更多系统、采取更多操作——扩展、安全性和沙箱隔离也变得更加具有挑战性。
其中几个障碍源于一种常见的架构选择:智能体框架通常与其工作的文件系统运行在同一个容器内。容器必须先启动(付出启动成本)Claude 才能开始思考,智能体及其代码执行紧邻你的凭证,而当容器终止时,运行也随之终止。
Managed Agents 通过将大脑与双手解耦来解决这些问题。调用 Claude 的框架与代码执行的沙箱分开运行,而会话——一个包含每次模型调用、工具调用和结果的仅追加日志——将两者连接起来。Claude 可以在任何容器存在之前就开始推理,沙箱远离你的凭证,且整个运行过程可随时从其会话中重建。
何时以及为何使用 Claude Managed Agents
使用 Managed Agents 进行构建时,用户定义任务、工具和护栏,Anthropic 在我们的基础设施上运行智能体,并处理底层的智能体循环:如何为智能体提供调用工具的执行环境、出现故障时如何恢复、多智能体编排等。
当框架不随模型智能一同演进时,智能体就会出现问题。在 Claude Sonnet 4.5 上,智能体在接近上下文窗口末尾时会匆忙完成,缩短工作而非利用剩余空间——这种模式被称为“上下文焦虑”。我们的解决方案是在框架中添加上下文重置,内置了一个假设:Claude 在接近极限时需要帮助保持连贯性。但这个假设没能延续到下一个模型。在 Claude Opus 4.5 上,该行为消失了,而我们添加的重置变成了纯粹的额外开销。
对大多数组织来说,维护一个编排框架(harness)是一种无法让其产品实现差异化的额外开销。编排框架必须针对特定的模型行为进行调整;诸如压缩(compaction)、工具执行和缓存等基础功能在 Claude 上的工作方式与其他模型不同。借助 Claude 托管智能体(Managed Agents),编排框架会与模型同步演进,让团队能够专注于真正能让其智能体实现差异化的部分:上下文管理和领域专业知识。
为了让开发者能够配置构建高效智能体所需的上下文和工具,托管智能体围绕三种核心资源构建:智能体(agents)、环境(environments)和会话(sessions)。智能体是一种配置:一个模型、一组提示词、一组工具,以及围绕它们的护栏(guardrails)。环境是智能体运行时的执行上下文:沙箱容器、其网络规则以及其中预装的软件包——这些环境可以托管在我们的云上,也可以部署在您控制的基础设施上。每次运行就是一个会话,它会将一个智能体与一个环境配对,并获取自己独立的沙箱实例。会话会在服务端持久化保存完整的事件历史、沙箱状态和输出结果,因此长时间运行的工作可以暂停、干净地恢复,并在事后逐步追溯。借助托管智能体,您可以一次定义好智能体和环境,然后随着工作负载的增长,针对同一配置运行多个会话。
在托管智能体上构建生产级、可规模化应用
在 Applied AI 团队,我们看到智能体从原型走向生产——无论是在 Anthropic 内部,还是在我们的客户系统中,覆盖了编码、金融、支持、法律以及十多个其他领域。这让我们清晰地看到了演示级智能体与生产就绪级智能体之间的区别,以及团队常常在哪些地方陷入困境。
下面,我们分享在 Claude 托管智能体这样的托管服务上进行构建的最常见原因:
1. 凭证被隔离在沙箱之外。当所有内容都在一个容器内运行时,Claude 生成的代码与你的凭证紧邻,因此提示注入可能诱使模型读取自身环境,从而泄露令牌。我们可以通过在同一个容器内设置强大的防护栏来防范此类风险,但通过解耦架构,将凭证完全隔离在沙箱之外,则能提供一种更为安全的方式。用于 MCP、CLI 和 GitHub 仓库等工具的令牌存放在独立的保管库中,由代理按需获取并解密。Managed Agents 提供了开箱即用的 Vaults 来处理凭证,因此你无需自行运行密钥存储、无需在每次调用时传输令牌,也无需追踪智能体代表哪个最终用户执行操作。Vault 中的凭证在存储前会经过信封加密保护,检索时需要携带签名的请求令牌进行验证。
2. 消除沙箱开销,降低延迟。延迟是许多企业团队最关注的指标之一,因为用户在等待 Claude 响应时能敏锐地感知到延迟。如果没有 Managed Agents 架构,每次会话都必须启动一个容器,即使智能体仅需思考而从不运行工具也是如此。这段启动时间被白白浪费,用户会感受到首响应之前的延迟。而在 Managed Agents 中,Claude 立即开始推理,同时环境并行启动;对于从不运行工具的会话,则完全跳过容器。这意味着用户无需等待容器启动即可看到第一个 token,而当智能体需要运行某些操作时,环境已经准备就绪。在我们的测试中,这在中位数情况下(p50)将首 token 时间缩短了约 60%,在最慢的情况下(p95)缩短了超过 90%。
3. 可靠、持久的会话,支持会话管理、可观测性与记忆。Managed Agents 不再采用请求/响应模式,而是以事件为思考单元。一个会话是一个持续进行的事件流:每一次模型调用、工具调用及其结果,都会被追加到一条日志中,该日志独立于运行智能体的进程之外。借助这种架构,你可以在智能体工作的同时,随着事件实时流入而获得最新状态,并且无需管理数据库或检查点,就能在之后恢复任意会话。除非你删除该会话,否则交互之间的历史记录会被保留;当会话进入空闲状态时,其容器会被创建检查点,这样你就能从暂停处干净地继续运行。由于整个运行过程本身就是一个事件记录,可观测性和记忆也随之而来:Claude Developer Console 提供了原生的可视化时间线视图,用于查看你的智能体会话,并提供调试体验,让你可以深入检查任何会话记录。Managed Agents 还包含 Memory 和 Dreaming 等功能,这些功能同样利用了这种会话持久性。Dreaming 是一个定时运行的进程,它会审查你的智能体会话和记忆存储,提取模式并整理记忆,从而使你的智能体随时间不断改进。Dreaming 在会话之间对记忆进行精炼,通过读取持久的会话日志来从重复出现的错误和用户偏好中学习。
4. 在 Anthropic 管理或自托管云容器之间灵活选择。默认情况下,使用 Managed Agents,你可以将编排和工具执行都委托给 Anthropic 管理的云容器。这使得托管和扩展变得简单易行,从而更快地走向生产环境。由于在 Managed Agents 中“大脑”与“双手”是解耦的,“双手”可以位于任何地方,包括你的虚拟私有云(VPC)内部。因此,我们也为希望控制工具执行的团队提供自托管沙箱,这样智能体的代码、文件系统和网络出站流量永远不会离开其环境。我们还提供 MCP 隧道,让你可以将 Claude 连接到在你私有网络内运行的模型上下文协议(MCP)服务器。因此,自托管沙箱控制智能体代码在哪里执行,而 MCP 隧道则控制 Anthropic 如何访问你网络中的 MCP 服务器,使你能够精确控制哪些内容保留在你的边界之内。
除了这些功能之外,还提供了额外能力,包括让智能体根据评价标准对自己的工作进行评分的“结果”、多智能体编排、权限策略以及 Webhook。更多详情请参见此处。
客户如今如何使用受管智能体(Managed Agents)
各行各业的客户已经在生产环境中使用 Claude 受管智能体(Managed Agents)交付智能体。以下是一些示例:
Notion 将其自定义智能体运行在受管智能体之上:团队直接从任务看板将工作分配给 Claude,Claude 会提取每个任务相关的文档、会议记录和关联数据,而完成的代码、演示文稿和站点则会回到工作区以供审核。数十个任务并行运行,他们的团队提到,一个早期原型将大约十二小时的工作压缩到了二十分钟。
Rakuten 使用受管智能体在产品、销售、营销和财务等部门交付了专业智能体,每个智能体大约一周内即可上线。
Sentry 将其 Seer 调试智能体与一个 Claude 智能体配对,由后者编写补丁并提交 PR,整个工作由一名工程师在数周而非数月内完成。
Asana 构建了能在项目内接收任务的 AI 同事,Atlassian 则将开发者智能体集成到了 Jira 工作流中。
开始使用 Claude 受管智能体(Managed Agents)
我们构建受管智能体(Managed Agents)是为了让您能通过 Claude Code 和 platform.claude.com 上的 Claude 开发者控制台尽可能轻松地快速创建智能体。例如,控制台的快速入门功能允许您从智能体模板开始,或用自然语言描述一个智能体,然后将其转化为一个可以在一分钟内完成安全配置和部署的生产级智能体。
在 Claude Code 中,`/claude-api` 技能默认提供,并为 Claude 提供详细且最新的参考素材,用于在 Claude 受管智能体上构建应用。我们强烈建议您利用它来获取设置受管智能体应用的最佳实践。请运行 `/claude-api managed-agents-onboard` 开始,通过交互式引导从头设置一个新的受管智能体。
构建受管智能体的未来
随着团队分享他们使用受管智能体构建的内容,我们注意到他们以往花在生产基础设施上的时间,现在被用到能让其智能体与众不同的地方:管理上下文和为用户体验量身定制。现在,当新模型发布时,您只需更新智能体以使用它,重新运行评估,然后交付改进,而无需改动底层架构。
我们很期待看到您的成果。
开始使用 Claude Managed Agents。
本文由 Anthropic 应用 AI 团队的技术成员 Gagan Bhat 和 Isabella He 撰写。他们感谢 Hema Thanki、Jess Yan 和 Molly Vorwerck 的贡献。
FAQ
相关文章
探索更多产品新闻以及为使用 Claude 构建的团队提供的最佳实践。
AI 智能体的零信任
使用 Claude 进行计算机和浏览器操作的最佳实践
为企业构建 AI 智能体
Claude API 技能现已集成至 CodeRabbit、JetBrains、Resolve AI 和 Warp
利用 Claude 改变您组织的运作方式
获取开发者新闻通讯
产品更新、操作指南、社区亮点等。每月发送至您的邮箱。