欢迎进入AI治理的AGI时代

2026-06-15 01:43·19小时前·Nathan Lambert

精选理由

美国政府强制叫停Claude 5，不是一次性的监管风波，而是AGI治理新时代的起跑枪。Nathan Lambert的分析撕开了政府、实验室和资本之间的脆弱关系，做AI安全与政策的人必须看的一篇。

AI 摘要

上周五收盘后，美国政府要求Anthropic暂停其最新Claude 5 Mythos/Fable模型的国内外访问权限，理由是存在模型越狱引发的网络安全风险。白宫通过Anthropic最大合作伙伴Amazon获知此事。作者评论称，对任何模型权重的出口禁令都是长期负面政策，且Anthropic过去几年将AI与核武器相提并论的恐惧宣传加速了这一时刻。该事件引发经济不稳定担忧，并暴露了前沿AI公司与政府间的紧张关系。

AI 翻译 · 中文

欢迎来到AI治理的通用人工智能时代

这是一扇单向门，而我们尚未做好准备。

美国行政部门强制要求Anthropic关闭其最新Claude 5 Mythos/Fable系列模型的访问权限——无论是内部还是外部——标志着AI治理新时代的发令枪响起。这是一个定义AI智能体的时代，这些智能体能够有效补充人类工作者，解锁新的工作方式以及应用现有工具的新领域。模型将以极快的速度持续进步，带来更多治理挑战。

前沿领域的不稳定平衡

上周五，就在市场收盘后，美国政府联系了Anthropic，强制要求其暂停向任何外国公民或境外用户提供模型访问权限。在撰写本文时，这一事件仍在持续发酵。Anthropic与政府很可能达成协议以重新发布该模型，但这预示着新型AI治理的混乱信号。白宫得知这一风险的消息来源是Anthropic最大的金融和技术合作伙伴Amazon。

这些动态非常复杂，尽管信息尚不完整，我仅就此事发表一些可能具有持久意义的评论：

对于任何模型权重的出口禁令，都将是美国一项具有持久负面影响的政策。这既适用于开源模型，也适用于闭源模型，尽管开源模型更有可能很快被列入进口禁令名单。

关于Fable模型的越狱漏洞，确实存在合理的网络安全担忧，即使该漏洞非常狭窄。我个人并不认为这应当引发这一系列事件，因为没有模型能完美免疫越狱攻击，而且我们需要为这样一个未来做好准备：在未来几年内，全球每个实体都将能够获得这种能力水平的模型。

Anthropic 在过去几年中持续的危言耸听加速了这一时刻的到来。如果没有那些将 AI 与核武器等相提并论的持续信息传递，我怀疑这种治理方式可能还要再过 6 到 12 个月（按 AI 进步的速度）才会显现。Anthropic 在一定程度上是自食其果。

人们不应该因为我们国家领先的 AI 公司反复遭受潜在的政治攻击而庆祝（是的，我指的就是开源社区里的人）。这在经济上极不稳定，并破坏了美国体系的经济稳定性。足够的不稳定可能导致经济衰退并戳破 AI 泡沫。

白宫禁止该模型的行为过于严厉，并且受到对 Anthropic 强烈的政治偏见影响。政府的要求和目标之间存在深刻的矛盾，因为如果外国公民不能在美国使用前沿 AI 进行开发，那么就不存在本土的 AI 产业。

我不太清楚亚马逊为何需要将所掌握的信息直接提交给白宫，也不清楚这次发布与封禁的前因后果（网上有大量关于发布前讨论的帖子），更不清楚领先科技公司与白宫之间的危机管理通常是如何进行的。这反映出Anthropic与政府互动时存在一些奇怪的动态，可能是对其在政治上被针对的一种反应。无论原因如何，这种动态都是不好的，给Anthropic在此处的参与蒙上了阴影。如果一家私营公司试图控制政府，政府会以更强的力度回击。我不认为Dario真的在参加健康静修（如白宫代表所言），但我确实认为，考虑到电话那头是谁，他接听电话的时间超出了可接受的范围。我很难就这些来回博弈的动态写出任何条理清晰的东西，但它们对于了解事情真相至关重要。

这幅图景非常复杂。它指向一个近期的世界：模型发布将由技术人才匮乏的行政分支根据氛围感来评判，并将发布挡在一系列充满政治判断的技术评估迷雾之后。

这是一个已经内化我们处于AGI时代的政府。他们对此毫无准备，并且觉得必须迅速行动，追回失去的时间。

这是一个在本届政府上台时，我们仍处于 AI 治理的 ChatGPT 时代——即模型仅仅回答问题的阶段——所组建的政府。他们最初的《AI 行动计划》反映了这个时代，指出过去许多安全讨论更多是烟雾弹而非真正的担忧，并且我们迫切需要开源模型来迎头赶上。总体而言，他们在此处的观点和建议对行业来说大多是合理且有用的。

需要记住的是，即便是在这个 ChatGPT 治理时代，AI 公司也常常告诉我们模型存在风险，不能不加谨慎地发布。许多头部实验室的发言人在语言升级上没有为自己留出足够的空间，以便在模型性能实现显著飞跃时使用。

随着我们从答案推理转向智能体推理，我仍然认为风险被夸大了，但最新 AI 系统的实际风险与描述它们所用的语言之间的差距已经缩小。这吓坏了头部 AI 实验室之外的权力结构。

进入 AI 治理的 AGI 时代，意味着世界上更多的主权实体开始认真对待 AI。欧洲、中东，可能还有中国，都意识到自己可能会被排除在前沿 AI 之外。这一转变被开源社区视为胜利，因为他们看到了一条长期轨迹：当政府可以任意裁决头部平台时，企业将希望控制自己的智能。

理解这个时代的关键在于，Anthropic 与联邦政府之间的这些事件——看似是 AI 政策史上最重大的两件事——实际上只是未来更大风波的起跑线。这就是新常态，因为现有权力结构感到有必要对快速崛起的技术施加控制。这将混乱、充满纷争，有时甚至危险重重。

追踪这些事件时，我内心充满一种凝视深渊般的恐惧，因为我知道更多风暴即将到来。要沿着缓和冲突的路径前行，帮助我们在全球范围内实现广泛传播、安全且廉价、超级强大的 AI 的积极愿景，需要坚定的决心。

主权 AI、开源需求，以及即将到来的战斗。

开源AI倡导者们正在狂热庆祝这一系列事件，但他们远未准备好面对快速响应AI政策的聚光灯转向他们的那一刻。很可能针对开源模型的类似激进措施将会到来，但我们不知道这是发生在3个月后还是2年后。

这篇文章仅供付费订阅者阅读。

Anthropic大佬观点安全/对齐政策/监管

Nathan Lambert：Interconnects（RSS）

精选69