欢迎进入AI治理的AGI时代
美国政府强制叫停Claude 5,不是一次性的监管风波,而是AGI治理新时代的起跑枪。Nathan Lambert的分析撕开了政府、实验室和资本之间的脆弱关系,做AI安全与政策的人必须看的一篇。
上周五收盘后,美国政府要求Anthropic暂停其最新Claude 5 Mythos/Fable模型的国内外访问权限,理由是存在模型越狱引发的网络安全风险。白宫通过Anthropic最大合作伙伴Amazon获知此事。作者评论称,对任何模型权重的出口禁令都是长期负面政策,且Anthropic过去几年将AI与核武器相提并论的恐惧宣传加速了这一时刻。该事件引发经济不稳定担忧,并暴露了前沿AI公司与政府间的紧张关系。
欢迎来到AI治理的通用人工智能时代
这是一扇单向门,而我们尚未做好准备。
美国行政部门强制要求Anthropic关闭其最新Claude 5 Mythos/Fable系列模型的访问权限——无论是内部还是外部——标志着AI治理新时代的发令枪响起。这是一个定义AI智能体的时代,这些智能体能够有效补充人类工作者,解锁新的工作方式以及应用现有工具的新领域。模型将以极快的速度持续进步,带来更多治理挑战。
前沿领域的不稳定平衡
上周五,就在市场收盘后,美国政府联系了Anthropic,强制要求其暂停向任何外国公民或境外用户提供模型访问权限。在撰写本文时,这一事件仍在持续发酵。Anthropic与政府很可能达成协议以重新发布该模型,但这预示着新型AI治理的混乱信号。白宫得知这一风险的消息来源是Anthropic最大的金融和技术合作伙伴Amazon。
这些动态非常复杂,尽管信息尚不完整,我仅就此事发表一些可能具有持久意义的评论:
对于任何模型权重的出口禁令,都将是美国一项具有持久负面影响的政策。这既适用于开源模型,也适用于闭源模型,尽管开源模型更有可能很快被列入进口禁令名单。
对于任何模型权重的出口禁令,都将是美国一项具有持久负面影响的政策。这既适用于开源模型,也适用于闭源模型,尽管开源模型更有可能很快被列入进口禁令名单。
关于Fable模型的越狱漏洞,确实存在合理的网络安全担忧,即使该漏洞非常狭窄。我个人并不认为这应当引发这一系列事件,因为没有模型能完美免疫越狱攻击,而且我们需要为这样一个未来做好准备:在未来几年内,全球每个实体都将能够获得这种能力水平的模型。
关于Fable模型的越狱漏洞,确实存在合理的网络安全担忧,即使该漏洞非常狭窄。我个人并不认为这应当引发这一系列事件,因为没有模型能完美免疫越狱攻击,而且我们需要为这样一个未来做好准备:在未来几年内,全球每个实体都将能够获得这种能力水平的模型。
Anthropic 在过去几年中持续的危言耸听加速了这一时刻的到来。如果没有那些将 AI 与核武器等相提并论的持续信息传递,我怀疑这种治理方式可能还要再过 6 到 12 个月(按 AI 进步的速度)才会显现。Anthropic 在一定程度上是自食其果。
Anthropic 在过去几年中持续的危言耸听加速了这一时刻的到来。如果没有那些将 AI 与核武器等相提并论的持续信息传递,我怀疑这种治理方式可能还要再过 6 到 12 个月(按 AI 进步的速度)才会显现。Anthropic 在一定程度上是自食其果。
人们不应该因为我们国家领先的 AI 公司反复遭受潜在的政治攻击而庆祝(是的,我指的就是开源社区里的人)。这在经济上极不稳定,并破坏了美国体系的经济稳定性。足够的不稳定可能导致经济衰退并戳破 AI 泡沫。
人们不应该因为我们国家领先的 AI 公司反复遭受潜在的政治攻击而庆祝(是的,我指的就是开源社区里的人)。这在经济上极不稳定,并破坏了美国体系的经济稳定性。足够的不稳定可能导致经济衰退并戳破 AI 泡沫。
白宫禁止该模型的行为过于严厉,并且受到对 Anthropic 强烈的政治偏见影响。政府的要求和目标之间存在深刻的矛盾,因为如果外国公民不能在美国使用前沿 AI 进行开发,那么就不存在本土的 AI 产业。
白宫禁止该模型的行为过于严厉,并且受到对 Anthropic 强烈的政治偏见影响。政府的要求和目标之间存在深刻的矛盾,因为如果外国公民不能在美国使用前沿 AI 进行开发,那么就不存在本土的 AI 产业。
我不太清楚亚马逊为何需要将所掌握的信息直接提交给白宫,也不清楚这次发布与封禁的前因后果(网上有大量关于发布前讨论的帖子),更不清楚领先科技公司与白宫之间的危机管理通常是如何进行的。这反映出Anthropic与政府互动时存在一些奇怪的动态,可能是对其在政治上被针对的一种反应。无论原因如何,这种动态都是不好的,给Anthropic在此处的参与蒙上了阴影。如果一家私营公司试图控制政府,政府会以更强的力度回击。我不认为Dario真的在参加健康静修(如白宫代表所言),但我确实认为,考虑到电话那头是谁,他接听电话的时间超出了可接受的范围。我很难就这些来回博弈的动态写出任何条理清晰的东西,但它们对于了解事情真相至关重要。
我不太清楚亚马逊为何需要将所掌握的信息直接提交给白宫,也不清楚这次发布与封禁的前因后果(网上有大量关于发布前讨论的帖子),更不清楚领先科技公司与白宫之间的危机管理通常是如何进行的。这反映出Anthropic与政府互动时存在一些奇怪的动态,可能是对其在政治上被针对的一种反应。无论原因如何,这种动态都是不好的,给Anthropic在此处的参与蒙上了阴影。如果一家私营公司试图控制政府,政府会以更强的力度回击。我不认为Dario真的在参加健康静修(如白宫代表所言),但我确实认为,考虑到电话那头是谁,他接听电话的时间超出了可接受的范围。我很难就这些来回博弈的动态写出任何条理清晰的东西,但它们对于了解事情真相至关重要。
这幅图景非常复杂。它指向一个近期的世界:模型发布将由技术人才匮乏的行政分支根据氛围感来评判,并将发布挡在一系列充满政治判断的技术评估迷雾之后。
这是一个已经内化我们处于AGI时代的政府。他们对此毫无准备,并且觉得必须迅速行动,追回失去的时间。
这是一个在本届政府上台时,我们仍处于 AI 治理的 ChatGPT 时代——即模型仅仅回答问题的阶段——所组建的政府。他们最初的《AI 行动计划》反映了这个时代,指出过去许多安全讨论更多是烟雾弹而非真正的担忧,并且我们迫切需要开源模型来迎头赶上。总体而言,他们在此处的观点和建议对行业来说大多是合理且有用的。
需要记住的是,即便是在这个 ChatGPT 治理时代,AI 公司也常常告诉我们模型存在风险,不能不加谨慎地发布。许多头部实验室的发言人在语言升级上没有为自己留出足够的空间,以便在模型性能实现显著飞跃时使用。
随着我们从答案推理转向智能体推理,我仍然认为风险被夸大了,但最新 AI 系统的实际风险与描述它们所用的语言之间的差距已经缩小。这吓坏了头部 AI 实验室之外的权力结构。
进入 AI 治理的 AGI 时代,意味着世界上更多的主权实体开始认真对待 AI。欧洲、中东,可能还有中国,都意识到自己可能会被排除在前沿 AI 之外。这一转变被开源社区视为胜利,因为他们看到了一条长期轨迹:当政府可以任意裁决头部平台时,企业将希望控制自己的智能。
理解这个时代的关键在于,Anthropic 与联邦政府之间的这些事件——看似是 AI 政策史上最重大的两件事——实际上只是未来更大风波的起跑线。这就是新常态,因为现有权力结构感到有必要对快速崛起的技术施加控制。这将混乱、充满纷争,有时甚至危险重重。
追踪这些事件时,我内心充满一种凝视深渊般的恐惧,因为我知道更多风暴即将到来。要沿着缓和冲突的路径前行,帮助我们在全球范围内实现广泛传播、安全且廉价、超级强大的 AI 的积极愿景,需要坚定的决心。
主权 AI、开源需求,以及即将到来的战斗。
开源AI倡导者们正在狂热庆祝这一系列事件,但他们远未准备好面对快速响应AI政策的聚光灯转向他们的那一刻。很可能针对开源模型的类似激进措施将会到来,但我们不知道这是发生在3个月后还是2年后。
这篇文章仅供付费订阅者阅读。