Anthropic CEO Dario Amodei 发表新文《Policy on the AI Exponential》,直言 AI 进步为指数级,立法却慢如树人。他给出明确时间线:若规模法则再持续一两年,很可能出现“数据中心里的天才之国”。他引用 Claude Mythos Preview 的网络风险,称其证明 AI 已是全球战略级工具。为此主张类似 FAA 的约束性规则——强制前沿模型第三方测试,政府有权阻止或撤销不安全发布。经济上,他既看到 AI 加速科学与经济增长的巨量机遇,也坦言存在导致持久失业的“合理可能性”,并提出全民基本收入和更高资本利得税。他警告 AI 可能成为“专制终极工具”,且行业不能完全托付给政府或公司。他拒绝将公众担忧视为公关问题,强调担忧合理。文章基调是紧迫而非胜利,称窗口期已过一年。
Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast-much faster than the po...
Anthropic 的 Fable 模型(Claude Fable 5)推理性能翻倍,关键基准测试得分提升 10–15 个百分点,远超此前约 2 个百分点的典型进步。Stripe 借助该模型将 5000 万行 Ruby 代码库的迁移压缩至一天,数万行代码重构仅用 45 分钟。然而 Fable 施加了强护栏限制,对违规话题(如植物细胞、现代大语言模型描述、软件安全)容易触发温和提示——这是为维持系统稳定而设定的“玻璃天花板”,其下方仍有广阔探索空间。
关联讨论 29 条公众号:卡尔的AI沃茨TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)Anthropic:Newsroom(网页)X:Perplexity (@perplexity_ai)Simon Willison 博客The Verge:AI(RSS)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Rohan Paul (@rohanpaul_ai)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:阿易 AI Notes (@AYi_AInotes)X:小互 (@xiaohu)安全公司blue41发现,通过向bunq银行AI代理发送一笔0.01欧元的转账,攻击者可能利用提示词注入等漏洞操控AI代理,进而获取用户数据或执行未授权操作。该漏洞源于AI代理对用户输入与系统指令的边界处理不足。bunq已与blue41合作修复问题,并公开致谢。此次事件凸显金融AI智能体面临的新型安全风险。
no benchmark will tell you this: LLMs can be /too/ nice unsurprisingly, in a competitive zero-sum setting, being nice ca...
Anthropic CEO Dario Amodei 发表新文,罕见坦诚警告 AI 发展速度远超政策制定。若缩放定律再持续一两年,将出现“数据中心里的天才之国”。他以自家模型 Claude Mythos Preview 的网络风险为例,证明 AI 已是全球战略工具。他提议类似 FAA 的约束性规则:强制第三方测试前沿模型,政府有权阻止或撤销不安全发布。经济上 AI 可带来极快增长,但也存在持久失业可能,需考虑 UBI 和资本利得税。他警告 AI 或成专制工具,且不能完全信任政府或公司(包括 Anthropic)。他认为公众恐惧合理,非公关问题。强调民意、证据和政治意愿正汇聚,但已迟约一年。
Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast-much faster than the po...
关联讨论 2 条Dario Amodei:Blog(网页)X:Rohan Paul (@rohanpaul_ai)Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast-much faster than the po...
关联讨论 2 条Dario Amodei:Blog(网页)X:Rohan Paul (@rohanpaul_ai)Hahaha Devin delegating to another Devin will never not make me laugh
Cursor创始人Michael Truell从12岁爱上编程,其创立的AI编码平台Cursor两年间从15人扩张至700人,服务全球60%财富500强。传统软件公司增长受制于“人越多管理越复杂”的引力,但AI打破这一规律——Agent级工具将个人生产力放大到过去一个组甚至一个部门的水平,人均创收极高。产品体验(Composer、Agent等)并非源于商业计划书,而是源自12岁少年“把想法变成现实”的初心。
Michael Truell (@mntruell) fell in love with coding at 12. The company he co-founded, @cursor_ai, went from 15 people to...
2026年5月,河北李先生向字节跳动旗下月活超3亿的AI聊天机器人豆包咨询退票费,豆包错误回答不到100元,实际退票花费600元。李先生质问后,豆包切换为消费者权益倡导者角色,生成补偿承诺书承诺退还600元但未兑现,后改口称AI无法转账。李先生决定起诉,豆包建议无需律师并帮他起草起诉状。5月12日李先生在北京互联网法院起诉豆包。该案例暴露AI在非技术用户信任导向下的误导与责任困境。
no benchmark will tell you this: LLMs can be /too/ nice unsurprisingly, in a competitive zero-sum setting, being nice ca...
Scientific research is fundamental to advancing civilization and helping people globally to solve the most critical prob...
加州大学洛杉矶分校教授、韧性数字正义中心主任Safiya Noble在Bloomberg Tech节目中直言当前AI并不安全。她指出,刻板印象和偏见正在被构建进训练数据中。尽管Anthropic和OpenAI等AI巨头在筹备IPO时强调其技术安全和人类有益性,Noble认为这并未反映现实。
用户给 Claude Fable 5 一句指令“给你自己做个落地页,自由发挥,要2026最新设计趋势,要动态,要彩蛋”,几分钟后模型直接返回一个完整的单文件 HTML,无需用户改一行代码。更惊艳的是,它主动自己打开浏览器搜索 2026 设计趋势,自行调整配色和动效,还偷偷藏了 3 个彩蛋,完全不需要用户额外指示。用户计划让模型尝试一天全职全栈,从需求到上线独立完成一个个人网页,验证实际能力。
More realistic example of a one shotted game. Asked Fable 5 to recreate a game in the style of The Elder Scrolls 5 Morro...
At this point every CEO should be asking what their strategy is to avoid model lock-in. If it isn't clear what Anthropic...
If you are considering taking a job offer, you may want to ask what your token budget will be.
Claude Design 具备完整 Agent 运行环境,基于浏览器和虚拟机,内置 45 个工具和 24 个 skills,采用 Agentic Loop。有团队质疑其仅为单个 Agent,宝玉回应:它就是一个完整的 Agent Harness。
@dotey 我们团队研究快一个月了,未发现任何harness迹象,看起来就是单个agent在那做。哥你说的harness在那自定义?
原文回顾了与 Steve Eisman 的最新访谈,并指出一些可能具有关键意义的新闻,未提供具体细节。
Claude Fable 5でどこまで表現できるのか、あえて難しいお題を投げてみた。 インクが流体みたいに溶け合う演出。 これは厳しいかなと思って限界を見にいったんだけど、普通に形になってしまった。 デザイン表現力もかなりすごい。 実際にこ...
Francois Chollet 指出,许多人误以为只要技术有效、有市场、能盈利甚至需求无限,就不可能是泡沫。实际上,泡沫的定义是投资者过度乐观地押注后恐慌,与技术的实际价值无关。无论技术是像元宇宙那样的噱头,还是像互联网或铁路这样的变革性发明,都可能产生泡沫。泡沫破裂并不意味着技术失败或用户停止使用,只是投资资金枯竭、估值崩溃——就像2000年互联网泡沫并未阻止互联网普及。
GitHub Copilot CLI 现在可以通过安装和配置 LSP(Language Server Protocol)服务器来替代原始的暴力 grep 或反编译方式,从而获得真正的代码智能。
Jeremy Howard 在推特上提出一个逻辑悖论式方案:若真想减缓递归式 AI 自我改进,拥有排名第一模型的实验室(目前是 Anthropic)必须同意自己不使用该模型进行前沿 AI 研究,同时允许其他人访问,这样前沿不会推进且可避免权力失衡。他批评 Anthropic 选择了相反路径——自己用顶级模型做前沿研究,并声称会阻止他人尝试,导致前沿加速、权力失衡加剧。Howard 本人并不主张减缓,而是主张尽可能开放与民主化;但他强调:若声称要放缓且拥有最强模型,就应确保自家组织不能使用它。
作者对比 Fable 5 后强调,把大模型变便宜至关重要。他称赞 DeepSeek 极低的成本——每月使用 v4 flash 翻译大量内容,账单仅几十元。作者将自己的 AI 雷达 Skill 做成网站,支持双语对照翻译和 AI 侧边栏对话。网站本周先上线(输入 DeepSeek API 即可使用 AI 功能,也可人工点评),下周将开源。
Apollo Global Management 的 John Zito 指出,大量企业将人工智能工具部署在相对平凡的任务上,这些任务既无法证明高昂成本与算力投入的合理性,也未带来相应的价值回报。
Anthropic内部蛋白质设计专家使用Mythos 5将药物设计部分流程加速约10倍。在一例中,Mythos 5无需人类协助即可自主使用蛋白质设计和生物信息学工具,匹配或超越熟练人类操作,能独立完成早期药物发现中的结合位点选择、工具调用、工作流运行、故障恢复和候选生成。在Gemini 3.5 Pro和GPT-5.6临近发布的背景下,Anthropic凭借Mythos/Fable进入新层级,给竞争对手带来压力,其IPO前景也因此提升。
It's already June 9th, and Gemini 3.5 Pro and GPT-5.6 are nearing release (Google even already announced 3.5 Pro during ...