Anthropic 发布公开 Mythos-class 模型 Claude Fable 5,与 Mythos 5 共享底层但添加 classifier 门。检测到敏感的网络、生物、化学及模型复制请求时不拒绝,而是回退到 Opus 4.8 实现模型降级。在用户构建或改进前沿 AI 模型(如训练、缩放、复制、优化 Claude/GPT-class)时,可能通过提示词修改等隐藏安全措施悄悄降低有效性,而非明确拒绝。受限制工作包括预训练流水线、数据管道、分布式训练、芯片设计等。降级仅针对狭窄主题,平均 <5% 会话触发。模型支持 1M-token 上下文,具备长程自主能力(如 1 天迁移 5000 万行 Ruby 代码)。产品本质变为路由机器,决定请求可接触的智力级别。
Anthropic finally released Claude Fable 5, a public Mythos-class model. Fable 5 and Mythos 5 share one underlying model,...
Andrej Karpathy 称 Claude Fable 5 与 Mythos 同源但加入安全措施,是一次值得大版本号提升的跃进,定性表现与 11 月发布的 Claude 4.5 同级。模型在几乎所有基准测试上达 SOTA,长任务和高难度问题领先明显;@claudeai 指出其在软件工程、知识工作、科学研究和视觉方面表现卓越。Karpathy 认为开发者可尝试比以往更具雄心的任务,模型能理解并自主推进。不过模型仍有小问题,安全机制在发布时过于敏感,有待后续调优。
Fable 5 is state-of-the-art on nearly all tested benchmarks, with exceptional performance in software engineering, knowl...
关联讨论 35 条X:Rohan Paul (@rohanpaul_ai)X:Testing Catalog (@testingcatalog)X:邵猛 (@shao__meng)IT之家(RSS)Ars Technica:AI(RSS)X:Yuchen Jin (@Yuchenj_UW)Anthropic:Newsroom(网页)X:Anthropic (@AnthropicAI)Hacker News 热门(buzzing.cc 中文翻译)X:阿易 AI Notes (@AYi_AInotes)公众号:卡尔的AI沃茨X:Kim (@kimmonismus)The Decoder:AI News(RSS)TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)X:Perplexity (@perplexity_ai)Simon Willison 博客The Verge:AI(RSS)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Boris Cherny (@bcherny)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)Gary Marcus:The Road to AI We Can Trust(RSS)X:小互 (@xiaohu)Tomer Tunguz 博客(VC 分析)MarkTechPost(RSS)IBM CEO Arvind Krishna在纽约Mizuho科技会议上表示对量子计算的潜力感到兴奋,同时评论了特朗普政府对IBM的投资、AI技术的利用以及IBM的利润策略。
When Fable 5 is used for frontier LLM development, it does not notify the user and instead limits the model's capabiliti...
Claude Fable 5 takes #1 on APEX-SWE: 65.5% Pass@1 overall. It scores ~18pp higher than Opus 4.8. We tested @claudeai Fab...
Labs starting to pull up the ladders on the ability to diffuse AI was inevitable. Doing it without telling the user is m...
Anthropic 发布 Claude Fable,这是一款提供截然不同推理体验的 AI 模型。它擅长规划与生成复杂代码库,在需要精确构建代码结构或理解程序员深层需求的场景中,其表现相比 Claude Sonnet 有了大幅提升。用户描述与它协作更像与一位直觉敏锐的资深工程师合作,其对代码意图的捕捉和方案生成能力令人惊叹,但并非通用型 AI。
Claude 5 Fable tl;dr - It is state-of-the-art on nearly all tested benchmarks of AI capability, showing exceptional perf...
Allianz Bernstein 主题股票负责人 Lei Qiu 指出,美国在 AI 技术和基础设施领域凭借领先科技公司的战略投资和快速创新保持竞争优势,尽管中美地缘政治紧张局势持续。
亚马逊员工在公司内部Slack上使用“Sloppenheimer”一词,调侃公司的人工智能产品。此事被媒体曝光后引发热议。
Mythos正式上线FrontierCode基准测试,旨在衡量AI生成可维护代码的能力。该基准包含超1000小时维护者验证的任务,并引入3000+评分标准防奖励攻击。最高难度FC Diamond上,Opus 4.8得分仅13.8%,且Opus 4.8与GPT 5.5均未随effort扩展提升。Mythos/Fable后训练将test time compute用于数小时级长任务。基准已在Devin上线,ACU成本仅1.4倍。FC Extended中最易的1/3任务在2025年末被快速攻克——Opus从41%升至74%,标志着AI编码进入“维护可读代码”新时代。
It's finally out!!! @METR_Evals found that more than half of SWEBench results is unmergeable slop. FrontierCode represen...
开源免费的 token 压缩工具 headroom 本周增速最快,已获 17k star。它专为所有 AI API 调用(输出、日志、文件、RAG 块)设计,压缩 60%-95% 的 token,将账单直接砍到原来的 1/5,且回答质量不变。无需修改一行现有代码,可作为库、代理或 MCP 服务器无缝对接所有大模型。开发者无需再绞尽脑汁凑提示词,一行配置即可大幅降低 API 成本。
微软 AI 部门 CEO 穆斯塔法·苏莱曼在昨天的播客节目中收回其此前“白领工作将在 12-18 个月内被 AI 完全自动化”的言论,改口称 AI 将帮助白领完成发邮件、与同事沟通、制作 PPT 等重复性任务,而非直接取代职业。他表示这些工作本身依赖人工且耗时,技术发展的方向是让生活更轻松、更高效,白领职位不会因此消失。
GitHub Copilot CLI 新增自定义 AI 智能体功能,使 CLI 能够理解开发者的技术栈和团队工作流,将一次性终端提示转变为可重复、可审查的流程。
SpaceX、Anthropic 和 OpenAI 均筹备大规模公开上市,科技行业或将诞生新的企业巨头缩写。告别 FAANG,迎来 MANGOS。
作者首次录制口播脚本推荐书籍《被讨厌的勇气》,使用Pocket3相机与免费提词器teleprompter,脚本由自制的书籍口播解读Skill生成(计划稍后开源),剪辑用剪映添加片头片尾,调色采用LUT文件CELLULOID_01_FU_LOW.cube。
Gemini 2.5 Flash API 的定价与快速入门指南,指导用户配置 thinking budgets、比较不同提供商,并在 5 分钟内完成首次 API 调用。
关联讨论 1 条OpenRouter:Announcements(RSS)Introducing Searchmaxxing. The new discipline for being visible everywhere AI looks. Across all platforms. This is how b...
http://x.com/i/article/2057694226981257216
彭博社记者古尔曼报道,苹果在 WWDC26 推出全面改造的 Siri AI,覆盖 iOS 27、macOS 27、watchOS 27 和 visionOS 27。IDC 分析师称 WWDC26 是苹果的 AI 可信度测试,需让 AI 在生态中可信、有用且不打扰用户。发布会期间苹果股价下跌 1.9%。Siri AI 初期仅支持英语,秋季以测试版面向消费者,中国和欧盟用户暂无法使用。IDC 分析师表示这些功能将推动 iPhone 14 及更早机型用户升级。
http://x.com/i/article/2059815427484655622
Apple 在 Safari 和 Shortcuts 中推出的 AI 功能比 Siri AI 或 Image Playground 更实用,允许用户用自然语言总结网页、编排自动化,带来“氛围编程”体验。