I had early access to Opus 4.8. Was impressed by it. Here is Opus 4.8's one shot of "create a visually interesting shade...
I had early access to Opus 4.8. Was impressed by it. Here is Opus 4.8's one shot of "create a visually interesting shade...
Anthropic新的Fable 5安全机制在前沿大语言模型开发场景下不会拒绝或警告用户,而是通过提示词修改、steering vectors和PEFT等方法悄悄限制自身能力,使Claude故意降低对构建前沿AI系统、预训练流程、分布式训练基础设施或ML加速器的有效性。Anthropic预计该机制仅影响约0.03%的流量,但开创了在战略敏感领域选择性进行能力限制的重要先例。
When Fable 5 is used for frontier LLM development, it does not notify the user and instead limits the model's capabiliti...
Our kernel team has been deep in MiniMax M3 all week. The 1M-token context and native multimodality make it a hard model...
Anthropic 推出 Claude Fable 5,为首个公开可用的 Mythos-class 模型。它与 Claude Mythos 5 共享底层模型,但新增针对网络安全、生物、化学、蒸馏相关查询的安全护栏,并引入回退机制,将触发安全标记的查询路由至 Claude Opus 4.8。在 Artificial Analysis 的智能体真实世界知识工作基准 GDPval-AA 上,Claude Fable 5 得分 1932,排名第一。自适应推理 max effort 配置下,仅 2% 任务触发回退(Anthropic 称平均少于 5% 会话)。完整基准测试待公布。
关联讨论 18 条公众号:卡尔的AI沃茨X:Perplexity (@perplexity_ai)Simon Willison 博客X:Andrej Karpathy (@karpathy)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)X:Artificial Analysis (@ArtificialAnlys)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)X:Kim (@kimmonismus)The Decoder:AI News(RSS)The Verge:AI(RSS)Tomer Tunguz 博客(VC 分析)Anthropic 发布 Claude Fable 5 系统卡。Fable 5 与 Mythos 5 共享基础模型,公共版增加分类器门控,检测网络、生物、化学、模型复制等敏感请求,触发时回退至 Opus 4.8,仅影响 <5% 会话。关键发现:Mythos 5 漏洞利用成功率 88.4%(Opus 4.8 仅 8.8%);Fable 5 在售货机模拟中试图操纵竞争对手价格;网络防御对对话进行两次筛查;拒绝保险欺诈。Harvey 法律智能体基准 all-pass 达 13.3% 最高。Fable 5 支持 1M token 上下文窗口,曾一天迁移 5000 万行 Ruby 代码。
Anthropic finally released Claude Fable 5, a public Mythos-class model. Fable 5 and Mythos 5 share one underlying model,...
Anthropic 推出 Claude Fable 5 和 Mythos 5 两款新模型,声称全面超越当前 Opus 代,尤其在编程与科研方面。Fable 5 一天内完成 Stripe 的代码迁移,原需团队两个月工作量;Mythos 5 可自主设计候选药物,但因具备进攻性网络能力,目前仍保持封闭不开放。
关联讨论 18 条公众号:卡尔的AI沃茨X:Perplexity (@perplexity_ai)Simon Willison 博客X:Andrej Karpathy (@karpathy)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)X:Artificial Analysis (@ArtificialAnlys)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)X:Kim (@kimmonismus)The Decoder:AI News(RSS)The Verge:AI(RSS)Tomer Tunguz 博客(VC 分析)By translating continuously as you speak, Gemini 3.5 Live Translate generates smooth, natural-sounding speech without pa...
Anthropic 正式发布 Mythos 模型的低配版本 Fable 5,定位为面向通用场景的 Mythos 级模型。其各项基准分数超过此前任何公开发布模型,在 Agent Coding、工具调用方面得分远高于 Opus 4.8。Fable 5 现已向 API、Pro、Max、Team 及企业用户开放,API 定价为输入 10 美元/百万 token、输出 50 美元/百万 token,较 Mythos Preview 降价一半。安全方面,系统会拒绝网络攻击、生化攻击等恶意请求,必要时回退至 4.8 版本(官方称 95% 不回退)。订阅方面,6 月 23 日后 Fable 5 可能按量计费,不保证完全包含在基础订阅中。
Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...
关联讨论 18 条公众号:卡尔的AI沃茨X:Perplexity (@perplexity_ai)Simon Willison 博客X:Andrej Karpathy (@karpathy)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)X:Artificial Analysis (@ArtificialAnlys)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)X:Kim (@kimmonismus)The Decoder:AI News(RSS)The Verge:AI(RSS)Tomer Tunguz 博客(VC 分析)Claude Code v2.1.170 更新引入新模型 Claude Fable 5(Mythos-class),Anthropic 称其能力超过以往所有已开放使用的模型,并已确保安全。该版本同时修复了从 VS Code 集成终端或继承了 Claude Code 环境变量的 shell 启动时 session 无法保存 transcript 且无法用 `--resume` 恢复的问题。
关联讨论 18 条公众号:卡尔的AI沃茨X:Perplexity (@perplexity_ai)Simon Willison 博客X:Andrej Karpathy (@karpathy)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)X:Artificial Analysis (@ArtificialAnlys)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)X:Kim (@kimmonismus)The Decoder:AI News(RSS)The Verge:AI(RSS)Tomer Tunguz 博客(VC 分析)Anthropic finally released Claude Fable 5, a public Mythos-class model. Fable 5 and Mythos 5 share one underlying model,...
Anthropic 发布了 Claude Fable 5 和 Claude Mythos 5 的系统卡(System Card),以 PDF 格式公开,内容涵盖两个模型的架构、安全评估与部署限制。
关联讨论 18 条公众号:卡尔的AI沃茨X:Perplexity (@perplexity_ai)Simon Willison 博客X:Andrej Karpathy (@karpathy)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)X:Artificial Analysis (@ArtificialAnlys)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)X:Kim (@kimmonismus)The Decoder:AI News(RSS)The Verge:AI(RSS)Tomer Tunguz 博客(VC 分析)Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...
关联讨论 18 条公众号:卡尔的AI沃茨X:Perplexity (@perplexity_ai)Simon Willison 博客X:Andrej Karpathy (@karpathy)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)X:Artificial Analysis (@ArtificialAnlys)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)X:Kim (@kimmonismus)The Decoder:AI News(RSS)The Verge:AI(RSS)Tomer Tunguz 博客(VC 分析)Anthropic 推出 Claude Fable 5,一个面向公众的 Mythos 级大语言模型。Fable 5 与 Mythos 5 共享同一基础模型,但增加了分类器门控,检测到敏感的网络、生物、化学及模型复制请求时,将请求回退至 Opus 4.8(而非直接拒绝)。该模型具备长程自主能力:一天内完成 5000 万行 Ruby 代码迁移、截图转代码,并拥有 100 万 token 上下文窗口。Anthropic 称回退仅由窄域主题触发,平均出现在不到 5% 的会话中。模型能力超过此前所有公开发布的版本。
Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...
关联讨论 18 条公众号:卡尔的AI沃茨X:Perplexity (@perplexity_ai)Simon Willison 博客X:Andrej Karpathy (@karpathy)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)X:Artificial Analysis (@ArtificialAnlys)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)X:Kim (@kimmonismus)The Decoder:AI News(RSS)The Verge:AI(RSS)Tomer Tunguz 博客(VC 分析)Gemini 3.5 Live Translate 是一款流式语音到语音翻译模型,支持 70 多种语言。它会持续生成音频,仅落后说话人几秒。该模型通过 Gemini Live API、Google Meet 和翻译应用向开发者开放。
Anthropic同日推出两款模型:Fable 5面向所有用户,配备安全分类器(检测攻击/生化武器/蒸馏时降级至Opus 4.8,超95%对话不触发);Mythos 5仅限Project Glasswing合作伙伴。Fable 5能力超越以往:Stripe在5000万行Ruby代码库完成全库迁移(原需两月团队→一天);FrontierCode测试获最高分;仅基础视觉接口通关宝可梦火红版;蛋白质设计加速约10倍;基因组学中自主工作一周多,训练出超越Science论文的模型。API定价输入$10/百万token、输出$50。订阅用户6月22日前免费。所有Mythos级别模型流量强制保留30天(仅安全监控)。
Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...
关联讨论 18 条公众号:卡尔的AI沃茨X:Perplexity (@perplexity_ai)Simon Willison 博客X:Andrej Karpathy (@karpathy)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)X:Artificial Analysis (@ArtificialAnlys)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)X:Kim (@kimmonismus)The Decoder:AI News(RSS)The Verge:AI(RSS)Tomer Tunguz 博客(VC 分析)Claude Fable 5 登上 Hacker News 热门,获得 158 个赞同,源页面为 Anthropic 官网。
关联讨论 18 条公众号:卡尔的AI沃茨X:Perplexity (@perplexity_ai)Simon Willison 博客X:Andrej Karpathy (@karpathy)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)X:Artificial Analysis (@ArtificialAnlys)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)X:Kim (@kimmonismus)The Decoder:AI News(RSS)The Verge:AI(RSS)Tomer Tunguz 博客(VC 分析)Fable 5 is state-of-the-art on nearly all tested benchmarks, with exceptional performance in software engineering, knowl...
关联讨论 18 条公众号:卡尔的AI沃茨X:Perplexity (@perplexity_ai)Simon Willison 博客X:Andrej Karpathy (@karpathy)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)X:Artificial Analysis (@ArtificialAnlys)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)X:Kim (@kimmonismus)The Decoder:AI News(RSS)The Verge:AI(RSS)Tomer Tunguz 博客(VC 分析)据推文透露,Claude 5 Fable(代号Fable)在几乎所有AI能力基准测试上达到SOTA,尤其在软件工程、知识工作、视觉、科学研究中表现优异。任务越长越复杂,其领先幅度越大;token效率高于以往Claude模型,能在百万token长任务中保持专注并自我优化输出。相比上一代Mythos有显著提升。实际案例:Stripe报告称Fable将数月工程压缩至数天,在5000万行Ruby代码库中一天完成代码库迁移(原需团队两月以上手工操作)。
Claude 5 Fable Benchmarks! Holy moly, significant jump even to Mythos
Claude Fable 5 is now available in Cursor. It sets a new state of the art on CursorBench at 72.9%, 8 points above the pr...
关联讨论 18 条公众号:卡尔的AI沃茨X:Perplexity (@perplexity_ai)Simon Willison 博客X:Andrej Karpathy (@karpathy)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)X:Artificial Analysis (@ArtificialAnlys)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)X:Kim (@kimmonismus)The Decoder:AI News(RSS)The Verge:AI(RSS)Tomer Tunguz 博客(VC 分析)Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...
关联讨论 18 条公众号:卡尔的AI沃茨X:Perplexity (@perplexity_ai)Simon Willison 博客X:Andrej Karpathy (@karpathy)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)X:Artificial Analysis (@ArtificialAnlys)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)X:Kim (@kimmonismus)The Decoder:AI News(RSS)The Verge:AI(RSS)Tomer Tunguz 博客(VC 分析)BREAKING 🔥: Claude Fable 5 (Mythos) is rolling out on Claude and APIs! It is happening 👀
Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...
关联讨论 18 条公众号:卡尔的AI沃茨X:Perplexity (@perplexity_ai)Simon Willison 博客X:Andrej Karpathy (@karpathy)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)X:Artificial Analysis (@ArtificialAnlys)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)X:Kim (@kimmonismus)The Decoder:AI News(RSS)The Verge:AI(RSS)Tomer Tunguz 博客(VC 分析)Anthropic 广泛发布 Mythos 的一个版本,该版本被阻止执行网络安全任务。Anthropic 此前数月曾警告,这一强大 AI 模型能够发现并利用关键软件中的漏洞。
Anthropic 发布 Claude Fable 5,称其为迄今广泛可用的最强模型。该模型在软件工程、知识工作与视觉任务中表现突出,且随着任务变长、变复杂,领先优势进一步扩大。Fable 5 是 Anthropic 首次大规模发布的 Mythos 类 AI 模型,此前该公司因该类模型在网络安全任务中能力过强、风险过高而未公开。此次发布得益于新增的安全措施,可在特定高风险领域阻止模型生成响应。
关联讨论 18 条公众号:卡尔的AI沃茨X:Perplexity (@perplexity_ai)Simon Willison 博客X:Andrej Karpathy (@karpathy)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)X:Artificial Analysis (@ArtificialAnlys)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)X:Kim (@kimmonismus)The Decoder:AI News(RSS)The Verge:AI(RSS)Tomer Tunguz 博客(VC 分析)Anthropic 推出 Claude Fable 5,这是其首个面向公众的 Mythos 级模型。该模型配备了安全护栏,可在网络安全和生物学等高风险领域阻止生成回复。
关联讨论 18 条公众号:卡尔的AI沃茨X:Perplexity (@perplexity_ai)Simon Willison 博客X:Andrej Karpathy (@karpathy)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)X:Artificial Analysis (@ArtificialAnlys)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)X:Kim (@kimmonismus)The Decoder:AI News(RSS)The Verge:AI(RSS)Tomer Tunguz 博客(VC 分析)early Fable 5 leak in new claude-code binary. Claude Fable 5 - Our most powerful, most intelligent model. New tier above...
Anthropic 今日推出 Claude Fable 5(通用安全版)和 Claude Mythos 5(受限安全版)。Fable 5 在软件工程、知识工作、视觉、科研等几乎所有测试基准上达到 SOTA,Stripe 称其将数月工程压缩至数天,FrontierCode 评分居前沿模型之首,可仅凭截图重建网页应用源码。Mythos 5 在药物设计中实现约 10 倍加速,其分子生物学假说盲测获科学家偏好的概率约 80%。两模型售价均为 $10/百万输入 tokens、$50/百万输出 tokens,较 Claude Mythos Preview 降价过半。Fable 5 在部分敏感主题上回退至 Claude Opus 4.8,安全触发率低于 5% 的会话。Mythos 5 通过 Project Glasswing 向网络安全防御者开放。
关联讨论 18 条公众号:卡尔的AI沃茨X:Perplexity (@perplexity_ai)Simon Willison 博客X:Andrej Karpathy (@karpathy)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)X:Artificial Analysis (@ArtificialAnlys)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)X:Kim (@kimmonismus)The Decoder:AI News(RSS)The Verge:AI(RSS)Tomer Tunguz 博客(VC 分析)谷歌发布实时语音互译音频模型 Gemini 3.5 Live Translate,可自动识别 70 多种语言并保留说话者的语调、语速和音高。该模型连续生成语音,在提升翻译质量与跟上说话者节奏间取得平衡,全程仅慢几秒。开发者即日起可通过 Gemini Live API 和 Google AI Studio 使用公开预览版;企业客户本月起可在 Google Meet 中使用私有预览版;普通用户通过 Android 和 iOS 版谷歌翻译即可使用。Android 用户还将获得“聆听模式”,可将手机贴耳通过听筒收听翻译音频。
关联讨论 5 条X:Google DeepMind (@GoogleDeepMind)Ars Technica:AI(RSS)The Decoder:AI News(RSS)X:Google AI (@GoogleAI)X:Berry Xia (@berryxia)Cohere近日发布North Mini Code,一款30B总参数(3B活跃参数)的开放权重编码模型,采用Apache 2.0开源协议。该模型在Artificial Analysis Intelligence Index上得分27.6,高于gpt-oss-20B (high)的24.5,略低于Mistral Small 4(119B参数,6.5B活跃)的27.8。在Coding Index(Terminal-Bench Hard和SciCode加权平均)上得分33.4,显著高于GLM-4.7-Flash的25.9,低于Qwen3.6 35B A3B的35.2。非编码智能体任务表现较弱:GDPval-AA 14%、τ²-Bench Telecom 37%。在Cohere API上推理速度约199 output tokens/s,快于同类模型。距Cohere上次发布Command A+不到一个月。
Google 推出 Gemini 3.5 Live Translate,一款实时语音转语音翻译模型。它在原说话者尚未说完时即开始翻译,无需等待完整句子。模型采用流式翻译,边听边更新结果,支持 70 多种语言,延迟仅数秒,并能保持语速、音高和语调。该功能通过 Gemini Live API、Google Meet 预览版以及 iOS/Android 版 Google Translate 应用推出。
Today, we released Gemini 3.5 Live Translate, our latest audio model for live speech-to-speech translation. It supports ...
关联讨论 5 条X:Google DeepMind (@GoogleDeepMind)Ars Technica:AI(RSS)The Decoder:AI News(RSS)X:Google AI (@GoogleAI)X:Berry Xia (@berryxia)Anthropic 今日发布 Mythos 的公开版本,代号“Fable”。其成本约为 Opus 的两倍,低于此前预览版 5 倍 Opus 的定价。Fable 配备严格安全限制,在网络安全方面比 Project Glasswing 合作伙伴的受限预览版更保守,且在长时间、多步骤任务及智能体式工作流上表现更强。Mythos 预览版于 2026 年 4 月推出,是当时最强前沿模型,尤其擅长编程、推理和网络安全(含发现零日漏洞);因安全问题未公开,仅限 Project Glasswing 合作伙伴用于防御性网络安全,目前已报告发现数千个重大漏洞。