Z-Image Turbo++是从8步教师模型Z-Image Turbo蒸馏得到的2步图像生成模型。针对两步生成中任务难度提升和模型容量有限的瓶颈,提出三项设计:分布对齐对抗学习(以教师生成图像而非真实图像作为GAN训练的真样本)、步骤分离参数化(两个去噪步独立参数)、以及带迭代正则化的端到端训练(第一步接收最终图像质量梯度并保留有意义的中间生成)。这些策略显著缩小了2步与8步生成的质量差距。
Z-Image Turbo++是从8步教师模型Z-Image Turbo蒸馏得到的2步图像生成模型。针对两步生成中任务难度提升和模型容量有限的瓶颈,提出三项设计:分布对齐对抗学习(以教师生成图像而非真实图像作为GAN训练的真样本)、步骤分离参数化(两个去噪步独立参数)、以及带迭代正则化的端到端训练(第一步接收最终图像质量梯度并保留有意义的中间生成)。这些策略显著缩小了2步与8步生成的质量差距。
FORT-Searcher 提出抗捷径训练数据合成框架 FORT,识别证据共覆盖、单线索选择性、暴露常数和先验知识绑定四种捷径风险,在实体选择、证据图构建、问题生成和对抗性精炼环节控制。实验表明,FORT 生成的数据比现有开源深度搜索数据集诱导更长的搜索路径和更少的捷径模式。仅用监督微调(SFT)训练的 FORT-Searcher 在多个深度搜索基准上达到同类开源搜索智能体的最佳整体性能。资源即将开放。
Evoflux是一种推理时进化搜索方法,通过结构化编辑、执行反馈、自适应强度、元引导重设计和多样性剪枝,将紧凑型语言模型的可执行工具工作流修复为可运行图。在覆盖250个工具和MCP服务器的MCP-Bench任务上,Evoflux将小型规划器的执行可行性从约3%提升至17-24%。相比之下,同一数据上的SFT和SFT+DPO表现持平、不如或崩溃至低于零样本水平;ReAct可达更高峰值但方差和token成本更高。结果表明,在稀缺教师轨迹预算下,基于执行反馈的搜索更可靠。
Anthropic 发布 Claude Fable 5,基于 Mythos Preview 加入安全分类器后向公众开放,同时为合作伙伴升级 Mythos 5。Fable 5 在多项基准测试中取得 SOTA,每百万输入 token 10 美元、输出 token 50 美元。即日起至 6 月 22 日,Pro、Max、Team 及企业版订阅用户可免费使用,之后仅通过 API 提供。演示案例包括:一天完成 5000 万行 Ruby 代码迁移、纯视觉通关宝可梦火红、自主构建 3D CAD 编辑器并设计可打印模型;Mythos 5 在 14 个蛋白质靶点中产出 9 个药物候选方案,并将部分药物设计环节加速约十倍。
关联讨论 34 条X:Rohan Paul (@rohanpaul_ai)X:Testing Catalog (@testingcatalog)X:邵猛 (@shao__meng)IT之家(RSS)Ars Technica:AI(RSS)X:Yuchen Jin (@Yuchenj_UW)Anthropic:Newsroom(网页)X:Anthropic (@AnthropicAI)Hacker News 热门(buzzing.cc 中文翻译)X:阿易 AI Notes (@AYi_AInotes)公众号:卡尔的AI沃茨X:Kim (@kimmonismus)The Decoder:AI News(RSS)TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)X:Perplexity (@perplexity_ai)The Verge:AI(RSS)Simon Willison 博客X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)Gary Marcus:The Road to AI We Can Trust(RSS)X:小互 (@xiaohu)Tomer Tunguz 博客(VC 分析)X:Berry Xia (@berryxia)MarkTechPost(RSS)苹果新版 Siri AI 终于能一次性从邮件或排版混乱的传单中提取足球赛或“精神周”主题日并添加到日历上。它还支持对话式交互,例如讨论花园玫瑰病害、整理五金店购物清单、设置花床堆肥提醒,并能引用邮件和日历中的信息来生成推荐。
Sabertooth VC 创始人 Justin Ernest 未采用耗时一年的传统风险基金募集方式,而是利用其专属 LP 网络,向 Anthropic、Anduril 和 SpaceX 等热门初创公司累计投资了近 4 亿美元。
just finished rerunning FC Diamond on my historical charts. none of the official tables/charts are capturing the degree ...
Anthropic 于 6 月 9 日推出 Claude Fable 5 和 Mythos 5。Fable 5 面向普通用户,是目前公开最强的 Claude 模型,在软件工程、知识工作、视觉、科学研究等领域优于 Opus,自主运行时间更长。Mythos 5 通过 Project Glasswing 向网络安全防御方和基础设施提供商开放,具备全球最强网络安全能力,并在药物设计、分子生物学和基因组学中表现突出。两款模型本质相同,仅安全护栏不同。Fable 5 采用新分类器拦截网络安全、生物化学和蒸馏请求,命中后转由 Claude Opus 4.8 响应。定价均为每百万输入 10 美元、每百万输出 50 美元。Fable 5 已全面上线,Mythos 5 暂限 Glasswing 合作伙伴及少量生物研究者。
关联讨论 34 条X:Rohan Paul (@rohanpaul_ai)X:Testing Catalog (@testingcatalog)X:邵猛 (@shao__meng)IT之家(RSS)Ars Technica:AI(RSS)X:Yuchen Jin (@Yuchenj_UW)Anthropic:Newsroom(网页)X:Anthropic (@AnthropicAI)Hacker News 热门(buzzing.cc 中文翻译)X:阿易 AI Notes (@AYi_AInotes)公众号:卡尔的AI沃茨X:Kim (@kimmonismus)The Decoder:AI News(RSS)TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)X:Perplexity (@perplexity_ai)The Verge:AI(RSS)Simon Willison 博客X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)Gary Marcus:The Road to AI We Can Trust(RSS)X:小互 (@xiaohu)Tomer Tunguz 博客(VC 分析)X:Berry Xia (@berryxia)MarkTechPost(RSS)据韩国经济日报报道,三星电子计划在韩国光州建设一座先进半导体封装工厂,以应对AI芯片需求。该投资计划有望于6月29日总统会谈期间公布,三星会长李在镕、SK集团会长崔泰源等将参会。三星拒绝对此置评。先进封装已成为决定芯片性能的关键环节,三星正加码HBM市场,挑战SK海力士领先地位。当前客户涵盖英伟达、AMD及谷歌。今年5月,三星已向客户提供最新12层HBM4E内存样品。
Anthropic 发布 Claude Fable 5 与 Claude Mythos 5 两款 AI 模型。小米 MiMo 发布 V2.5-Pro-UltraSpeed,在 1 万亿参数模型上实现超过 1,000 tokens/秒的输出速度,为业内首次。
前沿 AI 系统的权力政治又向前迈进了一步。Claude Fable 5 及新 AI 安全寓言标志着这一进展。
关联讨论 34 条X:Rohan Paul (@rohanpaul_ai)X:Testing Catalog (@testingcatalog)X:邵猛 (@shao__meng)IT之家(RSS)Ars Technica:AI(RSS)X:Yuchen Jin (@Yuchenj_UW)Anthropic:Newsroom(网页)X:Anthropic (@AnthropicAI)Hacker News 热门(buzzing.cc 中文翻译)X:阿易 AI Notes (@AYi_AInotes)公众号:卡尔的AI沃茨X:Kim (@kimmonismus)The Decoder:AI News(RSS)TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)X:Perplexity (@perplexity_ai)The Verge:AI(RSS)Simon Willison 博客X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)Gary Marcus:The Road to AI We Can Trust(RSS)X:小互 (@xiaohu)Tomer Tunguz 博客(VC 分析)X:Berry Xia (@berryxia)MarkTechPost(RSS)Anthropic发布Claude Fable 5与Mythos 5,输入$10/M、输出$50/M,5%高风险请求降级到Opus 4.8,药物设计加速10倍。ServiceNow发布语码转换ASR基准,覆盖4组语言对、7个ASR系统,Scribe V2、Gemini 3 Flash和AssemblyAI表现最稳。Salesforce从20,000个Agentforce企业客户总结:支持Agent处理3百万次对话,上线后运营是难点。
http://x.com/i/article/2064485562875260928
Wix VP @IShmool 推出的免费课程「Zero to Claude Code」现已支持简体中文,作者专门用中文官宣并感谢中文 AI 社区。该课程面向零基础学习者,讲解如何用 Claude Code 从零构建真实产品。已有 300 名中国学生参与学习。课程完全免费,访问 zero2claude.dev 即可开始。
zero2claude 正式推出简体中文版。 已有 300 名中国学生在学习用 Claude Code 从零开始构建真正的产品。 感谢 @shao__meng 和中国 AI 社区的支持 🇨🇳 免费课程,零基础也能上手。
Anthropic 发布 Claude Fable 5,这是经过安全处理的 Mythos 级模型,能力超越以往任何公开发布模型。它在软件工程、知识工作、科研和视觉等基准测试中几乎全线 SOTA,长任务越复杂领先越明显。在网络、生物化学、蒸馏等高风险领域,模型会自动回退至 Opus 4.8,平均每 20 次对话触发一次。同时,Anthropic 向少数可信的网络安全与关键基础设施团队开放完全版 Mythos 5,后续将扩大受信任访问。此举证明顶尖 AI 可在能力与安全之间同时达到极致。
Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...
关联讨论 34 条X:Rohan Paul (@rohanpaul_ai)X:Testing Catalog (@testingcatalog)X:邵猛 (@shao__meng)IT之家(RSS)Ars Technica:AI(RSS)X:Yuchen Jin (@Yuchenj_UW)Anthropic:Newsroom(网页)X:Anthropic (@AnthropicAI)Hacker News 热门(buzzing.cc 中文翻译)X:阿易 AI Notes (@AYi_AInotes)公众号:卡尔的AI沃茨X:Kim (@kimmonismus)The Decoder:AI News(RSS)TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)X:Perplexity (@perplexity_ai)The Verge:AI(RSS)Simon Willison 博客X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)Gary Marcus:The Road to AI We Can Trust(RSS)X:小互 (@xiaohu)Tomer Tunguz 博客(VC 分析)X:Berry Xia (@berryxia)MarkTechPost(RSS)Cohere推出North Mini Code开源模型,总参数30B,活跃参数仅3B,采用Apache 2.0许可。该模型在Artificial Analysis Coding Index上跑出33.4分,与同量级模型竞争,专为智能体编程(agentic coding)优化,支持本地运行、自由修改和迭代。开发者首次能完全掌控coding agent,而非依赖云端黑盒。
Small: 30 billion parameters, 3B active. Efficient: Benchmarks to 33.4 on the Artificial Analysis Coding Index, competit...
Google 宣布 Gemini 模型已通过 Apple Foundation Models 框架及 Xcode 原生支持,向数百万 Apple 开发者开放。开发者可在共享 API 接口上切换本地与云端推理,构建智能体式应用并提升开发速度;Xcode 内还提供 Gemini 智能体编码辅助,加速多步骤开发任务。
Gemini models are now accessible to millions of Apple developers through Apple's Foundation Models framework and nativel...
Matthew Berman 一周实测 Fable(Mythos),认为这是真正的下一代模型,但存在明显怪癖。优点:Workflow 模式能瞬间拉起几百个 agent 并行全量代码审查,找出 bug 和边缘 case 的数量是 Claude/GPT 的一倍以上;自主性极强,敢于长时间自主完成超长时域任务。缺点:极度啰嗦、信息密度过高;喜欢反复问澄清问题;速度慢,简单任务五分钟才输出几千 token。建议把 effort level 调到最低。总结:Fable 5 是当前最强模型,适合最复杂的任务,但价格高昂,简单任务不推荐。
Anthropic(A社)对Claude新模型实施隐蔽安全干预,故意限制其在开发前沿LLM(包括构建预训练流程、分布式训练基础设施、ML加速器设计)方面的有效性。该干预通过提示修改、引导向量或参数高效微调(PEFT)实现,对用户不可见,仅影响约0.03%流量及不到0.1%组织。引用指出这意在削弱模型对前沿LLM研究的能力,对研究社区造成恶劣影响。
mythos will be bad ON PURPOSE on ai "frontier llm research" tasks, this is very very sad for the research community also...
小道消息:Anthropic 将于今晚发布其最强 AI 模型Mythos...
Claude Fable 一旦停止提供帮助,用户将无从得知。该帖子在 Hacker News 获得 106 个点赞。
Hacker News 上一个帖子询问用户是否仍在坚持使用 Apple Vision Pro。该提问获得了 102 个 HN 积分。
We've reset usage limits across our products! For those just starting to test Fable, here's four tips for using it more ...
We've reset 5-hour and weekly rate limits for all users. Enjoy Fable 5!
Notion 利用 Codex 一次性生成产品规格、构建面向网页的 AI 语音输入功能,并提升小团队的工程效率。
Wes McKinney 开发的 AgentsView 是一个用于追踪本地编码智能体 token 使用情况的工具。由于近日发布的 Claude Fable 5 尚未被收录进 AgentsView 的定价数据库,作者利用 Fable 逆向工程,找到了为该模型设置自定义价格的方法,并展示了 Fable 5 当天在不同本地项目中的使用量树状图。
IBM CEO Arvind Krishna表示AI不会必然导致员工数量减少。他透露IBM已在量子计算(一种更快形式的AI)上投资100亿美元,并指出联邦政府承诺投入10亿美元在纽约Albany建设芯片制造设施,体现了公私部门间的紧密合作。
Lumentum 首席执行官 Michael Hurlston 指出,磷化铟(indium phosphide)在光芯片尤其是激光器中扮演关键角色,对 AI 革命至关重要。数据中心对速度和带宽的需求持续增长,正推动行业向光纤光学连接转型——光能提供无与伦比的传输速度。
We've reset 5-hour and weekly rate limits for all users. Enjoy Fable 5!
Thinnernet 是一个正在构建中的并行互联网项目。该帖子在 Hacker News 上获得 100 个点赞。
将Kolmogorov-Arnold Networks(KAN)部署于FPGA,实现超高速机器学习推理。
Anthropic的Claude 5 Fable(代号Mythos)在几乎所有AI能力基准测试中达到SOTA,长复杂任务优势尤为显著。模型更节约token,可在数百万tokens长任务中保持专注。Stripe早期测试中,Fable 5将5000万行Ruby代码库的迁移压缩到一天完成,而人工团队需两个多月。Gemini 3.5 Pro与GPT-5.6临近发布(GPT-5.6最早下周推出),面临压力。此次发布提振了Anthropic即将进行的IPO,证明其在性能与效率上仍能大幅跃升。
Claude 5 Fable tl;dr - It is state-of-the-art on nearly all tested benchmarks of AI capability, showing exceptional perf...