AIHOT

全部动态

全部一手资讯 X 论文

6月10日周三

6月10日

09:40

Thariq@trq212

我在 Code w/ Claude Tokyo 现场！如果你看到我，打个招呼吧。

Anthropic其他

09:36

凡人小北@frxiaobei

Anthropic 家的模型文字水平高，从他们家的模型起名就能看得出来。 haiku sonnet opus fable mythos 隔壁 OpenAI 家就土了很多，理科生无疑。

Claude: Fable 5 is state-of-the-art on nearly all tested benchmarks, with exceptional performance in software engineering, knowl...

AnthropicOpenAI其他

09:20

Simon Willison 博客

Anthropic 对 Claude Fable 5 引入静默干预：限制前沿 LLM 开发回答

Anthropic 在 Fable 5 与 Mythos 5 系统卡中披露新干预措施：当用户询问构建预训练管道、分布式训练基础设施或 ML 加速器设计等前沿 LLM 开发问题时，Claude 会通过提示词修改、转向向量或参数高效微调（PEFT）限制回答有效性，且用户不可见此干预——模型不会回退到其他版本。Anthropic 称此举旨在避免加速最可能违反服务条款的参与者，估算仅影响约 0.03% 流量，集中在不到 0.1% 的组织。这是其首次公开此类静默干预，引发关于模型以减缓竞争研究为目的篡改回复的伦理担忧。

Anthropic大佬观点

09:17

meng shao@shao__meng

Anthropic Claude 系列模型，价格真的是遥遥领先如果 Claude Fable 5 来个 Fast Mode，难道要： input $60， output $300 ？？？你（token）比我挣得都多，我咋用？

Anthropic大佬观点

09:17

meng shao@shao__meng

博主对比Claude Fable 5与Step 3.7 Flash官方API价格：输入/输出约50倍，缓存命中输入约100倍；开启Fast Mode（速度×3，价格×6）后分别升至约300倍、300倍、600倍。作为实例，用Step 3.7 Flash完成真实Coding Agent任务：将Agent Memory运行痕迹（含memory events、structured facts、memory chunks等）生成为单文件HTML工具agent_memory_inspector.html，可查看8条事件、9条事实、8个chunk、9/9测试通过等信息，展示了模型将混乱Agent traces转化为可用检查工具的能力。

meng shao: 我这次用 Step 3.7 Flash 测了一个真实 Coding Agent 任务: 把一组 Agent Memory 的运行痕迹,做成本地可检查的 Memory Inspector。输入不是干净需求文档,是一个已有 Local Age...

智能体Anthropic编码评测/基准

09:07

Berryxia.AI@berryxia

之前买高铁票没有注意，居然直接可以选择静音车厢。车险内没有手机外放震天响的短视频声音，旅途Vibe Coding 简直不要太爽啊！刚刚有人外放声音，乘务员直接当场制止😂 太爽了…

其他编码

09:07

Berryxia.AI@berryxia

猴哥都主动祝贺Anthropic 的Fable 5 了。那么，问题来了。 Google 人呢？虽然，Google 也是A社30 亿美金的大股东，但也要努力啊！

Logan Kilpatrick: congrats to the Anthropic team on Fable!!

AnthropicGoogle大佬观点模型发布

08:47

meng shao@shao__meng

精选75

Perplexity与哈佛商学院研究：AI Agent Computer相比Search使知识工作耗时降87%成本降94%

Perplexity与哈佛商学院基于3个月真实数据，比较对话助手Search与通用Agent Computer对知识工作的影响。核心发现：①自主性：Computer平均执行26分钟（Search仅33秒），用户中断率相近（3.7% vs 3.4%），满意度不满降低55%；②效率：任务时间从269分钟降至36分钟（节省87%），成本降94%（约16倍），编程领域时间降92%成本降96%；③范围：Computer 59%查询超出主职业（Search 50%），76%为高阶认知（Search 55%），50%达创造层级（Search 26%）。用户角色从逐步指挥转向验收与迭代。

Perplexity: We published new research with Harvard on the shift from chat interfaces to autonomous agents like Computer. Over 3 mont...

智能体现象/趋势

关联讨论 1 条

推荐理由：Perplexity和哈佛联手用真实数据第一个证明Agent对知识工作的效率提升，87%时间和94%成本不是口号，产品经理是该看一眼。

08:47

meng shao@shao__meng

精选77

Text-To-Lottie：Agent Skill + 本地预览 Harness，让 Agent 生成 Lottie 动画并实时验收

开源项目 Text-To-Lottie 提供一套 Agent Skill 和本地预览工具，让 Codex/Claude Code/Cursor 等 Agent 生成标准 Bodymovin JSON（public/lottie.json），通过 Skottie 渲染引擎在浏览器中实时验收。安装命令：`npx skills add diffusionstudio/lottie`。技术特点：输出标准 Lottie JSON，使用 Skottie 渲染（非 lottie-web）；基于 Vite 热重载实现自动刷新闭环；支持通过 Skottie Slots + controls.json 调整颜色、尺寸；Agent 可用 URL 参数 `?frame=60&paused=1` 精确定位帧截图。Prompt 指南包括：给具体素材、使用动效术语、pan/zoom/hold 模拟镜头、显式声明 Slots、锁定时间规格。适合单场景短时长 Motion Graphics、SVG→Lottie、数据可视化、透明背景矢量动效；不适合多镜头剪辑、复杂角色绑定、粒子、3D 或需 lottie-web 全特性的场景。

konstantinpaulus: Introducing text-to-lottie: an open source skill and harness for generating production ready Lottie animations with code...

智能体MCP/工具开源/仓库

推荐理由：让 Agent 写出能直接渲染的 Lottie JSON，这套 Skill + Harness 把生成到验收的链路打得很完整，前端和做动效的都可以直接试。

08:43

小互@xiaohu

Claude 重置用量并给出 Fable 使用四条建议

Claude 重置了所有用量。官方对使用 Fable 提出四条建议：分配比之前模型能处理的更大任务；默认使用 xhigh/high 努力程度以获得最佳性能，med 用于更快的交互式会话；重新调整技能和 CLAUDE.md，避免旧指令让 Fable 陷入陈旧模式；从提供任务转向提供目标，描述完成样貌并让 Fable 通过 /loop 和 /goal 自行寻找路径。

Anthropic教程/实践编码

08:39

jason@jxnlco

非常兴奋看到规模扩展仍然有效。

OpenAI大佬观点

08:27

IT之家（RSS）

苹果高管回应为何 iOS 27 推出 Siri 独立应用：方便查看历史对话

iOS 27 新增 Siri 独立应用，苹果高管克雷格·费德里吉在发布会后技术分享会上解释，推出该应用并非转变聊天机器人战略，而是为用户提供一处可回看、查阅过往 Siri 对话记录的入口。他指出，Siri 本质上是深入融入系统、随用随取的交互工具，而非孤立聊天工具；在主屏幕放置独立应用是让用户管理历史对话的最直观方式。

产品更新语音

08:25

karminski-牙医@karminski3

Anthropic Fable 5 测试：光追代码出现变量声明错误

用户测试 Anthropic Fable 5，使用 xhigh 模式让其从零编写光追渲染器。生成的 PBR 与 BRDF 代码质量出色，但出现变量声明晚于引用的错误，导致代码直接报错。推测模型过度关注核心算法逻辑，忽略了变量声明等细节。此外，成本高昂，仅生成该网页就花费 2 美元。作者调侃 AI 超越人类还为时尚早——因为自己的工资负担不起。

Anthropic编码评测/基准

08:22

The Verge：订阅版科技（RSS）

我体验了 Siri AI：虽然还在早期，但它真的能用了

新版 Siri AI 体验后评价为“基础但确实能用”，这本身就是一个重要突破。该版本在响应准确率和任务完成度上表现可靠，标志着苹果语音助手在 AI 能力上的实质性进展，尽管功能尚处于早期阶段，但“能用”这一反馈已属进步。

端侧评测/基准语音

08:20

Simon Willison 博客

Claude Fable 5 初步印象：容量更大、知识更丰富但速度慢价格高

Anthropic 发布 Claude Fable 5 与 Claude Mythos 5，后者无安全分类器。两模型均支持 1M token 上下文窗口、128k 最大输出 token，知识截止至 2026 年 1 月，定价为 Opus 4.5/4.6/4.7/4.8 的两倍（$10/百万输入 token，$50/百万输出 token）。Simon Willison 测试发现 Fable 5 知识更丰富、响应更详细（如列出其开源项目远超 Opus 4.8 的准确度），但速度慢且价格高昂，推测为迄今最大模型之一。Anthropic 称 Fable 5 与 Mythos 5 性能相同，但安全护栏更严格，API 新增回退机制及护栏触发通知。

Anthropic模型发布编码评测/基准

08:17

meng shao@shao__meng

Claude Fable 5 发布好可能是好一些，贵是真的贵，再搭配 Loop，token 成本原地起飞了。

Claude: Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...

Anthropic模型发布

08:07

Berryxia.AI@berryxia

Fable 5 一周测评：不如 Opus 和 GPT 实用

海外博主 Matthew Berman 对 Fable 5 进行了一周实战测评。结论是 Fable 5 价格高昂，不适合普通 Vibe Coding 场景，仅在专业领域、超长时任务中可能有所发挥。相比之下，Opus 和 GPT 等模型更可靠、更具性价比，建议普通用户优先选择 Opus 和 GPT。

Berryxia.AI: http://x.com/i/article/2064479983104602112

评测/基准

08:07

Berryxia.AI@berryxia

Fable 5 模型标注"Included until June 22"，订阅用户此前可免费体验，6月22日后仅能通过API使用。主推文猜测届时将验证所谓"中转站"是否真正提供Fable 5模型（暗示可能存在假模型）。

indigo: Fable 5 的这个"Included until June 22"是什么意思?订阅用户只在六月22号前才能免费体验一下么,后面要单独收费吗?

其他

08:06

Orange AI@oran_ge

Claude 产品线命名：从俳句到神话的全解析

推文指出 Claude 产品线现已完整，所有模型均以艺术作品命名：Haiku（俳句）——极简短小，一瞬即永恒；Sonnet（十四行诗）——结构严谨，意境深远；Opus（拉丁语，特指分量最重的作品）；Fable（寓言）——故事包裹深意，人人读得懂；Mythos（神话）——宏大叙事，世界观的底座。整条产品线通过艺术名称体现各模型定位。

Anthropic大佬观点

08:06

Orange AI@oran_ge

Claude Fable 5 的三项争议点

Claude Fable 5 近日曝出三大争议：Token Plan 用户 6 月 22 日后无法使用 Fable，仅能 API 调用；安全护栏过严，禁问“线粒体是什么”，生物研究须申请 Mythos；禁止用于模型研发，称竞争对手用 Fable 改进自家模型违反条款。推文批评美国厂商一边鼓吹打通 Loop，一边阻止其他玩家进入，形成闭环。

Anthropic大佬观点安全/对齐

07:50

公众号：数字生命卡兹克

Claude Fable 5 正式发布：Mythos 5 加入安全分类器后开放，多项基准 SOTA

Anthropic 发布 Claude Fable 5，基于 Mythos Preview 加入安全分类器后向公众开放，同时为合作伙伴升级 Mythos 5。Fable 5 在多项基准测试中取得 SOTA，每百万输入 token 10 美元、输出 token 50 美元。即日起至 6 月 22 日，Pro、Max、Team 及企业版订阅用户可免费使用，之后仅通过 API 提供。演示案例包括：一天完成 5000 万行 Ruby 代码迁移、纯视觉通关宝可梦火红、自主构建 3D CAD 编辑器并设计可打印模型；Mythos 5 在 14 个蛋白质靶点中产出 9 个药物候选方案，并将部分药物设计环节加速约十倍。

Anthropic大佬观点安全/对齐编码

关联讨论 28 条

07:44

The Verge：AI（RSS）

我试用了 Siri AI，目前来看确实好用

苹果新版 Siri AI 终于能一次性从邮件或排版混乱的传单中提取足球赛或“精神周”主题日并添加到日历上。它还支持对话式交互，例如讨论花园玫瑰病害、整理五金店购物清单、设置花床堆肥提醒，并能引用邮件和日历中的信息来生成推荐。

教程/实践语音

07:40

swyx@swyx

swyx 表示，当前在 Fable 上让 Claude Code 执行 "review my code for issues" 时不按使用量收费，建议开发者在发布前先用 Fable CheckTM 检查，否则可能发现已上线代码存在严重问题。他引用自己重跑 FC Diamond 历史数据的推文，指出官方表格/图表未充分反映 Fable 的起飞程度--Fable 是不同级别的模型，带有明显的"大模型气息"。

swyx: just finished rerunning FC Diamond on my historical charts. none of the official tables/charts are capturing the degree ...

Anthropic教程/实践编码

07:39

jason@jxnlco

一个 fable 5 工作流能替换多少顾问？

智能体其他

07:27

Nathan Lambert：Interconnects（RSS）

Claude Fable 5 与新的 AI 安全寓言

前沿 AI 系统的权力政治又向前迈进了一步。Claude Fable 5 及新 AI 安全寓言标志着这一进展。

大佬观点安全/对齐

关联讨论 28 条

07:23

SemiAnalysis@SemiAnalysis_

Anthropic大佬观点安全/对齐

07:19

ginobefun@hongming731

BestBlogs早报

智能体AnthropicOpenAI现象/趋势

07:19

ginobefun@hongming731

BestBlogs 早报 · 06-10

Anthropic发布Claude Fable 5与Mythos 5，输入$10/M、输出$50/M，5%高风险请求降级到Opus 4.8，药物设计加速10倍。ServiceNow发布语码转换ASR基准，覆盖4组语言对、7个ASR系统，Scribe V2、Gemini 3 Flash和AssemblyAI表现最稳。Salesforce从20,000个Agentforce企业客户总结：支持Agent处理3百万次对话，上线后运营是难点。

ginobefun: http://x.com/i/article/2064485562875260928

智能体Anthropic检索增强模型发布

07:17

meng shao@shao__meng

Zero to Claude Code 免费课程上线简体中文版

Wix VP @IShmool 推出的免费课程「Zero to Claude Code」现已支持简体中文，作者专门用中文官宣并感谢中文 AI 社区。该课程面向零基础学习者，讲解如何用 Claude Code 从零构建真实产品。已有 300 名中国学生参与学习。课程完全免费，访问 zero2claude.dev 即可开始。

itay shmool 🇮🇱☮️✨️: zero2claude 正式推出简体中文版。已有 300 名中国学生在学习用 Claude Code 从零开始构建真正的产品。感谢 @shao__meng 和中国 AI 社区的支持 🇨🇳 免费课程,零基础也能上手。

智能体教程/实践编码

07:12

Nathan Lambert@natolambert

我认为Anthropic在发布Claude Fable 5时的不均衡安全政策损害了更广泛AI社区的凝聚力，并加速了AI短期发展中更大的不确定性和风险。

Anthropic大佬观点安全/对齐

07:07

Berryxia.AI@berryxia

Gemini 模型通过 Apple Foundation Models 框架及 Xcode 向 Apple 开发者开放

Google 宣布 Gemini 模型已通过 Apple Foundation Models 框架及 Xcode 原生支持，向数百万 Apple 开发者开放。开发者可在共享 API 接口上切换本地与云端推理，构建智能体式应用并提升开发速度；Xcode 内还提供 Gemini 智能体编码辅助，加速多步骤开发任务。

Google for Developers: Gemini models are now accessible to millions of Apple developers through Apple's Foundation Models framework and nativel...

Google行业动态

07:07

Berryxia.AI@berryxia

Matthew Berman 一周实测 Fable（Mythos）：下一代模型但怪癖明显

Matthew Berman 一周实测 Fable（Mythos），认为这是真正的下一代模型，但存在明显怪癖。优点：Workflow 模式能瞬间拉起几百个 agent 并行全量代码审查，找出 bug 和边缘 case 的数量是 Claude/GPT 的一倍以上；自主性极强，敢于长时间自主完成超长时域任务。缺点：极度啰嗦、信息密度过高；喜欢反复问澄清问题；速度慢，简单任务五分钟才输出几千 token。建议把 effort level 调到最低。总结：Fable 5 是当前最强模型，适合最复杂的任务，但价格高昂，简单任务不推荐。

智能体推理评测/基准

06:45

Ethan Mollick@emollick

Anthropic 可能在两周内取消 Fable 的订阅访问权限，这很奇怪，也阻碍了用户投入学习模型。订阅使用是了解模型优势的方式，因为它允许实验。只有付费访问很受限。

Anthropic大佬观点行业动态

06:40

Hacker News 热门（buzzing.cc 中文翻译）

如果 Claude Fable 不再帮助你，你永远都不会知道

Claude Fable 一旦停止提供帮助，用户将无从得知。该帖子在 Hacker News 获得 106 个点赞。

智能体Anthropic安全/对齐

06:40

Hacker News 热门（buzzing.cc 中文翻译）

Ask HN：你还在用 Vision Pro 吗？

Hacker News 上一个帖子询问用户是否仍在坚持使用 Apple Vision Pro。该提问获得了 102 个 HN 积分。

现象/趋势

06:39

Chubby♨️@kimmonismus

Anthropic重置了产品使用限制，并分享四条使用Fable模型的技巧：1）分配比此前模型更宏大、更具挑战性的任务；2）默认使用xhigh/high effort获最佳性能，medium适合快速交互；3）重写Skills和CLAUDE.mds，避免旧指令限制Fable的自主判断；4）从提供任务转向提供目标，描述完成状态和验证方式，让Fable自行规划路径（/loop与/goal命令专为此设计）。

Alex Albert: We've reset usage limits across our products! For those just starting to test Fable, here's four tips for using it more ...

AnthropicMCP/工具大佬观点

06:22

OpenAI：官网动态（RSS · 排除企业/客户案例）

Codex 为 Notion 解锁的能力

Notion 利用 Codex 一次性生成产品规格、构建面向网页的 AI 语音输入功能，并提升小团队的工程效率。

OpenAI教程/实践编码语音

06:19

Simon Willison 博客

精选71

在 AgentsView 中为 Claude Fable 5 设置自定义价格

Wes McKinney 开发的 AgentsView 是一个用于追踪本地编码智能体 token 使用情况的工具。由于近日发布的 Claude Fable 5 尚未被收录进 AgentsView 的定价数据库，作者利用 Fable 逆向工程，找到了为该模型设置自定义价格的方法，并展示了 Fable 5 当天在不同本地项目中的使用量树状图。

智能体教程/实践部署/工程

推荐理由：如果你也用 coding agent 且在乎成本，Simon 这个自定义价格技巧能让你第一时间把新模型纳入追踪，简单但实用。

06:18

Bloomberg：Technology（RSS）

Lumentum CEO：光学行业迎来巨大机遇

Lumentum 首席执行官 Michael Hurlston 指出，磷化铟（indium phosphide）在光芯片尤其是激光器中扮演关键角色，对 AI 革命至关重要。数据中心对速度和带宽的需求持续增长，正推动行业向光纤光学连接转型——光能提供无与伦比的传输速度。

行业动态

06:10

Hacker News 热门（buzzing.cc 中文翻译）

我正在构建一个并行互联网，它被称为"Thinnernet"

Thinnernet 是一个正在构建中的并行互联网项目。该帖子在 Hacker News 上获得 100 个点赞。

其他