AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
6月10日周三
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月10日
09:40
Thariq@trq212
13
我在 Code w/ Claude Tokyo 现场!如果你看到我,打个招呼吧。
Anthropic其他
09:36
凡人小北@frxiaobei
15
Anthropic 家的模型文字水平高,从他们家的模型起名就能看得出来。 haiku sonnet opus fable mythos 隔壁 OpenAI 家就土了很多,理科生无疑。

Claude: Fable 5 is state-of-the-art on nearly all tested benchmarks, with exceptional performance in software engineering, knowl...

AnthropicOpenAI其他
09:20
Simon Willison 博客
61
Anthropic 对 Claude Fable 5 引入静默干预:限制前沿 LLM 开发回答

Anthropic 在 Fable 5 与 Mythos 5 系统卡中披露新干预措施:当用户询问构建预训练管道、分布式训练基础设施或 ML 加速器设计等前沿 LLM 开发问题时,Claude 会通过提示词修改、转向向量或参数高效微调(PEFT)限制回答有效性,且用户不可见此干预——模型不会回退到其他版本。Anthropic 称此举旨在避免加速最可能违反服务条款的参与者,估算仅影响约 0.03% 流量,集中在不到 0.1% 的组织。这是其首次公开此类静默干预,引发关于模型以减缓竞争研究为目的篡改回复的伦理担忧。

Anthropic大佬观点
09:17
meng shao@shao__meng
22
Anthropic Claude 系列模型,价格真的是遥遥领先 如果 Claude Fable 5 来个 Fast Mode,难道要: input $60, output $300 ??? 你 (token) 比我挣得都多,我咋用?
Anthropic大佬观点
09:17
meng shao@shao__meng
53
博主对比Claude Fable 5与Step 3.7 Flash官方API价格:输入/输出约50倍,缓存命中输入约100倍;开启Fast Mode(速度×3,价格×6)后分别升至约300倍、300倍、600倍。作为实例,用Step 3.7 Flash完成真实Coding Agent任务:将Agent Memory运行痕迹(含memory events、structured facts、memory chunks等)生成为单文件HTML工具agent_memory_inspector.html,可查看8条事件、9条事实、8个chunk、9/9测试通过等信息,展示了模型将混乱Agent traces转化为可用检查工具的能力。

meng shao: 我这次用 Step 3.7 Flash 测了一个真实 Coding Agent 任务: 把一组 Agent Memory 的运行痕迹,做成本地可检查的 Memory Inspector。 输入不是干净需求文档,是一个已有 Local Age...

智能体Anthropic编码评测/基准
09:07
Berryxia.AI@berryxia
15
之前买高铁票没有注意,居然直接可以选择静音车厢。 车险内没有手机外放震天响的短视频声音,旅途Vibe Coding 简直不要太爽啊! 刚刚有人外放声音,乘务员直接当场制止😂 太爽了…
其他编码
09:07
Berryxia.AI@berryxia
41
猴哥都主动祝贺Anthropic 的Fable 5 了。 那么,问题来了。 Google 人呢? 虽然,Google 也是A社30 亿美金的大股东,但也要努力啊!

Logan Kilpatrick: congrats to the Anthropic team on Fable!!

AnthropicGoogle大佬观点模型发布
08:47
meng shao@shao__meng
精选75
Perplexity与哈佛商学院研究:AI Agent Computer相比Search使知识工作耗时降87%成本降94%

Perplexity与哈佛商学院基于3个月真实数据,比较对话助手Search与通用Agent Computer对知识工作的影响。核心发现:①自主性:Computer平均执行26分钟(Search仅33秒),用户中断率相近(3.7% vs 3.4%),满意度不满降低55%;②效率:任务时间从269分钟降至36分钟(节省87%),成本降94%(约16倍),编程领域时间降92%成本降96%;③范围:Computer 59%查询超出主职业(Search 50%),76%为高阶认知(Search 55%),50%达创造层级(Search 26%)。用户角色从逐步指挥转向验收与迭代。

Perplexity: We published new research with Harvard on the shift from chat interfaces to autonomous agents like Computer. Over 3 mont...

智能体现象/趋势
关联讨论 1 条X:Perplexity (@perplexity_ai)
推荐理由:Perplexity和哈佛联手用真实数据第一个证明Agent对知识工作的效率提升,87%时间和94%成本不是口号,产品经理是该看一眼。
08:47
meng shao@shao__meng
精选77
Text-To-Lottie:Agent Skill + 本地预览 Harness,让 Agent 生成 Lottie 动画并实时验收

开源项目 Text-To-Lottie 提供一套 Agent Skill 和本地预览工具,让 Codex/Claude Code/Cursor 等 Agent 生成标准 Bodymovin JSON(public/lottie.json),通过 Skottie 渲染引擎在浏览器中实时验收。安装命令:`npx skills add diffusionstudio/lottie`。技术特点:输出标准 Lottie JSON,使用 Skottie 渲染(非 lottie-web);基于 Vite 热重载实现自动刷新闭环;支持通过 Skottie Slots + controls.json 调整颜色、尺寸;Agent 可用 URL 参数 `?frame=60&paused=1` 精确定位帧截图。Prompt 指南包括:给具体素材、使用动效术语、pan/zoom/hold 模拟镜头、显式声明 Slots、锁定时间规格。适合单场景短时长 Motion Graphics、SVG→Lottie、数据可视化、透明背景矢量动效;不适合多镜头剪辑、复杂角色绑定、粒子、3D 或需 lottie-web 全特性的场景。

konstantinpaulus: Introducing text-to-lottie: an open source skill and harness for generating production ready Lottie animations with code...

智能体MCP/工具开源/仓库

推荐理由:让 Agent 写出能直接渲染的 Lottie JSON,这套 Skill + Harness 把生成到验收的链路打得很完整,前端和做动效的都可以直接试。
08:43
小互@xiaohu
70
Claude 重置用量并给出 Fable 使用四条建议

Claude 重置了所有用量。官方对使用 Fable 提出四条建议:分配比之前模型能处理的更大任务;默认使用 xhigh/high 努力程度以获得最佳性能,med 用于更快的交互式会话;重新调整技能和 CLAUDE.md,避免旧指令让 Fable 陷入陈旧模式;从提供任务转向提供目标,描述完成样貌并让 Fable 通过 /loop 和 /goal 自行寻找路径。

Anthropic教程/实践编码
08:39
jason@jxnlco
17
非常兴奋看到规模扩展仍然有效。
OpenAI大佬观点
08:27
IT之家(RSS)
56
苹果高管回应为何 iOS 27 推出 Siri 独立应用:方便查看历史对话

iOS 27 新增 Siri 独立应用,苹果高管克雷格·费德里吉在发布会后技术分享会上解释,推出该应用并非转变聊天机器人战略,而是为用户提供一处可回看、查阅过往 Siri 对话记录的入口。他指出,Siri 本质上是深入融入系统、随用随取的交互工具,而非孤立聊天工具;在主屏幕放置独立应用是让用户管理历史对话的最直观方式。

产品更新语音
08:25
karminski-牙医@karminski3
64
Anthropic Fable 5 测试:光追代码出现变量声明错误

用户测试 Anthropic Fable 5,使用 xhigh 模式让其从零编写光追渲染器。生成的 PBR 与 BRDF 代码质量出色,但出现变量声明晚于引用的错误,导致代码直接报错。推测模型过度关注核心算法逻辑,忽略了变量声明等细节。此外,成本高昂,仅生成该网页就花费 2 美元。作者调侃 AI 超越人类还为时尚早——因为自己的工资负担不起。

Anthropic编码评测/基准
08:22
The Verge:订阅版科技(RSS)
51
我体验了 Siri AI:虽然还在早期,但它真的能用了

新版 Siri AI 体验后评价为“基础但确实能用”,这本身就是一个重要突破。该版本在响应准确率和任务完成度上表现可靠,标志着苹果语音助手在 AI 能力上的实质性进展,尽管功能尚处于早期阶段,但“能用”这一反馈已属进步。

端侧评测/基准语音
08:20
Simon Willison 博客
67
Claude Fable 5 初步印象:容量更大、知识更丰富但速度慢价格高

Anthropic 发布 Claude Fable 5 与 Claude Mythos 5,后者无安全分类器。两模型均支持 1M token 上下文窗口、128k 最大输出 token,知识截止至 2026 年 1 月,定价为 Opus 4.5/4.6/4.7/4.8 的两倍($10/百万输入 token,$50/百万输出 token)。Simon Willison 测试发现 Fable 5 知识更丰富、响应更详细(如列出其开源项目远超 Opus 4.8 的准确度),但速度慢且价格高昂,推测为迄今最大模型之一。Anthropic 称 Fable 5 与 Mythos 5 性能相同,但安全护栏更严格,API 新增回退机制及护栏触发通知。

Anthropic模型发布编码评测/基准
08:17
meng shao@shao__meng
45
Claude Fable 5 发布 好可能是好一些,贵是真的贵,再搭配 Loop,token 成本原地起飞了。

Claude: Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...

Anthropic模型发布
08:07
Berryxia.AI@berryxia
51
Fable 5 一周测评:不如 Opus 和 GPT 实用

海外博主 Matthew Berman 对 Fable 5 进行了一周实战测评。结论是 Fable 5 价格高昂,不适合普通 Vibe Coding 场景,仅在专业领域、超长时任务中可能有所发挥。相比之下,Opus 和 GPT 等模型更可靠、更具性价比,建议普通用户优先选择 Opus 和 GPT。

Berryxia.AI: http://x.com/i/article/2064479983104602112

评测/基准
08:07
Berryxia.AI@berryxia
17
Fable 5 模型标注"Included until June 22",订阅用户此前可免费体验,6月22日后仅能通过API使用。主推文猜测届时将验证所谓"中转站"是否真正提供Fable 5模型(暗示可能存在假模型)。

indigo: Fable 5 的这个"Included until June 22"是什么意思?订阅用户只在六月22号前才能免费体验一下么,后面要单独收费吗?

其他
08:06
Orange AI@oran_ge
30
Claude 产品线命名:从俳句到神话的全解析

推文指出 Claude 产品线现已完整,所有模型均以艺术作品命名:Haiku(俳句)——极简短小,一瞬即永恒;Sonnet(十四行诗)——结构严谨,意境深远;Opus(拉丁语,特指分量最重的作品);Fable(寓言)——故事包裹深意,人人读得懂;Mythos(神话)——宏大叙事,世界观的底座。整条产品线通过艺术名称体现各模型定位。

Anthropic大佬观点
08:06
Orange AI@oran_ge
61
Claude Fable 5 的三项争议点

Claude Fable 5 近日曝出三大争议:Token Plan 用户 6 月 22 日后无法使用 Fable,仅能 API 调用;安全护栏过严,禁问“线粒体是什么”,生物研究须申请 Mythos;禁止用于模型研发,称竞争对手用 Fable 改进自家模型违反条款。推文批评美国厂商一边鼓吹打通 Loop,一边阻止其他玩家进入,形成闭环。

Anthropic大佬观点安全/对齐
07:50
公众号:数字生命卡兹克
77
Claude Fable 5 正式发布:Mythos 5 加入安全分类器后开放,多项基准 SOTA

Anthropic 发布 Claude Fable 5,基于 Mythos Preview 加入安全分类器后向公众开放,同时为合作伙伴升级 Mythos 5。Fable 5 在多项基准测试中取得 SOTA,每百万输入 token 10 美元、输出 token 50 美元。即日起至 6 月 22 日,Pro、Max、Team 及企业版订阅用户可免费使用,之后仅通过 API 提供。演示案例包括:一天完成 5000 万行 Ruby 代码迁移、纯视觉通关宝可梦火红、自主构建 3D CAD 编辑器并设计可打印模型;Mythos 5 在 14 个蛋白质靶点中产出 9 个药物候选方案,并将部分药物设计环节加速约十倍。

Anthropic大佬观点安全/对齐编码
关联讨论 28 条公众号:卡尔的AI沃茨TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)Anthropic:Newsroom(网页)X:Perplexity (@perplexity_ai)Simon Willison 博客The Verge:AI(RSS)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Rohan Paul (@rohanpaul_ai)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)IT之家(RSS)X:卡兹克 (@Khazix0918)X:阿易 AI Notes (@AYi_AInotes)X:小互 (@xiaohu)Tomer Tunguz 博客(VC 分析)
07:44
The Verge:AI(RSS)
59
我试用了 Siri AI,目前来看确实好用

苹果新版 Siri AI 终于能一次性从邮件或排版混乱的传单中提取足球赛或“精神周”主题日并添加到日历上。它还支持对话式交互,例如讨论花园玫瑰病害、整理五金店购物清单、设置花床堆肥提醒,并能引用邮件和日历中的信息来生成推荐。

教程/实践语音
07:40
swyx@swyx
73
swyx 表示,当前在 Fable 上让 Claude Code 执行 "review my code for issues" 时不按使用量收费,建议开发者在发布前先用 Fable CheckTM 检查,否则可能发现已上线代码存在严重问题。他引用自己重跑 FC Diamond 历史数据的推文,指出官方表格/图表未充分反映 Fable 的起飞程度--Fable 是不同级别的模型,带有明显的"大模型气息"。

swyx: just finished rerunning FC Diamond on my historical charts. none of the official tables/charts are capturing the degree ...

Anthropic教程/实践编码
07:39
jason@jxnlco
22
一个 fable 5 工作流能替换多少顾问?
智能体其他
07:27
Nathan Lambert:Interconnects(RSS)
56
Claude Fable 5 与新的 AI 安全寓言

前沿 AI 系统的权力政治又向前迈进了一步。Claude Fable 5 及新 AI 安全寓言标志着这一进展。

大佬观点安全/对齐
关联讨论 28 条公众号:卡尔的AI沃茨TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)Anthropic:Newsroom(网页)X:Perplexity (@perplexity_ai)Simon Willison 博客The Verge:AI(RSS)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Rohan Paul (@rohanpaul_ai)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)IT之家(RSS)X:卡兹克 (@Khazix0918)X:阿易 AI Notes (@AYi_AInotes)X:小互 (@xiaohu)Tomer Tunguz 博客(VC 分析)
07:23
SemiAnalysis@SemiAnalysis_
56
突发新闻:Anthropic 的最新模型如果认为你的 ML 研究/ML 工程有趣,就不会帮助你,并且/或者会秘密降低其智商,以便普通工程师不会注意到。我们已经看到 Anthropic 最新模型的内容审核过滤了我们的 GPU 推理研究和编程 😭
Anthropic大佬观点安全/对齐
07:19
ginobefun@hongming731
57
BestBlogs早报
智能体AnthropicOpenAI现象/趋势
07:19
ginobefun@hongming731
64
BestBlogs 早报 · 06-10

Anthropic发布Claude Fable 5与Mythos 5,输入$10/M、输出$50/M,5%高风险请求降级到Opus 4.8,药物设计加速10倍。ServiceNow发布语码转换ASR基准,覆盖4组语言对、7个ASR系统,Scribe V2、Gemini 3 Flash和AssemblyAI表现最稳。Salesforce从20,000个Agentforce企业客户总结:支持Agent处理3百万次对话,上线后运营是难点。

ginobefun: http://x.com/i/article/2064485562875260928

智能体Anthropic检索增强模型发布
07:17
meng shao@shao__meng
69
Zero to Claude Code 免费课程上线简体中文版

Wix VP @IShmool 推出的免费课程「Zero to Claude Code」现已支持简体中文,作者专门用中文官宣并感谢中文 AI 社区。该课程面向零基础学习者,讲解如何用 Claude Code 从零构建真实产品。已有 300 名中国学生参与学习。课程完全免费,访问 zero2claude.dev 即可开始。

itay shmool 🇮🇱☮️✨️: zero2claude 正式推出简体中文版。 已有 300 名中国学生在学习用 Claude Code 从零开始构建真正的产品。 感谢 @shao__meng 和中国 AI 社区的支持 🇨🇳 免费课程,零基础也能上手。

智能体教程/实践编码
07:12
Nathan Lambert@natolambert
57
我认为Anthropic在发布Claude Fable 5时的不均衡安全政策损害了更广泛AI社区的凝聚力,并加速了AI短期发展中更大的不确定性和风险。
Anthropic大佬观点安全/对齐
07:07
Berryxia.AI@berryxia
48
Gemini 模型通过 Apple Foundation Models 框架及 Xcode 向 Apple 开发者开放

Google 宣布 Gemini 模型已通过 Apple Foundation Models 框架及 Xcode 原生支持,向数百万 Apple 开发者开放。开发者可在共享 API 接口上切换本地与云端推理,构建智能体式应用并提升开发速度;Xcode 内还提供 Gemini 智能体编码辅助,加速多步骤开发任务。

Google for Developers: Gemini models are now accessible to millions of Apple developers through Apple's Foundation Models framework and nativel...

Google行业动态
07:07
Berryxia.AI@berryxia
62
Matthew Berman 一周实测 Fable(Mythos):下一代模型但怪癖明显

Matthew Berman 一周实测 Fable(Mythos),认为这是真正的下一代模型,但存在明显怪癖。优点:Workflow 模式能瞬间拉起几百个 agent 并行全量代码审查,找出 bug 和边缘 case 的数量是 Claude/GPT 的一倍以上;自主性极强,敢于长时间自主完成超长时域任务。缺点:极度啰嗦、信息密度过高;喜欢反复问澄清问题;速度慢,简单任务五分钟才输出几千 token。建议把 effort level 调到最低。总结:Fable 5 是当前最强模型,适合最复杂的任务,但价格高昂,简单任务不推荐。

智能体推理评测/基准
06:45
Ethan Mollick@emollick
44
Anthropic 可能在两周内取消 Fable 的订阅访问权限,这很奇怪,也阻碍了用户投入学习模型。 订阅使用是了解模型优势的方式,因为它允许实验。只有付费访问很受限。
Anthropic大佬观点行业动态
06:40
Hacker News 热门(buzzing.cc 中文翻译)
56
如果 Claude Fable 不再帮助你,你永远都不会知道

Claude Fable 一旦停止提供帮助,用户将无从得知。该帖子在 Hacker News 获得 106 个点赞。

智能体Anthropic安全/对齐
06:40
Hacker News 热门(buzzing.cc 中文翻译)
29
Ask HN: 你还在用 Vision Pro 吗?

Hacker News 上一个帖子询问用户是否仍在坚持使用 Apple Vision Pro。该提问获得了 102 个 HN 积分。

现象/趋势
06:39
Chubby♨️@kimmonismus
35
Anthropic重置了产品使用限制,并分享四条使用Fable模型的技巧:1)分配比此前模型更宏大、更具挑战性的任务;2)默认使用xhigh/high effort获最佳性能,medium适合快速交互;3)重写Skills和CLAUDE.mds,避免旧指令限制Fable的自主判断;4)从提供任务转向提供目标,描述完成状态和验证方式,让Fable自行规划路径(/loop与/goal命令专为此设计)。

Alex Albert: We've reset usage limits across our products! For those just starting to test Fable, here's four tips for using it more ...

AnthropicMCP/工具大佬观点
06:22
OpenAI:官网动态(RSS · 排除企业/客户案例)
44
Codex 为 Notion 解锁的能力

Notion 利用 Codex 一次性生成产品规格、构建面向网页的 AI 语音输入功能,并提升小团队的工程效率。

OpenAI教程/实践编码语音
06:19
Simon Willison 博客
精选71
在 AgentsView 中为 Claude Fable 5 设置自定义价格

Wes McKinney 开发的 AgentsView 是一个用于追踪本地编码智能体 token 使用情况的工具。由于近日发布的 Claude Fable 5 尚未被收录进 AgentsView 的定价数据库,作者利用 Fable 逆向工程,找到了为该模型设置自定义价格的方法,并展示了 Fable 5 当天在不同本地项目中的使用量树状图。

智能体教程/实践部署/工程

推荐理由:如果你也用 coding agent 且在乎成本,Simon 这个自定义价格技巧能让你第一时间把新模型纳入追踪,简单但实用。
06:18
Bloomberg:Technology(RSS)
50
Lumentum CEO:光学行业迎来巨大机遇

Lumentum 首席执行官 Michael Hurlston 指出,磷化铟(indium phosphide)在光芯片尤其是激光器中扮演关键角色,对 AI 革命至关重要。数据中心对速度和带宽的需求持续增长,正推动行业向光纤光学连接转型——光能提供无与伦比的传输速度。

行业动态
06:10
Hacker News 热门(buzzing.cc 中文翻译)
9
我正在构建一个并行互联网,它被称为"Thinnernet"

Thinnernet 是一个正在构建中的并行互联网项目。该帖子在 Hacker News 上获得 100 个点赞。

其他
‹ 上一页
1…910111213…50
下一页 ›