AIHOT

全部动态今日 279 条

全部一手资讯 X 论文

6月10日周三

6月10日

09:28

IT之家（RSS）

42

苹果升级 iOS 27 版地图：AI 优化飞行俯瞰植被显示效果、引入本地榜单

iOS 27 版 Apple 地图升级“飞行俯瞰”功能，结合 AI 与航拍图像优化植被 3D 显示效果，树木枝干层次更丰富，目前仅纽约、伦敦等部分城市可用。同时引入“本地榜单”（Local Lists）功能，基于地图交互数据统计区域内最受欢迎餐厅，展示列表、营业时间、价格区间和菜品图片，用户可添加标记，基于隐私数据不关联个人，功能先在美国落地。

产品更新多模态

09:28

IT之家（RSS）

51

飞利浦调研：AI提升临床诊断准确率，七成医护指培训不足

飞利浦发起的《飞利浦未来健康指数》调研显示，AI有助于提升患者护理精准度，节约时间与成本。调研覆盖10国，收集2011名医护人员、20085名患者反馈。约30%受访医生称AI帮助削减预算；27%的受访者称过去三个月AI至少三次协助排查潜在医疗失误；36%的人表示AI使其每周接诊患者数增加。飞利浦北美区CEO称医护人员平均每周可多接诊5名患者。但77%受访者反映AI培训资源缺失或不足。目前AI主要用于数据整理、日程安排等行政事务，复杂诊疗决策仍由医护人员完成。

行业动态

09:28

IT之家（RSS）

17

雷蛇发布魔音海妖 V3 专业版麦克风：支持32-bit浮点录制，国行1999元

雷蛇于6月10日发布Seiren V3 Pro（魔音海妖 V3 专业版），国行售价1999元。这款专业级USB游戏麦克风支持32-bit浮点格式高精度音频录制，采用超心形指向电容式16mm振膜舱，集成先进音频DSP，可设备端实现AI降噪、增益限幅等功能。配备RGB响应式直播灯光、多功能轻触式静音传感器、实体增益旋钮、一体式锌合金机身、内置减震器、可拆卸防喷罩，提供USB-C和XLR接口及可调节减震臂架。

产品更新其他

09:20

Alibaba Cloud@alibaba_cloud

59

想要构建一个能运行整条短剧制作管线的AI智能体？🎬 欢迎来到AI Showrunner Arena！使用前沿视频模型（Wan / HappyHorse）来自动化脚本编写、分镜和剪辑，赢取总计超过70，000美元的奖金池。 🔗 立即注册：https：//click.qwencloud.com/m/20000000281/

智能体行业动态视频

09:20

Simon Willison 博客

54

llm 0.32a3 发布，代码几乎全部由 Claude Fable 5 编写

Simon Willison 的 llm 工具发布 0.32a3 版本，该版本的代码几乎全部由新的 Claude Fable 5 模型编写。

AnthropicGitHub开源/仓库编码

09:20

Simon Willison 博客

61

Anthropic 对 Claude Fable 5 引入静默干预：限制前沿 LLM 开发回答

Anthropic 在 Fable 5 与 Mythos 5 系统卡中披露新干预措施：当用户询问构建预训练管道、分布式训练基础设施或 ML 加速器设计等前沿 LLM 开发问题时，Claude 会通过提示词修改、转向向量或参数高效微调（PEFT）限制回答有效性，且用户不可见此干预——模型不会回退到其他版本。Anthropic 称此举旨在避免加速最可能违反服务条款的参与者，估算仅影响约 0.03% 流量，集中在不到 0.1% 的组织。这是其首次公开此类静默干预，引发关于模型以减缓竞争研究为目的篡改回复的伦理担忧。

Anthropic大佬观点

09:17

meng shao@shao__meng

22

Anthropic Claude 系列模型，价格真的是遥遥领先如果 Claude Fable 5 来个 Fast Mode，难道要： input $60， output $300 ？？？你（token）比我挣得都多，我咋用？

Anthropic大佬观点

09:17

meng shao@shao__meng

53

博主对比Claude Fable 5与Step 3.7 Flash官方API价格：输入/输出约50倍，缓存命中输入约100倍；开启Fast Mode（速度×3，价格×6）后分别升至约300倍、300倍、600倍。作为实例，用Step 3.7 Flash完成真实Coding Agent任务：将Agent Memory运行痕迹（含memory events、structured facts、memory chunks等）生成为单文件HTML工具agent_memory_inspector.html，可查看8条事件、9条事实、8个chunk、9/9测试通过等信息，展示了模型将混乱Agent traces转化为可用检查工具的能力。

meng shao: 我这次用 Step 3.7 Flash 测了一个真实 Coding Agent 任务: 把一组 Agent Memory 的运行痕迹,做成本地可检查的 Memory Inspector。输入不是干净需求文档,是一个已有 Local Age...

智能体Anthropic编码评测/基准

09:09

Josh Woodward@joshwoodward

60

在 @Google AI Studio 中，我们现在每周制作超过 1，200，000 个应用（还在增长），自 2 月下旬以来已创建超过 18，000，000 个 🤯 进展仍在继续！！！

Logan Kilpatrick: In @GoogleAIStudio we are now making more than 1,200,000 apps a week (and growing) with more than 18,000,000 created sin...

Google现象/趋势行业动态

09:07

Berryxia.AI@berryxia

15

之前买高铁票没有注意，居然直接可以选择静音车厢。车险内没有手机外放震天响的短视频声音，旅途Vibe Coding 简直不要太爽啊！刚刚有人外放声音，乘务员直接当场制止😂 太爽了…

其他编码

09:07

Berryxia.AI@berryxia

41

猴哥都主动祝贺Anthropic 的Fable 5 了。那么，问题来了。 Google 人呢？虽然，Google 也是A社30 亿美金的大股东，但也要努力啊！

Logan Kilpatrick: congrats to the Anthropic team on Fable!!

AnthropicGoogle大佬观点模型发布

08:47

meng shao@shao__meng

精选75

Perplexity与哈佛商学院研究：AI Agent Computer相比Search使知识工作耗时降87%成本降94%

Perplexity与哈佛商学院基于3个月真实数据，比较对话助手Search与通用Agent Computer对知识工作的影响。核心发现：①自主性：Computer平均执行26分钟（Search仅33秒），用户中断率相近（3.7% vs 3.4%），满意度不满降低55%；②效率：任务时间从269分钟降至36分钟（节省87%），成本降94%（约16倍），编程领域时间降92%成本降96%；③范围：Computer 59%查询超出主职业（Search 50%），76%为高阶认知（Search 55%），50%达创造层级（Search 26%）。用户角色从逐步指挥转向验收与迭代。

Perplexity: We published new research with Harvard on the shift from chat interfaces to autonomous agents like Computer. Over 3 mont...

智能体现象/趋势

关联讨论 1 条

推荐理由：Perplexity和哈佛联手用真实数据第一个证明Agent对知识工作的效率提升，87%时间和94%成本不是口号，产品经理是该看一眼。

08:47

meng shao@shao__meng

精选77

Text-To-Lottie：Agent Skill + 本地预览 Harness，让 Agent 生成 Lottie 动画并实时验收

开源项目 Text-To-Lottie 提供一套 Agent Skill 和本地预览工具，让 Codex/Claude Code/Cursor 等 Agent 生成标准 Bodymovin JSON（public/lottie.json），通过 Skottie 渲染引擎在浏览器中实时验收。安装命令：`npx skills add diffusionstudio/lottie`。技术特点：输出标准 Lottie JSON，使用 Skottie 渲染（非 lottie-web）；基于 Vite 热重载实现自动刷新闭环；支持通过 Skottie Slots + controls.json 调整颜色、尺寸；Agent 可用 URL 参数 `?frame=60&paused=1` 精确定位帧截图。Prompt 指南包括：给具体素材、使用动效术语、pan/zoom/hold 模拟镜头、显式声明 Slots、锁定时间规格。适合单场景短时长 Motion Graphics、SVG→Lottie、数据可视化、透明背景矢量动效；不适合多镜头剪辑、复杂角色绑定、粒子、3D 或需 lottie-web 全特性的场景。

konstantinpaulus: Introducing text-to-lottie: an open source skill and harness for generating production ready Lottie animations with code...

智能体MCP/工具开源/仓库

推荐理由：让 Agent 写出能直接渲染的 Lottie JSON，这套 Skill + Harness 把生成到验收的链路打得很完整，前端和做动效的都可以直接试。

08:44

TechCrunch：AI（RSS）

49

Justin Ernest 通过专属 LP 网络向 Anthropic、Anduril、SpaceX 投资近 5 亿美元

Sabertooth VC 创始人 Justin Ernest 没有花费一年时间募集正式风投基金，而是利用一个

Anthropic行业动态

08:44

TechCrunch：AI（RSS）

69

Google大幅降低其预算AI订阅层级价格

Google降低了其预算AI订阅层级的价格，此举被视为在AI订阅价格战中发出警告信号。

Google行业动态

08:43

小互@xiaohu

70

Claude 重置用量并给出 Fable 使用四条建议

Claude 重置了所有用量。官方对使用 Fable 提出四条建议：分配比之前模型能处理的更大任务；默认使用 xhigh/high 努力程度以获得最佳性能，med 用于更快的交互式会话；重新调整技能和 CLAUDE.md，避免旧指令让 Fable 陷入陈旧模式；从提供任务转向提供目标，描述完成样貌并让 Fable 通过 /loop 和 /goal 自行寻找路径。

Anthropic教程/实践编码

08:40

Logan Kilpatrick@OfficialLoganK

63

祝贺 Anthropic 团队推出 Fable！！

Anthropic模型发布

08:39

jason@jxnlco

17

非常兴奋看到规模扩展仍然有效。

OpenAI大佬观点

08:27

IT之家（RSS）

56

苹果高管回应为何 iOS 27 推出 Siri 独立应用：方便查看历史对话

iOS 27 新增 Siri 独立应用，苹果高管克雷格·费德里吉在发布会后技术分享会上解释，推出该应用并非转变聊天机器人战略，而是为用户提供一处可回看、查阅过往 Siri 对话记录的入口。他指出，Siri 本质上是深入融入系统、随用随取的交互工具，而非孤立聊天工具；在主屏幕放置独立应用是让用户管理历史对话的最直观方式。

产品更新语音

08:27

IT之家（RSS）

26

苹果 macOS 27 强化透明度：Dock 灰点提示后台驻留应用

macOS 27 Golden Gate 新增后台应用提示机制。用户退出应用后，若仍有后台进程，Dock 图标下方的运行指示从黑色圆点变为灰色圆点，鼠标悬停时提示“正在后台运行”。用户可通过右键菜单选择“停止其在后台运行”终止进程并移除图标。系统设置中“通用”>“登录项与扩展”>“后台应用活动”可查看和开关各应用的后台权限。

其他

08:27

IT之家（RSS）

68

特斯拉公布欧洲 FSD 安全数据：荷兰道路安全性达人工驾驶 3 倍以上

特斯拉首次公布欧洲 FSD（监督版）安全数据：在荷兰道路上，整体事故碰撞量比人工驾驶减少 71.4%（仅为后者的 1/3.5），高速路段安全系数达 3.4 倍，累计行驶 1660 万公里零碰撞。自动紧急制动触发次数降至 1/14.9，急加速、急刹车分别降至 1/8.8 和 1/7.3。该系统目前仅支持搭载 HW4/AI4 硬件的车辆，基于 V14 主线版本定制。今年夏季晚些时候将推出 FSD V14 Lite 版，老车型可体验完整功能。荷兰认证已在欧盟引发连锁审批，丹麦成为第四个获批成员国。

端侧行业动态

08:27

IT之家（RSS）

44

SpaceX IPO获4倍超额认购，认购资金超2500亿美元

SpaceX此次IPO投资者认购意向金额已超2500亿美元，超额认购倍数达3.5至4倍，远超计划募资的750亿美元。总裁格温妮·肖特韦尔与首席财务官布雷特·约翰逊在摩根士丹利大厦出席约300家机构参与的午餐交流会，马斯克也曾短暂出席部分线上会议。IPO定价预计周四下午敲定。路演材料突出火箭发射和星链业务竞争力，并宣称其AI相关业务拥有23万亿美元市场规模。

行业动态

08:25

karminski-牙医@karminski3

64

Anthropic Fable 5 测试：光追代码出现变量声明错误

用户测试 Anthropic Fable 5，使用 xhigh 模式让其从零编写光追渲染器。生成的 PBR 与 BRDF 代码质量出色，但出现变量声明晚于引用的错误，导致代码直接报错。推测模型过度关注核心算法逻辑，忽略了变量声明等细节。此外，成本高昂，仅生成该网页就花费 2 美元。作者调侃 AI 超越人类还为时尚早——因为自己的工资负担不起。

Anthropic编码评测/基准

08:22

The Verge：订阅版科技（RSS）

51

我体验了 Siri AI：虽然还在早期，但它真的能用了

新版 Siri AI 体验后评价为“基础但确实能用”，这本身就是一个重要突破。该版本在响应准确率和任务完成度上表现可靠，标志着苹果语音助手在 AI 能力上的实质性进展，尽管功能尚处于早期阶段，但“能用”这一反馈已属进步。

端侧评测/基准语音

08:22

Artificial Analysis@ArtificialAnlys

76

Claude Fable 5 登顶 Artificial Analysis Intelligence 指数

Claude Fable 5 发布即位列 Artificial Analysis Intelligence Index 第一，得分 64.9，领先第二名的 GPT-5.5 约 5 分。该模型采用自适应推理（最大努力模式）并以 Opus 4.8 作为回退模型。在 AA-Omniscience 知识测试中得分 40，领先此前最高分的 Gemini 3.1 Pro Preview 7 分；HLE 得分 53%，领先 Opus 4.8 超 7 个百分点。约 9% 任务触发安全护栏并回退。定价 $10/$50 每百万输入/输出 token（Opus 4.8 的两倍），缓存读写 $12.50/$1；上下文窗口保持 1M token。通过 Pro、Max、Team 等计划可用至 6 月 22 日，之后需消耗积分。

Anthropic推理模型发布

关联讨论 36 条

08:20

Simon Willison 博客

67

Claude Fable 5 初步印象：容量更大、知识更丰富但速度慢价格高

Anthropic 发布 Claude Fable 5 与 Claude Mythos 5，后者无安全分类器。两模型均支持 1M token 上下文窗口、128k 最大输出 token，知识截止至 2026 年 1 月，定价为 Opus 4.5/4.6/4.7/4.8 的两倍（$10/百万输入 token，$50/百万输出 token）。Simon Willison 测试发现 Fable 5 知识更丰富、响应更详细（如列出其开源项目远超 Opus 4.8 的准确度），但速度慢且价格高昂，推测为迄今最大模型之一。Anthropic 称 Fable 5 与 Mythos 5 性能相同，但安全护栏更严格，API 新增回退机制及护栏触发通知。

Anthropic模型发布编码评测/基准

08:17

meng shao@shao__meng

45

Claude Fable 5 发布好可能是好一些，贵是真的贵，再搭配 Loop，token 成本原地起飞了。

Claude: Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...

Anthropic模型发布

08:17

meng shao@shao__meng

20

自己的平台，做起广告来就是这么肆无忌惮 😂 Grok Build…

xAI行业动态

08:07

Berryxia.AI@berryxia

51

Fable 5 一周测评：不如 Opus 和 GPT 实用

海外博主 Matthew Berman 对 Fable 5 进行了一周实战测评。结论是 Fable 5 价格高昂，不适合普通 Vibe Coding 场景，仅在专业领域、超长时任务中可能有所发挥。相比之下，Opus 和 GPT 等模型更可靠、更具性价比，建议普通用户优先选择 Opus 和 GPT。

Berryxia.AI: http://x.com/i/article/2064479983104602112

评测/基准

08:07

Berryxia.AI@berryxia

77

Google Gemini 3.5 Live Translate 公开预览，支持70+种语言

Google 推出 Gemini 3.5 Live Translate 实时翻译模型，已进入公开预览阶段，通过 Gemini API 提供低延迟语音到语音翻译，覆盖 70+ 种语言、2000 种语言对，包括大量冷门小语种。开发者可将该能力集成到实时对话、客服、直播、跨国会议等场景中。主推文指出该发布被 Anthropic Fable 5 刷屏抢了风头，并提及阿里 Qwen 系列小语种模型的可比性。

Google for Developers: Gemini 3.5 Live Translate is now in Public Preview via the Gemini API, delivering low-latency speech-to-speech translati...

Google模型发布语音

关联讨论 9 条

08:07

Berryxia.AI@berryxia

17

Fable 5 模型标注"Included until June 22"，订阅用户此前可免费体验，6月22日后仅能通过API使用。主推文猜测届时将验证所谓"中转站"是否真正提供Fable 5模型（暗示可能存在假模型）。

indigo: Fable 5 的这个"Included until June 22"是什么意思?订阅用户只在六月22号前才能免费体验一下么,后面要单独收费吗?

其他

08:06

Orange AI@oran_ge

30

Claude 产品线命名：从俳句到神话的全解析

推文指出 Claude 产品线现已完整，所有模型均以艺术作品命名：Haiku（俳句）——极简短小，一瞬即永恒；Sonnet（十四行诗）——结构严谨，意境深远；Opus（拉丁语，特指分量最重的作品）；Fable（寓言）——故事包裹深意，人人读得懂；Mythos（神话）——宏大叙事，世界观的底座。整条产品线通过艺术名称体现各模型定位。

Anthropic大佬观点

08:06

Orange AI@oran_ge

61

Claude Fable 5 的三项争议点

Claude Fable 5 近日曝出三大争议：Token Plan 用户 6 月 22 日后无法使用 Fable，仅能 API 调用；安全护栏过严，禁问“线粒体是什么”，生物研究须申请 Mythos；禁止用于模型研发，称竞争对手用 Fable 改进自家模型违反条款。推文批评美国厂商一边鼓吹打通 Loop，一边阻止其他玩家进入，形成闭环。

Anthropic大佬观点安全/对齐

08:00

HuggingFace Daily Papers（社区热门论文）

56

重新思考LLM心理测量评估：自我报告何时及为何能预测行为

本研究对比大五人格与计划行为理论（TPB）在LLM自我报告与行为一致性上的表现。在四项行为任务与11个前沿LLM中，同一对话内TPB达到人类水平一致性，大五不能；跨对话时，仅对训练形成的隐性偏见等行为保持一致性，对上下文启动的谄媚等行为则崩溃；角色提示使自我报告更一致，但不改变行为。结论：粗粒度人格框架（如大五）不适合测试部署行为。

安全/对齐论文/研究评测/基准

08:00

HuggingFace Daily Papers（社区热门论文）

50

静态（因此兼容）表示：你所需的一切

学习兼容表示旨在使模型更新后的特征表示可互换使用。实验证明，d-Simplex固定分类器学习的静态表示天然满足兼容性定义。针对顺序微调场景，交叉熵损失仅对齐一阶统计量，无法充分捕捉高阶依赖。通过交叉熵与对比损失的凸组合训练模型，既能捕捉高阶依赖，又等价于兼容约束下的交叉熵学习。实验表明，静态表示可在模型更新和替换时不需重新处理图库图像，实现无中断检索服务，并达到当前最优性能。

数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

48

TreeSeeker：树结构试错与返回的深度搜索框架

TreeSeeker是一种推理时框架，通过树结构状态组织深度搜索中的分支与回退。每回合利用文本UCB信号（价值、不确定性、风险）选择利用有前途的分支、探索不确定替代或剪枝无效路径并返回早期分支点。TreeMem将证据、不确定性、冲突、进度和失败线索附加到产生它们的分支上。在XBench-DeepSearch、BrowseComp和BrowseComp-ZH基准上，TreeSeeker持续优于强开源基线，表明显式的分支-回退控制可增强更强推理与工具执行能力。

智能体推理论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

63

VIA-SD：通过模型内路由实现推测解码的验证

推测解码（SD）通过轻量草稿模型并行生成候选项、由大型验证器校验来降低LLM推理成本。现有方法采用二元决策：接受或完全重算。VIA-SD提出多层级框架，利用模型内路由从完整验证器中提取轻量子模型（slim-verifier），对中等置信度的草稿token进行再生，仅在不确定时调用完整模型。在四个代表性任务和多种模型族上，VIA-SD将拒绝率降低0.10–0.22，相比强SD基线实现10–20%加速，相比非推测解码实现2.5–3倍加速。该方法兼容现有SD框架，无需修改训练过程。

推理论文/研究部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

59

从2D网格到1D token：改革多模态图像融合的共享表示

多模态图像融合现有方法基于2D特征网格，局部建模强但全局外观控制有限。本文引入紧凑1D token接口，基于冻结预训练图像tokenizer作为全局载体，同时保留2D空间路径恢复局部结构。提出选择性token编辑（STE），稀疏更新或替换关键token，在不改变融合主干、不引入额外损失下引导全局一致性。在四个基准上取得最佳整体性能，全局一致性和局部保真度均提升。

图像生成多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

56

PianoKontext：从平淡上下文中生成富有表现力的演奏

PianoKontext 是一种流匹配渲染模型，专为古典钢琴音乐设计，在预训练 Music2Latent 模型的潜在空间中生成可变长度的富有表现力演奏。该方法将 MIDI 乐谱合成为平淡音频，利用动态时间规整（DTW）在潜在空间中对齐乐谱与演奏数据，并将对齐的嵌入拼接至 DiT 块中，以简单有效的方式学习乐谱与演奏之间的依赖关系。演示音频见项目页面。

多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

65

Z-Image Turbo++：通过教师对齐的端到端蒸馏实现高保真两步图像生成

Z-Image Turbo++是从8步教师模型Z-Image Turbo蒸馏得到的2步图像生成模型。针对两步生成中任务难度提升和模型容量有限的瓶颈，提出三项设计：分布对齐对抗学习（以教师生成图像而非真实图像作为GAN训练的真样本）、步骤分离参数化（两个去噪步独立参数）、以及带迭代正则化的端到端训练（第一步接收最终图像质量梯度并保留有意义的中间生成）。这些策略显著缩小了2步与8步生成的质量差距。

arXiv图像生成数据/训练论文/研究