AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态今日 279 条
全部一手资讯X论文
6月10日周三
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月10日
09:28
IT之家(RSS)
42
苹果升级 iOS 27 版地图:AI 优化飞行俯瞰植被显示效果、引入本地榜单

iOS 27 版 Apple 地图升级“飞行俯瞰”功能,结合 AI 与航拍图像优化植被 3D 显示效果,树木枝干层次更丰富,目前仅纽约、伦敦等部分城市可用。同时引入“本地榜单”(Local Lists)功能,基于地图交互数据统计区域内最受欢迎餐厅,展示列表、营业时间、价格区间和菜品图片,用户可添加标记,基于隐私数据不关联个人,功能先在美国落地。

产品更新多模态
09:28
IT之家(RSS)
51
飞利浦调研:AI提升临床诊断准确率,七成医护指培训不足

飞利浦发起的《飞利浦未来健康指数》调研显示,AI有助于提升患者护理精准度,节约时间与成本。调研覆盖10国,收集2011名医护人员、20085名患者反馈。约30%受访医生称AI帮助削减预算;27%的受访者称过去三个月AI至少三次协助排查潜在医疗失误;36%的人表示AI使其每周接诊患者数增加。飞利浦北美区CEO称医护人员平均每周可多接诊5名患者。但77%受访者反映AI培训资源缺失或不足。目前AI主要用于数据整理、日程安排等行政事务,复杂诊疗决策仍由医护人员完成。

行业动态
09:28
IT之家(RSS)
17
雷蛇发布魔音海妖 V3 专业版麦克风:支持32-bit浮点录制,国行1999元

雷蛇于6月10日发布Seiren V3 Pro(魔音海妖 V3 专业版),国行售价1999元。这款专业级USB游戏麦克风支持32-bit浮点格式高精度音频录制,采用超心形指向电容式16mm振膜舱,集成先进音频DSP,可设备端实现AI降噪、增益限幅等功能。配备RGB响应式直播灯光、多功能轻触式静音传感器、实体增益旋钮、一体式锌合金机身、内置减震器、可拆卸防喷罩,提供USB-C和XLR接口及可调节减震臂架。

产品更新其他
09:20
Alibaba Cloud@alibaba_cloud
59
想要构建一个能运行整条短剧制作管线的AI智能体?🎬 欢迎来到AI Showrunner Arena!使用前沿视频模型(Wan / HappyHorse)来自动化脚本编写、分镜和剪辑,赢取总计超过70,000美元的奖金池。 🔗 立即注册:https://click.qwencloud.com/m/20000000281/
智能体行业动态视频
09:20
Simon Willison 博客
54
llm 0.32a3 发布,代码几乎全部由 Claude Fable 5 编写

Simon Willison 的 llm 工具发布 0.32a3 版本,该版本的代码几乎全部由新的 Claude Fable 5 模型编写。

AnthropicGitHub开源/仓库编码
09:20
Simon Willison 博客
61
Anthropic 对 Claude Fable 5 引入静默干预:限制前沿 LLM 开发回答

Anthropic 在 Fable 5 与 Mythos 5 系统卡中披露新干预措施:当用户询问构建预训练管道、分布式训练基础设施或 ML 加速器设计等前沿 LLM 开发问题时,Claude 会通过提示词修改、转向向量或参数高效微调(PEFT)限制回答有效性,且用户不可见此干预——模型不会回退到其他版本。Anthropic 称此举旨在避免加速最可能违反服务条款的参与者,估算仅影响约 0.03% 流量,集中在不到 0.1% 的组织。这是其首次公开此类静默干预,引发关于模型以减缓竞争研究为目的篡改回复的伦理担忧。

Anthropic大佬观点
09:17
meng shao@shao__meng
22
Anthropic Claude 系列模型,价格真的是遥遥领先 如果 Claude Fable 5 来个 Fast Mode,难道要: input $60, output $300 ??? 你 (token) 比我挣得都多,我咋用?
Anthropic大佬观点
09:17
meng shao@shao__meng
53
博主对比Claude Fable 5与Step 3.7 Flash官方API价格:输入/输出约50倍,缓存命中输入约100倍;开启Fast Mode(速度×3,价格×6)后分别升至约300倍、300倍、600倍。作为实例,用Step 3.7 Flash完成真实Coding Agent任务:将Agent Memory运行痕迹(含memory events、structured facts、memory chunks等)生成为单文件HTML工具agent_memory_inspector.html,可查看8条事件、9条事实、8个chunk、9/9测试通过等信息,展示了模型将混乱Agent traces转化为可用检查工具的能力。

meng shao: 我这次用 Step 3.7 Flash 测了一个真实 Coding Agent 任务: 把一组 Agent Memory 的运行痕迹,做成本地可检查的 Memory Inspector。 输入不是干净需求文档,是一个已有 Local Age...

智能体Anthropic编码评测/基准
09:09
Josh Woodward@joshwoodward
60
在 @Google AI Studio 中,我们现在每周制作超过 1,200,000 个应用(还在增长),自 2 月下旬以来已创建超过 18,000,000 个 🤯 进展仍在继续!!!

Logan Kilpatrick: In @GoogleAIStudio we are now making more than 1,200,000 apps a week (and growing) with more than 18,000,000 created sin...

Google现象/趋势行业动态
09:07
Berryxia.AI@berryxia
15
之前买高铁票没有注意,居然直接可以选择静音车厢。 车险内没有手机外放震天响的短视频声音,旅途Vibe Coding 简直不要太爽啊! 刚刚有人外放声音,乘务员直接当场制止😂 太爽了…
其他编码
09:07
Berryxia.AI@berryxia
41
猴哥都主动祝贺Anthropic 的Fable 5 了。 那么,问题来了。 Google 人呢? 虽然,Google 也是A社30 亿美金的大股东,但也要努力啊!

Logan Kilpatrick: congrats to the Anthropic team on Fable!!

AnthropicGoogle大佬观点模型发布
08:47
meng shao@shao__meng
精选75
Perplexity与哈佛商学院研究:AI Agent Computer相比Search使知识工作耗时降87%成本降94%

Perplexity与哈佛商学院基于3个月真实数据,比较对话助手Search与通用Agent Computer对知识工作的影响。核心发现:①自主性:Computer平均执行26分钟(Search仅33秒),用户中断率相近(3.7% vs 3.4%),满意度不满降低55%;②效率:任务时间从269分钟降至36分钟(节省87%),成本降94%(约16倍),编程领域时间降92%成本降96%;③范围:Computer 59%查询超出主职业(Search 50%),76%为高阶认知(Search 55%),50%达创造层级(Search 26%)。用户角色从逐步指挥转向验收与迭代。

Perplexity: We published new research with Harvard on the shift from chat interfaces to autonomous agents like Computer. Over 3 mont...

智能体现象/趋势
关联讨论 1 条X:Perplexity (@perplexity_ai)
推荐理由:Perplexity和哈佛联手用真实数据第一个证明Agent对知识工作的效率提升,87%时间和94%成本不是口号,产品经理是该看一眼。
08:47
meng shao@shao__meng
精选77
Text-To-Lottie:Agent Skill + 本地预览 Harness,让 Agent 生成 Lottie 动画并实时验收

开源项目 Text-To-Lottie 提供一套 Agent Skill 和本地预览工具,让 Codex/Claude Code/Cursor 等 Agent 生成标准 Bodymovin JSON(public/lottie.json),通过 Skottie 渲染引擎在浏览器中实时验收。安装命令:`npx skills add diffusionstudio/lottie`。技术特点:输出标准 Lottie JSON,使用 Skottie 渲染(非 lottie-web);基于 Vite 热重载实现自动刷新闭环;支持通过 Skottie Slots + controls.json 调整颜色、尺寸;Agent 可用 URL 参数 `?frame=60&paused=1` 精确定位帧截图。Prompt 指南包括:给具体素材、使用动效术语、pan/zoom/hold 模拟镜头、显式声明 Slots、锁定时间规格。适合单场景短时长 Motion Graphics、SVG→Lottie、数据可视化、透明背景矢量动效;不适合多镜头剪辑、复杂角色绑定、粒子、3D 或需 lottie-web 全特性的场景。

konstantinpaulus: Introducing text-to-lottie: an open source skill and harness for generating production ready Lottie animations with code...

智能体MCP/工具开源/仓库

推荐理由:让 Agent 写出能直接渲染的 Lottie JSON,这套 Skill + Harness 把生成到验收的链路打得很完整,前端和做动效的都可以直接试。
08:44
TechCrunch:AI(RSS)
49
Justin Ernest 通过专属 LP 网络向 Anthropic、Anduril、SpaceX 投资近 5 亿美元

Sabertooth VC 创始人 Justin Ernest 没有花费一年时间募集正式风投基金,而是利用一个

Anthropic行业动态
08:44
TechCrunch:AI(RSS)
69
Google大幅降低其预算AI订阅层级价格

Google降低了其预算AI订阅层级的价格,此举被视为在AI订阅价格战中发出警告信号。

Google行业动态
08:43
小互@xiaohu
70
Claude 重置用量并给出 Fable 使用四条建议

Claude 重置了所有用量。官方对使用 Fable 提出四条建议:分配比之前模型能处理的更大任务;默认使用 xhigh/high 努力程度以获得最佳性能,med 用于更快的交互式会话;重新调整技能和 CLAUDE.md,避免旧指令让 Fable 陷入陈旧模式;从提供任务转向提供目标,描述完成样貌并让 Fable 通过 /loop 和 /goal 自行寻找路径。

Anthropic教程/实践编码
08:40
Logan Kilpatrick@OfficialLoganK
63
祝贺 Anthropic 团队推出 Fable!!
Anthropic模型发布
08:39
jason@jxnlco
17
非常兴奋看到规模扩展仍然有效。
OpenAI大佬观点
08:27
IT之家(RSS)
56
苹果高管回应为何 iOS 27 推出 Siri 独立应用:方便查看历史对话

iOS 27 新增 Siri 独立应用,苹果高管克雷格·费德里吉在发布会后技术分享会上解释,推出该应用并非转变聊天机器人战略,而是为用户提供一处可回看、查阅过往 Siri 对话记录的入口。他指出,Siri 本质上是深入融入系统、随用随取的交互工具,而非孤立聊天工具;在主屏幕放置独立应用是让用户管理历史对话的最直观方式。

产品更新语音
08:27
IT之家(RSS)
26
苹果 macOS 27 强化透明度:Dock 灰点提示后台驻留应用

macOS 27 Golden Gate 新增后台应用提示机制。用户退出应用后,若仍有后台进程,Dock 图标下方的运行指示从黑色圆点变为灰色圆点,鼠标悬停时提示“正在后台运行”。用户可通过右键菜单选择“停止其在后台运行”终止进程并移除图标。系统设置中“通用”>“登录项与扩展”>“后台应用活动”可查看和开关各应用的后台权限。

其他
08:27
IT之家(RSS)
68
特斯拉公布欧洲 FSD 安全数据:荷兰道路安全性达人工驾驶 3 倍以上

特斯拉首次公布欧洲 FSD(监督版)安全数据:在荷兰道路上,整体事故碰撞量比人工驾驶减少 71.4%(仅为后者的 1/3.5),高速路段安全系数达 3.4 倍,累计行驶 1660 万公里零碰撞。自动紧急制动触发次数降至 1/14.9,急加速、急刹车分别降至 1/8.8 和 1/7.3。该系统目前仅支持搭载 HW4/AI4 硬件的车辆,基于 V14 主线版本定制。今年夏季晚些时候将推出 FSD V14 Lite 版,老车型可体验完整功能。荷兰认证已在欧盟引发连锁审批,丹麦成为第四个获批成员国。

端侧行业动态
08:27
IT之家(RSS)
44
SpaceX IPO获4倍超额认购,认购资金超2500亿美元

SpaceX此次IPO投资者认购意向金额已超2500亿美元,超额认购倍数达3.5至4倍,远超计划募资的750亿美元。总裁格温妮·肖特韦尔与首席财务官布雷特·约翰逊在摩根士丹利大厦出席约300家机构参与的午餐交流会,马斯克也曾短暂出席部分线上会议。IPO定价预计周四下午敲定。路演材料突出火箭发射和星链业务竞争力,并宣称其AI相关业务拥有23万亿美元市场规模。

行业动态
08:25
karminski-牙医@karminski3
64
Anthropic Fable 5 测试:光追代码出现变量声明错误

用户测试 Anthropic Fable 5,使用 xhigh 模式让其从零编写光追渲染器。生成的 PBR 与 BRDF 代码质量出色,但出现变量声明晚于引用的错误,导致代码直接报错。推测模型过度关注核心算法逻辑,忽略了变量声明等细节。此外,成本高昂,仅生成该网页就花费 2 美元。作者调侃 AI 超越人类还为时尚早——因为自己的工资负担不起。

Anthropic编码评测/基准
08:22
The Verge:订阅版科技(RSS)
51
我体验了 Siri AI:虽然还在早期,但它真的能用了

新版 Siri AI 体验后评价为“基础但确实能用”,这本身就是一个重要突破。该版本在响应准确率和任务完成度上表现可靠,标志着苹果语音助手在 AI 能力上的实质性进展,尽管功能尚处于早期阶段,但“能用”这一反馈已属进步。

端侧评测/基准语音
08:22
Artificial Analysis@ArtificialAnlys
76
Claude Fable 5 登顶 Artificial Analysis Intelligence 指数

Claude Fable 5 发布即位列 Artificial Analysis Intelligence Index 第一,得分 64.9,领先第二名的 GPT-5.5 约 5 分。该模型采用自适应推理(最大努力模式)并以 Opus 4.8 作为回退模型。在 AA-Omniscience 知识测试中得分 40,领先此前最高分的 Gemini 3.1 Pro Preview 7 分;HLE 得分 53%,领先 Opus 4.8 超 7 个百分点。约 9% 任务触发安全护栏并回退。定价 $10/$50 每百万输入/输出 token(Opus 4.8 的两倍),缓存读写 $12.50/$1;上下文窗口保持 1M token。通过 Pro、Max、Team 等计划可用至 6 月 22 日,之后需消耗积分。

Anthropic推理模型发布
关联讨论 36 条X:Rohan Paul (@rohanpaul_ai)X:Testing Catalog (@testingcatalog)X:邵猛 (@shao__meng)IT之家(RSS)Ars Technica:AI(RSS)X:Yuchen Jin (@Yuchenj_UW)Anthropic:Newsroom(网页)X:Anthropic (@AnthropicAI)Hacker News 热门(buzzing.cc 中文翻译)X:阿易 AI Notes (@AYi_AInotes)公众号:卡尔的AI沃茨X:Kim (@kimmonismus)The Decoder:AI News(RSS)TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)X:Perplexity (@perplexity_ai)The Verge:AI(RSS)Simon Willison 博客X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)Gary Marcus:The Road to AI We Can Trust(RSS)X:小互 (@xiaohu)Tomer Tunguz 博客(VC 分析)MarkTechPost(RSS)
08:20
Simon Willison 博客
67
Claude Fable 5 初步印象:容量更大、知识更丰富但速度慢价格高

Anthropic 发布 Claude Fable 5 与 Claude Mythos 5,后者无安全分类器。两模型均支持 1M token 上下文窗口、128k 最大输出 token,知识截止至 2026 年 1 月,定价为 Opus 4.5/4.6/4.7/4.8 的两倍($10/百万输入 token,$50/百万输出 token)。Simon Willison 测试发现 Fable 5 知识更丰富、响应更详细(如列出其开源项目远超 Opus 4.8 的准确度),但速度慢且价格高昂,推测为迄今最大模型之一。Anthropic 称 Fable 5 与 Mythos 5 性能相同,但安全护栏更严格,API 新增回退机制及护栏触发通知。

Anthropic模型发布编码评测/基准
08:17
meng shao@shao__meng
45
Claude Fable 5 发布 好可能是好一些,贵是真的贵,再搭配 Loop,token 成本原地起飞了。

Claude: Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...

Anthropic模型发布
08:17
meng shao@shao__meng
20
自己的平台,做起广告来就是这么肆无忌惮 😂 Grok Build…
xAI行业动态
08:07
Berryxia.AI@berryxia
51
Fable 5 一周测评:不如 Opus 和 GPT 实用

海外博主 Matthew Berman 对 Fable 5 进行了一周实战测评。结论是 Fable 5 价格高昂,不适合普通 Vibe Coding 场景,仅在专业领域、超长时任务中可能有所发挥。相比之下,Opus 和 GPT 等模型更可靠、更具性价比,建议普通用户优先选择 Opus 和 GPT。

Berryxia.AI: http://x.com/i/article/2064479983104602112

评测/基准
08:07
Berryxia.AI@berryxia
77
Google Gemini 3.5 Live Translate 公开预览,支持70+种语言

Google 推出 Gemini 3.5 Live Translate 实时翻译模型,已进入公开预览阶段,通过 Gemini API 提供低延迟语音到语音翻译,覆盖 70+ 种语言、2000 种语言对,包括大量冷门小语种。开发者可将该能力集成到实时对话、客服、直播、跨国会议等场景中。主推文指出该发布被 Anthropic Fable 5 刷屏抢了风头,并提及阿里 Qwen 系列小语种模型的可比性。

Google for Developers: Gemini 3.5 Live Translate is now in Public Preview via the Gemini API, delivering low-latency speech-to-speech translati...

Google模型发布语音
关联讨论 9 条X:Google DeepMind (@GoogleDeepMind)Ars Technica:AI(RSS)X:Jeff Dean (@JeffDean)X:Google AI for Developers (@googleaidevs)X:Logan Kilpatrick (@OfficialLoganK)X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)The Decoder:AI News(RSS)X:Google AI (@GoogleAI)
08:07
Berryxia.AI@berryxia
17
Fable 5 模型标注"Included until June 22",订阅用户此前可免费体验,6月22日后仅能通过API使用。主推文猜测届时将验证所谓"中转站"是否真正提供Fable 5模型(暗示可能存在假模型)。

indigo: Fable 5 的这个"Included until June 22"是什么意思?订阅用户只在六月22号前才能免费体验一下么,后面要单独收费吗?

其他
08:06
Orange AI@oran_ge
30
Claude 产品线命名:从俳句到神话的全解析

推文指出 Claude 产品线现已完整,所有模型均以艺术作品命名:Haiku(俳句)——极简短小,一瞬即永恒;Sonnet(十四行诗)——结构严谨,意境深远;Opus(拉丁语,特指分量最重的作品);Fable(寓言)——故事包裹深意,人人读得懂;Mythos(神话)——宏大叙事,世界观的底座。整条产品线通过艺术名称体现各模型定位。

Anthropic大佬观点
08:06
Orange AI@oran_ge
61
Claude Fable 5 的三项争议点

Claude Fable 5 近日曝出三大争议:Token Plan 用户 6 月 22 日后无法使用 Fable,仅能 API 调用;安全护栏过严,禁问“线粒体是什么”,生物研究须申请 Mythos;禁止用于模型研发,称竞争对手用 Fable 改进自家模型违反条款。推文批评美国厂商一边鼓吹打通 Loop,一边阻止其他玩家进入,形成闭环。

Anthropic大佬观点安全/对齐
08:00
HuggingFace Daily Papers(社区热门论文)
56
重新思考LLM心理测量评估:自我报告何时及为何能预测行为

本研究对比大五人格与计划行为理论(TPB)在LLM自我报告与行为一致性上的表现。在四项行为任务与11个前沿LLM中,同一对话内TPB达到人类水平一致性,大五不能;跨对话时,仅对训练形成的隐性偏见等行为保持一致性,对上下文启动的谄媚等行为则崩溃;角色提示使自我报告更一致,但不改变行为。结论:粗粒度人格框架(如大五)不适合测试部署行为。

安全/对齐论文/研究评测/基准
08:00
HuggingFace Daily Papers(社区热门论文)
50
静态(因此兼容)表示:你所需的一切

学习兼容表示旨在使模型更新后的特征表示可互换使用。实验证明,d-Simplex固定分类器学习的静态表示天然满足兼容性定义。针对顺序微调场景,交叉熵损失仅对齐一阶统计量,无法充分捕捉高阶依赖。通过交叉熵与对比损失的凸组合训练模型,既能捕捉高阶依赖,又等价于兼容约束下的交叉熵学习。实验表明,静态表示可在模型更新和替换时不需重新处理图库图像,实现无中断检索服务,并达到当前最优性能。

数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
48
TreeSeeker: 树结构试错与返回的深度搜索框架

TreeSeeker是一种推理时框架,通过树结构状态组织深度搜索中的分支与回退。每回合利用文本UCB信号(价值、不确定性、风险)选择利用有前途的分支、探索不确定替代或剪枝无效路径并返回早期分支点。TreeMem将证据、不确定性、冲突、进度和失败线索附加到产生它们的分支上。在XBench-DeepSearch、BrowseComp和BrowseComp-ZH基准上,TreeSeeker持续优于强开源基线,表明显式的分支-回退控制可增强更强推理与工具执行能力。

智能体推理论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
63
VIA-SD:通过模型内路由实现推测解码的验证

推测解码(SD)通过轻量草稿模型并行生成候选项、由大型验证器校验来降低LLM推理成本。现有方法采用二元决策:接受或完全重算。VIA-SD提出多层级框架,利用模型内路由从完整验证器中提取轻量子模型(slim-verifier),对中等置信度的草稿token进行再生,仅在不确定时调用完整模型。在四个代表性任务和多种模型族上,VIA-SD将拒绝率降低0.10–0.22,相比强SD基线实现10–20%加速,相比非推测解码实现2.5–3倍加速。该方法兼容现有SD框架,无需修改训练过程。

推理论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
59
从2D网格到1D token:改革多模态图像融合的共享表示

多模态图像融合现有方法基于2D特征网格,局部建模强但全局外观控制有限。本文引入紧凑1D token接口,基于冻结预训练图像tokenizer作为全局载体,同时保留2D空间路径恢复局部结构。提出选择性token编辑(STE),稀疏更新或替换关键token,在不改变融合主干、不引入额外损失下引导全局一致性。在四个基准上取得最佳整体性能,全局一致性和局部保真度均提升。

图像生成多模态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
56
PianoKontext:从平淡上下文中生成富有表现力的演奏

PianoKontext 是一种流匹配渲染模型,专为古典钢琴音乐设计,在预训练 Music2Latent 模型的潜在空间中生成可变长度的富有表现力演奏。该方法将 MIDI 乐谱合成为平淡音频,利用动态时间规整(DTW)在潜在空间中对齐乐谱与演奏数据,并将对齐的嵌入拼接至 DiT 块中,以简单有效的方式学习乐谱与演奏之间的依赖关系。演示音频见项目页面。

多模态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
65
Z-Image Turbo++:通过教师对齐的端到端蒸馏实现高保真两步图像生成

Z-Image Turbo++是从8步教师模型Z-Image Turbo蒸馏得到的2步图像生成模型。针对两步生成中任务难度提升和模型容量有限的瓶颈,提出三项设计:分布对齐对抗学习(以教师生成图像而非真实图像作为GAN训练的真样本)、步骤分离参数化(两个去噪步独立参数)、以及带迭代正则化的端到端训练(第一步接收最终图像质量梯度并保留有意义的中间生成)。这些策略显著缩小了2步与8步生成的质量差距。

arXiv图像生成数据/训练论文/研究
‹ 上一页
1…3031323334…50
下一页 ›