AIHOT

全部动态一手 · 2391 条

全部一手资讯 X 论文

6月2日周二

6月1日周一

5月30日周六

6月2日

18:00

公众号：百度智能云（文心）

北京人形机器人创新中心联合百度智能云发起具身智能黑客松大赛

北京人形机器人创新中心与百度智能云发起具身智能黑客松大赛，设运动控制与VLA模型微调双赛道，面向全球征集真机可部署方案。提供百万奖金、天工3.0本体及世界人形机器人运动会直通名额。天工Ultra曾夺半马冠军（2:40:42）及百米冠军（21.50秒）。

具身智能开源生态行业动态

18:00

公众号：百度智能云（文心）

云服务器19.9元/年，百度智能云618全栈AI超值购！

百度智能云618全栈AI超值购活动推出，云服务器仅需19.9元/年。该活动以全栈AI超值购为主题，提供19.9元/年的云服务器优惠价格，用户可在活动期间享受这一超值购福利。

行业动态

18:00

公众号：百度智能云（文心）

华硕商用电脑与百度智能云推出企业级AI解决方案"华硕×百度搭子DuMate"

华硕商用电脑与百度智能云在COMPUTEX 2026期间推出面向中国市场的企业级AI解决方案“华硕×百度搭子DuMate”。该方案采用端云混合推理架构：云端接入百度文心大模型及22+官方Skills，负责复杂检索与任务编排；端侧利用华硕商用AI PC本地算力，在32GB内存环境下可部署35B量级大语言模型及PaddleOCR-VL等多模态模型，支持敏感文件处理、批量OCR等离线运行，确保数据不出本机。方案具备沙箱隔离、权限授权、长期记忆等企业级能力，可实现邮件整理、PPT生成、合同审查等工作流自动化闭环，降低云端Token调用成本。

智能体产品更新端侧

17:52

Anthropic：Transformer Circuits（可解释性研究）

精选63

Anthropic可解释性研究：区分因果效应相似的特征

Anthropic可解释性团队介绍了其Circuits研究的新进展。为区分那些激活模式相似但因果效应不同的模型特征，团队提出一种新方法。该方法通过分析特征的下游连接来预测其实际影响，并使用基于共激活统计的TWERA（虚拟权重）对连接进行加权排序。实验表明，借助下游连接信息能更准确地判断哪个特征会引导特定输出。此方法为识别模型内部真正的因果组件提供了新途径。

Anthropic安全/对齐论文/研究

推荐理由：做可解释性研究的同学值得读，它用下游连接区分看似相同的特征，比只看激活例子更能预测因果作用，对齐审计里能省不少试错。

17:12

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选57

Codex正在成为每个人的生产力工具

The Next Era of Knowledge Work报告指出，Codex正通过AI增强的研究、数据分析、工作流自动化与内容创作，变革知识工作的生产力。

OpenAI现象/趋势论文/研究

关联讨论 1 条

推荐理由：OpenAI 这份报告把 Codex 从编码工具重新定位成每个人都能用的生产力引擎，虽然还是趋势预测，但官方出手定调，对「AI 怎么改变白领工作」的讨论会是个强参考。

13:16

公众号：面壁智能（MiniCPM）

对话刘知远：中国AI要"向外卷"，大模型密度定律登上《自然·机器智能》封面

面壁智能首席科学家刘知远提出“大模型密度定律”，该研究登上《自然·机器智能》封面，发现智能密度每3.5个月翻倍。他认为中国AI需“向外卷”，深入产业场景，而非重复OpenAI路径。刘知远指出中国模型与顶尖仍有差距，DeepSeek-V4尚未超越Claude Opus，原始创新是最大短板，但DeepSeek-R1在未公开路线下的创新值得肯定。他还强调智源研究院作为“中间地带”对原始创新的支持作用。

大佬观点现象/趋势端侧

12:19

OpenRouter：Announcements（RSS）

精选65

OpenRouter 5月发布亮点

OpenRouter 发布5月更新，推出语音与转录API、模型融合（Model Fusion）功能，并为平台添加了私有模型和企业工作区管控能力。此次更新共上线20个新模型，其中包括 Gemini 3.5 Flash 和 Claude Opus 4.8。

MCP/工具产品更新部署/工程

推荐理由：OpenRouter 把模型融合和语音 API 做成内置功能，对用它的开发者是实打实的工作流升级，Gemini 3.5 Flash 和 Claude Opus 4.8 的接入反倒只算添头。

10:56

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.160 发布

Claude Code v2.1.160版本主要增强安全性和稳定性。新版本在向shell启动文件和.git/config等文件写入内容前增加提示，防止意外命令执行；acceptEdits模式在写入.npmrc等构建配置文件前也会提示。此次更新修复了多个问题，包括Windows/WSL剪贴板、会话恢复、后台会话连接等，并优化了自动模式延迟和后台清理流程。此外移除了JetBrains插件建议，将动态工作流触发词从workflow重命名为ultracode。

Anthropic产品更新编码

09:00

公众号：蚂蚁百灵（Ling）

KPop：用对称二元KL散度解决MoE大模型RL训练推理不一致问题

KPop针对MoE大模型强化学习中的训练-推理不一致问题，提出用对称二元KL散度代替IcePop的固定ratio阈值。该方法只需一个超参数，根据token概率自适应调整屏蔽边界：稀有token更宽容，高频token更严格。在Ring-flash-2.0（100B总参，6.1B激活）的RLVR训练中，支撑800+步稳定训练，屏蔽比例从10%动态升至30%+（IcePop仅约0.2%）；在AIME25、HMMT25-Nov、ARC-AGI-2、LiveCodeBench上全面优于IcePop。在长程智能体任务中，基于Ring-2.6-1T（1万亿总参，63B激活）的SWE-bench Verified得分从70.8%提升至76.28%，且仅需更新70%~80% token即可收敛。

推理数据/训练论文/研究

08:19

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选63

OpenAI的AI政策与政治倡导观点

OpenAI阐述了其在AI政策与政治倡导方面的立场，包括对透明度、深思熟虑的监管以及AI安全的支持。同时，公司明确表示，任何外部政治组织均不能代表OpenAI发言。

OpenAI安全/对齐政策/监管

推荐理由：OpenAI 这次把政策底牌摊开，强调透明度和独立政治立场，对想摸清他们监管角色的从业者是份基础文件，但信息增量不算多。

07:14

Cursor Blog

精选64

Cursor Teams计划定价方案更新

Cursor Teams计划推出三项更新：增加Composer特定使用池，将第一方模型（Composer和Auto）与第三方API的使用额度分开计费；推出Premium席位，提供5倍于标准席位（$40/月）的使用量，价格为$96/月（年付）；仪表盘现可实时显示用户额度使用情况，管理员可通过Slack或邮件配置智能提醒。

智能体产品更新编码

推荐理由：Cursor这个定价更新把「用不用得起第三方模型」的问题从团队开支里切出去了，标准席位加量不加价，重度用户直接上Premium可能比现在更划算，做Agent开发的团队不妨算算账。

05:48

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选77

OpenAI前沿模型与Codex现可在AWS上使用

OpenAI的前沿模型与Codex现已在AWS上全面可用。企业客户可通过其现有的AWS环境、控制与采购流程来使用OpenAI的AI技术，从而加速从评估到生产部署的过程。

OpenAI产品更新部署/工程

关联讨论 3 条

推荐理由：OpenAI 模型终于在 AWS 上全面可用，之前只能走 Azure 或自家 API，这次对大量 AWS 原生企业是实质性门槛降低，评估到生产的路径直接打通。

03:16

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选71

OpenAI在密歇根州启动Stargate 1GW数据中心建设

OpenAI在密歇根州启动了名为Stargate的1GW数据中心项目。作为AI基础设施建设的一部分，该项目旨在扩大人工智能技术的可及性、为当地创造就业机会并支持社区发展。

OpenAI行业动态部署/工程

关联讨论 1 条

推荐理由：Stargate项目从PPT走到了动工，1GW数据中心是AI军备竞赛的又一个物理锚点，虽然不会立刻改变产品，但它决定了未来模型能跑多快。

02:15

xAI：News（网页）

精选78

xAI发布Composer 2.5

xAI的最新编程模型Composer 2.5现已在Grok Build中可用，用户可通过`/models`菜单选择使用。这是一款快速、先进的模型，擅长处理长时间运行的任务和复杂指令。该模型面向SuperGrok和X Premium+用户开放。

xAI推理模型发布

关联讨论 1 条

推荐理由：xAI 的 Composer 2.5 主攻长任务和复杂指令，如果你在用 Grok 搭 Agent，这模型值得切过去试试，可能比之前的编码模型更稳。

01:59

公众号：通义实验室（千问）

精选64

Qwen3.7-Plus 多模态智能体模型发布

Qwen3.7-Plus 深度融合视觉与语言，实现“看、想、写、做、验”端到端闭环，在 12 项核心基准测试中表现提升。实测中，基于该模型的智能体连续运行超 11 小时，自动完成英语学习 APP 开发，生成代码超 10000 行、触发调用超 1000 次；复刻 macOS Stocks 应用并通过 10 项功能验证。支持图像/视频转 SVG、视觉驱动网页设计及浏览器自动化。已在阿里云百炼上线，提供 OpenAI 兼容 API 与 Anthropic 协议。

智能体多模态模型发布

关联讨论 1 条

推荐理由：Qwen3.7-Plus 把视觉智能体推到了‘能看、能想、能动手’的端到端闭环，从写代码到操作浏览器一条龙，做自动化 Agent 的团队可以直接拿来用。

01:37

Qwen：Blog Retrieval（API）

精选67

Qwen3.7-Plus：多模态智能体模型发布

阿里云通义千问推出 Qwen3.7-Plus，基于 Qwen3.7 文本骨干，增强视觉语言能力，保留编码、工具使用和生产工作流的智能体能力。它支持感知现实场景、读取并操作 GUI、从视觉参考编写代码、端到端导航手机应用、基于网络知识回答视觉问题，融合 GUI 与 CLI 交互，跨 Claude Code、OpenClaw、Qwen Code 等框架泛化。在 Terminal Bench 2.0-Terminus 得分 70.3，SWE-Verified 77.7，QwenWorldBench 62.1，GPQA Diamond 90.3，MMLU-Pro 88.5。通过阿里云 Model Studio API 提供。

智能体多模态模型发布编码

关联讨论 10 条

推荐理由：Qwen3.7-Plus 把视觉理解和 agent 操作揉到了一起，看图写代码、自主操作手机界面，对想做多模态自动化的开发者来说是个值得跑一跑的新基座。

01:26

Google Blog：AI（RSS）

谷歌员工如何使用 Gemini 制作 Google I/O 2026

本文介绍了谷歌员工使用 Gemini 模型来制作 2026 年的 Google I/O 开发者大会。

Google现象/趋势

00:38

Hugging Face：Blog（RSS）

精选71

JetBrains 发布 Mellum2：12B 参数混合专家模型

Mellum2 是 JetBrains 从头训练的 12B 参数混合专家（MoE）模型，专注于自然语言与代码。每个 token 仅激活 2.5B 参数，推理速度可达同类模型的 2 倍以上，适合高吞吐、低延迟场景。该模型支持路由、RAG、摘要、子智能体及私有部署，以 Apache 2.0 许可证开源。在代码生成、推理、科学和数学基准测试中，Mellum2 与同等规模的开放模型竞争力相当。

推理模型发布编码

推荐理由：JetBrains 开源了 Mellum2，一个激活参数仅 2.5B 的 12B MoE 模型，专为代码和问答管道设计的快模型。做实时 RAG 或子代理时，终于不用硬扛大模型了。

00:35

Tomer Tunguz 博客（VC 分析）

精选62

AI看跌情绪地图

金融市场对AI的看跌情绪正从整体上升转向板块分化。上季度，软件、半导体、云及超大规模公司的空头比例中位数上升约24%。GPU数据中心业务空头股份在过去一年激增60%。AI云与新型云公司的当前空头比例中位数最高，达16.8%，SaaS与开发工具领域随后，分别为9.5%和8.9%。相比之下，超大规模公司和NVIDIA的空头比例极低，仅为1.1%和1.2%。市场怀疑主要针对那些AI业务仍依赖未来资本、需求或运营杠杆的中小型公司。

现象/趋势

推荐理由：这份AI做空地图把市场怀疑论的矛头指向了谁说得明明白白，GPU云和AI SaaS被看空得最狠，但NVIDIA和超大规模云商几乎没被碰，做投资或者关心谁在裸泳的可以认真看看。

00:24

Anthropic：Newsroom（网页）

精选86

Anthropic 保密向 SEC 提交 S-1 草案

Anthropic, PBC 今日保密向美国证券交易委员会提交了 S-1 表格草案，计划进行普通股的首次公开发行。这使其在 SEC 完成审核后拥有上市的选择权。IPO 的具体发行股数和价格尚未确定，将取决于市场条件等因素。公司近期刚完成由 Altimeter Capital 等领投的 650 亿美元 H 轮融资，估值达 9650 亿美元，并发布了 Claude Opus 4.8 模型。

Anthropic行业动态

关联讨论 10 条

推荐理由：Anthropic 秘密提交 IPO 申请，是继 OpenAI 之后最值得盯的 AI 公司上市信号，不管最终定价多少，都会重新校准整个行业的估值坐标系。

6月1日

22:38

Hugging Face：Blog（RSS）

精选60

超越LLM：为何可扩展的企业AI采用取决于智能体逻辑

可扩展的企业AI采用需超越大语言模型，依靠智能体逻辑来引导模型执行动态、长周期且受约束的企业工作流，从而提升质量、降低成本并建立信任。文中以IBM watsonx Code Assistant for Z为例，展示了智能体逻辑如何通过程序分析等技术，在理解大型遗留代码库时，相比纯LLM基线方法，能以约30倍更低的token消耗达到更优性能。在加速测试生成任务中，该方法亦能使代码覆盖度提升20%-45%，同时token消耗降低最高达15倍。

智能体推理现象/趋势部署/工程

推荐理由：不是又一篇炒作 agent 的文章，IBM 拿真实项目数据说清楚了‘agent logic’怎么让大模型在企业落地时既降本又增效。

22:06

Nathan Lambert：Interconnects（RSS）

精选66

开源与闭源模型在不同的增长曲线上

当模型智能的微小提升能直接转化为实际价值时，开源与闭源模型正沿着不同的增长路径发展。闭源模型通过在特定场景下提供更高的边际智能来创造价值，而开源模型则在其他维度寻找增长点，两者形成了差异化的竞争格局。

大佬观点开源生态

推荐理由：Nathan Lambert 这篇文章一反所有人都在讨论「开源能否追上闭源」的调调，直接指出两者走的根本不是同一条增长曲线，做产品选型的真该看看。

19:39

公众号：火山引擎

江苏交控×火山引擎：出行智能体"小茉莉"上线，覆盖全周期高速服务

江苏交通控股有限公司与火山引擎合作推出出行智能体“小茉莉”，已在96777热线、江苏高速APP和茉莉管家小程序提供7×24小时智能问答。服务覆盖行前路况查询、行中服务区及充电桩信息、紧急救援、行后ETC办理等全周期。热线首次接听100%由AI完成，节假日高峰和恶劣天气时承接约33%的问询。火山引擎HiAgent与大模型防火墙提供运维安全支撑，veCDP、GMP等构建的用户管理平台通过出行标签实现“千人千面”精细化运营。

产品更新

19:05

公众号：京东JoyAI

JoyInside儿童节专题 | 不止一问一答，更是装在万物里的"童年玩伴"

京东JoyInside将大模型技术嵌入多款儿童产品，包括AI毛绒公仔、小龙AI魔法益智打印机、京造AI台灯和小鸡球球点读笔，实现语音交互、伴读、双语互动等功能。六一前夕（5月最后一周），搭载JoyInside的AI终端销量环比4月同一周增长535%；小龙AI魔法益智打印机在618开门红4小时内销量环比激增17倍。

端侧行业动态语音

18:24

Runway：News（网页）

精选65

Runway 在伦敦设立欧洲总部及世界模型研究中心

Runway 宣布在伦敦建立新的欧洲总部和专注于通用世界模型的研究中心。公司计划在未来18个月向英国AI生态投资$100M，到2028年投资额将翻倍以上。过去12个月，其在欧洲的订阅销量增长了50%，企业客户占比超20%。新总部将扩大其在欧洲的研究与商业布局，公司正招聘欧洲负责人以组建跨研究、产品、工程和销售的团队，并深化与BBC、Fremantle、WPP等企业的合作。世界模型是其研究的核心，旨在将生成式AI的应用扩展至机器人、科学研究与工业模拟等领域。

行业动态视频

关联讨论 1 条

推荐理由：Runway把研究重心放到伦敦，100M投资不小，对欧洲AI创业者和创作者是个信号，但本质还是区域扩张，技术惊喜不多，可以过一眼。