AIHOT

全部动态一手 · 2414 条

全部一手资讯 X 论文

5月7日周四

5月6日周三

5月7日

22:59

Google DeepMind：Blog（RSS）

精选66

AlphaEvolve：我们由Gemini驱动的编程智能体如何跨领域扩展影响力

AlphaEvolve推出了基于Gemini大模型的编程智能体，其算法正驱动多个领域产生实际影响。该智能体在商业流程、基础设施优化与科学研究三个关键领域实现规模化应用，通过自动化代码生成与问题解决提升效率。具体实践表明，它能显著加速开发周期并处理复杂任务，标志着AI编程助手从辅助工具向核心生产力引擎的演进。

智能体DeepMindGoogle产品更新

推荐理由：DeepMind这次不只是秀参数，AlphaEvolve用Gemini驱动编码代理，已经开始在工业设计和科学发现里产生真实影响了，做自动化的可以盯着看。

22:30

Apple：Newsroom（RSS）

54

AI 与无障碍技术在今年 Swift Student Challenge 中的相遇

本届 Swift Student Challenge 评选出四位获奖者，他们开发的创新应用深度融合人工智能技术，并聚焦于无障碍功能设计。这些应用利用 AI 为视障、听障等群体提供实时环境识别、语音交互增强等解决方案，展现了技术普惠的实践路径。获奖作品均基于 Swift 平台开发，体现出年轻开发者将前沿 AI 能力与包容性设计理念相结合的趋势。

行业动态

20:03

公众号：豆包（字节）

28

科研工作者们如何用豆包？他们这样说

多模态教程/实践

20:00

OpenRouter：Announcements（RSS）

精选56

OpenRouter 为每个模型提供一致网络搜索与抓取功能

OpenRouter 向所有支持工具调用的模型开放自主网络搜索与页面内容抓取能力，并允许用户从多个搜索引擎和抓取引擎中自行选择。

智能体MCP/工具产品更新搜索

推荐理由：OpenRouter把网络搜索和抓取做成统一的工具接口，任何工具调用模型都能用，做agent的开发者不用再自己拼搜索层了。

20:00

OpenRouter：Announcements（RSS）

精选55

OpenRouter 为所有工具调用模型提供统一的网页搜索与抓取功能

OpenRouter 推出新功能，允许任何工具调用模型自主进行网页搜索并抓取页面内容，支持多种搜索引擎和抓取引擎供选择。

MCP/工具产品更新搜索

关联讨论 1 条

推荐理由：OpenRouter 给所有工具调用模型配上了统一的网络搜索和抓取能力，开发者不用再为每个模型单独对接搜索 API，适配成本直线下降。

19:58

公众号：龙猫LongCat（美团）

49

美团校园 AI Hackathon 大赛启动，30 万 + 元奖金池直通实习 offer

美团宣布启动校园 AI Hackathon 大赛，总奖金池超过 30 万元，优胜者有机会获得直通实习 offer。大赛主题为“让科技融入烟火，用AI定义未来”，面向在校学生开放报名。

行业动态

19:58

公众号：龙猫LongCat（美团）

53

报名|CVPR 2026 美团学术论文精选及分享会

美团技术团队将于5月21日（周四）下午举办线上直播，分享CVPR 2026学术论文精选。

图像生成行业动态

19:58

公众号：龙猫LongCat（美团）

56

用Agent评测思路管理AI Coding -- 31万行代码AI重构的实践

美团技术团队在LongCat项目中实践AI编码管理，指出当90%以上代码由AI生成时，决定系统走向的不是谁写得更快，而是约束AI的能力。

智能体教程/实践编码

19:34

公众号：面壁智能（MiniCPM）

37

面壁智能联合清华等发布《智能座舱》白皮书，定义AGI时代汽车新范式

在2026北京车展上，面壁智能联合清华大学车辆与运载学院、中国汽车报发布行业白皮书《智能座舱：定义AGI时代的汽车新范式》，以“默契之境，智动于心”为主题举办发布会暨研讨会。白皮书探讨端侧AI如何成为智能汽车演进的核心引擎，实现从感知到主动服务的汽车与人的“默契”体验。

端侧行业动态

19:13

OpenAI：官网动态（RSS · 排除企业/客户案例）

22

Parloa 打造客户愿意与之交谈的服务代理

Parloa 推出基于 OpenAI 模型的语音驱动 AI 客服代理，具备可扩展性，支持企业设计、模拟并部署可靠的实时交互。该平台通过大语言模型技术，使客服系统能够处理自然语音对话，提升服务响应速度与准确性，帮助企业实现高效、个性化的客户沟通解决方案。

OpenAI行业动态语音

18:29

Anthropic：Research（发表成果 · 网页）

精选67

聚焦领域：Anthropic研究所的核心研究方向

Anthropic研究所公布了其四大核心研究领域：经济扩散、威胁与韧性、真实世界中的AI系统以及AI驱动的研发。该机构将利用其身处前沿AI实验室内部的独特优势，研究AI对世界的实际影响，并公开分享成果。具体举措包括发布更细粒度的“Anthropic经济指数”以预警重大变革，分析面对新型AI安全风险时最需投资韧性的社会领域，以及探讨AI工具如何加速其自身研发。这些研究成果将为Anthropic的“长期利益信托”提供决策依据，并帮助外部组织与公众更好地应对AI发展。

Anthropic安全/对齐现象/趋势

关联讨论 1 条

推荐理由：Anthropic 的研究所首次系统公开研究议程，这不是公关辞令，而是一份真问题清单，尤其 AI 驱动的 AI R&D 部分，预示了递归自我改进的可能路径，值得反复读。

15:00

公众号：昆仑万维（天工）

46

口袋里的AI专家：Opera安卓浏览器深度思考功能全面升级

Opera安卓浏览器对其深度思考功能进行了全面升级，该功能旨在为移动端用户提供AI驱动的智能辅助体验。此次升级的具体技术细节与版本号尚未披露。

产品更新推理

14:09

公众号：火山引擎

45

火山引擎领跑中国大模型公有云市场

火山引擎在中国大模型公有云市场占比49.5%，位居行业第一。

行业动态

10:01

公众号：腾讯混元

32

腾讯混元 Hy3 preview 上线两周 Token 调用增长 10 倍

腾讯混元推出的 Hy3 preview 模型上线仅两周，Token 调用量即增长 10 倍，其中代码和智能体类场景的 Token 调用增长尤为明显。

智能体模型发布编码

08:30

Apple Machine Learning Research（RSS）

精选61

Normalizing Flows with Iterative Denoising

研究团队在归一化流（NFs）生成模型领域取得新进展，提出了迭代TARFlow（iTARFlow）。该方法在训练阶段保持完全端到端的基于似然的目标，采样时则采用自回归生成方式。iTARFlow延续了TARFlow在图像建模任务上的优势，使其成为扩散模型等方法的可行替代方案，进一步提升了归一化流生成模型的性能表现。

图像生成论文/研究

推荐理由：Normalizing Flows 这个老方法被苹果玩出新花样，iTARFlow 在训练上保留端到端似然，采样却自回归，给做生成模型的人提供了扩散模型之外的第二个靠谱选择。

08:30

Apple Machine Learning Research（RSS）

精选64

SpecMD：关于推测性专家预取的综合研究

研究团队开发了SpecMD，这是一个用于在各种硬件配置上对临时缓存策略进行基准测试的标准化框架。该研究聚焦于混合专家模型，这类模型虽然实现了稀疏专家激活，但需要专家缓存机制才能将稀疏性转化为实际性能提升。此前的研究提出了以硬件为中心的缓存策略，但不同缓存策略之间以及它们与不同硬件规格之间的相互作用尚不明确。SpecMD框架旨在填补这一理解空白，系统性地评估缓存策略的交互影响与硬件适配性。

推理论文/研究部署/工程

推荐理由：MoE推理的缓存策略一直靠经验摸，Apple给的标准化框架能系统比较不同策略，做分布式推理的可以省些心力。

07:11

xAI：News（网页）

精选79

Grok Imagine API 推出"Quality Mode"图像生成与编辑功能

xAI正式向企业开发者和团队推出Grok Imagine API的“Quality Mode”图像生成与编辑功能。该模式在真实性、文本渲染和创意控制上实现显著提升，能生成细节精细、纹理准确、场景逼真的图像，并具备清晰的多语言文本生成能力。在独立排行榜中，该API已位列顶级模型之列。定价为输入提示每次0.01美元，输出图像根据分辨率（1K或2K）每张费用在0.05至0.07美元之间。此功能适用于产品可视化、营销素材快速生成、用户内容风格创作等多种商业场景。

xAI产品更新多模态

关联讨论 1 条

推荐理由：Grok Imagine 的 Quality Mode 在写实度和文字渲染上提升很明显，对需要高频生成产品图和 UGC 内容的品牌团队是个实在的更新，API 直接能用，单张才几分钱。

06:55

OpenAI：官网动态（RSS · 排除企业/客户案例）

50

Singular Bank 借助 ChatGPT 和 Codex 助力银行家高效工作

Singular Bank 开发了名为 Singularity 的内部助手，该工具整合了 ChatGPT 和 Codex 技术，旨在帮助银行家节省日常工作时间。它主要应用于会议准备、投资组合分析和后续跟进等任务，可使银行家每天在这些事务上节省 60 至 90 分钟。

智能体OpenAI行业动态

06:40

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选72

Uber 利用 OpenAI 帮助司机更智能地赚钱、乘客更快地叫车

Uber 宣布在其全球实时交通服务平台中集成 OpenAI 技术，用于驱动 AI 助手与语音功能。新功能旨在帮助司机更智能地规划接单以提升收入，同时让乘客能够更快完成叫车流程。该技术将应用于优化实时供需匹配与用户体验。

OpenAI行业动态语音

推荐理由：Uber 把 OpenAI 的语音和助手能力搬进了打车场景，这是 AI 真正融入日常服务的一个信号，对做产品的人来说，落地路径比技术参数更重要。

06:30

Apple Machine Learning Research（RSS）

精选73

从位置认知到功能理解：为多模态大语言模型设立空间功能智能基准

现有基准如VSI-Bench主要评估基础几何感知能力，但未能触及具身智能所需的高阶认知。为此，研究团队推出了空间功能智能基准SFI-Bench，该基准包含超过1700个问题，数据来源于多样化的第一人称室内扫描视频。SFI-Bench旨在系统评估多模态大模型从物体位置感知到功能意图理解的高级空间推理能力，标志着对智能体空间认知的评估从几何层面迈向功能层面。

多模态推理论文/研究

推荐理由：Apple 自己搞的 SFI-Bench 把评估从几何定位推进到功能理解，这个方向很对，做具身智能和空间推理的团队该跟一下。

06:30

Claude Code：GitHub Releases（RSS）

51

Claude Code v2.1.132 版本更新与问题修复

Claude Code 发布 v2.1.132 版本，新增多项功能并修复超过20个问题。主要新增内容包括：为 Bash 工具子进程环境添加 `CLAUDE_CODE_SESSION_ID` 环境变量；引入 `CLAUDE_CODE_DISABLE_ALTERNATE_SCREEN=1` 环境变量以退出全屏渲染器；在粘贴图片时显示“Pasting…”提示。关键修复涉及：外部 SIGINT 信号现在能触发优雅关机并打印 `--resume` 提示；修复了原生构建下终端关闭或 SSH 断开时的未捕获异常；解决了 `--resume` 因表情符号被截断而失败以及 `--permission-mode` 标志在恢复会话时被忽略的问题。此外，还修复了全屏模式唤醒后黑屏、特定字符输入损坏、鼠标滚动过快、内存无限增长等具体问题。

Anthropic产品更新编码

06:10

xAI：News（网页）

精选83

Grok Web 正式推出 Connectors 功能，实现与日常应用深度集成

xAI 正式在 Grok Web 上线 Connectors 功能，提供与多种日常应用工具的深度集成。该功能允许 Grok 端到端处理任务，如阅读总结邮件、更新幻灯片、管理日历和编辑电子表格，无需频繁切换和复制粘贴。首批支持的连接器包括 SharePoint、Outlook、OneDrive、Google Workspace、Notion、GitHub 和 Linear，涵盖文件搜索读写、代码审查与任务管理等操作。同时推出的“自带 MCP”功能支持连接自定义模型上下文协议服务器。完整的 Connectors 支持也即将登陆 Grok iOS 和 Android 应用。

MCP/工具xAI产品更新

关联讨论 1 条

推荐理由：Grok这波连接器把 Office、GitHub 和 Notion 全打通了，不是演示级挂接，是能直接读写编辑的真集成，外加开放自建 MCP，产品经理和开发者都该立刻上手试试。

05:30

GitHub Blog

精选56

Validating agentic behavior when "correct" isn't deterministic

GitHub 探讨如何为 Copilot 编码智能体构建“信任层”。文章提出，在“正确”答案非确定性的场景下，可通过领域分析来验证智能体的自主行为，避免使用脆弱的脚本或黑盒判断。该方法旨在提升 AI 编码助手的可靠性与透明度，确保其行为符合预期标准。

智能体GitHub教程/实践编码

推荐理由：做coding agent最头疼的就是如何验证产出质量，GitHub这篇把他们的内部方法论开源了，用dominance分析替代脆弱的脚本，对正在折腾AI编程工具的团队是实打实的参考，值得逐帧学习。

03:22

Hugging Face：Blog（RSS）

精选65

vLLM V0 到 V1：在线强化学习中优先确保后端行为正确性

为确保 vLLM 从 0.8.5 到 0.18.1 的重大重写后，在线强化学习训练结果与 V0 参考运行一致，团队优先修复后端行为而非调整 RL 目标。关键修复包括：将日志概率模式设为 `processed_logprobs` 以匹配采样器分布；禁用 V1 特有的前缀缓存和异步调度等运行时默认值；调整权重更新路径以匹配 V0 的缓存保留行为；并确保 rollout 后端使用 fp32 精度的 `lm_head` 进行最终投影。这些措施消除了策略比率均值偏差，使 V1 在 KL 散度、熵等指标上与 V0 达成一致。

Hugging Face推理教程/实践部署/工程

推荐理由：vLLM V1迁移时踩的四个坑全在这里，从logprob语义到fp32投影头，修完才调RL目标，做在线RL的团队可以直接抄这份配置清单。

01:39

OpenAI：官网动态（RSS · 排除企业/客户案例）

42

Introducing ChatGPT Futures： Class of 2026

OpenAI公布了“ChatGPT Futures: 2026届”的26名学生创新者名单。这些学生正利用以ChatGPT为代表的AI技术进行构建、研究，并推动产生现实世界的影响力。他们的项目正在重新定义学习、创造力和机遇，展示了新一代如何将AI工具应用于具体实践以解决实际问题。

OpenAI行业动态

01:10

xAI：News（网页）

68

SpaceXAI与Anthropic达成新计算合作伙伴关系

SpaceXAI与Anthropic签署协议，提供对Colossus 1超级计算机的访问权限。Colossus 1是全球最大、部署最快的AI超算之一，拥有超过22万个NVIDIA GPU，包括H100、H200和下一代GB200加速器，专为AI训练、微调、推理及高性能计算工作负载设计。Anthropic计划利用此计算能力直接提升Claude Pro和Claude Max订阅者的服务容量。此外，Anthropic表示有兴趣合作开发多个千兆瓦的轨道AI计算容量，以应对地球资源限制。SpaceX凭借其高发射频率、轨道经济性和星座运营经验，可能使轨道计算在近期成为工程计划，而非仅停留于研究概念。

AnthropicxAI行业动态部署/工程

关联讨论 14 条

00:35

Cursor Blog

53

通过自动安装系统引导Composer开发

团队开发了Composer自动安装系统，利用早期模型（如Composer 1.5）为强化学习训练自动配置可运行环境。该系统分两阶段工作：先由智能体设定成功环境的目标命令与描述，再由另一智能体执行具体配置，包括安装依赖、模拟缺失组件并进行测试。在一项针对区块链项目Celo的真实实验中，该系统成功处理了稀疏文档和复杂依赖。采用此方法后，Composer 2在环境设置基准测试中的得分从47.9%提升至61.7%，为后续训练提供了更优基础。

智能体教程/实践编码部署/工程

00:33

Claude：Blog（网页）

精选69

Claude托管智能体新增功能：梦想、成果与多智能体编排

Anthropic为其Claude托管智能体平台推出三项核心更新。“梦想”功能通过回顾会话历史提取模式，使智能体能够自我改进。“成果”功能允许开发者设定成功标准，智能体据此进行自我评估与修正，内部测试显示其显著提升了任务成功率和输出质量。“多智能体编排”功能支持主智能体将复杂任务分解，并分配给配备专用工具的子智能体并行处理。这些更新旨在以最小人工干预，增强智能体处理复杂任务的能力。

智能体Anthropic产品更新部署/工程

关联讨论 3 条

推荐理由：Anthropic给托管Agent加了dreaming、outcomes和multiagent，这是Agent从完成任务到自我改进和协作的质变。dreaming让Agent能跨session复盘，做Agent产品的团队现在多了一个必须研究的模块。

00:31

Google Blog：AI（RSS）

27

5 个你可以在 Search 中直接尝试的园艺技巧

Google 整合了利用其 AI Mode、Search Live 和 Shopping 功能来帮助植物茁壮成长的主要方法。这些工具能提供实时的园艺指导、植物护理建议以及相关产品购买信息，用户可直接在搜索中获取并应用这些技巧，以优化自己的园艺实践。

Google其他

00:31

Anthropic：Newsroom（网页）

精选81

Claude使用限制提升及与SpaceX达成算力合作

Anthropic与SpaceX达成合作，获得其Colossus 1数据中心超300兆瓦（含逾22万块NVIDIA GPU）的算力。此举使Claude Code的Pro、Max等多档计划的五小时速率限制立即翻倍，并取消了高峰时段限流；Claude Opus的API速率也大幅提升。公司还公布了与亚马逊、谷歌、微软等科技巨头的一系列大规模算力协议，总投资额巨大。为满足企业客户的合规需求，算力扩张计划也将覆盖亚洲和欧洲地区。

Anthropic产品更新部署/工程

关联讨论 14 条

推荐理由：跟 SpaceX 搞轨道算力是长期故事，但今天起 Claude Code 速率翻倍、API 限制松绑，对重度用户是立刻能摸到的甜头，即日生效不用等。

5月6日

23:08

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选65

前沿企业如何构建人工智能优势

OpenAI的B2B Signals研究揭示了前沿企业深化AI应用、规模化基于Codex的智能体工作流，并构建持久竞争优势的路径。这些企业正超越基础应用，将AI深度集成至核心业务流程，通过部署能自主执行复杂任务的智能体工作流来提升效率与创新能力。研究指出，成功的关键在于规模化应用AI代理，这能带来显著的运营优势并形成竞争壁垒。

智能体OpenAI现象/趋势编码

关联讨论 1 条

推荐理由：OpenAI的B2B研究把企业AI落地差距摊开了，Codex驱动的代理工作流正在成为壁垒，做企业服务的可以当镜子照。

21:00

公众号：昆仑万维（天工）

23

昆仑万维方汉：天工AI领跑垂类大模型开源赋能全球创作

昆仑万维方汉指出，天工AI在垂类大模型领域中处于领先地位，并通过开源策略推动全球范围内的内容创作与生态构建。

开源生态行业动态

19:54

公众号：火山引擎

49

豆包基础模型 Doubao-Seed-2.0-lite 升级，支持全模态理解

豆包基础模型 Doubao-Seed-2.0-lite 完成升级，新增全模态理解能力。升级后的模型支持全模态理解，可处理多种信息形式。此为火山引擎旗下模型的最新升级。

多模态模型发布

19:37

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选69

通过 MRC（多路径可靠连接）解锁大规模 AI 训练网络

OpenAI 发布了名为 MRC 的新型超级计算机网络协议，旨在提升大规模 AI 训练集群的韧性与性能。该协议通过开放计算项目公开，支持在数千个 GPU 间建立高效、可靠的多路径连接，能自动绕过故障链路，将网络有效带宽提升最高达 30%，同时显著降低训练作业因网络问题中断的概率。MRC 的设计目标是应对万卡级集群的复杂网络挑战，为下一代大模型训练提供基础设施支持。

OpenAI产品更新部署/工程

关联讨论 1 条

推荐理由：虽然只是个网络协议，但MRC在超大规模训练集群里解决的是真实痛点，OpenAI自己内部用了才放出来，做万卡级训练的团队确实该看看。

19:37

公众号：面壁智能（MiniCPM）

44

面壁智能2026北京车展展示端侧大模型全套解决方案

2026北京车展上，面壁智能展出了端侧大模型解决方案，包括全模态+全双工交互、AI Box算力魔方、SuperMate无感智舱和EmbodiedClaw物理Agent。AI Box已与Intel等合作，预计2026年底30万辆汽车搭载面壁端侧模型。SuperMate覆盖上车、行程、事故处理等全场景，实现感知→记忆→推理→执行闭环，不依赖云端。EmbodiedClaw让车辆成为24小时在线物理Agent，可完成拿取物品等简单物理任务。

产品更新端侧

19:00

公众号：可灵AI（快手·视频）

39

可灵AI：8所高校AI创作工坊开课，优秀作品直通釜山电影节

可灵AI联合8所高校启动AI创作工坊，课程已正式开课。工坊中的优秀作品将获得直通釜山电影节的参展机会。

行业动态视频

17:22

Hugging Face：Blog（RSS）

47

Open ASR 排行榜引入私有数据集以对抗基准过度优化

Hugging Face 的 Open ASR Leaderboard 加入了来自 Appen Inc. 和 DataoceanAI 的高质量私有英语 ASR 数据集，涵盖多种口音及脚本式/会话式语音，总时长约 28.7 小时。数据集保持私有以降低 benchmaxxing（针对基准的过度优化）或测试集污染风险。默认平均 WER 仍基于公开数据集计算，用户可通过切换查看私有数据集影响。标准化采用基于 Whisper 的标准化器，UI 代码和评估脚本已开源。自 2023 年 9 月上线以来，该榜单访问量已超过 71 万次。

Hugging Face产品更新开源/仓库评测/基准

16:29

Claude Code：GitHub Releases（RSS）

26

该版本修复了两个关键问题。一是解决了 VS Code 扩展在 Windows 系统上因捆绑 SDK 中硬编码的构建路径而无法激活的故障，涉及 `createRequire` 的 polyfill 错误。二是修正了 Mantle 端点认证因缺少 `x-api-key` 请求头而失败的问题。两项修复均针对特定错误，未涉及功能新增或性能指标变更。

Anthropic产品更新

16:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

48

ChatGPT 如何在保护隐私的同时学习世界知识

ChatGPT 通过技术手段在训练中减少使用个人数据，以保护用户隐私。系统允许用户自行选择是否将对话内容用于改进 AI 模型，从而赋予用户数据控制权。这一方法旨在平衡模型学习与隐私保护，确保在提升智能水平的同时，降低个人信息暴露的风险。

OpenAI产品更新安全/对齐

10:27

Claude Code：GitHub Releases（RSS）

精选58

Claude Code v2.1.129 版本更新

Claude Code 发布 v2.1.129 版本，带来多项功能新增与问题修复。新增功能包括支持通过 `--plugin-url` 从 URL 获取插件压缩包、新增 `CLAUDE_CODE_FORCE_SYNC_OUTPUT` 环境变量以强制启用终端同步输出，以及为 Homebrew 或 WinGet 安装提供后台自动更新提示。功能调整方面，插件清单中的 `themes` 和 `monitors` 现在建议在 `"experimental"` 下声明；网关模型发现功能改为通过环境变量手动启用；Ctrl+R 历史记录选择器恢复为默认搜索所有项目的提示。此外，修复了约 20 项问题，涉及 `/clear` 命令、会话标题显示、外部编辑器切换、令牌浪费、OAuth 凭证刷新、缓存警告等多个方面。

Anthropic产品更新编码

推荐理由：Claude Code 用户最烦的 session 消失、token 浪费和缓存降级问题这次都修了，还支持从 URL 加载插件，日常体验会顺滑不少。