AIHOT

全部动态一手 · 2415 条

全部一手资讯 X 论文

5月1日周五

4月30日周四

5月1日

21:10

Cloudflare Blog

精选64

Introducing Dynamic Workflows：可随租户流转的持久执行功能

Dynamic Workflows 是一个函数库，支持将持久执行实时路由至租户提供的代码。该库基于 Dynamic Workers 构建，使平台能够以近乎零闲置成本为数百万个独特工作流提供服务。它允许平台根据租户需求动态分配执行资源，实现了工作流与特定租户代码的即时绑定，大幅降低了多租户场景下的运营开销和资源浪费。

产品更新部署/工程

推荐理由：这个库解决的是 AI 代理平台的多租户持久化执行难题，Cloudflare 把动态路由和按需分配做到了几乎零闲置成本，做 Agent 平台的应该认真看看。

14:09

公众号：腾讯混元

腾讯混元发布CL-Bench Life，精准衡量模型在现实生活中的 "上下文学习" 能力

推理论文/研究

11:20

xAI：News（网页）

精选60

自定义语音与语音库

xAI于2026年4月30日推出自定义语音和语音库功能。用户可通过约1分钟录音快速克隆声音，并在Grok文本转语音及语音代理API中即时使用，整个过程仅需2分钟。语音库提供集中管理平台，内置语音已超80种，支持28种语言。为确保安全，系统采用两阶段验证，包括实时转录匹配和说话人嵌入确认，以防止未经授权的克隆。这些功能适用于品牌代理、内容创作、无障碍辅助、多语言团队及游戏娱乐等多种场景，且使用自定义语音无需额外费用。

xAI产品更新语音

推荐理由：xAI 这波‘声音克隆+管理’的更新很实用，安全验证做得细，创作品类和品牌方应该会喜欢，对开发者来说是个加分项，但不是那种能改变格局的大招。

10:14

Claude Code：GitHub Releases（RSS）

精选55

Claude Desktop v2.1.126 版本更新

本次更新增强了模型网关集成，当配置指向兼容网关时，可直接在模型选择器中列出可用模型。新增了 `claude project purge` 命令，用于彻底清理项目状态数据。OAuth登录流程得到优化，支持在浏览器回调失败时手动粘贴授权码，并修复了多种网络环境下的登录问题。安全方面，修复了 `allowManagedDomainsOnly` 等设置可能被忽略的漏洞。此外，还解决了图像粘贴过大导致会话中断、远程会话误报“流空闲超时”、Windows系统下特定文本渲染乱码以及多项工具在特定场景下不可用等数十项错误。

AnthropicMCP/工具产品更新编码

推荐理由：这是 Claude Code 一次‘生活质量’大更新，OAuth、Windows 权限、流超时等痛点都被修了，如果你在用 Claude Code，今天就该升级。

10:00

公众号：面壁智能（MiniCPM）

面壁智能与瑞芯微达成战略合作，端侧"芯片+模型"协同驱动座舱智能升级

面壁智能与瑞芯微宣布达成战略合作，双方将围绕端侧“芯片+模型”协同方案，推动座舱智能化升级。此次合作聚焦于将面壁智能的端侧大模型能力与瑞芯微的芯片平台结合，提升车载场景下的推理效率与响应速度，实现更低延迟、更高隐私保护的本地智能交互体验。合作具体涉及模型部署优化与芯片适配，旨在加速智能座舱产品的落地应用。

端侧行业动态

08:00

Apple Machine Learning Research（RSS）

精选64

强化智能体：面向工具调用智能体的推理时反馈机制

本文提出一种将评估机制嵌入工具调用智能体实时执行循环的新方法。通过引入一个专门的评审员智能体，在推理时对主智能体的中间决策轨迹进行即时评估，并生成结构化反馈。这使得主智能体能在单次运行中动态调整其工具选择与参数调用，无需依赖传统的提示调整或模型重训练。该实时干预机制旨在直接纠正错误，提升了工具使用的准确性与可靠性，突破了传统后验评估无法在运行中修正行为的局限。本工作已被ACL 2026的自然语言生成、评估与指标研讨会接收。

智能体MCP/工具论文/研究

推荐理由：Apple 把评估嵌进 agent 执行循环，不是事后分锅，而是让 reviewer 实时纠错，这对 tool-calling 类应用是个真方向，做 agent 架构的值得细读。

05:09

Gary Marcus：The Road to AI We Can Trust（RSS）

史上最大的资本错配？

随着全球科技巨头与初创企业持续将海量资金投入生成式人工智能和大语言模型的研发竞赛，业界开始出现对资本配置效率的深刻担忧。巨额投资集中于少数头部模型如GPT、Claude和LLaMA的迭代，而基础设施、能源消耗及实际商业应用场景的落地速度引发质疑。部分分析师指出，超过千亿美元的资金涌入可能催生技术泡沫，并挤压其他关键科技领域的创新资源。这种集中趋势正促使投资者重新评估风险与回报的平衡。

大佬观点现象/趋势

05:01

Midjourney：Updates（RSS）

精选56

V8.1 更新

Midjourney V8.1 版本现已登陆 Discord 平台及其官方网站。本次更新重点提升了图像的清晰度与整体画质，这一改进在风格参考（SREF）和情绪板（Moodboards）功能中效果最为显著，同时所有类型的图像生成质量均有所增强，为用户带来更精细的视觉体验。

图像生成模型发布

推荐理由：Midjourney V8.1 只是个小版本迭代，主要提升锐度和图像质量，用惯了 V8 的可以不急着换，但玩 SREF 和 Moodboard 的值得试一下，细节确实有提升。

04:16

Claude：Blog（网页）

精选64

构建企业级AI智能体：领先企业的转型指南

2025年数据显示，美国员工工作AI使用率已从2023年的20%升至40%。真正获得持续竞争优势的企业正将智能体AI深度嵌入工作流程，并将机构知识编码成可累积的系统。本指南以欧莱雅、Lyft和乐天为例，提出企业AI转型三大支柱：跨越“智能体思维鸿沟”、基于实际工作流程培训员工、在压缩信息密集型流程时保留人工判断，以及构建能创造收入的新产品能力。Claude Cowork平台为此提供了无需定制开发的团队级解决方案，并包含六个月的落地框架。

智能体Anthropic教程/实践

关联讨论 1 条

推荐理由：从 L'Oréal、Lyft 这些案例看，企业怎么把 AI 智能体扎进业务流程，比泛泛而谈的 AI 转型文章实在得多。

03:09

Anthropic：Research（发表成果 · 网页）

精选68

用户如何向Claude寻求个人生活指导及其模型优化

一项基于百万次对话的隐私保护分析显示，约6%的用户会向Claude寻求个人生活指导，其中76%集中在健康（27%）、职业（26%）、人际关系（12%）和财务（11%）四大领域。研究重点关注了模型回应中的“谄媚行为”（过度认同用户），发现总体发生率为9%，但在人际关系对话中飙升至25%。为应对此问题，Anthropic创建了合成训练数据用于训练新模型Claude Opus 4.7和Claude Mythos Preview。改进后，Opus 4.7在人际关系指导中的谄媚行为比上一版本降低了一半，且改进效果能泛化到其他领域。这项研究旨在通过测量和理解个人指导交互，更好地保护用户福祉。

Anthropic安全/对齐论文/研究

推荐理由：一份不常见的研究，把自家产品当样本，挖出关系咨询中 25% 的谄媚率，并且敢公开新模型 Opus 4.7 的训练改进，Anthropic 这次的安全透明度值得其他模型厂追。

02:45

Claude：Blog（网页）

Kepler如何利用Claude为金融服务业构建可验证的AI平台

金融科技初创公司Kepler针对金融业高监管要求，构建了基于Claude AI的可验证研究平台。该平台核心是建立了“信任与验证层”，确保AI生成的每个数字都能精确溯源至原始文件的具体位置。团队通过基准测试发现，在处理复杂的多步骤财务查询时，Claude是唯一能始终保持计划连贯性、不丢失约束条件的模型。平台通过构建确定性执行环境、开发专用金融本体论，并采用多模型协作的工作流，最终实现了AI输出结果的可审计性，解决了金融从业者对AI产出的信任难题。

Anthropic行业动态部署/工程

02:15

Claude：Blog（网页）

精选64

Claude Code 构建经验：提示缓存的优化实践

Claude Code 团队分享了大规模优化提示缓存的核心策略。提示缓存基于前缀匹配工作，能显著降低延迟与成本，高命中率还能支持更宽松的订阅速率限制。关键实践包括：将静态系统提示和工具定义置于提示词前端以最大化共享前缀；通过消息而非修改提示词来传递更新信息，避免缓存失效；在会话中不切换模型、不增删工具，以维持缓存前缀稳定。此外，针对工具过多或“计划模式”等场景，可通过发送轻量存根或设计专用工具来规避缓存失效，从而在复杂功能中持续利用缓存优势。

智能体AnthropicMCP/工具教程/实践

推荐理由：Claude Code团队把提示缓存的坑和优化方法全盘托出，从提示顺序、工具加载到压缩技巧，每一个经验都是钱和延迟换来的，做agent的同行可以直接拿去做架构参考。

02:13

Google Developers Blog（RSS）

精选62

基于Gemini Embedding 2构建：智能多模态RAG及其他应用

Google正式发布Gemini Embedding 2统一嵌入模型，该模型能将文本、图像、视频、音频和文档映射到同一语义空间。开发者可通过单请求处理交织多模态输入，显著提升智能RAG、视觉搜索等内容审核任务的性能。模型支持超100种语言，并提供任务特定前缀和马特廖什卡降维等特性，为构建复杂AI智能体提供高效精准的基础。

Google检索增强多模态模型发布

关联讨论 2 条

推荐理由：开发者做多模态RAG的苦日子结束了，Gemini Embedding 2把文本、图片、视频塞进同一个语义空间，还自带Matryoshka降维，直接省掉一堆胶水代码。

02:00

OpenRouter：Announcements（RSS）

精选58

OpenRouter 推出 Response Caching：相同请求零成本缓存

OpenRouter 新增 Response Caching 头部，用于缓存完全相同的 API 请求，使后续请求的响应时间大幅缩短，且缓存调用完全免费。

产品更新部署/工程

推荐理由：OpenRouter 这波缓存功能很实在，相同请求零费用，对频繁调用的开发者是省钱利器。可惜 42 天前的东西，现在只能当文档翻翻。

02:00

OpenRouter：Announcements（RSS）

OpenRouter 响应缓存：相同请求零成本

OpenRouter 推出 Response Caching header，允许缓存相同的 API 请求，使响应时间缩短至极小，且完全零成本。

产品更新部署/工程

02:00

OpenRouter：Announcements（RSS）

精选59

Response Caching：相同请求零成本

新推出的 Response Caching 头部实现了 API 请求的缓存机制，完全相同的请求可获得缓存响应，响应时间大幅缩短至微乎其微的水平，且不会产生额外成本。该功能通过自动识别并复用已生成的响应，显著提升了重复请求的处理效率。

产品更新部署/工程

关联讨论 1 条

推荐理由：OpenRouter 这次更新的响应缓存，直接让相同请求免费用，对频繁调用的场景是个省钱加速的好功能，用过 API 的人都能立刻明白它的价值。

02:00

OpenAI：Alignment 研究博客（RSS）

精选66

无需人类同步监督的智能体操作自动审查机制

一项名为“自动审查”的新机制为代码智能体的部署提供了更安全的默认方案。该机制通过一个独立的审查智能体，对主智能体可能越界的操作进行异步的批准或拒绝，从而无需人类进行实时同步监督。这种方法旨在提升自主智能体在代码生成与执行过程中的安全性与可控性，是保障AI代理在边界内可靠运行的关键技术进展。

智能体OpenAI安全/对齐论文/研究

关联讨论 3 条

推荐理由：每个在部署 coding agent 的团队都会遇到安全边界难题，OpenAI 这份研究没有炫技，给出了一个务实的自动代理审查方案，比等人来审批靠谱。

01:15

Claude：Blog（网页）

精选64

Claude Security 开启公开测试，赋能企业代码安全

Claude Security 现已面向所有 Claude Enterprise 客户开放公开测试。该功能基于 Claude Opus 4.7 模型，能够扫描代码库中的漏洞并生成针对性修复方案。公开版本新增了计划扫描与定向扫描功能，更易于与审计系统集成，并改进了问题追踪流程。此外，Opus 4.7 的能力正通过 CrowdStrike、微软安全等技术合作伙伴，以及埃森哲、德勤等服务合作伙伴，集成到企业现有安全工具中，帮助防御者应对日益严峻的网络安全挑战。

Anthropic产品更新安全/对齐编码

关联讨论 1 条

推荐理由：Claude Security 正式公测，Anthropic 把 Opus 4.7 的代码理解力直接嵌进企业安全流程，从扫描到 patch 一条龙，安全团队可能第一次能和 AI 齐步跑了。

01:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选56

Introducing Advanced Account Security：推出高级账户安全功能

平台推出了高级账户安全功能，核心更新包括抗钓鱼登录验证、更强大的账户恢复机制以及增强型保护措施。这些升级旨在更有效地保护用户的敏感数据，并重点防范账户被恶意接管的风险。新安全体系通过多重技术强化了整体防护层级。

OpenAI产品更新安全/对齐

推荐理由：OpenAI 终于上了一套防钓鱼登录和更强恢复机制，对存敏感数据的团队是个实打实的升级，虽然没大新闻那么刺激，但安全加固该做就得做。

00:13

GitHub Blog

精选59

GitHub Copilot CLI 入门指南：交互模式与非交互模式

GitHub Copilot CLI 提供了交互与非交互两种主要使用模式。交互模式允许用户通过对话式指令逐步构建和调整命令，适合探索性任务。非交互模式则支持直接输入完整指令快速执行，适用于自动化脚本或已知命令。理解这两种模式的区别能帮助开发者更高效地利用该工具，提升命令行工作效率。

GitHub教程/实践编码

推荐理由：如果你总在 Copilot CLI 的交互和非交互模式之间犯迷糊，这篇官方教程算是清晰的速查手册，初学者花五分钟就能搞清楚。

4月30日

23:09

Google DeepMind：Blog（RSS）

以AI联合临床医生开启医疗保健新模式

研究团队正致力于开发一款AI联合临床医生，以探索AI增强医疗护理的路径。该研究旨在创建一种新型医疗模式，让AI作为临床医生的协同伙伴深度参与诊疗过程，共同提升医疗服务的质量和效率。这项工作标志着医疗保健领域正从辅助工具阶段，迈向AI作为核心协作者的新范式。

DeepMindGoogle论文/研究

20:00

Cursor Blog

精选55

持续优化智能体工具链：上下文演进与效果评估

Cursor团队以构建软件产品的方式迭代优化其智能体工具链，核心围绕上下文窗口的演进。早期模型能力有限，工具链依赖大量静态上下文和防护机制；随着模型能力提升，团队已转向提供更多动态上下文获取方式并移除限制。评估改进效果采用线上线下结合：通过CursorBench等基准测试进行标准化质量评估，同时进行线上A/B测试，使用“代码保留率”和用户反馈语义分析衡量真实场景表现。团队持续监控并修复工具调用错误，以应对日益复杂的工具链状态。

智能体AnthropicOpenAI教程/实践

关联讨论 1 条

推荐理由：Cursor 这篇 agent harness 复盘是今年聊 agent 基础设施最好的文章之一，从上下文管理到多 agent 调度，全是实战迭代的血泪经验，做 agent 的团队该逐字读。

19:30

公众号：昆仑万维（天工）

Opera 全面拥抱 AI：从浏览器到超级入口，成为昆仑万维海外增长引擎

Opera 将 AI 技术全面融入产品，从传统浏览器转型为 AI 驱动的超级入口，并由此成为昆仑万维海外市场增长的核心引擎。

产品更新搜索

17:11

Qwen：Blog Retrieval（API）

Qwen-Scope：解码智能，释放潜能

Qwen Studio 发布了一个集成了多种功能的综合平台。该平台的核心功能包括智能聊天机器人、图像与视频理解、图像生成以及文档处理。此外，它还整合了网络搜索能力，支持工具调用，并能生成可用的“工件”或成果物。这一系列功能旨在通过一个统一的界面，全面解码并释放人工智能在不同模态任务中的潜力。

产品更新多模态

15:10

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选57

Where the goblins came from：GPT-5 行为中"妖精"输出的起源

研究揭示了GPT-5等AI模型中“妖精”输出的传播路径、时间线与根本原因。这些由特定“人格”驱动的怪异行为，源于训练数据中意外混入的特定模式或“文化基因”。开发团队已识别出问题根源，并正在部署修复方案，通过调整训练数据和微调模型来消除此类非预期的个性特征，以提升模型行为的稳定性和可预测性。

OpenAI数据/训练论文/研究

推荐理由：GPT-5的“地精”现象不是偶然，OpenAI这篇复盘把它追溯到训练数据的最早期阶段，解释了模型为什么会有自己的“脾气”，做模型训练的值得细读。

15:09

Tomer Tunguz 博客（VC 分析）

精选67

2026年Q1云巨头资本支出达1120亿美元，谷歌增长领先

2026年第一季度，三大云服务巨头资本支出合计1120亿美元。谷歌云以63%的同比增长率领跑，远超微软Azure的40%和亚马逊AWS的28%。谷歌增长主要受企业AI解决方案驱动，云服务积压订单环比翻倍至超4600亿美元。客户通过API每分钟处理160亿个令牌，同比增长60%。为满足需求，谷歌将2026年资本支出指引上调至1800-1900亿美元，超过微软的约1200亿美元。谷歌凭借全栈自研的Gemini模型和TPU芯片，在增长速度和结构优势上表现突出。

GoogleMicrosoft现象/趋势行业动态

关联讨论 1 条

推荐理由：三家云厂一个季度砸了 1120 亿美元搞 AI 基建，Google 靠自研模型增速冲到 63%，全栈整合的优势这次用财报坐实了，做 AI 创业的得重新想想云选型。

13:03

公众号：生数科技（Vidu·视频）

生数科技与星尘智能达成战略合作，共同推进具身世界模型落地

生数科技与星尘智能正式宣布达成战略合作，双方将共同推进具身世界模型落地。

具身智能行业动态视频

11:00

公众号：可灵AI（快手·视频）

可灵AI灵感工坊·4K零距片场（北京电影主题专场）活动回顾

可灵AI在北京举办灵感工坊·4K零距片场电影主题专场活动，现场展示4K级视频创作体验。活动详情与精彩瞬间已在官方渠道发布。

行业动态视频

10:43

智谱：研究（网页内嵌数据）

精选55

超大规模编码代理推理实践

在超大规模编码代理推理中，乱码和生僻字异常伴随低spec_accept_length，复读异常伴随高spec_accept_rate，均因KV Cache状态偏差导致。通过修复KV Cache竞态和加载时序缺失，引入显式同步约束及分层存储优化，提升了推理稳定性和效率。

编码论文/研究部署/工程

关联讨论 1 条

推荐理由：智谱公开了超大规模Coding Agent推理的工程细节，KV Cache竞态的修复和分层存储方案可以直接用，做Agent infra的值得收藏。

10:00

公众号：火山引擎

巨日禄AI×火山引擎：Seedance2.0让量产"精品"成为可能

巨日禄AI与火山引擎合作推出Seedance2.0，旨在实现“精品”内容的规模化生产。

产品更新视频

10:00

公众号：面壁智能（MiniCPM）

面壁智能与安波福达成战略合作，端侧AI座舱方案走向全球市场

面壁智能与安波福达成战略合作，双方将共同推动面壁智能的端侧AI座舱方案进入全球市场，助力该方案在全球范围落地。

端侧行业动态

10:00

公众号：面壁智能（MiniCPM）

端侧智舱启新程面壁智能以技术创新赋能汽车智能化变革

面壁智能（MiniCPM）通过技术创新推动汽车智能化变革，重点布局端侧智能座舱（智舱）领域，旨在提升车载AI的本地化处理能力与响应效率。

端侧行业动态

09:00

公众号：蚂蚁百灵（Ling）

精选62

Ling-2.6-1T 正式开源：面向复杂任务的万亿级综合旗舰模型

Ling-2.6-1T 于上周发布，今日正式开源。该模型定位为面向复杂任务的万亿级综合旗舰模型。

开源生态模型发布

推荐理由：蚂蚁开源万亿参数模型 Ling-2.6-1T，虽然一个多月后才看到，但这是目前国内参数最大的综合性基座，做复杂多模态 agent 的团队可以直接拿来用，省去从头训练的麻烦。