AIHOT

全部动态一手 · 2416 条

全部一手资讯 X 论文

4月20日周一

4月18日周六

4月17日周五

4月16日周四

4月20日

21:00

Cloudflare Blog

我们基于对外交付平台构建的内部 AI 工程栈

该公司基于对外交付的同一产品平台构建了内部 AI 工程栈，实现真正的"自产自用"。该架构已通过 AI Gateway 路由 2000 万请求，处理 2410 亿 token，并依托 Workers AI 运行推理，为 3683 余名内部用户提供支持。这一实践验证了其平台在超大规模企业级场景下的稳定性与性能表现。

智能体教程/实践部署/工程

21:00

Cloudflare Blog

构建智能体云：Agents Week 2026 期间发布的所有产品

Agents Week 2026 活动正式收官，期间密集发布了构建智能体云的完整产品矩阵，涵盖计算基础设施、安全架构、智能体工具箱、平台开发工具及新兴智能体网络等关键领域，全面覆盖从底层算力到上层应用的工具链，系统性推进智能体云生态建设。

智能体产品更新部署/工程

19:48

CMU：Machine Learning Blog

卡内基梅隆大学在 ICLR 2026

卡内基梅隆大学将在2026年4月23日至27日于巴西里约热内卢举行的ICLR 2026会议上展示194篇研究论文。其中，研究人员发布了EditBench基准测试，包含545个真实世界代码编辑任务，用于评估大语言模型根据用户指令编辑现有代码的能力。该基准考虑了周围代码和光标位置等实际上下文。测试结果显示，大多数AI模型在该任务上表现挣扎。

编码论文/研究

19:38

公众号：豆包（字节）

大家对豆包的"依赖"程度，都藏在这些细节里

用户对豆包的依赖程度，隐藏在众多日常使用细节中。

行业动态

17:31

蚂蚁 inclusionAI：GitHub 新仓库

精选69

DR-Venus：基于开放数据的边缘级深度研究智能体

DR-Venus 是一个仅用1万条开放数据训练的40亿参数深度研究智能体，基于Qwen3-4B-Thinking-2507架构，支持200步工具调用和超20万tokens的上下文。它通过监督微调与强化学习两阶段训练，在BrowseComp、GAIA等多个深度研究基准上树立了小模型性能新标杆。其SFT版本已超越多数同类开源模型，而RL版本进一步将长程任务可靠性和工具使用校准度提升2-3个百分点。项目已全面开源模型、代码与训练流程。

智能体开源/仓库推理模型发布

关联讨论 1 条

推荐理由：4B 参数、仅用 1 万条公开数据就能在多个 deep research benchmark 上碾压 8B 对手，蚂蚁 inclusionAI 这次证明了小模型做 Agent 的关键不在参数量而在数据管线，做端侧 Agent 的团队值得拆一下它的 SFT+RL 流程。

15:40

公众号：通义实验室（千问）

通义千问发布 Qwen3.6-Max-Preview

通义千问发布 Qwen3.6-Max-Preview 预览版，相比 Qwen3.6-Plus 在多项基准上显著提升：智能体编程（SkillsBench +9.9、SciCode +6.3、NL2Repo +5.0、Terminal-Bench 2.0 +3.8）、世界知识（SuperGPQA +2.3、QwenChineseBench +5.3）、指令遵循（ToolcallFormatIFBench +2.8）。新版本支持 preserve_thinking，可在消息中保留前序轮次思维内容，避免多步任务上下文丢失，官方推荐用于智能体开发。用户可登录 Qwen Studio 直接对话，或通过阿里云百炼（即将上线）调用 API。

智能体推理模型发布编码

关联讨论 1 条

14:01

公众号：通义实验室（千问）

敢不敢用家乡话测试这个 AI？

产品更新语音

00:00

Anthropic：Newsroom（网页）

Anthropic与Amazon扩大合作，承诺投入超千亿美元获取5吉瓦算力

Anthropic与Amazon签署十年协议，承诺向AWS投入超1000亿美元以获取高达5吉瓦算力，用于Claude训练与部署。Amazon追加投资50亿美元（未来可达200亿美元），新容量包括上半年上线的Trainium2及2026年底前部署的近1GW Trainium2与Trainium3。Claude Platform将直接集成AWS，目前超10万客户通过Bedrock使用Claude，Anthropic年化收入已突破300亿美元。

Anthropic行业动态部署/工程

4月18日

09:43

Claude Code：GitHub Releases（RSS）

v2.1.114 版本发布

v2.1.114 版本发布，修复了权限对话框在 Agent Teams 队友请求工具权限时发生的崩溃问题。此次更新解决了多智能体协作场景中的关键稳定性故障，当团队成员发起工具权限申请时，系统不再出现异常退出，确保了协作流程的顺畅进行。

智能体Anthropic产品更新编码

03:43

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.113 发布

Claude Code v2.1.113 将CLI改为通过原生二进制文件运行，替代原有JavaScript捆绑包。新增 deniedDomains 设置实现域名精确拦截，并强化Bash工具安全策略，将macOS系统路径列为危险删除目标，修复命令包装器绕过限制的问题。交互方面优化全屏选择、多行输入快捷键及长URL点击体验，改进/loop和/ultrareview命令性能。此外修复30余项Bug，涵盖MCP调用超时、表格渲染、远程控制会话及插件安装冲突等问题。

智能体Anthropic产品更新编码

02:00

GitHub Blog

使用 GitHub Copilot CLI 构建 emoji 列表生成器

开发者在 Rubber Duck Thursday 直播中展示了使用 GitHub Copilot CLI 构建 emoji 列表生成器的完整过程。该项目通过 AI 编程助手在命令行界面实现快速开发，演示了如何利用 GitHub Copilot CLI 生成功能性工具代码，体现了 AI 辅助编程在提升开发效率与快速原型制作方面的实际应用。

GitHub教程/实践编码

4月17日

22:29

Google Blog：AI（RSS）

Google 助你今夏智能出行的 7 种方式

Google 针对暑期出行场景发布七项智能旅行新功能，帮助用户优化行程规划、筛选高性价比方案并探索目的地。这些工具整合最新技术，提供从行前规划到实地探索的全流程支持，旨在提升旅行效率、降低出行成本，为用户带来更便捷、智能的今夏旅行体验。

Google产品更新搜索

21:05

Cloudflare Blog

Agent Readiness 评分正式发布：你的网站是否已做好 agent 准备？

Cloudflare 推出 Agent Readiness 评分体系，帮助网站所有者量化评估其网站对 AI agent 的支持能力。该体系建立全新技术标准，并基于 Radar 数据监测分析。Cloudflare 通过重构文档站点，将其打造为全网对 agent 最友好的网站，为行业提供了可复现的优化范例，推动网站基础设施向 AI 代理友好型架构升级。

智能体产品更新部署/工程

21:02

Cloudflare Blog

共享字典：适应代理式网络的压缩技术

技术团队预告了共享压缩字典功能的上线计划，这项压缩技术专为适应代理式网络的发展需求而设计，能够显著缩短页面加载时间并提升传输效率。该功能目前处于预览阶段，具体的 beta 测试开放时间即将公布，用户很快就能亲自体验这项新技术。

智能体产品更新部署/工程

21:00

Cloudflare Blog

推出 Flagship：面向 AI 时代的功能标志服务

Cloudflare 发布原生功能标志服务 Flagship，直接构建于其全球网络之上，旨在消除第三方供应商的延迟。该服务利用 KV 和 Durable Objects 技术，实现亚毫秒级的 flag 评估速度，满足 AI 时代对实时性能的需求，为开发者提供低延迟的功能开关能力。

产品更新部署/工程

21:00

Cloudflare Blog

会记忆的智能体：Cloudflare 推出 Agent Memory

Cloudflare 发布 Agent Memory 托管服务，为 AI 智能体提供持久化记忆能力。该服务支持智能体长期保留关键上下文、自动过滤并遗忘无关信息，同时基于交互历史持续学习优化。开发者无需自建基础设施，即可快速部署具备长期记忆、能随使用时间增长而变聪明的 AI 应用。

智能体产品更新

21:00

Cloudflare Blog

Unweight：我们如何在不牺牲质量的情况下将 LLM 压缩 22%

Cloudflare 发布无损推理时压缩系统 Unweight，可在不牺牲模型质量的前提下，将大语言模型（LLM）的占用空间减少 22%。该系统针对 GPU 内存带宽进行优化，使推理速度更快、成本更低，解决了在网络边缘大规模部署 LLM 时的内存效率挑战，实现了模型体积与计算资源的高效平衡。

论文/研究部署/工程

21:00

Cloudflare Blog

Cloudflare 推出 Redirects for AI Training，强制 AI 爬虫抓取规范内容

Cloudflare 推出 Redirects for AI Training 功能，解决软指令无法阻止 AI 爬虫抓取弃用内容的局限。网站管理员可通过一键切换，将已验证的 AI 爬虫自动重定向至规范页面，无需修改源站配置即可确保 AI 模型训练获取权威内容，避免过时信息被纳入训练数据。

产品更新数据/训练

20:34

公众号：阶跃星辰（Step）

坐进极氪8X，感受阶跃大模型

阶跃 Step 3.5 Flash 大规模上车极氪8X，深度集成该模型的整车智能体超级 Eva 随车量产上市。超级 Eva 融合阶跃三款大模型：Step 3.5 Flash 作为核心大脑，提供模糊指令理解与多步骤任务规划；语音大模型带来低延迟、更自然的交互；视觉理解模型可感知车外环境并决策，如判断路况、找车位。即日起用户可在极氪8X驾驶场景中体验。未来超级 Eva 将覆盖更多车型。

多模态端侧行业动态

18:00

公众号：可灵AI（快手·视频）

可灵AI×艾菲 AIGC广告创作大赛征稿进行中！

可灵AI与艾菲奖联合发起AIGC广告创作大赛，设置潮宏基珠宝、云南白药、华帝、999澳诺四大品牌赛道。奖项包括艾菲奖杯/证书、万元品牌实物奖励及50万灵感值，每个赛道独立评奖。投稿周期即日起至5月25日。早鸟福利：可灵AI联合艾菲评选50件优秀作品，入选作品报名费用全额支持。

行业动态视频

16:48

蚂蚁 inclusionAI：GitHub 新仓库

精选56

inclusionAI发布LLaDA2.0-Uni模型

LLaDA2.0-Uni是一个统一的多模态模型，具备对世界的理解与生成能力。该模型通过整合视觉、语言等多模态信息，实现了跨模态的语义理解和内容生成。其架构支持从图像理解到文本生成、跨模态检索等复杂任务，标志着多模态人工智能向更通用、统一的方向演进。

多模态开源生态模型发布

推荐理由：蚂蚁 inclusionAI 推出 LLaDA2.0-Uni，主打理解与生成统一架构，但距发布已过两周且信息极少，建议等官方技术报告出来再决定是否跟进。

09:00

公众号：智谱（GLM）

不用研究Hermes！AutoClaw开启自进化

智谱（GLM）AutoClaw项目宣布开启自进化，无需研究Hermes。该进展聚焦于AI模型自主进化能力，具体技术细节尚未披露。

智能体产品更新

04:42

Claude Code：GitHub Releases（RSS）

发布 v2.1.112 版本

发布 v2.1.112 版本更新，重点修复自动模式下 claude-opus-4-7 模型提示"temporarily unavailable"的可用性故障。此次补丁解决了该模型在自动模式调用时的服务中断问题，消除错误提示，恢复其正常响应功能，确保用户可稳定使用该 AI 模型进行交互。

智能体Anthropic产品更新编码

4月16日

22:49

Dwarkesh Patel：Podcast & Blog（RSS）

本周所学--预训练并行策略、蒸馏能否被阻止、Mythos与网络安全平衡、流水线强化学习、预训练运行失败原因分析

文章探讨了大规模预训练中的并行计算策略优化方案，分析模型蒸馏技术是否可被检测或阻止及其对AI生态的影响；介绍 Mythos 系统在维护网络安全平衡中的应用，阐述流水线强化学习（Pipeline RL）的架构设计与效率提升，并总结预训练任务失败的常见技术瓶颈与排查方法，为分布式训练提供实践参考。

大佬观点推理数据/训练

22:05

Cloudflare Blog

Cloudflare AI 平台：专为智能体设计的推理层

Cloudflare 将 AI Gateway 重构为统一的 AI 推理层，开发者可通过单一接口调用 14 家以上提供商的模型。新版本集成 Workers AI 绑定功能，并扩充了多模态模型目录，专为 AI 智能体优化设计。该平台旨在简化跨服务商的模型调用流程，降低多模型集成的技术门槛。

智能体产品更新部署/工程

22:00

Cloudflare Blog

构建超大型语言模型运行基础架构

Cloudflare 针对超大型语言模型推理需求打造了专属技术栈，通过在其全球基础设施上部署定制化高性能 AI 推理系统，实现了大模型的低延迟运行。该方案深入剖析了工程权衡与技术优化路径，解决了超大规模模型部署中的性能瓶颈，使企业无需自建复杂基础设施即可获取高性能 AI 推理能力。

产品更新部署/工程

21:22

公众号：通义实验室（千问）

精选62

Qwen3.6-35B-A3B 开源！

开源/仓库模型发布

关联讨论 1 条

推荐理由：千问又推轻量 MoE 模型，35B 总参激活仅 3B，小团队能跑，但正文就一句宣传语，缺技术细节，先观望。

21:01

Cloudflare Blog

Artifacts：兼容 Git 的版本化存储

Artifacts 正式发布，这是一款专为智能体（agents）打造的版本化存储服务，完全兼容 Git 协议。该平台支持创建数千万个仓库，允许从任意远程仓库 fork，并可通过 URL 提供给任何 Git 客户端访问。Artifacts 旨在为智能体、开发者和自动化工具提供代码与数据的统一存储空间，实现大规模仓库管理与无缝的 Git 操作集成。

智能体产品更新部署/工程

21:00

Cloudflare Blog

AI Search：面向智能体的搜索原语

AI Search 作为面向智能体的搜索基础组件发布，支持动态创建实例、上传文件，并基于混合检索与相关性增强技术实现跨实例搜索。用户只需完成创建搜索实例、上传文档、执行检索三步操作，即可为 Agents 快速构建高效的知识检索能力，满足智能体对信息查询与知识管理的核心需求。

智能体检索增强产品更新

19:58

公众号：龙猫LongCat（美团）

MARS TALK 香港大学站|具身智能的技术演进与商业化进程

美团技术团队主办的MARS TALK香港大学站活动开放线上线下报名，主题聚焦具身智能的技术演进与商业化进程。

具身智能行业动态

19:58

公众号：龙猫LongCat（美团）

LongCat-AudioDiT：突破零样本TTS音色克隆上限

美团技术团队推出的LongCat-AudioDiT模型，实现了零样本TTS音色克隆，让AI直接学习声音本身的规律，跳过中间处理环节，从而突破音色克隆的上限。

开源/仓库论文/研究语音

19:58

公众号：龙猫LongCat（美团）

2026 美团 LongCat 大模型 | 北斗实习计划

数据/训练行业动态

18:04

OpenAI：官网动态（RSS · 排除企业/客户案例）

加速保护所有人的网络防御生态系统

OpenAI 启动 Trusted Access for Cyber 计划，多家领先安全公司和企业加入该生态，使用 GPT-5.4-Cyber 模型并分享 1000 万美元 API 资助额度，共同强化全球网络防御能力。该倡议通过开放先进 AI 技术与资金资源，推动网络安全产业协同升级，构建更广泛的防护网络。

OpenAI产品更新

18:00

公众号：生数科技（Vidu·视频）

红果爆款《教书五年》布局背后：Vidu&酱油动漫联手合围真人剧

Vidu与酱油动漫合作，助力仙侠真人剧《教书五年，我教出满门妖神》热映。该剧是红果平台爆款，背后整合了AI视频生成与动漫制作资源，试图以AI赋能真人剧内容生产。

行业动态视频

14:04

公众号：阶跃星辰（Step）

阶跃 StepAudio 2.5 TTS 上线！人人都能是配音导演

产品更新语音

13:46

EleutherAI：Blog

基于推理插值的奖励黑客早期指标

研究团队提出一种基于推理插值的早期检测方法，利用重要性采样结合微调供体前缀技术，在模型训练过程中预测奖励黑客行为的出现。该方法通过分析模型推理路径的插值变化，在奖励黑客完全形成前识别其风险迹象，为语言模型安全训练提供关键的预警指标。

安全/对齐推理数据/训练

11:46

Hermes Desktop：GitHub Releases（RSS）

Hermes 桌面客户端 v0.1.0

NousResearch 发布了 Hermes Agent 的桌面客户端 v0.1.0，提供一键安装体验。该客户端内置了 Python 3.11 和 Node.js 22 等运行环境，实现零依赖部署。它集成了 hermes-webui 聊天界面，支持会话管理、文件上传与技能编辑。安装向导支持 Anthropic、OpenAI、Google 等 7 种 AI 服务商，并特别优化了 Ollama 本地模型的使用（无需 API Key）。客户端适用于 macOS (Apple Silicon) 和 Windows (x64) 平台，可通过系统托盘后台运行，并会自动安装 hermes CLI 命令。

智能体GitHub产品更新开源生态

10:30

公众号：腾讯混元

腾讯混元3D世界模型2.0发布：无缝对接游戏工作流

多模态开源生态模型发布

08:26

公众号：MiniMax（稀宇科技）

MaxHermes：全球首个云端沙箱 Hermes，一键养"马"

MaxHermes 是全球首个云端沙箱 Hermes，提供“一键养‘马’”功能。该产品由 MiniMax 推出，定位为云端沙箱环境。

智能体产品更新

06:40

Claude Code：GitHub Releases（RSS）

Claude Code CLI v2.1.110 发布

新增 `/tui` 命令实现全屏无闪烁渲染，Ctrl+O 改为切换详细转录模式，焦点视图由 `/focus` 独立控制。强化插件管理界面，新增 MCP 服务器配置冲突警告，扩展远程控制客户端对多条斜杠命令的支持。修复 30 余项问题，包括 MCP 工具调用挂起、全屏高 CPU 占用、非受信文件名命令注入漏洞等，并优化内存分配与会话管理。

智能体AnthropicMCP/工具产品更新