AIHOT

全部动态一手 · 2416 条

全部一手资讯 X 论文

3月26日周四

3月25日周三

3月24日周二

3月23日周一

3月26日

00:46

Google DeepMind：Blog（RSS）

保护人们免受有害操纵

Google DeepMind 针对金融、健康等领域研究 AI 有害操纵风险，并推出新的安全措施。

DeepMind安全/对齐

00:01

Google DeepMind：Blog（RSS）

Lyria 3 Pro：支持更长音轨，扩展至更多平台

Lyria 3 Pro 发布，支持生成更长音轨并具备结构感知能力，同时将集成至更多 Google 产品和平台。

DeepMind产品更新多模态

00:00

Meta AI：Blog（网页）

精选83

Meta与世界资源研究所发布开源森林冠层高度地图模型Canopy Height Maps v2

Meta与世界资源研究所合作推出开源模型Canopy Height Maps v2，用于生成全球高精度森林冠层高度地图。该模型采用自监督视觉模型DINOv3作为主干，并基于大规模卫星图像数据集SAT-493M进行预训练，在准确性、细节和全球一致性上较2024年初版有显著提升。其关键指标R²从0.53大幅提高至0.86，能更精准预测树高。通过增加多样化激光雷达数据、开发自动匹配工具和专用损失函数，新版地图清晰度更高，并减少了对高树的预测偏差。该工具已应用于英国、欧盟及美国等多个地区的森林监测与城市规划项目。

Meta多模态数据/训练模型发布

关联讨论 1 条

推荐理由：开源视觉模型提升森林监测精度，环保和开发者可直接应用

00:00

Google Blog：AI（RSS）

Lyria 3 Pro：在更多 Google 产品中创作更长音轨

Google 将 Lyria 3 Pro 扩展至更多产品，支持生成更长音轨，并集成至专业人士日常工作和创作工具中。

Google产品更新多模态

00:00

Google Blog：AI（RSS）

精选

基于 Lyria 3 构建：全新音乐生成模型开放预览

Lyria 3 音乐生成模型现已开放付费预览，开发者可通过 Gemini API 调用，或在 Google AI Studio 免费测试。

Google多模态模型发布

关联讨论 2 条

推荐理由：Google 发布音乐生成模型 Lyria 3，现可通过 Gemini API 和 AI Studio 体验

00:00

Suno：Blog（网页）

Suno v5.5：更具表现力，更懂你

Suno发布v5.5模型，推出Voices、Custom Models与My Taste三大功能。Voices支持Pro及Premier订阅者录制或上传人声，经语音验证后仅限本人使用；Custom Models可基于用户原创曲库训练最多三个个性化模型；My Taste则面向所有用户，自动学习其音乐偏好。此次更新旨在同时服务专业音乐人与普通创作者，并为与音乐产业合作的下一代模型奠定基础。

产品更新多模态语音

3月25日

21:36

Gary Marcus：The Road to AI We Can Trust（RSS）

战争与 AI、Sora 的消亡，以及今日现场观看的 3 种方式

这是一则简短预告，作者为仓促通知致歉，宣布将围绕战争与人工智能、Sora 的终结等话题发布几项公告，同时提供今日现场观看的三种途径，但正文未透露具体发布内容、技术细节或数据指标。

大佬观点视频

21:18

美团 LongCat：HuggingFace 新模型

美团 LongCat-Next

美团开源项目 LongCat-Next 正式发布，宣称将通过开源与开放科学推进人工智能技术的普及与民主化。该项目目前仅公开使命宣言，强调降低AI技术门槛的愿景，尚未披露具体模型架构、训练数据或性能基准等技术指标，也未说明应用场景或发布时间表。

Hugging Face开源生态模型发布

20:00

公众号：月之暗面（Kimi）

Kimi 杨植麟「2026 中关村论坛」演讲全文（附视频）

大佬观点开源生态

18:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选

深入解析我们构建 Model Spec 的方法

OpenAI 公开 Model Spec 行为框架，阐述如何在安全、用户自由与问责制之间取得平衡，为 AI 系统发展提供可公开查阅的行为指导原则。

OpenAI安全/对齐

推荐理由：OpenAI 公开模型行为框架，阐释安全与责任平衡之道

15:58

公众号：智谱（GLM）

智谱携手奔驰，多模态大模型"上车"

多模态端侧行业动态

13:15

公众号：昆仑万维（天工）

Mureka V8登顶Artificial Analysis双榜单第一

Mureka V8 在 Artificial Analysis 两项榜单中均位列第一。

多模态模型发布

09:06

公众号：MiniMax（稀宇科技）

MiniMax Office Skills：开源一套生产级办公文档引擎

MiniMax 开源了 Office Skills，一套生产级办公文档引擎。

开源/仓库开源生态

08:00

Google Developers Blog（RSS）

精选84

用 Agent 技能弥合知识鸿沟

Google DeepMind 开发出一项“Gemini API 开发者技能”，使智能体能够实时获取最新文档与 SDK 指导。评估结果显示，配备该技能后，gemini-3.1-pro-preview 模型的成功率从 28.2% 大幅跃升至 96.6%。这种轻量级方法通过赋予模型强大的推理能力并接入“事实来源”，有效解决了静态模型知识与快速演进的软件实践之间的脱节问题，显著消除了过时的编码模式。

智能体DeepMindGoogle产品更新

推荐理由：通过实时文档赋能模型，编码任务成功率飙升，开发者可借鉴优化AI工具。

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选

OpenAI 推出安全漏洞赏金计划

OpenAI 启动安全漏洞赏金计划，悬赏征集 AI 滥用及安全风险漏洞，涵盖智能体漏洞、提示注入攻击和数据泄露等问题。

智能体OpenAI安全/对齐

推荐理由：OpenAI推出安全漏洞赏金计划，聚焦Agent安全与提示词注入风险

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选77

Claude Code 自动模式：在安全与效率间取得平衡

Anthropic 为 Claude Code 推出“自动模式”，旨在解决用户因频繁手动批准而产生的“批准疲劳”。该模式介于完全手动审批和危险的无权限跳过之间，采用两层防御机制：输入层通过服务器端提示注入探测器扫描工具输出；输出层则利用基于 Sonnet 4.6 模型的转录分类器，在执行前评估操作风险。分类器采用高效的两阶段设计，先快速过滤，必要时才启动思维链推理。其目标是拦截危险操作（如过度积极行为、无心之失、提示注入等），同时让大部分安全操作无需确认即可运行，内部测试显示用户原本会批准约93%的手动提示。

Anthropic产品更新安全/对齐编码

关联讨论 1 条

推荐理由：这是 Claude Code 从「手动审批」跳到「AI 自审」的关键一步，双层防御设计坦诚到连 17% 漏检率都公开讲，做 coding agent 的团队该把这篇当安全设计参考。

00:00

LMSYS：Blog（Chatbot Arena 团队）

Elastic EP：实现DeepSeek MoE部署的部分故障容忍

Mooncake团队与Volcano Engine在SGLang框架中推出Elastic EP功能，解决大规模DeepSeek MoE模型"宽"专家并行部署的可靠性瓶颈。该技术通过解耦专家与GPU的刚性绑定并维护冗余副本，可在32 GPU集群中容忍最多16个rank故障，将服务恢复时间从2-3分钟缩短至10秒以内，降幅达90%。基准测试显示，该方案在实现极端韧性的同时，吞吐量、TTFT和TPOT等关键指标与标准DeepEP持平，实现零静态性能损耗。

DeepSeek开源/仓库部署/工程

00:00

LMSYS：Blog（Chatbot Arena 团队）

SGLang亮相NVIDIA GTC 2026：三天五场活动展示开源AI基础设施实力

SGLang亮相Jensen Huang主题演讲AI生态图谱，三天内密集举办五场活动。团队与RadixArk合办200人技术聚会，在LinkedIn总部举办搜索与推荐LLM系统研讨，并参与700人规模的Novita行业论坛。官方培训实验室发布Miles RL框架，解决生产环境训练-推理不匹配难题；LinkedIn工程师分享预填充优化方案，在H100上实现2–3倍吞吐量提升并回馈上游。

开源/仓库数据/训练部署/工程

00:00

Google Research：Blog（网页）

精选

Vibe Coding XR：基于 XR Blocks 与 Gemini 加速 AI + XR 原型开发

Google XR 团队推出 Vibe Coding XR 工作流，结合 Gemini Canvas 与开源框架 XR Blocks，利用长上下文推理能力将自然语言提示在 60 秒内转化为可交互、支持物理效果的 WebXR 应用。该方案基于 WebXR、three.js 和 LiteRT.js 构建，支持手势交互与深度感知，可在桌面模拟环境或 Android XR 头显中实时预览。已展示的应用包括几何可视化数学辅导和交互式物理实验室，用户可通过捏合等手势操作 3D 对象，快速验证空间交互设计。

Google产品更新多模态编码

推荐理由：Google推出Vibe Coding XR，用自然语言快速生成可交互的Android XR空间应用。

3月24日

19:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选

帮助开发者为青少年构建更安全的 AI 体验

OpenAI 发布面向开发者的提示词青少年安全策略，配合 gpt-oss-safeguard 使用，帮助审核 AI 系统中的年龄特定风险。

OpenAI安全/对齐开源生态

推荐理由：OpenAI 发布青少年 AI 安全策略与开源保障工具

17:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选

ChatGPT 推出产品发现功能

ChatGPT 上线基于 Agentic Commerce Protocol 的全新购物功能，提供更丰富的视觉化沉浸式体验，支持商品发现、并排对比及商家集成。

智能体OpenAI产品更新搜索

推荐理由：ChatGPT 上线 Agentic 购物功能，支持商品智能对比与商家集成

17:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

OpenAI Foundation 最新动态

OpenAI Foundation 宣布将在治愈疾病、经济机会、AI 韧性和社区项目四大领域投资至少 10 亿美元。

OpenAI行业动态

15:34

公众号：通义实验室（千问）

PrismAudio：声画同频，音效随行

PrismAudio 由通义实验室（千问）开源发布，定位为“更会思考的AI音效师”，能够实现声画同频、音效随行的智能音效生成。

多模态模型发布视频

10:01

Hugging Face：Blog（RSS）

精选78

全新语音智能体评估框架EVA发布

ServiceNow AI团队在Hugging Face上发布了语音智能体评估框架EVA。该框架通过标准化测试集与多模态指标，系统评估语音助手在对话理解、任务完成及交互自然度等方面的性能，旨在量化衡量智能体在复杂真实场景下的表现，助力研究人员客观比较不同模型，推动技术优化。

智能体Hugging Face开源/仓库语音

推荐理由：提供语音代理评估标准，帮助开发者优化模型性能和测试效率。

09:06

公众号：阶跃星辰（Step）

StepClaw 现已支持飞书、企微一键唤起

StepClaw 新增通过飞书和企业微信远程唤起功能。用户只需在手机飞书或企微对话框发送指令，即可驱动本地 StepClaw 即刻执行。接入方式：企业微信可通过阶跃AI Web端点击「一键部署企业微信机器人」扫码授权，或桌面伙伴发送「连接企微」获取凭证配置；飞书可通过阶跃AI APP创建机器人并发送凭证绑定，Web端一键部署并发送配置指令，或桌面伙伴生成二维码完成授权。配置后即可实现远程操控。

智能体MCP/工具产品更新

08:00

Google Developers Blog（RSS）

精选71

跳跃即玩：利用Gemini与MediaPipe进行开发

该工作流通过Gemini Canvas，借助高级提示词快速原型化MediaPipe Pose Landmarker等体感游戏机制。开发者可在Google AI Studio中优化原型，采用低延迟的“轻量”模型和稳定的追踪点（如肩部关节点）以确保游戏响应灵敏。最后，流程利用Gemini Code Assist将实验性代码重构为模块化、可用于生产的应用程序，使其能够支持多种多模态输入，从而显著简化了体感控制游戏的开发过程。

Google多模态教程/实践编码

推荐理由：开发者可快速上手AI游戏开发，优化性能并部署生产应用。

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选75

利用对抗网络灵感设计多代理架构，突破长时应用开发瓶颈

作者受生成对抗网络启发，设计了一个包含规划器、生成器和评估器的三代理架构，以解决Claude在长时应用开发中的两大瓶颈。该架构通过上下文重置机制，有效克服了模型在长任务中的“上下文焦虑”问题；同时，通过分离生成与评估功能，使代理能依据具体标准进行迭代改进，而非盲目自评。这一方法成功使系统能在多小时的自主运行中生成完整的全栈应用程序，突破了此前提示工程和传统工具设计的性能上限。

智能体Anthropic教程/实践编码

推荐理由：Anthropic 工程师把 GAN 的 generator-evaluator 思路搬进长时 Agent 架构，从设计到全栈编码都跑通了，还附了成本和失败模式。做 Agent 产品的人读完能直接抄作业，比看十篇论文管用。