AIHOT

全部动态一手 · 2391 条

全部一手资讯 X 论文

10月26日周日

10月25日周六

10月24日周五

10月23日周四

10月22日周三

10月21日周二

10月20日周一

10月17日周五

10月26日

02:14

Google DeepMind：Blog（RSS）

T5Gemma：全新的编码器-解码器 Gemma 模型系列

T5Gemma 是基于 Gemma 的编码器-解码器大语言模型新系列，采用双向编码器与自回归解码器架构，适用于翻译、摘要等序列到序列任务。

DeepMindGoogle模型发布

02:02

Google DeepMind：Blog（RSS）

精选

MedGemma：健康 AI 开发领域最强的开源多模态模型

谷歌 MedGemma 系列新增多模态模型，专为健康 AI 开发设计。作为该系列迄今最强的开源版本，新模型具备更强大的医疗场景理解能力，为开发者提供先进的医疗人工智能技术支持，助力构建更精准的健康医疗解决方案。

DeepMind多模态开源生态模型发布

推荐理由：DeepMind发布最强开放医疗多模态模型，支持开发者微调构建健康AI应用

01:34

Google DeepMind：Blog（RSS）

精选

Gemini 2.5 Flash-Lite 正式发布，可用于规模化生产

Gemini 2.5 Flash-Lite 结束预览，达到生产级可用状态。这款高性价比模型在轻量体积下提供高质量输出，支持 100 万 token 超长上下文和多模态能力。

Google多模态模型发布端侧

关联讨论 1 条

推荐理由：Google轻量模型Gemini 2.5 Flash-Lite正式版发布，百万上下文多模态兼顾成本效益

01:27

Google DeepMind：Blog（RSS）

《ANCESTRA》幕后：Veo 与真人实景拍摄相结合

与导演 Darren Aronofsky、Eliza McNitt 及超 200 人团队合作，采用 Veo AI 视频生成与真人实景拍摄结合的方式制作电影《ANCESTRA》。

DeepMindGoogle产品更新多模态

10月25日

03:06

Google DeepMind：Blog（RSS）

AlphaEarth Foundations 以前所未有的细节绘制地球地图

AlphaEarth Foundations 新AI模型整合PB级地球观测数据，生成统一数据表示，以前所未有的精度革新全球测绘与监测。

DeepMind多模态数据/训练模型发布

00:04

美团 LongCat：HuggingFace 新模型

美团 LongCat-Video 项目

美团 LongCat-Video 项目秉持开源与开放科学理念，致力于推进并普及人工智能技术。该项目通过开放源代码的方式，旨在降低 AI 技术应用门槛，打破技术壁垒，促进视频领域人工智能技术的广泛传播与创新发展，体现了推动 AI 技术民主化与开源生态建设的长期愿景。

Hugging Face模型发布视频

10月24日

15:16

蚂蚁 inclusionAI：GitHub 新仓库

47

inclusionAI/TwinFlow

该研究提出了一种名为“自对抗流”的新方法，旨在驯化大规模少步训练。该方法通过引入一种内部对抗机制来优化流模型在有限训练步数下的性能，有望解决大模型训练中计算成本高昂的挑战。相关工作已被顶级机器学习会议ICLR 2026接收。

开源生态数据/训练论文/研究

11:17

Google DeepMind：Blog（RSS）

使用 Backstory 探索网络图片背景

实验性 AI 工具 Backstory 发布，支持查询网络图片的背景与原始出处，帮助用户追溯图像来源。

DeepMindGoogle产品更新多模态

11:12

Google DeepMind：Blog（RSS）

精选

带 Deep Think 的 Gemini 高级版本在 IMO 中正式达到金牌标准

集成 Deep Think 的 Gemini 高级版本在国际数学奥林匹克（IMO）中达到金牌水平。IMO 自1959年起每年举办，是全球最顶尖的青年数学家竞赛，各国派出6名精英学生角逐代数、组合、几何和数论领域的6道极难题目。

DeepMindGoogle推理模型发布

关联讨论 1 条

推荐理由：Gemini Deep Think在IMO数学竞赛达到金牌标准，推理能力获重大突破

10:58

Google DeepMind：Blog（RSS）

Aeneas 改变历史学家连接过去的方式

首个古代铭文语境化模型 Aeneas 发布，帮助历史学家解读、归属和修复残缺文本，革新历史文献研究方式。

DeepMindGoogle模型发布

10:30

Google DeepMind：Blog（RSS）

AI 助力生物声学研究，拯救濒危物种

新 Perch 模型帮助保护人员快速分析音频，监测从夏威夷蜜旋木雀到珊瑚礁的濒危物种，提升保护效率。

DeepMindGoogle论文/研究

10:21

Google DeepMind：Blog（RSS）

利用人工智能深度感知宇宙

利用人工智能技术，科学家能够从海量宇宙数据中提取深层信息，突破传统观测局限，揭示隐藏规律，从而以前所未有的深度感知和理解宇宙，持续拓展人类认知边界。

DeepMindGoogle多模态数据/训练

08:48

美团 LongCat：HuggingFace 新模型

精选

美团开源全模态模型LongCat-Flash-Omni

美团开源全模态模型LongCat-Flash-Omni，采用5600亿参数MoE架构（激活270亿），支持128K上下文与实时音视频交互。模型基于快捷连接MoE与零计算专家，配备轻量级编解码器及分块特征交错机制，通过课程式渐进训练提升效率。在OmniBench、WorldSense等基准测试中超越Qwen3-Omni与Gemini-2.5-Pro，在文档理解、语音识别及GUI控制等任务中达到领先水平。

Hugging Face多模态模型发布语音

关联讨论 1 条

推荐理由：美团开源 560B 参数多模态模型，27B 激活即可实现实时音视频交互

08:02

Google DeepMind：Blog（RSS）

发现流体力学百年难题的新解法

新方法可帮助数学家利用AI技术攻克数学、物理与工程领域的长期挑战，为流体力学百年难题提供全新解决思路。

DeepMind推理论文/研究

07:44

Google DeepMind：Blog（RSS）

强化 Frontier Safety Framework

正在强化 Frontier Safety Framework（FSF），旨在识别并降低先进 AI 模型的严重风险。

Google安全/对齐

07:05

Google DeepMind：Blog（RSS）

精选

CodeMender 发布：面向代码安全的 AI 智能体

CodeMender 是一款面向代码安全的 AI 智能体，利用先进 AI 技术自动修复关键软件漏洞。

智能体DeepMind产品更新编码

关联讨论 1 条

推荐理由：DeepMind 发布代码安全 AI Agent CodeMender，可自动修复关键软件漏洞

06:04

Google DeepMind：Blog（RSS）

将AI引入下一代聚变能源

与Commonwealth Fusion Systems (CFS)建立合作，将AI技术引入下一代聚变能源领域，致力于让清洁、安全、无限的聚变能源更快成为现实。

Google行业动态

02:52

Google DeepMind：Blog（RSS）

重新思考如何衡量 AI 智能

Game Arena 是新的开源平台，用于严格评估 AI 模型，支持在具备明确获胜条件的环境中对前沿系统进行一对一比较。

DeepMind评测/基准

02:50

Google DeepMind：Blog（RSS）

精选

Gemma 3 270M 发布：专为超高效 AI 打造的轻量模型

Gemma 3 系列新增 270M 参数模型，仅 2.7 亿参数，定位紧凑型超高效 AI 专业工具。

DeepMind开源生态模型发布端侧

关联讨论 1 条

推荐理由：Google 发布 270M 超小参数开源模型，端侧部署新选择

02:48

Google DeepMind：Blog（RSS）

Gemini 图像编辑功能迎来重大升级

Gemini 应用原生图像编辑功能迎来重大升级，用户现可通过更新后的工具以全新方式变换图像，获得更强大的创意编辑能力。

Google产品更新图像生成多模态

02:42

Google DeepMind：Blog（RSS）

VaultGemma：全球能力最强的差分隐私 LLM

VaultGemma 基于差分隐私技术从头训练，是目前能力最强的隐私保护大语言模型，在严格隐私约束下实现了顶尖性能。

DeepMind安全/对齐数据/训练模型发布

02:40

Google DeepMind：Blog（RSS）

精选

Gemini 2.5 Computer Use 模型发布

Gemini 2.5 Computer Use 模型基于 Gemini 2.5 Pro 构建，专门用于驱动能与用户界面交互的 agent，现已通过 API 以预览版形式提供。

智能体DeepMindGoogle多模态

推荐理由：Google 发布 Gemini 2.5 Computer Use 模型，支持 Agent 自主操作图形界面

02:38

Google DeepMind：Blog（RSS）

推出 Veo 3.1 及高级创意功能

Veo 3.1 正式发布，带来重大功能更新。此次升级为用户提供更强大的高级创意控制能力，让创作过程更加灵活高效，满足多样化的创意需求。

Google产品更新视频

02:22

Google DeepMind：Blog（RSS）

Gemma 模型助力发现潜在癌症治疗新途径

发布基于 Gemma 的 270 亿参数单细胞分析基础模型，该模型此前已协助发现潜在癌症治疗新通路。

DeepMindGoogle开源生态模型发布

00:00

Mistral AI：News（网页）

56

介绍 Mistral AI Studio

企业AI团队常将原型卡在生产环节，主要瓶颈在于缺乏一套系统来跟踪模型输出变化、复现结果、监控真实使用数据、运行领域特定评估、私有增量微调模型以及满足安全合规的部署。Mistral AI Studio 作为生产级AI平台，基于 Mistral 运营大规模系统的经验而构建，为团队提供构建、评估和运行AI所需的基础设施。其核心功能包括：用于数据驱动闭环的可观测性、基于 Temporal 的有状态智能体运行时，以及用于模型和提示词版本管理的 AI 注册表。

智能体产品更新部署/工程

关联讨论 1 条

00:00

Runway：Changelog（网页）

将工作流发布为应用

支持将自动化工作流打包发布为独立应用，提供从构建到分发的完整工具链。用户可将现有流程转化为可部署的产品，实现「所需即所得」的一站式创作体验。

产品更新视频

10月23日

17:42

美团 LongCat：HuggingFace 新模型

美团 LongCat 发布 Flash-Omni 模型

美团 LongCat 团队发布 LongCat-Flash-Omni 开源项目，致力于通过开源和开放科学推进人工智能技术的普及与民主化。该项目旨在降低 AI 技术应用门槛，打破技术壁垒，但目前尚未披露具体模型架构、性能基准、参数规模及应用场景等详细技术规格。

Hugging Face多模态开源生态模型发布

08:00

OpenRouter：Announcements（RSS）

45

OpenRouter 探讨隐式缓存是否等同于 ZDR

OpenRouter 在公告中提出问题：是否应将提供隐式缓存（implicit caching）的供应商视为“ZDR”？

教程/实践部署/工程

08:00

OpenRouter：Announcements（RSS）

35

OpenRouter 提出隐式缓存是否视为 ZDR 的问题

OpenRouter 向客户提问：是否应将提供隐式缓存的供应商视为“ZDR”（零数据保留）？该公告未提供更多背景或结论。

行业动态部署/工程

08:00

OpenRouter：Announcements（RSS）

47

隐式缓存是提示词保留吗？

文章探讨了AI服务提供商采用的隐式缓存技术是否应被视为零数据保留策略。隐式缓存指服务商为提高响应速度与效率，在系统内部临时存储用户提示词与生成结果，而非明确告知用户。这引发了数据隐私与透明度争议，关键问题在于这种未声明的缓存行为是否违背了用户对数据立即删除的预期。客户需评估该技术是否满足其数据保留要求，尤其在处理敏感信息时。

安全/对齐行业动态部署/工程

01:58

Dwarkesh Patel：Podcast & Blog（RSS）

精选

AI基建扩张观察

AI基础设施建设正面临晶圆厂资本支出过剩的风险，同时算力扩张带来每周1吉瓦的能源消耗压力。文章指出，在长周期基础设施竞赛中，中国凭借产业链整合优势占据有利地位。分析涵盖了AI基建中的产能过剩隐忧、电力瓶颈挑战，以及地缘政治背景下的技术长跑格局，揭示了算力军备竞赛背后的资本与能源约束。

大佬观点部署/工程

关联讨论 2 条

推荐理由：AI基建泡沫与地缘博弈的冷思考，长期格局研判必读

10月22日

00:00

LMSYS：Blog（Chatbot Arena 团队）

SGLang集成KTransformers：基于AMX优化与专家延迟的MoE混合推理加速

SGLang现已集成KTransformers后端，为DeepSeek-V3等稀疏MoE模型提供CPU/GPU混合推理加速。该技术采用Intel AMX优化内核，使单路Xeon算力达21.3 TFLOPS，较PyTorch原生实现快3.9倍；通过NUMA感知张量并行和CUDA Graph调度，双路服务器解码吞吐量提升63%，GPU内核启动开销从20%降至接近零；专家延迟机制支持跨层重排计算以重叠CPU与GPU执行，在精度变化低于0.5%的情况下使解码吞吐量再提高1.45倍。

DeepSeek开源/仓库推理部署/工程

00:00

字节 Seed：Research Papers（网页内嵌数据）

Seed3D 1.0：从图像生成高保真、可直接仿真的 3D 资产

Seed3D 1.0 基础模型支持从单张图像直接生成具备准确几何、对齐纹理与真实物理材质的 3D 资产，可直接集成至物理引擎用于机器人操作与仿真训练，无需复杂配置。该系统解决了现有世界仿真器在内容多样性与物理准确性之间的权衡难题，并支持将物体组合为连贯场景，实现可扩展的仿真就绪内容创作。

具身智能多模态论文/研究

10月21日

08:00

OpenRouter：Announcements（RSS）

40

Provider Variance：OpenRouter 推出 Exacto

OpenRouter 推出 Exacto，旨在回答同一个大语言模型在不同 AI 服务供应商上是否表现不同的问题。该工具帮助用户量化供应商间的性能差异，为模型部署选择提供参考。

MCP/工具产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

52

OpenRouter 推出 Exacto，聚焦模型在不同提供商的性能差异

OpenRouter 发布 Exacto 功能，旨在解决同一模型在不同 AI 提供商之间的表现差异问题。该工具帮助用户识别并评估不同部署环境下的模型输出质量变化。

产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

精选68

Provider Variance： Introducing Exacto

同一AI模型在不同服务提供商上的性能表现可能存在显著差异。为了量化这种“提供商方差”，研究团队推出了Exacto评估平台。该平台通过标准化测试揭示，即使是相同的模型（如GPT-4、Claude或LLaMA），在不同云服务或API提供商处运行时，其输出质量、响应速度和稳定性都可能产生高达30%的波动。这一发现对企业和开发者的模型部署策略具有直接影响，强调在选择服务商时需进行针对性性能基准测试。

产品更新部署/工程

推荐理由：OpenRouter 推出 Exacto，直接回答了开发者最头疼的问题：同一个模型换家供应商跑出来的结果到底差多少。做 Agent 或多模型路由的产品人，这个工具能帮你少踩很多坑。

10月20日

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选73

超越权限提示：让Claude Code更安全、更自主

Claude Code引入沙盒化技术，通过文件系统与网络双重隔离来增强安全性，并大幅减少权限提示。内部测试显示，该技术将权限提示安全地降低了84%。新推出的沙盒运行时（作为开源研究预览版）允许开发者自定义目录和网络访问权限，使Claude能在限定范围内自主运行命令。同时，网页版Claude Code在云端隔离沙盒中运行，即使遭遇提示注入或代码入侵，也能有效保护Git密钥等敏感凭证不被泄露，从而提升开发安全性与效率。

Anthropic产品更新安全/对齐编码

关联讨论 4 条

推荐理由：Claude Code 的沙箱方案把安全和自主性这对矛盾解开了，权限提示减少 84% 不是数字游戏，是真把 agent 从「每步都要你点确认」变成「在笼子里自己跑」，做 coding agent 的团队该认真看看这套 OS 级隔离思路。

00:00

Claude：Blog（网页）

精选

Claude Code 发布网页版

Anthropic 推出网页版 Claude Code，以研究预览形式向 Pro、Max 及企业用户开放。用户可直接在浏览器中分配编码任务，无需本地终端，支持并行处理多个 GitHub 仓库的开发工作，并自动创建 PR 和变更摘要。该服务基于云端隔离沙盒运行，具备网络和文件系统限制，同时登陆 iOS 应用支持移动编码。云会话与现有 Claude Code 使用共享速率限制。

智能体Anthropic产品更新编码

关联讨论 4 条

推荐理由：Claude Code搬进浏览器，零门槛并行编程提PR，手机端也能随时跑任务

10月17日

11:09

美团 LongCat：HuggingFace 新模型

meituan-longcat 发布 LongCat-Audio-Codec

meituan-longcat 发布开源项目 LongCat-Audio-Codec，致力于通过开源与开放科学推进人工智能技术的普及与民主化。该项目旨在促进音频编解码技术的开放获取，推动行业技术进步与开放生态建设。

Hugging Face开源生态模型发布语音

02:36

Midjourney：Updates（RSS）

Midjourney 风格排名与 TV 功能更新

Midjourney 启动第二轮高分辨率风格排名活动，改为单图排名模式以学习细节特征、改进风格系统。同期正在新增 TV 功能。

产品更新图像生成