AIHOT

2月20日

08:00

OpenRouter：Announcements（RSS）

OpenRouter 在 2026 年 2 月 17 日与 19 日的服务中断事件

OpenRouter 在 2026 年 2 月 17 日和 19 日遭遇了两次服务中断。故障源于其依赖的云服务提供商发生区域性网络问题，导致 API 请求失败。团队在数小时内恢复了服务，并通过实施多区域故障转移、增加备用云服务提供商以及改进监控警报机制来增强系统韧性。此次事件后，OpenRouter 的服务可用性目标已提升至 99.9%。

行业动态部署/工程

08:00

Hugging Face：Blog（RSS）

使用 Unsloth 和 Hugging Face Jobs 免费训练 AI 模型

Hugging Face 宣布通过其平台提供免费 AI 模型训练服务，用户可结合 Unsloth 高效训练工具与 Hugging Face Jobs 功能，无需支付费用。该举措旨在降低 AI 开发门槛，推动开源开放科学，促进人工智能技术的民主化进程。核心变化在于将原先需付费或自建基础设施的训练流程，整合为平台内可直接调用的免费资源，显著减少开发者的时间和经济成本。

Hugging Face教程/实践数据/训练

08:00

Hugging Face：Blog（RSS）

精选86

GGML 和 llama.cpp 加入 HF 以确保 Local AI 的长期进展

GGML 和 llama.cpp 团队正式加入 Hugging Face，以支持本地 AI 社区的长期扩展。创始人 Georgi Gerganov 及团队将全职维护 llama.cpp，保持 100% 技术自主权和社区领导力，项目继续 100% 开源和社区驱动。Hugging Face 提供长期可持续资源，助力项目增长。技术上将优化 transformers 库与 llama.cpp 的无缝集成，实现近乎“一键式”的模型部署，并改进基于 GGML 的软件打包和用户体验。长期愿景是构建高效本地推理堆栈，推动开源超级智能的普及。

开源生态端侧行业动态

推荐理由：本地推理核心引擎获得长期资源保障，端侧 AI 生态稳定性大幅提升

00:06

Google DeepMind：Blog（RSS）

精选

Gemini 3.1 Pro：专为最复杂任务打造的更智能模型

Gemini 3.1 Pro 发布，专为无法通过简单回答解决的复杂任务设计，提供更智能的深度推理与处理能力。

Google推理模型发布

关联讨论 2 条

推荐理由：Google 发布 Gemini 3.1 Pro，强化复杂任务推理能力

00:00

LMSYS：Blog（Chatbot Arena 团队）

SGLang 在 NVIDIA GB300 NVL72 上实现 25 倍推理性能突破

SGLang 与 NVIDIA 合作，在最新 GB300 NVL72 服务器上实现相比 H200 最高 25 倍的推理性能提升。基于 Blackwell Ultra GPU 的架构升级包括 1.5 倍 FP4 算力和 2 倍 Softmax 吞吐量，结合 NVFP4 GEMM 低精度计算、计算通信重叠及与 NVIDIA Dynamo 的集成优化，DeepSeek R1 等 MoE 模型在 InferenceXv2 基准测试中达成突破性表现。同时，GB200 NVL72 平台性能在 4 个月内提升 8 倍，显著降低大模型部署的延迟与成本。

开源/仓库推理部署/工程

2月19日

04:14

Midjourney：Updates（RSS）

V8 图像评分活动 Round 3

V8 图像评分活动进入第三轮。本轮重点从识别"差的"样本转向学习"好的"标准，与上一轮形成对比，邀请用户前往投票链接参与。

产品更新图像生成

00:15

Hugging Face：Blog（RSS）

精选70

IBM与伯克利利用IT-Bench和MAST诊断企业级AI智能体失败原因

IBM Research与加州大学伯克利分校合作，通过新构建的IT-Bench基准测试和MAST评估框架，系统分析了企业级AI智能体在复杂IT运维任务中的失败原因。研究发现，当前智能体在多步骤规划、长序列操作及工具精确使用方面存在明显不足，导致任务失败率较高。该研究旨在为开发更可靠、适用于实际业务环境的企业级智能体提供关键诊断依据和改进方向。

智能体论文/研究评测/基准

关联讨论 1 条

推荐理由：企业Agent落地失败的系统性诊断，部署前可参考避坑

00:01

Google DeepMind：Blog（RSS）

表达自我的新方式：Gemini 现已支持音乐创作

Gemini 应用集成 Lyria 3 音乐生成模型，支持通过文本或图片提示创作 30 秒音乐片段，让任何用户都能轻松制作音轨。

Google产品更新多模态

00:00

LMSYS：Blog（Chatbot Arena 团队）

GB300 NVL72部署DeepSeek R1优化方案：长上下文推理性能突破

NVIDIA与SGLang团队发布DeepSeek R1-NVFP4在GB300 NVL72上的优化部署方案，针对128K/8K长上下文推理实现显著性能提升。通过PD分离、分块流水线并行、宽专家并行及多Token预测（MTP）等技术，系统在GB300上达226 TPS/GPU峰值吞吐量，较GB200提升1.53倍；相同延迟下性能领先1.4–1.6倍。MTP可再提升每用户TPS达1.87倍，128K预填充首Token延迟降至8.6秒。

DeepSeek开源/仓库推理部署/工程

2月18日

09:45

Ethan Mollick：One Useful Thing（RSS）

精选

Agentic 时代 AI 选择指南

Agentic 时代 AI 不再只是聊天机器人，而是能自主执行任务的智能体。面对 Claude、GPT、LLaMA 等模型，需根据代理能力、任务类型和生态集成重新评估选择策略。

智能体教程/实践

推荐理由：AI 大咖 Ethan Mollick 撰写 Agent 时代实用选型指南

09:20

公众号：蚂蚁百灵（Ling）

蚂蚁百灵发布 Ming-flash-omni-2.0 与 Ming-omni-tts 语音模型

百灵多模态团队于两天前发布 Ming-flash-omni-2.0，并基于其语音模块推出新模型 Ming-omni-tts。通过模型规模扩展（scale up），Ming-omni-tts 实现更强的语音生成效果。

模型发布语音

08:00

Hugging Face：Blog（RSS）

精选78

使用 Gradio 的 gr.HTML 组件一键构建任意 Web 应用

Gradio 的 gr.HTML 组件允许开发者通过单一 Python 文件快速构建和部署交互式 Web 应用，无需构建步骤。它通过 html、css 和 js_on_load 三个模板，将 Python 状态注入前端并实现与 JavaScript 的双向同步。应用示例涵盖生产力工具（如像素艺术番茄钟）、商业应用（如可拖拽看板）、创意组件（如抽奖转盘）以及专业的 ML 应用（如目标检测查看器）。组件可子类化复用，并能直接集成到模型流水线中，借助快速重载模式，从构思到部署仅需数秒。

Hugging Face产品更新部署/工程

推荐理由：ML 开发者可快速构建自定义 Web 应用，单文件部署，无需前端经验。

06:22

Midjourney：Updates（RSS）

V8 Rating Party！（第二轮）

Midjourney 开启 V8 第二轮评级活动，重点针对生成文本的提示词测试模型能力。用户可访问 midjourney.com/rank-v8 参与图片评级，活动持续1天。

产品更新图像生成

01:27

Nathan Lambert：Interconnects（RSS）

精选

开源模型的永无止境的追赶

开源模型与闭源巨头（如 GPT、Claude）之间的能力差距持续存在，形成永无止境的追赶态势。文章探讨了知识蒸馏技术对缩小差距的作用，分析了开源与闭源模型在创新时间尺度上的差异，以及开源模型如何通过专业化模型在特定领域寻找获胜路径。同时指出当前开源生态在基础研究和资源投入上的缺失环节，并评估了这种追赶模式的可持续性。

大佬观点开源生态现象/趋势

关联讨论 1 条

推荐理由：开源与闭源鸿沟难越，但蒸馏与专业化或是破局关键

2月17日

21:42

Google DeepMind：Blog（RSS）

Google DeepMind 将 National Partnerships for AI 计划引入印度，以AI赋能科学教育加速探索

Google DeepMind 在印度启动 National Partnerships for AI 计划，通过规模化应用AI技术推动科学研究和教育发展，加速探索发现。

DeepMindGoogle行业动态

12:00

公众号：豆包（字节）

豆包春晚 AI 互动量达 19 亿次

字节旗下 AI 产品豆包在春晚期间累计完成 19 亿次 AI 互动，记录了广大用户与春晚相关的智能对话与交互体验。

其他行业动态

07:32

Midjourney：Updates（RSS）

V8 评分活动更新

Midjourney 本周将再举办两场 V8 Rating Party，随后正式发布 V8 模型。用户可前往 midjourney.com/rank-v8 参与 Round 1 图片评分，当前反馈已直接用于模型优化。

图像生成模型发布

2月16日