AIHOT

全部动态一手 · 2393 条

全部一手资讯 X 论文

2月3日周二

2月2日周一

2月1日周日

1月31日周六

1月30日周五

1月29日周四

1月28日周三

1月27日周二

1月26日周一

1月23日周五

1月22日周四

2月3日

23:03

Hugging Face：Blog（RSS）

精选80

全球开源AI生态系统的未来：从 DeepSeek 到 AI+

Hugging Face 在其官方博客发布文章，展望了全球开源人工智能生态系统的发展路径与未来趋势。文章以 DeepSeek 等代表性开源模型为例，探讨了开源社区如何推动技术民主化与创新加速。核心观点指向一个更加开放、协作的“AI+”未来生态，其中开源框架、模型和工具将深度融入各行各业，降低开发门槛并促进多样化应用场景的涌现。

DeepSeekHugging Face开源生态现象/趋势

推荐理由：开源AI核心平台对生态走向的判断，直接影响开发者技术选型和投资方向

19:25

Hugging Face：Blog（RSS）

精选73

文本到图像模型训练设计：来自消融研究的经验

Photoroom团队通过消融研究，总结了文本到图像模型训练的关键发现：混合高质量与多样化数据、在训练中后期引入强数据增强，以及调整无分类器引导的丢弃率，能有效优化模型性能。这些结论为Stable Diffusion等模型的训练提供了实用指导。

Hugging Face图像生成论文/研究

推荐理由：为文本到图像模型训练提供实用优化建议，帮助开发者提升模型效果。

19:06

公众号：腾讯混元

41

混元研究博客上线姚顺雨团队最新成果：从Context探索语言模型的范式转变

混元研究博客上线姚顺雨团队最新成果，从Context角度探索语言模型的范式转变，旨在推动Context学习真正走向现实。该成果聚焦于模型对上下文的理解与利用机制，为语言模型能力演进提供新思路。

推理论文/研究

17:46

美团 LongCat：HuggingFace 新模型

美团-longcat/LongCat-Image-Edit-Turbo

美团-longcat发布LongCat-Image-Edit-Turbo图像编辑模型，秉持开源与开放科学理念推进人工智能技术的普及。该项目专注于图像编辑领域，旨在提供高效的图像处理能力。目前公开信息主要阐述项目愿景与使命，具体技术参数、性能指标及版本更新细节有待进一步披露。

Hugging Face图像生成模型发布

12:18

腾讯混元：Research（API）

从上下文学习比我们想象的更难

上下文学习（in-context learning）的实际效果存在明显局限。研究表明，大语言模型难以从提示示例中真正提取任务规则，往往依赖表面模式匹配而非深层理解。单纯增加示例数量无法线性提升性能，模型容易受到示例顺序和分布的影响，需要重新评估该能力的实际边界。

数据/训练论文/研究

04:00

Qwen：Blog Retrieval（API）

Qwen3-Coder-Next：推进小型混合模型在智能体编程中的应用

Qwen Studio 提供全栈功能，涵盖聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索集成、工具调用及 Artifacts 等模块。

智能体模型发布编码

00:00

Moonshot AI：Kimi Blog（VitePress）

WorldVQA：多模态大模型视觉世界知识基准测试

Kimi团队发布WorldVQA基准测试，评估多模态大语言模型视觉世界知识的事实准确性。数据集包含3,500个经多阶段人工验证的图像-问题对，涵盖自然、地理、文化等9个类别，区分头部与尾部知识分布。测试显示，即使是Kimi K2.5、Gemini-3-pro等前沿模型，整体准确率仅46%-47%，长尾视觉知识上常低于50%，揭示当前模型在事实可靠性方面的显著不足。

多模态评测/基准

00:00

智谱：研究（网页内嵌数据）

GLM-OCR发布：性能SOTA，搞定复杂文档

GLM-OCR 开源发布，0.9B 参数规模在 OmniDocBench V1.5 以 94.6 分取得 SOTA，擅长手写体、复杂表格、印章等场景结构化识别。兼容 vLLM、SGLang 和 Ollama 部署，推理延迟低，适合高并发与边缘计算，提供完整 SDK 支持一行命令调用。

多模态开源生态模型发布端侧

2月2日

21:55

公众号：MiniMax（稀宇科技）

38

MiniMax Agent "卧底" Moltbook 聊天记录曝光

MiniMax Agent 以卧底身份潜入 Moltbook，相关聊天记录被曝光。

智能体产品更新

21:03

Nathan Lambert：Interconnects（RSS）

最新开源模型（第18期）：Arcee 400B MoE、LiquidAI 被低估的 1B 模型、新版 Kimi，以及本月密集发布的预期

本期开源模型动态涵盖 Arcee 400B MoE、LiquidAI 1B 及新版 Kimi 等实用小众模型。Arcee 发布 4000 亿参数 MoE 架构模型，LiquidAI 推出性能被低估的 10 亿参数方案，Kimi 迎来重要更新。业界预期本月将迎来密集的大模型发布潮，多款重要产品即将面世。

开源/仓库开源生态端侧

18:04

公众号：生数科技（Vidu·视频）

25

"Yes，Vidu全球创想周亮点回顾"

"生数科技（Vidu·视频）发布《Yes,Vidu全球创想周亮点回顾，一文尽览》一文，标题即为全文内容，未提供具体亮点细节。"

行业动态

08:00

xAI：News（网页）

精选

SpaceX 收购 xAI

SpaceX 于 2026 年 2 月 2 日宣布收购 xAI。马斯克旗下的火箭公司与人工智能公司正式合并，具体交易条款未予披露。

xAI行业动态

推荐理由：SpaceX收购xAI，马斯克旗下AI与航天业务重大整合

2月1日

16:50

公众号：腾讯混元

29

开抢！限量「元宝派」邀请码（手慢无）

行业动态

1月31日

14:20

公众号：生数科技（Vidu·视频）

44

Vidu 全球生态计划正式启航

Vidu 全球生态计划正式启航，以“创想共赢”为核心理念，面向全球开放生态合作。该计划由生数科技旗下 Vidu 发起，旨在携手全球伙伴共同推动视频创作生态发展。

行业动态视频

1月30日

23:49

Nathan Lambert：Interconnects（RSS）

LLM 时代就业市场思考

探讨大语言模型普及背景下就业市场的结构性变化。重点分析求职者如何在 AI 自动化与生成内容泛滥的环境中实现差异化脱颖而出，以及招聘方如何穿透技术表象识别真正具备价值的人才瑰宝。这种双向筛选机制正在重塑人才评估标准与竞争逻辑，对雇佣双方均提出新的能力要求。

大佬观点现象/趋势

15:55

蚂蚁 inclusionAI：GitHub 新仓库

精选61

高效离线推理框架 Flood：吞吐量显著领先，支持多模态与量化

Flood 是一款面向离线应用的高效大语言模型推理框架。它采用流水线并行降低通信开销，并通过分段式KV缓存管理提升连续性。框架支持连续批处理、分块预填充、FP8/INT8量化及多模态模型推理。性能测试表明，其在多种模型和硬件上的吞吐量最高可达 vLLM 的 2.4 倍。其专用内核 SegmentAttention 在处理长序列时，解码速度较 FlashAttention 最高提升 3.16 倍。该项目于 2025 年 3 月开源并快速迭代，已支持前瞻解码等新特性。

开源/仓库推理部署/工程

推荐理由：蚂蚁的 FLOOD 框架用流水线并行替代张量并行来压通信开销，实测吞吐比 vLLM 高 1.4 到 2.4 倍，做离线推理部署的团队值得花半小时跑一下 benchmark 看看自家场景能不能吃这个红利。

12:34

公众号：月之暗面（Kimi）

37

Kimi Code 接入 K2.5，限时 3 倍额度并改为 Token 计费

Kimi Code 已接入最强编程模型、原生多模态模型 Kimi K2.5。即日起至 2026 年 2 月 28 日，新老用户可享最高平时 3 倍的使用额度，无限速和购买限制。同时取消基于请求次数的计费，全面切换为基于 Token 计费，所有用户配额已重置。额度按实际输入输出长度扣减，简单提问消耗极少 Token，复杂任务获得更充足空间。用户可访问 kimi.com/code 开始使用并了解 Kimi Code Plan 会员权益。

产品更新编码

08:04

公众号：月之暗面（Kimi）

55

不只PPT，Kimi K2.5 Agent可以帮你做Excel、Word和PDF了

智能体产品更新多模态

01:01

Google DeepMind：Blog（RSS）

Project Genie：探索无限交互世界

Google 向美国 AI Ultra 订阅用户开放实验性原型 Project Genie 试用，支持实时创建并探索无限生成的交互式世界。

DeepMindGoogle产品更新多模态

00:00

字节 Seed：Research Papers（网页内嵌数据）

Post-LayerNorm 回归：稳定、高表达力与深度

提供的正文内容为 PDF 二进制流数据及乱码，无法提取有效信息（如具体方法、实验指标或模型发布细节），因此无法撰写准确摘要。请提供可读的文本内容（如论文摘要或正文段落），以便提取关键信息点完成摘要撰写。

数据/训练论文/研究

1月29日

20:00

公众号：蚂蚁百灵（Ling）

35

Clawdbot 换上百灵大脑：自动买车 Agent 测试

蚂蚁百灵团队将近期刷屏的自动买车 Agent Clawdbot 的核心大脑替换为自家百灵模型，进行功能测试。Clawdbot 是本周最火的通用 Agent 架构，此次实验验证了百灵模型在工具调用任务中的实际表现。

智能体教程/实践

15:35

Steve Yegge：Medium（RSS）

51

Software Survival 3.0

作者基于对AI指数级发展的预测，于2025年末构建了Gas Town项目，以验证软件编排（orchestration）的早期形态。文章指出，在未来AI能编写几乎所有软件的“Software 3.0”时代，选择压力将遵循一条核心法则：节省认知资源的软件更可能生存。由于推理（Inference）消耗Token，而Token、能源与成本相互关联且受限，因此最小化认知支出（可量化为Token消耗）成为关键。作者主张，系统应优先使用能完成任务的最小模型，并通过编排将任务分配给合适的模型层，以节约能源与成本。

智能体大佬观点开源生态

08:00

Hugging Face：Blog（RSS）

63

发布 Daggr：以编程方式链接应用，以可视化方式进行检查

Meta AI 团队发布了开源工具 Daggr，旨在通过编程方式链接不同的 AI 应用，并支持对工作流进行可视化检查与调试。该工具允许开发者将多个模型（如 GPT、Claude、LLaMA）和数据处理步骤串联成自动化流程，同时提供直观的图形界面来监控数据流转和状态变化。此举是其通过开源与开放科学推进人工智能民主化进程的一部分。

智能体Hugging Face产品更新部署/工程

00:00

Qwen：Blog Retrieval（API）

Qwen3-ASR 与 Qwen3-ForcedAligner 正式开源：鲁棒、流式、多语言！

Qwen3-ASR 与 Qwen3-ForcedAligner 正式开源，具备鲁棒性、流式处理与多语言能力。Qwen Studio 同步集成聊天机器人、图像视频理解、图像生成、文档处理、网页搜索、工具调用及 Artifacts 等全栈功能。

开源/仓库开源生态语音

1月28日

15:51

公众号：腾讯混元

57

10亿红包后，我们打算开源这个800亿的模型

图像生成开源生态模型发布

08:00

Hugging Face：Blog（RSS）

50

我们让Claude构建CUDA内核并教导开源模型！

研究团队成功利用Claude模型自动生成高性能CUDA内核代码，并将其应用于训练开源大语言模型。这一方法显著提升了模型在特定硬件上的计算效率，是推动AI民主化的重要步骤。通过开源工具与科学，团队致力于降低先进AI技术的开发门槛，让更广泛的社区能够参与并受益于人工智能的创新发展。

Anthropic教程/实践编码

06:47

Nathan Lambert：Interconnects（RSS）

精选

Arcee AI 全力投入在美国构建的开放模型

Arcee AI 发布开源大模型 Trinity Large，标志着其全面投入在美国本土构建开放模型的战略布局。该发布作为 Interconnects 第16期访谈的核心内容，彰显该公司对开源生态与数据主权的承诺。Trinity Large 的推出代表 Arcee AI 在本土 AI 基础设施建设上的关键进展，强调模型训练与开发的地理合规性及技术自主性。

开源生态模型发布

推荐理由：开源模型Trinity Large发布，美国本土训练的企业级合规新选择

00:55

Ethan Mollick：One Useful Thing（RSS）

精选

管理是 AI 的超能力

智能体（agents）时代，管理能力将成为人类 thriving 的核心超能力。在 AI 主导的未来，懂得如何管理比单纯的技术能力更能决定成败。

智能体大佬观点

推荐理由：沃顿教授 Ethan Mollick 深度解析 Agent 时代的管理变革与机遇

1月27日

23:01

Hugging Face：Blog（RSS）

精选83

中国开源AI生态中的架构选择：构建超越DeepSeek的未来

Hugging Face发布博客文章，探讨中国开源人工智能生态系统的核心架构选择与发展路径。文章聚焦于如何构建一个超越现有模型（如DeepSeek）的可持续技术体系，分析了中国开发者在模型架构、训练框架、部署工具和社区协作等方面的关键决策。文中指出，中国开源社区正致力于打造独立且互操作的技术栈，以应对大规模模型训练与推理的独特挑战，并推动全球AI生态的多元化发展。

DeepSeek开源生态现象/趋势

推荐理由：揭示中国开源AI架构演进，帮助开发者把握生态趋势与选型方向。

19:11

公众号：月之暗面（Kimi）

精选61

Kimi 发布并开源 K2.5 模型，带来全新视觉理解、代码和 Agent 集群能力

智能体多模态开源/仓库模型发布

推荐理由：Kimi K2.5把视觉理解和Agent集群能力打包开源，国内模型里比较早做这个组合的，虽然参数规模争议不小，但对想搭多模态Agent的团队是个可用的起点。

18:26

Hugging Face：Blog（RSS）

60

Alyah ⭐️：迈向对阿拉伯语大语言模型（LLaMA、GPT、Claude等）阿联酋方言能力的稳健评估

阿联酋技术创新研究院在Hugging Face发布博客，正式推出Alyah评估框架，专门用于系统评估各类阿拉伯语大语言模型在理解与生成阿联酋方言方面的能力。该框架旨在解决当前阿拉伯语评估中标准方言主导、忽视地区方言多样性的问题。Alyah包含一个精心构建的基准数据集，涵盖多种方言语言现象和实际应用场景，为衡量模型在阿联酋方言上的真实性能提供了首个系统化、可复现的评估标准。

Hugging Face评测/基准

16:03

美团 LongCat：HuggingFace 新模型

美团 LongCat 发布 LongCat-Flash-Lite

美团 LongCat 团队发布开源模型 LongCat-Flash-Lite，致力于通过开源与开放科学推进人工智能技术的普及与民主化。该项目旨在降低 AI 应用门槛，为开发者社区提供轻量级技术基础设施，助力先进人工智能能力的广泛获取与开放协作。

Hugging Face开源生态模型发布端侧

09:53

Hugging Face：Blog（RSS）

精选83

解锁GPT-OSS的智能体强化学习训练：一项实践回顾

LinkedIn团队探索了将GPT-OSS模型作为智能体应用核心进行强化学习的可行性。实验发现，由于GPT-OSS采用的混合专家架构在两次前向传播中可能产生路由差异，导致在同策略PPO训练中出现重要性采样比率偏离、KL散度爆炸及奖励不增长的问题。团队通过一个关键修复——在同策略条件下强制将旧对数概率设置为新计算值（并分离梯度），确保了重要性采样比率为1，从而恢复了PPO同策略训练的完整性。该修复方案适用于GPT-OSS-20B及GPT-OSS-120B模型。

智能体Hugging Face教程/实践数据/训练

推荐理由：为MoE模型RL训练提供实用调试方案，提升代理AI开发效率。

00:00

MiniMax：Blog（网页）

50

MiniMax-M2-her 技术解析：专为角色扮演打造的 AI 智能体

MiniMax 基于产品 Talkie/Xingye 三年的观察，推出了专为角色扮演场景优化的模型 MiniMax-M2-her。团队发现，深度角色扮演的核心是“叙事精度”和“情感连接”。该模型旨在解决三大挑战：保留每个角色与世界观的“灵魂”、维持故事随时间推进的叙事活力、以及解读用户的隐式意图。其目标是提供高保真的世界体验，能主动推动故事发展以赋予张力，并动态适应用户的长期习惯，实现直觉性的偏好对齐。

智能体模型发布评测/基准

00:00

Mistral AI：News（网页）

58

Mistral Vibe 2.0终端智能体发布

Mistral AI 发布了终端原生编码智能体 Mistral Vibe 2.0，由 Devstral 2 模型驱动。其主要升级包括：可构建自定义子代理、在执行操作前提供多选项澄清、通过斜杠命令加载技能，以及配置自定义工作流程。Mistral Vibe 2.0 目前可通过 Le Chat Pro 和 Team 计划使用，支持按使用量付费或自带 API 密钥。同时，Devstral 2 模型已转向付费 API 访问。

智能体产品更新编码

关联讨论 1 条

1月26日

04:00

Qwen：Blog Retrieval（API）

将 Qwen3-Max-Thinking 推向极限

Qwen Studio 提供聊天机器人、图像与视频理解、图像生成、文档处理、网络搜索、工具调用及 Artifacts 等全面功能，支持多模态 AI 应用。

产品更新多模态

00:00

LMSYS：Blog（Chatbot Arena 团队）

单卡H200部署1TB模型：INT4 QAT RL端到端实践

SGLang RL团队联合多家机构开源INT4量化感知训练端到端方案。受Kimi K2启发，训练阶段采用伪量化，推理阶段使用W4A16（INT4权重、BF16激活）真实量化，实现与BF16全精度相当的稳定性。该方案将约1TB模型压缩至单张H200（141GB）GPU即可完成rollout，彻底消除跨节点通信瓶颈，显著提升推理效率，为大规模模型训练提供高性能、低成本的开源实践参考。

数据/训练论文/研究部署/工程

1月23日

10:50

美团 LongCat：HuggingFace 新模型

美团 LongCat 发布 Flash-Thinking-ZigZag 模型

美团 LongCat 团队发布 Flash-Thinking-ZigZag 模型，延续通过开源与开放科学推进人工智能民主化的技术路线。该项目致力于降低 AI 应用门槛，以开源方式使先进技术更广泛地惠及开发者社区，推动 AI 技术的普及与可持续发展。

Hugging Face开源生态推理模型发布

00:00

MiniMax：Blog（网页）

精选

MiniMax Speech 2.8 语音模型

MiniMax 发布新一代语音模型 MiniMax Speech 2.8，通过原生声音标签技术模拟人类口语中的"嗯"、"啊"等填充词及呼吸停顿，显著提升对话自然度。该模型支持10秒样本高保真声音克隆，精准还原音色与语速，同时消除背景噪音与数字伪影，输出录音室级纯净音质。此外，模型优化了跨语言表现，从普通话-日语对开始解决口音渗透问题，实现更接近母语者的发音效果。

模型发布语音

关联讨论 1 条

推荐理由：10秒样本克隆真人声线，AI说话带'嗯啊'呼吸声，MiniMax语音模型上新

1月22日

01:05

Nathan Lambert：Interconnects（RSS）

精选

AI Agents 的能力正逼近关键临界点，其性能飞跃已超出传统工作模式的承载范围。这要求从业者必须重新界定工作范畴、重构项目管理流程并革新任务执行策略。从需求规划到交付标准，现有方法论面临全面调整，组织与个人亟需掌握与智能体协作的新范式，以适应这一技术变革带来的深层影响。

智能体Hugging Face大佬观点

关联讨论 1 条

推荐理由：Agent工具迫使开发者重构工作流，资深研究者分享进阶路径