AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态一手 · 2393 条
全部一手资讯X论文
1月7日周三
1月6日周二
1月5日周一
1月1日周四
12月31日周三
12月30日周二
12月25日周四
12月24日周三
12月23日周二
12月22日周一
12月19日周五
12月18日周四
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
1月7日
12:07
公众号:蚂蚁百灵(Ling)
58
蚂蚁·安诊儿开源:基于百灵的医疗大模型

蚂蚁集团联合浙江省卫健委开源基于百灵高效 MoE 基座 Ling-flash-base-2.0 训练的医疗大模型 AntAngelMed(蚂蚁·安诊儿)。模型总参数 100B,仅 1/32 激活(6.1B)即可媲美约 40B 稠密模型性能,实现约 7 倍性能杠杆。基于 40T+ tokens 高质量语料、20T+ tokens 预训练。在 OpenAI 发起的 HealthBench 评测中登顶全球开源医疗模型第一。训练采用三阶段流程:持续预训练注入医学语料、监督微调、双阶段 GRPO 强化学习。模型已开源,可在 HuggingFace 和 ModelScope 获取。

开源生态模型发布
1月6日
08:00
xAI:News(网页)
xAI 完成 200 亿美元 E 轮融资

xAI 完成 200 亿美元 E 轮融资,投资方包括 NVIDIA、Cisco 等。目前拥有约 6 亿月活用户,运营超 100 万 H100 GPU 等效算力的 Colossus 超算,正在训练 Grok 5。资金将用于基础设施建设和 AI 产品开发。

智能体xAI多模态行业动态
06:56
Hugging Face:Blog(RSS)
精选80
NVIDIA发布Cosmos Reason 2模型,增强物理AI推理能力

NVIDIA在Hugging Face上发布了Cosmos Reason 2模型,旨在提升物理AI系统的推理能力。该模型通过改进的推理架构,使AI能更准确地理解和预测物理世界的动态与交互,核心升级包括对复杂场景的多步推理、不确定性量化及时间序列数据的深度理解。这一进展将推动机器人、自动驾驶等领域的发展,使AI在现实环境中的决策更可靠、更符合物理规律。

具身智能推理模型发布

推荐理由:物理AI推理能力升级,机器人和具身智能落地的关键拼图
1月5日
17:16
Hugging Face:Blog(RSS)
精选73
Introducing Falcon-H1-Arabic: 以混合架构突破阿拉伯语AI的边界

阿联酋技术创新研究院在Hugging Face发布了Falcon-H1-Arabic模型。该模型采用创新的混合架构,融合了自回归与自编码技术,专门针对阿拉伯语进行优化。其目标是通过提升对阿拉伯语复杂语法和丰富形态的理解与生成能力,显著推进阿拉伯语人工智能的发展。这一发布标志着阿拉伯语大语言模型在技术架构上取得了重要进展。

开源生态模型发布

推荐理由:阿拉伯语AI新模型发布,推动多语言AI应用发展
08:00
Hugging Face:Blog(RSS)
38
NVIDIA 借助 DGX Spark 与 Reachy Mini 将智能体带入现实

NVIDIA 推出 DGX Spark 平台与 Reachy Mini 机器人,旨在通过开源框架降低智能体开发门槛。该组合将大语言模型与物理执行器结合,使 AI 智能体能完成复杂任务。DGX Spark 提供分布式训练基础设施,Reachy Mini 则提供高精度七自由度机械臂硬件,共同推动具身智能发展。

智能体产品更新具身智能
00:00
Runway:News(网页)
Runway基于NVIDIA Rubin平台加速视频生成与世界模型

Runway率先在NVIDIA Rubin平台部署视频生成模型Gen-4.5与世界模型GWM-1。Gen-4.5在一天内从Hopper迁移至Vera Rubin NVL72,展现平台后向兼容性与生产就绪能力。Rubin单GPU提供50 PF推理算力,可加速实时长视频生成。GWM-1作为Runway首个通用世界模型家族,支持物理感知机器人训练、可探索虚拟世界及交互式化身,推动AI从文本理解向物理世界模拟演进。

产品更新具身智能视频
1月1日
00:00
Dario Amodei:Blog(网页)
精选
技术的青春期

Dario Amodei 将当前 AI 发展阶段定义为「技术的青春期」,认为人类即将获得难以想象的力量,但社会和政治系统是否具备驾驭成熟度仍存疑。文章强调需避免「末日论」式恐慌,以务实、基于事实的方式讨论风险,同时承认 AI 发展速度和风险的不确定性。作者主张通过企业自愿行动与精准政府监管相结合,在避免过度干预的前提下应对潜在危险,为可能到来的更强有力行动储备证据和方案。

智能体Anthropic大佬观点安全/对齐
关联讨论 2 条Dario Amodei:Blog(网页)X:Dario Amodei (@DarioAmodei)
推荐理由:Anthropic CEO 长文剖析 AI 文明风险与治理路径,值得深读。
12月31日
20:32
公众号:蚂蚁百灵(Ling)
30
百灵2025的SOLID新航程--行而不辍,履践致远

百灵以“坚定”SOLID为首字母的五个关键词总结2025年,感谢所有下载者、使用者和社区贡献者的支持与肯定。

行业动态
13:08
Qwen:Blog Retrieval(API)
Qwen-Image-2512:细节更精细,真实感更强

Qwen-Image-2512 发布,图像细节与真实感显著提升。Qwen Studio 平台提供聊天、图像视频理解/生成、文档处理、网页搜索、工具调用及 artifacts 等全功能支持。

图像生成模型发布
11:50
公众号:豆包(字节)
15
豆包发布年度回顾

豆包(字节跳动)发布年度回顾,以99个用户与AI助手的真实互动瞬间,记录每个人在2025年的故事。

其他
01:07
Dwarkesh Patel:Podcast & Blog(RSS)
精选
Adam Marblestone - AI 缺失了关于大脑的根本认知

Adam Marblestone 指出,当前人工智能研究忽略了大脑运作的核心机制。与业界普遍关注神经网络架构不同,大脑的真正优势在于其奖励函数而非结构本身。这一观点挑战了主流 AI 研究范式,暗示未来突破可能来自对大脑激励系统的深入理解,而非单纯的架构模仿。该论断为人工智能发展提供了新的思考维度。

大佬观点数据/训练

推荐理由:AI研发或应转向奖励函数设计,而非一味堆叠架构复杂度
12月30日
17:22
公众号:豆包(字节)
28
他们这样用豆包|2025年终讲述
其他教程/实践
08:00
xAI:News(网页)
精选
xAI推出Grok Business与Enterprise企业版

xAI发布Grok Business和Grok Enterprise企业版。Business版定价30美元/座位/月,支持自助开通,提供团队管理、统一账单及Google Drive集成(保留原文件权限),并承诺用户数据永不用于模型训练。Enterprise版面向大型组织,提供Custom SSO、Directory Sync及高级审计控制;可选的Enterprise Vault插件提供独立数据平面与客户自管加密密钥(CMEK),实现应用级加密隔离。平台支持实时使用监控、安全对话共享及Projects功能。

智能体xAI产品更新部署/工程

推荐理由:xAI 推出 Grok 企业版,主打隐私保护与 Agent 能力,月费 30 美元起
12月25日
16:15
公众号:月之暗面(Kimi)
38
AlphaEngine Agent模型升级至Kimi K2 Thinking,7万金融投研人已在使用

金融投研工具AlphaEngine完成Agent模型升级,接入Kimi K2 Thinking。该工具目前已有7万金融投研人在使用。

智能体产品更新推理
12月24日
08:00
OpenRouter:Announcements(RSS)
精选55
可蒸馏模型与合成数据管道:使用 NeMo Data Designer

介绍如何利用 NeMo Data Designer 构建许可安全的合成数据工作流,用于模型特化(model specialization)。该管道支持生成可蒸馏模型所需的高质量合成数据,确保数据来源合规,适用于下游微调与领域适配场景。

教程/实践数据/训练

推荐理由:虽然发布快半年了,但教程讲的是如何用 NeMo Data Designer 构建 license-safe 的合成数据管道,对正在搞模型蒸馏和微调的开发者依然有参考价值,细节够实操。
08:00
OpenRouter:Announcements(RSS)
52
使用 NeMo Data Designer 构建可蒸馏模型与合成数据流水线

NeMo Data Designer 提供符合许可证安全的合成数据工作流,用于模型专门化与知识蒸馏,帮助开发者高效生成定制化训练数据。

教程/实践数据/训练
08:00
OpenRouter:Announcements(RSS)
50
利用NeMo Data Designer构建可蒸馏模型与合成数据管道

NVIDIA推出NeMo Data Designer工具,帮助企业生成合规的合成数据工作流,用于定制化大模型训练。该工具通过创建“许可证安全”的合成数据,规避版权风险,并支持构建可蒸馏的轻量级模型。它为在特定领域数据受限的企业提供了端到端的合成数据生成与管理解决方案,助力模型高效微调与优化。

产品更新数据/训练部署/工程
01:01
Google DeepMind:Blog(RSS)
Google 年度回顾:2025年8大研究突破领域

Google 2025年度研究回顾全面盘点8大领域关键技术突破,总结全年在前沿研究方向取得的重要进展与核心创新成果。

Google现象/趋势
00:00
字节 Seed:Research Feed(网页内嵌数据)
Seed Prover 1.5:全新 Agentic 架构,更强数学推理表现

字节跳动 Seed 团队发布形式化数学推理模型 Seed Prover 1.5,采用 Agentic 架构支持 Mathlib 搜索、Python 执行与增量引理验证,并引入 Sketch Model 将复杂证明拆解为子引理并行攻克。基于大规模 Agentic RL 训练,该模型在 16.5 小时内完成 IMO 2025 前 5 题获 35/42 分(金牌线),9 小时内解决 Putnam 2025 的 11/12 题,在 Putnam 历史集、Fate-H 和 Fate-X 上分别达 88%、80% 和 33% 通过率,刷新多项 SOTA。

智能体推理模型发布
12月23日
22:07
Hugging Face:Blog(RSS)
66
AprielGuard:现代大语言模型系统的安全与对抗鲁棒性护栏

ServiceNow AI团队在Hugging Face发布了AprielGuard框架。该框架专为提升LLM在生产环境中的安全性而设计,通过集成多层检测与过滤机制,防御对抗性攻击和恶意输入,以增强系统的整体稳健性。

Hugging Face安全/对齐部署/工程
13:08
Qwen:Blog Retrieval(API)
Qwen-Image-Edit-2511:提升一致性

Qwen Studio 集成聊天机器人、图像与视频理解、图像生成、文档处理、联网搜索、工具调用及 artifacts 等全栈 AI 功能。

产品更新图像生成多模态
03:00
OpenAI:Alignment 研究博客(RSS)
45
Helpful assistant 功能抑制新兴错位

研究发现,新兴错位现象不仅会激活错位的人格角色,同时也会抑制有帮助的助手人格。这一机制表明,在大型语言模型中,有害行为的显现可能伴随着有益助手功能的同步减弱。该发现揭示了模型行为动态中一种潜在的平衡或竞争关系,为理解和缓解AI错位问题提供了新的视角。

OpenAI安全/对齐论文/研究
00:00
Qwen:Blog Retrieval(API)
Qwen3-TTS 升级:支持语音克隆和语音设计!

Qwen3-TTS 新增语音克隆与语音设计能力,Qwen Studio 集成聊天机器人、图像视频理解、图像生成、文档处理、联网搜索、工具调用及 artifacts 等综合服务。

产品更新多模态语音
00:00
MiniMax:Blog(网页)
53
MiniMax M2.1:显著增强多语言编程能力,专为现实世界复杂任务打造

MiniMax 发布 M2.1 模型,是对 M2 的更新。其核心升级在于系统提升了在 Rust、Java、Golang 等多语言编程任务上的性能,并达到行业领先水平。同时,模型显著增强了原生 Android 与 iOS 开发能力,以及在 Web/App 场景下的设计理解与美学表达。M2.1 优化了复合指令约束以更好地支持办公场景,响应更简洁高效。该模型在 Claude Code、Cline 等各类编程工具与 AI 智能体框架中表现出色。在衡量全栈开发能力的 VIBE 新基准上,取得了平均 88.6 分的成绩。

开源/仓库模型发布编码
00:00
LMSYS:Blog(Chatbot Arena 团队)
SpecBundle与SpecForge v0.2发布:生产级投机解码模型与框架

SpecForge团队联合蚂蚁、美团、Nex-AGI与EigenAI发布SpecBundle第一阶段及SpecForge v0.2框架。SpecBundle提供基于大规模数据集训练的生产级EAGLE-3草稿模型,覆盖Llama-3.1/3.3/4、Qwen3、Kimi-K2等十余种主流架构,解决开源社区高质量草稿模型稀缺问题。SpecForge v0.2重构数据处理管道,数据再生速度提升10倍,并新增多后端支持,进一步增强系统可扩展性与生产就绪能力。

开源/仓库开源生态部署/工程
12月22日
08:00
xAI:News(网页)
精选
以 AI 支持 DOW 的使命

xAI 被美国战争部(DOW)选中,为其 GenAI.Mil 套件提供 Frontier AI 系统。基于 Grok 模型的解决方案将覆盖 DOW 旗下 300 万军事和文职人员,支持 Impact Level 5(IL5)级别的企业 AI 和关键任务用例,可嵌入从五角大楼到战术边缘的日常工作流,并支持机密作战工作负载。DOW 用户还可独家获取 X 平台实时全球洞察。

智能体xAI行业动态部署/工程
关联讨论 1 条xAI:News(网页)
推荐理由:xAI获美国国防部大单,Grok将覆盖300万军事人员并提供实时情报支持
08:00
xAI:News(网页)
Grok 发布 Collections API

Grok 推出 Collections API,支持上传 PDF、Excel、代码库等文件构建知识库,提供语义、关键词及混合搜索三种检索方式,帮助开发者零基础设施构建 RAG 应用。首周文件索引与存储免费,检索定价 $2.50/千次。基准测试显示,其在金融(93.0%)、法律(73.9%)、编码(86%)场景的检索准确率均优于 Gemini Pro 3 和 GPT 5.1。

检索增强xAI产品更新部署/工程
00:00
智谱:研究(网页内嵌数据)
精选
GLM-4.7:更强的 Coding

GLM-4.7 发布,编程能力显著提升。SWE-bench 达 73.8%(+5.8%),Terminal Bench 2.0 达 41%(+16.5%),支持 Claude Code 等主流智能体框架。新增交错式思考、保留式思考和轮级思考功能,可控制推理过程以降低延迟或提高准确性。同步改进 UI 生成、工具调用和数学推理能力,可通过 API 或本地部署使用。

智能体模型发布编码

推荐理由:智谱发布GLM-4.7,编程Agent能力大幅提升,支持Claude Code等主流框架和Vibe Coding。
12月19日
14:35
蚂蚁 inclusionAI:GitHub 新仓库
45
inclusionAI/HeartBench

HeartBench是一个面向心理学与社会科学领域的评估基准,旨在超越传统的知识与推理评测。该基准专注于衡量大语言模型在人机交互中拟人化的能力,覆盖了人格、情绪、社交技能及道德伦理等多个维度。它通过系统化的评估框架,为衡量模型是否具备更接近人类的心理与社会属性提供了量化标准。

安全/对齐论文/研究评测/基准
13:08
Qwen:Blog Retrieval(API)
Qwen-Image-Layered:通过分层分解实现内在可编辑性

Qwen Studio 集成聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索、工具调用及 Artifacts 等全栈能力,提供一站式多模态 AI 服务。

其他图像生成
12:47
公众号:豆包(字节)
17
豆包可以直接生成有声视频了
产品更新多模态
03:00
OpenAI:Alignment 研究博客(RSS)
51
规避评估意识与预测生产环境中的未对齐行为

研究团队提出了一种新流程,旨在发现模型未知的未对齐行为,并规模化创建贴近现实的评估方案。该方法通过规避模型对评估的“警觉性”,直接模拟真实生产环境中的使用场景,从而更有效地暴露潜在风险。该流程能够系统性地生成高质量评估数据集,提升对前沿模型在复杂、开放环境中行为的预测能力,为人工智能安全评估提供了可扩展的工具。

OpenAI安全/对齐评测/基准
00:00
LMSYS:Blog(Chatbot Arena 团队)
SGLang实现扩散LLM框架:支持LLaDA 2.0-flash

Ant Group DeepXPU团队与SGLang团队合作,在SGLang推理引擎中实现了扩散大语言模型(dLLM)框架,为100B参数的LLaDA 2.0-flash提供首日支持。该方案复用现有Chunked-Prefill机制适配Block Diffusion架构,通过修改prefill adder和chunked reqs组件实现多Diffusion Blocks批处理,无需改动SGLang核心即可继承生产级推理优化,并支持用户灵活定制扩散解码算法。

开源/仓库推理部署/工程
12月18日
18:00
公众号:小红书技术(dots.llm)
42
NeurIPS2025|小红书AIGC团队提出布局可控生成框架InstanceAssemble

小红书AIGC团队在NeurIPS2025上提出全新布局可控生成框架InstanceAssemble,专用于复杂场景下的Layout-to-Image任务。该框架通过从布局条件中引导图像生成,实现了对多对象位置、大小及空间关系的精确控制,解决了现有模型在密集布局下对象漏生、重叠等难题。

图像生成多模态论文/研究
16:11
公众号:豆包(字节)
53
豆包大模型1.8发布,Seedance模型同步升级

字节跳动发布豆包大模型1.8版本,同步升级Seedance模型。

多模态模型发布
09:00
公众号:蚂蚁百灵(Ling)
32
AEnvironment - 面向 Agentic RL 时代的环境系统,开箱即用,万物互联

AEnvironment 是专为 Agentic RL 打造的基础设施,将环境搭建从写脚本转变为调用服务,实现开箱即用和万物互联。

智能体开源/仓库部署/工程
08:00
OpenRouter:Announcements(RSS)
精选57
OpenRouter 推出 Response Healing:将 JSON 缺陷减少 80% 以上

OpenRouter 推出 Response Healing 新功能,可在响应到达应用前自动修复大语言模型产生的格式错误的 JSON,从而将 JSON 缺陷减少 80% 以上。

产品更新部署/工程

推荐理由:如果你无数次被 LLM 返回的残缺 JSON 搞到崩溃,OpenRouter 这个 response healing 能自动修复 80% 的缺陷,以后 debug 可以少肝半小时。
08:00
OpenRouter:Announcements(RSS)
54
OpenRouter 12月发布亮点:结构化输出响应修复、聊天室通知与长上下文模型排名

OpenRouter 推出结构化输出的响应修复(Response Healing)功能,新增聊天室通知,发布长上下文模型排行榜,并位列 Brex 增长最快 AI 基础设施榜单第一。

产品更新部署/工程
08:00
OpenRouter:Announcements(RSS)
40
OpenRouter 十二月发布:响应修复、聊天室通知、长上下文模型排名,登顶 Brex 最快增长 AI 基础设施榜单

OpenRouter 十二月版本更新引入响应修复(Response Healing)机制以提升结构化输出可靠性,新增聊天室通知功能,并推出长上下文模型排名。此外,OpenRouter 在 Brex 评选的增长最快 AI 基础设施公司榜单中位列第一。

产品更新部署/工程
08:00
OpenRouter:Announcements(RSS)
47
OpenRouter Response Healing 上线:将 JSON 错误减少 80%+

OpenRouter 推出 Response Healing 新功能,可在 JSON 响应到达应用程序之前自动修复大语言模型输出的畸形 JSON,从而将 JSON 缺陷减少 80% 以上。

产品更新编码
‹ 上一页
1…4041424344…50
下一页 ›