AIHOT

全部动态

全部一手资讯 X 论文

4月28日周二

4月27日周一

4月26日周日

4月25日周六

4月24日周五

4月28日

13:33

Alibaba Cloud@alibaba_cloud

Qwen3.6全系列模型已在NetMind平台上线，专为不同生产场景的智能体应用设计。该系列包含三个模型：Qwen3.6-Plus专注于前沿推理和长上下文，适用于复杂编码任务；Qwen3.6-Flash强调速度、规模和成本效益，适合大规模实时编码辅助；Qwen3.6-35B-A3B提供开源权重和Apache 2.0许可，支持自主托管和微调。所有模型共享高效的混合架构，具备函数调用和推理能力，并运行在NetMind的低延迟基础设施上，提供统一的OpenAI兼容端点。平台还提供即用代码，便于开发者快速集成和使用。

NetMind.AI: We're thrilled to announce that the full Qwen3.6 family, built for real-world agents at every scale with benchmark-toppi...

智能体模型发布编码

11:50

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/Ling-2.6-flash-fp8

inclusionAI 团队发布了 Ling-2.6-flash-fp8 模型，致力于通过开源与开放科学推动人工智能的发展与普及。该版本采用 FP8 精度优化，显著提升了推理效率并降低了计算资源消耗，是其在推进技术民主化进程中的最新实践。

开源/仓库模型发布端侧

11:27

蚂蚁 inclusionAI：HuggingFace 新模型

精选55

inclusionAI/Ling-2.6-flash

inclusionAI发布了Ling-2.6-flash模型。该模型是其开源语言模型系列的最新成员，旨在通过开源与开放科学推动人工智能的进步与民主化。此次发布延续了团队降低AI技术使用门槛、促进更广泛社区参与开发的使命。

开源/仓库模型发布端侧

推荐理由：蚂蚁 inclusionAI 的 Ling-2.6-flash 上线 HuggingFace，名字带 flash 大概率是轻量推理模型，但官方描述几乎空白，没有 benchmark 也没有用例，建议等社区实测再决定是否投入精力。

10:47

Simon Willison 博客

介绍 talkie：一个源自1930年的130亿参数复古语言模型

Nick Levine、David Duvenaud 和 Alec Radford 发布了 talkie，这是一个基于1931年前历史英文文本训练的130亿参数语言模型。其基础版本在2600亿token的已过版权数据上训练，而指令微调版本则用于驱动聊天界面。该版本借助Claude等现代模型生成合成数据进行训练，可能导致年代错位的知识污染。项目旨在探索此类模型预测未来、超越知识截止点进行发明等能力，并希望最终构建一个完全由复古模型自举的训练流程。模型采用Apache 2.0许可。

开源/仓库数据/训练模型发布端侧

10:47

Hacker News 热门（buzzing.cc 中文翻译）

Talkie：一款诞生于1930年的13B复古语言模型

Talkie是一款参数规模为130亿的复古风格语言模型，其设计灵感源于1930年代的语言特征与表达方式。该模型通过模拟特定历史时期的语料与文风，在文本生成中呈现出独特的复古韵味。项目已在官网发布，并在Hacker News社区获得102点热度关注。这一尝试展示了语言模型在风格化与历史语境模拟方面的技术拓展。

开源/仓库数据/训练模型发布

10:45

歸藏(guizang.ai)@op7418

作者表示将尝试为Codepilot用户争取免费的Token补贴。这一考虑基于小米MiMo -V2.5系列模型的开源动态，该模型采用MIT协议，允许自由商用、二次训练与微调。同时，小米推出了Orbit 100T Token计划，包含面向AI builder的"百万亿Token创造者激励计划"和面向Agent框架团队的"Agent生态共建计划"。激励计划为通过申请的用户提供Token支持，如最高16亿Credits。作者意图借鉴此机制为Codepilot社区谋取福利。

歸藏(guizang.ai): 小米 MiMo -V2.5 系列模型全部开源采用宽松的 MIT 协议,允许自由商用、二次训练与微调,无需额外授权。同时他们还推出了Orbit 100T Token 计划。这个太牛批了!如果你有自己 Vibe Coding 一些东西可以...

开源/仓库模型发布

10:42

歸藏(guizang.ai)@op7418

精选74

小米 MiMo-V2.5 系列模型全部开源

小米正式开源MiMo-V2.5系列模型，采用宽松的MIT协议，允许自由商用、二次训练与微调。该系列包含两个支持100万token上下文窗口的模型：专为复杂Agent和编码任务设计、在多项评测领先的MiMo-V2.5-Pro，以及具备强大Agent能力的原生全模态模型MiMo-V2.5。同时，小米推出Orbit 100T Token计划，包含面向AI开发者的“百万亿Token创造者激励计划”，提供最高价值659元的Credits，以及面向Agent框架团队的“Agent生态共建计划”，为其用户提供MiMo token限免支持。

Xiaomi MiMo: Xiaomi MiMo-V2.5 is now officially open-sourced! MIT License, supporting commercial deployment, continued training, and ...

智能体开源/仓库模型发布端侧

关联讨论 3 条

推荐理由：小米把 MiMo-V2.5 全线 MIT 开源，Pro 版在 agent 和编码榜单冲到开源第一，百万亿 Token 激励计划更是直接送钱让你用，做 Vibe Coding 的人没理由不去薅一把。

09:45

meng shao@shao__meng

精选75

小米开源MiMo-V2.5系列大模型

小米正式开源MiMo-V2.5系列模型，包含专注于代码代理的1T参数MoE模型MiMo-V2.5-Pro，以及支持多模态代理的310B参数MoE模型MiMo-V2.5，两者均支持1M上下文长度。其架构核心采用混合注意力、多Token预测和稀疏MoE技术，以支撑万亿参数规模下的高效长文处理。后训练基于MOPD范式，通过多教师策略蒸馏提升模型综合能力。同时，小米推出100T Token的创造者激励计划，为开发者提供免费计算资源以鼓励创新。模型已在Hugging Face平台开源。

Fuli Luo: Just dropped two open-source models: MiMo-V2.5-Pro (Code Agent, 1T total) and MiMo-V2.5 (Multimodal Agent, 310B total). ...

智能体开源/仓库模型发布端侧

关联讨论 3 条

推荐理由：小米把万亿参数 MoE 做到开源且百万上下文，MTP 三层原生集成让推理速度翻三倍，这在国内大厂开源里是第一个真正敢放权重的万亿级模型，做 Agent 的值得认真看看。

07:23

Berryxia.AI@berryxia

小米开源MiMo-V2.5系列模型，支持百万token上下文

小米正式开源MiMo-V2.5系列模型，采用MIT许可证，允许商业部署、持续训练和微调。两个模型均支持100万token上下文窗口：MiMo-V2.5-Pro专为复杂Agent和编码任务设计，在开源模型的GDPVal-AA和ClawEval基准测试中排名第一；MiMo-V2.5是原生多模态模型，具备强大的Agent能力。小米强调，模型的价值不应仅由排行榜衡量，而应取决于其解决实际问题的能力。

Xiaomi MiMo: Xiaomi MiMo-V2.5 is now officially open-sourced! MIT License, supporting commercial deployment, continued training, and ...

智能体开源/仓库模型发布编码

04:26

AK@_akhaliq

小米 MiMo-V2.5 已在 Hugging Face 发布 https：//huggingface.co/collections/XiaomiMiMo/mimo-v25

多模态开源/仓库模型发布

03:45

Fuli Luo@_LuoFuli

精选76

小米宣布开源两个大模型：专攻复杂智能体和编码任务的MiMo-V2.5-Pro，以及原生全模态模型MiMo-V2.5。两者均支持100万token的上下文长度，并采用允许商业部署和微调的MIT许可证。同时，小米为开发者和创作者提供了100万亿token的免费额度，鼓励基于此构建应用。模型的价值不仅在于其在GDPVal-AA和ClawEval等基准测试中的排名，更在于其解决实际问题的能力。

Xiaomi MiMo: Xiaomi MiMo-V2.5 is now officially open-sourced! MIT License, supporting commercial deployment, continued training, and ...

智能体开源/仓库模型发布编码

关联讨论 3 条

推荐理由：小米这次把 1T 参数的 Code Agent 模型直接 MIT 开源，还送 100T 免费 token，诚意拉满。做 coding agent 的团队值得认真看看，这可能是目前开源阵营里最强的代码智能体基座。

01:48

Xiaomi MiMo@XiaomiMiMo

精选71

小米开源MiMo-V2.5双模型，支持百万上下文与商用

小米正式开源MiMo-V2.5系列模型，采用MIT许可，支持商业部署、继续训练与微调。该系列包含两个支持100万令牌上下文窗口的模型：MiMo-V2.5-Pro专为复杂智能体和编码任务设计，在GDPVal-AA和ClawEval基准测试中位列开源模型第一；MiMo-V2.5则是具备强大智能体能力的原生全模态模型。官方强调，模型的价值不仅在于排名，更在于其解决实际问题的能力，并已公开模型权重与技术博客。

智能体开源生态模型发布编码

关联讨论 3 条

推荐理由：小米把 MiMo-V2.5 直接 MIT 开源且支持商用，1M 上下文 + Agent 能力在开源阵营里确实能打，做 Agent 产品的团队值得花半小时跑一下 benchmark 看看真实水平。

01:27

公众号：小米 MiMo

小米 MiMo-V2.5 系列开源 & Orbit 百万亿 Token 计划启动

小米开源 MiMo-V2.5 系列模型，同时启动 Orbit 百万亿 Token 计划，携手全球开发者与 Agent 框架共建开源繁荣生态。

智能体开源生态模型发布

4月27日

19:20

IT之家（RSS）

精选74

阿里：视频生成模型 HappyHorse1.0 开启灰测，千问 App 首发支持 15 秒多镜头叙事

阿里巴巴视频生成模型 HappyHorse1.0 开启灰度测试，支持生成15秒多镜头叙事视频，具备多画幅适配和1080P超分输出功能。官网720P视频生成刊例价为0.9元/秒，千问App上体验价格低至0.44元/秒。大众用户可通过千问App使用，还能创作粤语、英语、法语、韩语等多种语言的剧情短片。该模型此前登顶AI Video Arena排行榜，并将于5月份正式发布商用。

多模态模型发布

关联讨论 2 条

推荐理由：HappyHorse 悄悄登顶 AI Video Arena 后才被阿里认领，这个反转让它不只是又一个视频模型。0.44 元/秒的定价对内容创作者是真金白银的信号，做短视频的值得现在就去千问 App 试一轮。