AIHOT

全部动态

全部一手资讯 X 论文

6月3日周三

6月2日周二

6月3日

03:03

The Verge：订阅版科技（RSS）

微软首个高级推理 AI 模型 MAI-Thinking-1 在 Build 2026 发布

微软在 Build 2026 开发者大会上发布了其首个高级推理 AI 模型 MAI-Thinking-1。该模型是此次发布的七款新模型之一，标志着微软在提升模型复杂推理能力方面迈出新步伐。

Microsoft推理模型发布

02:47

Chubby♨️@kimmonismus

Mai-1 thinking：中型模型，45b 活跃参数，MoE，与 Sonnet 4.6 并列 0 知识蒸馏 "微软的首个推理模型"

Chubby♨️: Mustafa Suleyman, Microsoft AI: 7 new Microsoft Models, no end in sight when it comes to development, orders of magnitud...

Microsoft推理模型发布

02:47

Artificial Analysis@ArtificialAnlys

Microsoft发布MAI-Transcribe-1.5语音转录模型

微软AI发布了MAI-Transcribe-1.5语音转录模型。该模型在AA-WER排行榜上位列第三，词错误率（WER）为2.4%，仅次于阿里巴巴的Fun-Realtime-ASR-preview（1.7%）和ElevenLabs Scribe v2（2.2%）。其主要特点是速度极快，处理速度约为276倍实时，是准确率前十模型中第二快模型速度的两倍以上，因此在准确率-速度帕累托前沿上处于领先地位。模型还支持关键词偏差识别，并涵盖包括英语、法语、阿拉伯语、日语和中文在内的43种语言。

Microsoft模型发布语音

02:45

The Verge：AI（RSS）

精选78

微软首款高级推理AI模型MAI-Thinking-1发布

微软在Build 2026上发布了其首款高级推理AI模型MAI-Thinking-1。该模型被定位为“中等规模”，能在“关键”软件工程基准测试中达到领先模型的水平。微软称其完全从头使用干净数据进行训练，未涉及从第三方模型进行知识蒸馏。这标志着微软在自研AI模型上迈出重要一步，此前其主要依赖OpenAI。近期两家公司已重新协商合作协议，关系有所松绑。

Microsoft推理模型发布

关联讨论 4 条

推荐理由：微软自己从头训练的推理模型，不用任何第三方蒸馏数据，这可能是微软系 Agent 和 Copilot 底座更换的信号，值得盯着看。

02:23

🚨 AI News | TestingCatalog@testingcatalog

微软发布 MAI Code 1 Flash 和 MAI Thinking 1 等新模型

微软在官网更新了 MAI 模型系列，重点发布了 MAI Code 1 Flash 和 MAI Thinking 1。MAI Thinking 1 拥有 35B 活跃参数和约 1T 总参数，采用 MoE 架构，其推理成本低于更大型模型，但在 SWE-Bench Pro 上的表现可与 Claude Opus 4.6 竞争。MAI Code 1 Flash 则专注于通过规划和推理来完成端到端的复杂编码任务。此外，MAI Image 2.5、MAI Voice 2 及 MAI Transcribe 1.5 也同步上线。

Microsoft多模态推理模型发布

01:17

Artificial Analysis@ArtificialAnlys

Krea 2 Medium在AI文生图排行榜位列第6，性能与定价引发关注

Krea AI自研的文生图模型Krea 2 Medium在Artificial Analysis排行榜上位列第6，仅落后于OpenAI、Google和NVIDIA的模型。值得注意的是，体积更小、速度更快的Medium版本在排名上超过了定位更强大的Large版本。两款模型均支持通过API进行风格迁移和创意控制等操作，生成1K分辨率图像。定价方面，Krea 2 Medium为30美元/千张，Krea 2 Large为60美元/千张。

图像生成模型发布评测/基准

6月2日

22:40

Hugging Face：Blog（RSS）

精选73

Holo3.1：快速本地计算机使用智能体

Holo3.1 是基于 Qwen 模型家族的计算机使用智能体系列，旨在提升在桌面、网页和移动环境中的鲁棒性。新模型提供 0.8B、4B、9B 和 35B-A3B 四种尺寸，并首次发布量化检查点，包括 FP8、Q4 GGUF 和 NVFP4，以优化本地推理。在 AndroidWorld 基准测试中，35B-A3B 模型得分从 67% 提升至 79.3%。在 DGX Spark 上，NVFP4 量化相比 BF16 实现 1.74 倍 token 吞吐量提升，并将平均步骤时间从 6.8 秒缩短至 3.3 秒。模型支持函数调用协议，可在第三方智能体框架中部署。

智能体Hugging Face开源/仓库模型发布

推荐理由：Holo3.1 把计算机使用代理从桌面扩展到了移动端，还首次放出了量化版，让本地运行真正快了起来。想做 GUI 自动化的开发者可以立刻跑起来了。

21:06

StepFun@StepFun_ai

阶跃星辰发布 Step 3.7 Flash 模型，强调其为快速智能体编程设计，具备可靠的工具调用与多模态理解能力。该模型采用开放权重。同期，MiniMax 也开源了 M3 模型。两者已均在 Kilo 中上线。此次发布凸显了开放权重模型正从模型卡片走向实际编程工作流的趋势。

Kilo: The open-weight labs did not come to play this week. StepFun dropped Step 3.7 Flash. MiniMax dropped M3. Both with open ...

MCP/工具开源/仓库模型发布编码

关联讨论 3 条

17:13

MarkTechPost（RSS）

阿里巴巴通义千问团队在百炼平台发布 Qwen3.7-Plus

通义千问（Qwen）团队在百炼平台发布了多模态智能体模型 Qwen3.7-Plus。该模型能理解图像和视频，并新增了自我编程、工具调用、深度推理和自主迭代能力。

智能体多模态模型发布

16:53

MiniMax (official)@MiniMax_AI

MiniMax发布M3模型，宣称是首个将编程与智能体能力、1M上下文长度及原生多模态三大前沿能力结合的开源权重模型。其编程与智能体能力在多个评测中表现突出：SWE-Bench Pro得分59.0%，Terminal Bench 2.1得分66.0%，SWE-fficiency 34.8%，KernelBench Hard 28.8%，MCP Atlas 74.2%。模型通过MiniMax Sparse Attention技术支持1M上下文。官方提供了API接入与新的MiniMax Code服务，模型权重和技术报告预计约10天后发布。

MiniMax (official): Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...

多模态推理模型发布编码

关联讨论 10 条

16:13

MarkTechPost（RSS）

JetBrains 发布 Mellum2：用于多模型 AI 流水线快速专用任务的 12B MoE 模型

JetBrains 发布开源模型 Mellum2。该模型为 12B 参数的 MoE 架构，在 10.6 万亿个 token 上训练，采用 Apache 2.0 许可，专为多模型 AI 流水线中的快速、专用任务设计。

开源生态模型发布部署/工程

14:07

IT之家（RSS）

JetBrains 开源 Mellum2 模型：12B 参数，升级为 AI 智能体编程助手

JetBrains 开源了面向软件工程的模型 Mellum2。该模型总规模为 12B 参数，采用稀疏 Mixture-of-Experts 框架，激活参数量为 2.5B。上下文窗口扩展至 131072 Token。Mellum2 支持生成编辑代码、调用外部工具及执行多步骤智能体式工作流。模型基础版、指令版和思考版均以 Apache 2.0 许可证开源。

开源生态模型发布编码

13:36

StepFun@StepFun_ai

我们可能对"可用性"的讨论还不够。当Flash模型同时将速度、成本和智能带入"可用"范围时，智能的供给方式发生了结构性变化。

E01: A Lab note for Step 3.7 Flash launch. -- When Flash models bring speed, cost, and intelligence into the "usable" range a...

推理模型发布

关联讨论 3 条

12:35

SenseTime@SenseTime_AI

精选73

感谢使用我们的模型来创建这些复杂的图表和图表。看到具有挑战性的信息被转化为清晰、准确和可读的视觉效果真是太棒了。这就是我们的目标。😄

The AI Colony: SenseNova U1 just released an infographic-specialized version and +18.2 on IGenBench Q-ACC isn't a rounding error. It me...

Hugging Face图像生成开源生态模型发布

关联讨论 1 条

推荐理由：SenseNova U1 这波信息图特化不是刷分，+18.2 Q-ACC 证明模型真的懂了排版，做汇报、做图表的可以直接上 Hugging Face 扒下来用。

12:35

SenseTime@SenseTime_AI

将复杂信息转化为准确的图表和示意图。这就是 SenseNova-U1-8B-MoT-Infographic。了解更多：https：//x.com/SenseTime_AI/status/2061465029959209106？s=20

Future Stacked: AI-generated infographics with garbled text have been a running joke. SenseNova U1's new infographic-enhanced model fina...

Hugging Face图像生成多模态模型发布

关联讨论 1 条

12:06

StepFun@StepFun_ai

阶跃星辰发布其推理优化型模型Step 3.7 Flash。该模型为196B MoE架构，从设计之初就专注于推理效率。其采用多矩阵分解注意力机制，使KV-cache成本仅为DeepSeek模型的约22%；同时通过注意力与FFN解耦技术，实现了硬件优化的高效服务。该模型已通过Fireworks AI提供，采用Apache 2.0许可，并可用于构建智能体应用。

Fireworks AI: Many research labs only consider inference efficiency after the fact. Step 3.7 Flash is a 196B MoE model, and built for ...

智能体开源/仓库推理模型发布

关联讨论 3 条

11:53

MiniMax (official)@MiniMax_AI

MiniMax宣布推出首个开源权重模型M3。该模型结合了三大前沿能力：在编程与智能体方面，它在SWE-Bench Pro等评测上取得了具体分数；通过MiniMax Sparse Attention技术，其上下文窗口可扩展至1M tokens；并且模型从零开始原生支持多模态。模型的权重与技术报告将在约10天后发布。

MiniMax (official): Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...

开源生态模型发布编码

关联讨论 10 条

10:36

Alibaba Cloud@alibaba_cloud

阿里云发布通义千问3.7-Plus多模态智能体模型

阿里云推出Qwen3.7-Plus，这是一个统一视觉与语言的多模态智能体模型。其定位为多功能编码智能体与生产力助手，支持全模态输入，能够跨GUI与CLI执行任务。该模型具备视觉智能体能力，涵盖感知、推理、定位及搜索增强问答，并能跨多种智能体框架泛化。目前已在阿里云百炼平台通过API上线。

智能体多模态模型发布

关联讨论 9 条

10:07

IT之家（RSS）

AI 气象模型 WeatherMesh-6 发布，预报精度超欧洲政府机构顶尖系统

初创企业 WindBorne Systems 今日发布第六代气象模型 WeatherMesh-6。该模型预报精度已超越欧洲中期天气预报中心（ECMWF）的传统与AI预报产品，其提前五天的地表气温预报准确度相当于传统模型提前一天的水平。WindBorne Systems 通过全球15个站点约400只探空气球自主采集数据，形成“自研模型+自主数据源”的核心优势。该公司于2024年完成2500万美元融资，估值8500万美元。

数据/训练模型发布

09:07

IT之家（RSS）

微软首个自研推理 AI 模型 MAI-Thinking-1、新 Copilot 超级应用曝光

微软将在 Build 2026 大会上发布首个自研推理模型 MAI-Thinking-1，该模型未使用其他模型输出进行知识蒸馏训练。同期还将发布 MAI-Image-2.5 和 MAI-Image-2.5-Flash 图像生成模型，以完善其自有模型矩阵。此外，微软可能展示整合了多个 AI 助手及 Scout AI agent 的 Copilot 超级应用新形态，但该功能测试版预计要到夏末才会推出。

Microsoft推理模型发布

08:19

MiniMax (official)@MiniMax_AI

🚀 M3 已在 Vercel 的 AI Gateway 上线！我们首个支持 1M token 长上下文和多模态输入的模型。本周享 50% 折扣 🎉 期待看到大家用 M3 和 @vercel_dev 构建什么 ✨

Vercel Developers: MiniMax M3 is available on AI Gateway. MiniMax's first long-context model, with support for multimodal inputs. 50% off f...

多模态模型发布

关联讨论 10 条

07:54

ginobefun@hongming731

MiniMax发布开源模型M3：集成编码、长上下文与多模态

MiniMax开源发布了国内首个集成前沿Coding能力、1M超长上下文和原生多模态的模型M3。该模型能在24小时内自主完成145次CUDA算子迭代。与此同时，xAI前负责人指出，视频模型的上限将由LLM决定，下一个类似Sora的产品应是视频Agent，而非单纯的视频生成模型。

多模态开源/仓库模型发布编码

07:35

Alibaba Cloud@alibaba_cloud

通义千问 Qwen3.7-Plus 多模态代理模型发布

阿里云发布了 Qwen3.7-Plus，这是一款统一了视觉与语言能力的多模态代理模型。该模型旨在成为通用的代理基础，支持图形界面与命令行操作，能够处理视觉和文本任务，充当编程代理和效率助手。其能力涵盖视觉感知、推理、目标定位以及搜索增强问答，并可跨多种代理框架进行泛化。该模型现已在阿里云百炼平台提供 API 服务。

智能体多模态模型发布编码

关联讨论 9 条

07:19

MiniMax (official)@MiniMax_AI

精选81

M3 on Cloudflare AI Gateway， day one ⚡ 前沿编码能力，1M 上下文，原生多模态，现在一次 fetch 即可调用。是时候构建些东西了。 🦞

Cloudflare Developers: M3 from @MiniMax_AI is now available on Cloudflare AI Gateway: - First open model to push SOTA coding frontier - 1M cont...

多模态开源/仓库模型发布编码

关联讨论 10 条

推荐理由：MiniMax的M3把开源编码模型拉到新高度，1M上下文加原生多模态是惊喜，上线首周5折，值得跑一下看是不是真能干翻闭源。