@MiniMax_AI M3 is now live on Qubrid AI. https://platform.qubrid.com/model/minimax-m3 - 1M-token context. - Native multi...
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)@MiniMax_AI M3 is now live on Qubrid AI. https://platform.qubrid.com/model/minimax-m3 - 1M-token context. - Native multi...
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)NVIDIA 的 Cosmos 3 全模态世界模型在 Artificial Analysis 排行榜的开放权重类别中,同时夺得文本生成图像和图像生成视频两项第一。该模型基于 Mixture-of-Transformers 架构,结合自回归推理器与扩散生成器,提供 16B 参数的 Nano 和 64B 参数的 Super 等变体。其中,Cosmos3-Super-Text2Image 与 Cosmos3-Super-Image2Video 版本分别超越了 HiDream-O1-Image-Dev-2604、通义千问(Qwen)Image Max 2512、FLUX.2 [dev] 以及 LTX-2、万相(Wan)2.2 A14B 等模型。Cosmos 3 的生成器接受结构化 JSON 提示词,可通过外部工具或模型自身的推理器分支进行提示词上采样。该模型完全开源,采用 OpenMDW 1.1 许可,提供权重、代码、精选数据集和微调方案。
关联讨论 1 条HuggingFace Daily Papers(社区热门论文)英伟达发布了 Cosmos 3,这是一个用于物理 AI 推理的世界和行动模型。该信息来源于英伟达开发者博客,发布日期为 2026 年 6 月 1 日。
关联讨论 1 条HuggingFace Daily Papers(社区热门论文)Mellum2 是 JetBrains 从头训练的 12B 参数混合专家(MoE)模型,专注于自然语言与代码。每个 token 仅激活 2.5B 参数,推理速度可达同类模型的 2 倍以上,适合高吞吐、低延迟场景。该模型支持路由、RAG、摘要、子智能体及私有部署,以 Apache 2.0 许可证开源。在代码生成、推理、科学和数学基准测试中,Mellum2 与同等规模的开放模型竞争力相当。
Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)MiniMax M3 turned a napkin sketch into a playable game We handed MiniMax M3 a hand-drawn draft of a Doodle Jump style pl...
大多数AI模型在生成图表时存在数值错误(如负值显示为正)、柱状图位置偏移、元素关系混乱等问题。SenseNova-U1-8B-MoT-Infographic(SenseNova-U1)专为解决此类图表生成问题而设计,能够生成准确的图表,并支持实时调整设计和布局。项目在Hugging Face提供了模型,并在GitHub展示了效果案例。
关联讨论 1 条X:商汤 SenseTime (@SenseTime_AI)中国AI公司MiniMax发布了新模型M3。它被定位为首个同时具备顶级编码性能、100万token上下文窗口以及原生多模态能力的开源权重模型。
Nvidia在GTC台北大会上发布了一系列面向机器人、自动驾驶和视频系统的模型。核心发布包括升级版世界模型Cosmos 3、显著扩展规模的驾驶模型Alpamayo 2 Super,以及一个开源的人形机器人参考平台。这些产品共同推进了其在物理AI领域的布局。
根据Artificial Analysis基准评估,Nvidia发布的Nemotron 3 Ultra模型被评为目前最强大的美国开源大语言模型。但这一成就并未改变中国在开源大语言模型领域仍然保持领先的格局。
Introducing Cosmos 3: Our latest frontier model for Physical AI Cosmos 3 is the world's first fully open omnimodel with ...
关联讨论 1 条HuggingFace Daily Papers(社区热门论文)MiniMax M3 现已在 SiliconFlow 平台上线,并提供限时7天的50%折扣。定价为:缓存 $0.06、输入 $0.30、输出 $1.20(每百万 token)。M3 是首个同时具备三大前沿能力的开源模型:一是编码与智能体能力,在 SWE-Bench Pro 评测中击败了 GPT-5.5 和 Gemini 3.1 Pro;二是支持 100万 token 上下文窗口(通过 MiniMax Sparse Attention 技术实现);三是具备原生多模态能力,支持图像、视频与计算机操作。
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)跟祖传的 20K context 说 bye bye 了。 MiniMax M3 发布了,三个亮点: 1M context、原生多模态、Agentic。 我这次做了一次完整评测,使用CC workflow 、 @ZenMuxAI和MiniM...
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)Nemotron 3 Ultra is coming this week. ⌛️
Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)MiniMax M3 scores 90.3% GPT 5.5 Scores 92.4% Just a 2.1% gap now at @convex. Incredible to see the open-source models cl...
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)🚀 We're launching MiniMax M3 from @MiniMax_AI on Novita AI as a Day-0 API launch partner. The first open-weights model ...
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)KwaiKeye开源了多模态大模型Keye VL 2.0-30B-A3B,采用Apache 2.0许可。该模型总参数为30B,但仅激活3B参数。其核心亮点是通过DeepSeek稀疏注意力技术实现了256K的上下文长度。该模型的视频理解能力表现出一个反直觉的特性:喂入的帧数越多,其准确率反而持续上升。在基准测试中,其表现已与Qwen3 VL、Gemini 3 Flash等模型相当。
Keye VL 2.0-30B-A3B 🔥 New multimodal model from @KwaiKeye ✨ 30B/3B active - Apache 2.0 ✨ 256K context via DeepSeek Spar...
MiniMax 发布了其大版本号模型升级 MiniMax M3。该模型标配 1M 超长上下文,采用新的 MSA(MoE with Segment-wise Attention)稀疏注意力架构,在 100 万上下文下每 token 计算量降至约上一代的 1/20。M3 从训练起即融合了原生多模态能力。在基准测试中,其取得了 SWE-Bench Pro 59.0%、Terminal Bench 2.1 66.0%、MCP Atlas 74.2% 等成绩。此外,其 API 推出小于 512k 调用的限时七天五折优惠。模型权重与技术报告预计约 10 天后发布。
Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)🚀 @MiniMax_AI M3 is now available on OrcaRouter. One of the most anticipated open model releases, bringing next-gen spa...
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)英伟达推出全球首款全开源全模态物理AI大模型Cosmos 3。该模型基于混合Transformer架构,可在单一系统中融合文本、图像、视频、音效及动作内容的理解与生成,将物理AI的训练与评估周期从数月缩短至数日。Cosmos 3在Artificial Analysis、Physics-IQ等多个评测基准上排名第一,提供Super和Nano版本用于机器人与自动驾驶的训练与实时推理,Edge版本即将推出。
关联讨论 1 条HuggingFace Daily Papers(社区热门论文)MiniMax发布了新开源权重模型M3,现已通过API和MiniMax Agent提供服务。该模型在SWE-Bench Pro上得分59.0%,在Terminal Bench 2.1上得分66.0%,并支持高达1M的上下文窗口。同时,MiniMax Agent更新了持久记忆与进化技能等能力。此外,MiniMax Code也已发布,模型权重与技术报告将在约10天后公开。
Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)NVIDIA 发布 Cosmos 3,基于 Mixture-of-Transformers(MoT)架构的开源全能模型,统一世界生成、场景理解、因果推理和策略生成。该模型通过自回归与扩散子序列联合注意力,在单一前向过程中处理文本、图像、视频、音频和动作等多模态。本次发布包含两个版本:Cosmos 3 Nano(16B 参数,8B 推理器 + 8B 生成器,面向工作站级 GPU)和 Cosmos 3 Super(64B 参数,32B + 32B,面向 Hopper 和 Blackwell GPU,用于大规模合成数据生成与研究)。两者均已上架 Hugging Face,并提供 Diffusers 集成、GitHub 后训练脚本和开源合成数据数据集。
关联讨论 1 条HuggingFace Daily Papers(社区热门论文)英伟达发布面向AI智能体的开源模型Nemotron 3 Ultra,其为5500亿参数的混合专家模型。相较于同级别开源模型,该模型推理速度最高提升5倍,使用成本最高降低30%。模型已适配Hermes Agent、LangChain Deep Agents等主流框架,并已助力CrowdStrike、Palantir等企业构建智能体系统。该模型预计于6月4日通过Hugging Face、ModelScope等平台以NVIDIA NIM微服务形式提供。
关联讨论 4 条X:Perplexity (@perplexity_ai)X:opencode (@opencode)LMSYS:Blog(Chatbot Arena 团队)X:Kim (@kimmonismus)英伟达开源了 Alpamayo 2 Super 视觉-语言-动作(VLA)模型,参数规模从 100 亿增至 320 亿。该模型支持 360 度感知与推理式自动标注,专为研发 L4 自动驾驶设计。模型可通过知识蒸馏压缩,部署于 DRIVE AGX Thor 芯片。代码与权重将在夏季于 GitHub 和 Hugging Face 开源。
NVIDIA在Computex上发布了Nemotron 3 Ultra,总参数达550B(激活参数55B),是目前最大的Nemotron 3模型。该模型在美国开放权重模型中智能性最强,在Artificial Analysis Intelligence Index评测中得分为48,超越了Gemma 4 31B(39分),但仍落后于月之暗面(Kimi)的K2.6(54分)。在推理速度方面,其在预发布端点上超过了300 tokens/s,远高于同级别中国模型通常的50-100 tokens/s。该模型将提供BF16权重及NVFP4量化版本以提升推理性能。
关联讨论 4 条X:Perplexity (@perplexity_ai)X:opencode (@opencode)LMSYS:Blog(Chatbot Arena 团队)X:Kim (@kimmonismus)英伟达 CEO 黄仁勋在 2026 台北电脑展宣布,下一代 AI 超级芯片平台 Vera Rubin 全面投产。该平台是 POD 级基础架构,与上一代 Grace Blackwell 平台相比,其大规模智能体吞吐量提高了 10 倍。凭借开源 MGX 设计,其供应链规模是 Grace Blackwell 的两倍,产品预计于今年秋季开始发货。
MiniMax M3 is now live on CREAO. Sparse-attention reasoning with up to 15.6× faster decoding at long context, built for ...
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)The new MiniMax-M3 is their first model to have 1m context, multimodal, and agentic coding capability. Congratulations t...
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)Congrats to the @MiniMax_AI team on the release of M3! 👉 A frontier-class open-weight model 👉 1M context window 👉 Nat...
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)MiniMax M3 是一个开源前沿模型,具备先进的编码与AI智能体能力。它支持100万token的超长上下文窗口,并采用名为MSA(MiniMax Sparse Attention)的新型稀疏注意力架构。该架构使模型在100万token上下文下的每token计算成本降至前代的1/20,预填充速度提升9倍以上,解码速度提升15倍以上。在SWE-Bench Pro编码基准上,MiniMax M3得分59.0%,超越GPT-5.5和Gemini 3.1 Pro,性能接近Opus 4.7。该模型可通过MiniMax Code、Token Plan和API服务使用。
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)MiniMax-M3 is live on OpenRouter! A frontier-class open-weight model that combines a 1M-token context window, frontier c...
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)MiniMax-M3 by @MiniMax_AI is now live on Venice. The first open-weight model to deliver frontier coding and agentic perf...
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)A fun fact: Right now in China it's June 1st Children's Day @MiniMax_AI just brought their best gift M3👧🎁
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)MiniMax M3 will be launching soon You can try it right now in OpenCode For free
MiniMax 发布旗舰大语言模型 M3,宣称是首个同时具备编码与智能体能力、百万上下文与原生多模态的国产模型。模型基于自研 MSA 架构,API 上下文窗口最高支持 1M tokens,保障至少 512K 可用。在 BrowseComp 智能体评测中,M3 以 83.5 分超越 Opus 4.7(79.3)。官方提供 M3 与 M3-highspeed 两个版本 API,标准版定价为输入 2.1 元、输出 8.4 元/百万 tokens(上下文≤512K,限时五折),并即将在 HuggingFace 与 GitHub 开源。
关联讨论 2 条X:MiniMax (@MiniMax_AI)X:opencode (@opencode)