AIHOT

MiniMax (official)@MiniMax_AI

精选82

MiniMax M3 发布，具备前沿编码与智能体能力，原生图像视频输入和计算机使用，1M-token 上下文。核心采用 MSA 稀疏注意力：每个 query 评分 128-token KV 块，仅对 top 块做注意力。vLLM 当日即支持 M3，包括专用 MSA prefill/decode 核、前缀缓存与分块 prefill、BF16 和 MXFP8 检查点、Hopper 与 Blackwell 的 MoE 后端，并在 NVIDIA 与 AMD 硬件上验证。同时支持原生多模态输入、工具调用、推理解析和思考模式控制等智能体工作负载。

vLLM: 🎉 Congrats to @MiniMax_AI on releasing MiniMax M3! Frontier coding and agentic capabilities, native image and video inp...

多模态开源生态推理模型发布

推荐理由：M3把1M上下文从‘理论上能做’变成了‘今天就能部署’，MSA稀疏注意力是关键，开源社区和推理框架的深度合作值得关注。

MarkTechPost（RSS）

Google 发布 Gemini-SQL2：Gemini 3.1 Pro Text-to-SQL 在 BIRD 单模型排行榜上取得 80.04% 执行准确率

Google Research 于 2026 年 6 月 12 日发布 Gemini-SQL2，基于 Gemini 3.1 Pro 驱动的文本转 SQL（Text-to-SQL）能力，在 BIRD 单模型排行榜上达到 80.04% 的执行准确率。

Google推理模型发布编码

MiniMax (official)@MiniMax_AI

来自@NVIDIAAI的认可意义重大免费GPU加速的M3端点现已上线快来试试👇

NVIDIA AI: Congrats to the @MiniMax_AI team on the release of MiniMax M3, a long-context multimodal model for text, image, and vide...

多模态模型发布视频

MiniMax (official)@MiniMax_AI

MiniMax-M3 是一款拥有 428B（23B 激活）参数、1M 上下文的新开源模型，性能与 Gemini 3.1 Pro 相当。可在 138GB 内存/显存上运行动态 2-bit GGUF 版本，或 165GB 上运行 3-bit 版本。在 @UnslothAI 的帮助下，今天即可本地运行 M3。

Unsloth AI: MiniMax M3 can now be run locally!🔥 MiniMax-M3 is a new 428B (23B active) open model with 1M context that performs on p...

Hugging Face开源生态模型发布

🚨 AI News | TestingCatalog@testingcatalog

NVIDIA ❤️ MiniMax MiniMax M3 权重现已在 @huggingface 上发布，NVIDIA 在其平台上提供免费端点用于测试。测试时间到 👀

NVIDIA AI: Congrats to the @MiniMax_AI team on the release of MiniMax M3, a long-context multimodal model for text, image, and vide...

Hugging Face多模态开源/仓库模型发布

SenseTime@SenseTime_AI

商汤SenseNova-U1-8B-MoT-Interleaved发布

商汤推出SenseNova-U1-8B-MoT-Interleaved模型，专门用于交错文本与图像生成。核心升级包括：叙事连续性增强，支持多页连贯故事；角色一致性改进，人物身份与艺术风格保持稳定；视觉质量提升，文字渲染更清晰、布局更可靠、伪影减少。模型已在HuggingFace开放体验。

图像生成多模态开源/仓库模型发布

MiniMax (official)@MiniMax_AI

精选81

MiniMax 发布开源权重模型 M3，约 428B 总参数、23B 激活参数，已上传 HuggingFace。该模型融合三种前沿能力：编码与智能体方面达 59.0% SWE-Bench Pro、66.0% Terminal Bench 2.1、34.8% SWE-fficiency、28.8% KernelBench Hard、74.2% MCP Atlas；采用 MiniMax 稀疏注意力将上下文窗口扩展至 1M token；原生多模态。同步上线 MiniMax Code 工具及 API 平台。权重与技术报告预计约 10 天后发布。

MiniMax (official): Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...

Hugging Face多模态推理模型发布

推荐理由：开放权重模型首次把编码 Agent 和多模态拉满，SWE-bench Pro 59% 逼近专有前沿，附带稀疏注意力 1M 上下文。做代码工具和 Agent 的团队应该都盯上它了。

🚨 AI News | TestingCatalog@testingcatalog

KIMI AI🔥：一个新的开源"Kimi K2.7 Code"模型已在 API 和 Huggingface 上发布！ > 相比 K2.6，编码与智能体性能提升 > 推理效率 > 长时域编码测试时间 👀

Kimi.ai: 🔗 Weights & code: https://huggingface.co/moonshotai/Kimi-K2.7-Code

Hugging Face开源生态推理模型发布

X.PIN@thexpin

余承东发布华为openPangu 2.0，坦诚AI短板

华为开发者大会2026上，余承东正式接管华为LLM业务，发布openPangu 2.0模型。他坦诚华为自有算力不足，且AI人才招揽困难：“我们薪资拼不过互联网公司，一起做大模型的人靠信念和热情坚持。”2025年6月，旧版Pangu模型曾被指与Qwen-2.5高度相似，相关高管离职。余承东此前曾从零打造华为手机、推动赛力斯汽车合作。此次接管意味着华为模型落后，需加速追赶。

开源生态模型发布

Hacker News 热门（buzzing.cc 中文翻译）

Kimi K2.7-Code：具有更高模型 token 效率的开源编码模型

Kimi K2.7-Code 是一个开源编码模型，相比同类模型拥有更高的模型 token 效率，能够用更少的 token 完成相同的代码生成任务。模型已在 HuggingFace 上发布。

Hugging Face模型发布编码

🚨 AI News | TestingCatalog@testingcatalog

KIMI AI🔥：全新开源 "Kimi K2.6 Code" 模型已在 API 及 HuggingFace 发布！ > 较 K2.6 改进编码与智能体性能 > 推理效率 > 长时编码测试时间 👀

Kimi.ai: 🔗 Weights & code: https://huggingface.co/moonshotai/Kimi-K2.7-Code

开源/仓库模型发布编码

IT之家（RSS）

月之暗面开源 Kimi K2.7 Code 编程模型，预告 6 倍速高速版

月之暗面发布并开源 Kimi K2.7 Code 编程模型。相比 K2.6，长上下文编程指令遵循和长程任务性能提升，过度思考倾向改善，平均 token 消耗减少 30%。Kimi Code Bench v2 提升 21.8%、Program-Bench 提升 11%、MLS Bench Lite 提升 31.5%；Agent 基准提升约 10%。即日起通过 Kimi API 调用，输入 6.5 元/百万 token、输出 27 元、缓存输入 1.3 元。非编程任务仍推荐 K2.6，模型需开启思考模式。预告高速版（输出约 180 Token/s），6 月 15 日可调用，6x 速度仅需 2x 价格。

Hugging Face模型发布编码

meng shao@shao__meng

Kimi 开源发布编码模型 Kimi-K2.7-Code

Kimi 开源发布最新编码模型 Kimi-K2.7-Code，基于 K2.6 优化。编码基准全面提升：Kimi Code Bench v2 提高 21.8%，Program Bench +11.0%，MLS Bench Lite +31.5%。推理 token 整体降低约 30%。Agent 方面，MCP Mark Verified 得分 81.1，超过 Opus 4.8（76.4），GPT-5.5（92.9）仍为天花板。技术特性：强制 Thinking 模式、Preserve Thinking、Interleaved Thinking+多步工具调用，支持图像和视频输入。可通过 Kimi API 和 Kimi Code 使用，6x 高速模式即将推出。开源地址：HuggingFace 上的 moonshotai/Kimi-K2.7-Code。

Kimi.ai: 🌘 Kimi-K2.7-Code, our latest coding model, is now released and open-sourced! 🔷 Improved coding & agent performance ove...

智能体开源生态推理模型发布

Kimi.ai@Kimi_Moonshot

精选70

Kimi 发布并开源最新代码模型 Kimi-K2.7-Code

Kimi 发布并开源最新代码模型 Kimi-K2.7-Code。相比 K2.6，其在 Kimi Code Bench v2 上提升 +21.8%，Program Bench 提升 +11.0%，MLS Bench Lite 提升 +31.5%。推理效率改进，推理 token 使用量降低 30%，长时编码任务中指令遵循和端到端成功率均提升。6x 高速模式即将推出，即日起可通过 Kimi API 和 Kimi Code 使用。

开源生态推理模型发布编码

推荐理由：月之暗面这次把编码模型做到 K2.7 还直接开源，Bench 提升不小，关键是把「想太多」的毛病治了，推理 token 省了三成，做 coding agent 的可以立刻换上试试。

IT之家（RSS）

商汤开源 SenseNova U1 图文交错生成增强版模型：支持多页连续创作，角色风格不"跑偏"

商汤科技开源日日新 SenseNova U1 系列新成员 U1-8B-MoT-Interleaved 图文交错增强版模型。该模型面向图文交错创作与生成场景强化，支持绘本、故事书、多页 PPT 等连续内容创作，解决了多轮生成后角色形象飘移、画风断裂、图文脱节等痛点。核心升级包括叙事一致性与角色连贯性提升、图文对应关系增强、视觉质量改善，以及新增多页 PPT 自动生成能力。模型已开源。

Hugging Face图像生成多模态模型发布

MarkTechPost（RSS）

Zyphra 发布 Zamba2-VL：混合 Mamba2-Transformer 视觉语言模型，首 token 延迟降低约一个数量级

Zyphra 推出 Zamba2-VL 系列开源视觉语言模型，包含 1.2B、2.7B 和 7B 三种参数规模。采用混合 Mamba2 状态空间与 Transformer 骨干架构，基于 Apache 2.0 许可证开源。在保持与同类 Transformer VLM 相当性能的同时，首 token 生成时间（time-to-first-token）缩短约一个数量级。

多模态开源生态推理模型发布

Alibaba Cloud@alibaba_cloud

精选84

一个提示词，无限可能。认识 Qwen3.7-Max，旗舰模型重新定义智能体工作负载，在前端编码中表现出色，能从单个提示词生成丰富的交互式网页体验--从 Three.js 3D 场景到动态 SVG 图形。立即体验 Qwen3.7-Max - 限时五折优惠 🔗： https：//int.alibabacloud.com/m/1000414100/ 🎥 观看视频，了解 Qwen3.7-Max 如何提升生产力。

智能体模型发布编码

关联讨论 1 条

推荐理由：Qwen3.7‑Max不只是参数升级，它主打从单个prompt直接生成可交互网页，Three.js 3D场景都不在话下，做前端或agent的可以认真看看，这方向比刷榜有意思。

IT之家（RSS）

华为发布开源盘古2.0模型：最高505B参数，余承东坦言算力有限

华为在HDC 2026上发布开源盘古openPangu 2.0模型，拥有512K上下文，提供Pro和Flash两个版本：Pro总参数505B、激活18B，Flash总参数92B、激活6B。该模型更亲和昇腾算力，单卡吞吐率可达其他主流开源模型2倍；更适配鸿蒙，Agent任务更快更准更省。计划从6月30日起陆续开源7大组件，包括预训练代码、后训练代码、训练算子。余承东解释总参数仅505B，因算力大量支持国内其他企业，自身留用有限，且AI算力成本高，华为更聚焦时延和吞吐率提升。

开源生态推理模型发布

TechCrunch：AI（RSS）

Avataar AI 发布蒸馏视频生成模型，面向印度市场

Avataar AI 推出蒸馏视频生成模型，专为印度的大规模应用打造，定价为每生成一秒视频 0.005 美元。该模型主打更廉价、更快速且具有文化意识，旨在适应印度本地需求。

数据/训练模型发布视频

karminski-牙医@karminski3

Google 发布 Diffusion Gemma，模型大小 26B，激活参数量 4B。与 NVIDIA 合作优化 RTX 4090/5090，5090 每秒可生成 700+ token。支持文本、图片、视频多模态输入。AIME 2026 数学测试达 Gemma4-26B-A4B 的 94%，tau2 bench Agent 测试达 82%。输出质量略逊于传统大模型但速度更快。4bit 量化版本仅需 16GB 显存即可运行。

karminski-牙医: 单卡 700TPS! Diffusion Gemma 来了! Google 刚刚发布了 Gemma 小模型的 Diffusion 版本! 大小26B, 激活参数量4B, 最重要的是, 这次还跟 NVIDIA 合作针对4090和5090优化了...

Google多模态推理模型发布

karminski-牙医@karminski3

Google 发布 Diffusion Gemma：26B/4B 激活，5090 达 700+ token/s

Google 推出 Diffusion Gemma，大小 26B、激活参数量 4B，与 NVIDIA 合作针对 RTX 4090/5090 优化，5090 上速度达 700+ token/s。该扩散文本模型以“刮奖式”并行生成而非逐 token 生成，输出质量略逊但优于此前同类模型：AIME 2026（数学）达 Gemma4-26B-A4B 的 94%，tau2 bench（Agent）达 82%。4bit 量化版仅需 16G 显存即可运行。

Google推理模型发布部署/工程

Artificial Analysis@ArtificialAnlys

Ideogram 4.0 开源权重文生图模型发布

Ideogram 4.0 是 Ideogram 首个开源权重模型，生成 2K×2K 输出，支持多语言文本渲染、边界框布局控制和透明背景。采用结构化 JSON 提示，提示增强器仅限 Ideogram 专有 API。在 Artificial Analysis 开放权重排行榜排名第8，整体第31，领先 Seedream 3.0 等闭源模型。API 三档：Turbo $30/千张、Default $60/千张、Quality $100/千张。开源权重免费用于评估和非商业用途，商业自部署需单独许可。

图像生成开源生态模型发布

Logan Kilpatrick@OfficialLoganK

精选81

Gemini Omni Flash 在图像到视频、文本到视频和视频编辑方面达到了 SATA ：）很高兴很快能将这一能力通过 API 提供给开发者！

Google图像生成多模态模型发布

推荐理由：视频生成正式进入全模态一体时代，Gemini Omni Flash 把图生视频、文生视频和剪辑整合在一个模型里，API 很快上线，做视频工具的可以提前琢磨对手在哪了。

MiniMax (official)@MiniMax_AI

我们高性能MSA内核库现已开源。M3权重预计本周五发布。感谢等待！ Github： https：//github.com/MiniMax-AI/MSA Paper：https：//github.com/MiniMax-AI/MSA/blob/main/docs/MiniMaxSparseAttention.pdf 主推文：权重周五发布🫶

RyanLee: Hey everyone - our high-performance MSA kernel library is now open-source. The M3 weights are expected to drop this Frid...

开源/仓库模型发布

MarkTechPost（RSS）

Cohere 发布 North Mini Code：30B 参数 MoE 编码模型，3B 活跃参数，单卡 H100 运行，支持 256K 上下文

Cohere 推出首款开发者编码模型 North Mini Code，采用 30B 总参数的混合专家（MoE）架构，每次推理仅激活 3B 参数，可在单块 H100 GPU 上运行，支持 256K token 上下文窗口，专为智能体编码场景设计，模型权重开源。

模型发布编码

Midjourney@midjourney

我们已将 V8.1 设为 Midjourney 所有用户的新默认模型。V8 将在两周后弃用。V8.2 即将开始测试。

Midjourney: V8.1 is live! Our iconic aesthetics are back w native 2K HD rendering - 3x faster and 3x cheaper vs V8. Full quality V8....

图像生成模型发布

Midjourney：Updates（RSS）

精选64

Midjourney V8.1 已成为默认模型

Midjourney 已将默认模型从 V7 升级为 V8.1。V8.1 在智能性、连贯性、对详细提示的遵循度以及文本渲染效果上均有提升，HD 模式也已支持。

图像生成模型发布

推荐理由：虽然V8.1不是大版本，但设为默认后所有用户自动升级，尤其是文本和复杂提示词的理解增强，做设计的朋友值得重新测试一下关键词。

小互@xiaohu

Google 开源扩散架构模型 DiffusionGemma

Google 开源 DiffusionGemma，基于扩散架构，一次性生成大段文本再逐步优化。H100 上达 1000+ tokens/s，RTX 5090 上 700+ tokens/s。26B 参数仅需 18GB 显存，一次生成 256 tokens。多轮迭代自我纠错，可修改已生成内容。

Google开源/仓库推理模型发布

Demis Hassabis@demishassabis

Google Gemma 团队推出实验性开放文本扩散模型 DiffusionGemma，采用 Apache 2.0 许可。该模型突破传统逐 token 顺序生成方式，能同时生成整段文本。Demis Hassabis 称其速度是其他 Gemma 4 模型的 4 倍。

Google Gemma: Meet DiffusionGemma! An experimental open model that explores a fast approach to text generation, released under an Apac...

Google开源/仓库模型发布

关联讨论 8 条

IT之家（RSS）

因安全顾虑，Anthropic 最强 AI 模型 Claude Fable 5 拒绝回答基础生物问题

Anthropic 昨日推出最强 AI 模型 Claude Fable 5（Mythos 级），其在生物学领域能力突出，但为防范生物武器风险，设置极为保守的安全限制，导致模型拒绝回答“细胞膜”“线粒体”等大量基础生物问题，仅“什么是癌症”等极少数问题获回复，被拒提问转由 Claude Opus 4.8 解答。化学、网络安全类问题接纳度较高。Anthropic 表示此防护策略为临时取舍，未来计划面向生物专业群体推出解除限制的 Mythos 级模型。

Anthropic安全/对齐模型发布

IT之家（RSS）

谷歌推出 DiffusionGemma 文本扩散模型：本地 AI 推理速度提升 4 倍

谷歌6月11日发布开源文本扩散模型DiffusionGemma，本地推理速度较自回归模型提升4倍。采用Apache 2.0许可证，可从Hugging Face下载权重。采样速度1479 tokens/秒，开销0.84秒。代码生成HumanEval达89.6%，数学AIME 2025达23.3%超越对比模型。在H100 GPU上每秒生成1000 token，DGX Station上可达2000 token。

Google开源生态推理模型发布