AIHOT

公众号：面壁智能（MiniCPM）

面壁智能联合清华大学、OpenBMB开源社区发布并开源MiniCPM5-1B，一款1B参数的端侧文本基座大模型。其在AA-Index榜单得分17.9分，超越所有2B以下参数模型，包括Qwen3.5-2B（16.3分），验证了智能密度约每3.5个月翻一番的密度定律。INT4量化后权重仅0.5GB，可运行于手机、浏览器等终端。Base Model由AI训练框架ForgeTrain（全球首个完全由AI编写，训练速度比Megatron快10%）在华为昇腾上预训练完成。模型全面开源权重、训练数据集Ultra-FineWeb-L3及部署方案，支持Llama_factory、SGLang、vLLM等主流框架。

Hugging Face开源生态推理模型发布

关联讨论 1 条

公众号：昆仑万维（天工）

天工AI发布SkyClaw-v1.0：面向真实工作流的百万上下文Agent模型

天工AI今日推出SkyClaw-v1.0及轻量版SkyClaw-v1.0-lite，支持百万token上下文，深度适配复杂工具调用、多轮任务执行、代码生成与文件编辑等智能体场景。模型在主流Agent benchmark上全面超越Minimax 2.7、DeepSeek V4 Flash及Qwen 3.6，在OpenClaw任务上接近更大规模模型，定价低于Minimax 2.7与Qwen 3.6一半。训练采用大规模mid-train、合成轨迹SFT与端到端Agentic RL优化，适配OpenClaw、Hermes、Claude Code等主流Agent框架。模型已于5月22日接入天工Skywork，开放2至4周免费试用，并提供兼容OpenAI格式的免费API调用。

智能体模型发布编码

Tencent Hy@TencentHunyuan

腾讯混元新翻译模型双榜亮眼，小程序发布

腾讯混元发布翻译模型 Hy-MT2，在 Hugging Face 开源模型趋势排行榜上表现突出：1.8B 版本排名第一，30B-A3B（MoE）版本排名第四，下载量已超 7K。官方同步推出了基于该模型的“腾讯混译”微信小程序，支持语音输入与离线翻译，并可自定义翻译风格与指令。模型代码与权重已开源。

Hugging Face开源生态模型发布

关联讨论 2 条

IT之家（RSS）

Anthropic 或公开最强模型 Mythos，曾短暂现身多款产品

据科技媒体报道，Anthropic 似乎准备公开上线其前沿模型 Claude Mythos 预览版。该模型名称“claude-mythos-1-preview”曾短暂出现在 Claude Code 和 Claude Security 的公开版本中。Claude Mythos 定位为面向计算机安全任务的模型，相比现有旗舰模型 Opus 4.7，在代码推理和自主执行方面有显著提升。但因其能力过强，Anthropic 担忧公开发布可能带来安全风险，目前尚未全面开放。同时，Anthropic 还在推进名为“Glasswing”的联合项目，旨在保护关键软件系统。

Anthropic安全/对齐模型发布

Elon Musk@elonmusk

精选71

Grok基础模型V9-Medium（1.5T）已完成训练。评估结果良好。补充训练中加入了大量Cursor数据，后续还会有更多。微调正在进行中，强化学习将在几天后开始。预计2到3周内公开发布。这将比当前服务所有Grok生产流量的0.5T v8-small模型有重大改进，尤其在复杂编码任务上。

xAI模型发布编码

推荐理由：Grok 参数翻到 1.5T，还专门喂了 Cursor 代码数据，这波升级明显奔着 coding 去的。如果 evals 不注水，两周后的 coding 排行榜可能变天。

小互@xiaohu

影眸科技发布 Rodin Gen-2.5 3D 生成模型

影眸科技推出 Rodin Gen-2.5，号称全球首个千万面级 3D 生成模型。该模型提供从极低（4秒）到极高（80秒）的五档思考模式，以平衡生成速度与细节精度。其原生 3D 贴图算法能在三维空间直接生成纹理，支持 PBR 材质与 360° 无死角覆盖，并提供 Faithful（贴合参考）与 Creative（自动优化）两种贴图模式。该模型已获 SIGGRAPH 2025 最佳论文奖。

多模态模型发布

IT之家（RSS）

精选72

面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN

开源生态模型发布端侧

推荐理由：谁说国产算力只能跑小模型？面壁这个1.58-bit模型在昇腾上原生训练，直接把8B塞进旗舰手机，开源全套训练底座，做端侧的该看一眼。

公众号：面壁智能（MiniCPM）

面壁智能联合清华开源中国首个基于昇腾训练的1.58-bit端侧大模型 BitCPM-CANN

面壁智能联合清华大学正式开源中国首个基于昇腾训练的1.58-bit端侧大模型BitCPM-CANN，实现6倍显存效率提升，可将60B参数大模型封装进手机等端侧设备。

推理模型发布端侧

MarkTechPost（RSS）

阶跃星辰发布StepAudio 2.5 Realtime：一款具有角色扮演RLHF和副语言理解的端到端语音模型

阶跃星辰于2026年5月发布StepAudio 2.5 Realtime，这是一款支持完全可定制个性化角色的端到端实时语音大语言模型。该模型通过WebSocket API提供服务，支持中英文。在2026年4月进行的五个基准测试维度中均排名第一，具体包括80.41的人类评测得分和82.18的副语言理解得分。

模型发布语音

Chubby♨️@kimmonismus

Google DeepMind的AlphaProof Nexus自主解决多个开放数学问题

Google DeepMind的AlphaProof Nexus系统自主解决了9个开放的Erdős问题（部分问题存在56年），每个问题的成本约几百美元。它还证明了44个OEIS猜想，解决了一个15年的代数几何问题，并在优化理论中发现了新算法参数。其核心机制是将大语言模型的推理能力与Lean形式化验证系统结合，Lean自动检查每一步逻辑，无需人工复核。研究发现，一个仅交替使用大语言模型生成与编译器反馈的基础智能体，便能复现全部9个Erdős问题的成功。该系统还能检测并修正现有数学文献中的表述错误。其局限在于成功案例集中于Lean数学库成熟的领域（如组合、数论），仍无法解决需要全新理论的大问题。

DeepMind开源生态推理模型发布

MarkTechPost（RSS）

NVIDIA发布Gated DeltaNet-2：解耦Delta规则中擦除与写入的线性注意力层

NVIDIA推出了改进的线性注意力模型Gated DeltaNet-2。其核心创新在于将Delta规则中控制记忆擦除与写入的单一门控机制，解耦为两个独立的通道级门控。该模型参数规模为1.3B，在100B个FineWeb-Edu令牌数据上训练。实验表明，它在语言建模、常识推理和长上下文检索等任务中全面超越了Mamba-2、Gated DeltaNet、KDA及Mamba-3等现有模型，尤其在RULER S-NIAH和多关键针检索任务中取得了最显著的性能提升。

推理搜索模型发布

StepFun@StepFun_ai

精选76

StepAudio实时语音发布，能听懂你的语气与言外之意

StepAudio 2.5 Realtime 是一款实时语音交互模型。其核心优势在于能感知用户的副语言特征，如语气、节奏、停顿甚至轻叹，从而理解话语背后的真实意图。该模型支持通过 API 高度定制角色人格与说话风格，内置超过10,000种可组合的预置角色，并提供5种开箱即用的预设角色供体验。同时，模型经过RLHF优化，能在复杂的角色扮演压力测试中稳定保持设定的人设。支持中英文双语交互。

模型发布语音

关联讨论 1 条

推荐理由：StepFun 这个语音模型把副语言感知做进了实时 API，产品人想搞点情感化语音交互的可以试试，预设角色能省不少调 prompt 的功夫。

The Decoder：AI News（RSS）

阿里巴巴最新AI模型自主运行35小时为自研芯片优化代码

阿里巴巴云千问团队发布Qwen3.7-Max，这是一款专为长时间自主智能体任务设计的闭源模型。该模型曾在单次会话中持续运行35小时，为阿里巴巴自研的专用芯片优化代码。在标准基准测试中，Qwen3.7-Max的表现与Claude Opus 4.6持平，并超越了国内竞品如DeepSeek V4 Pro和Kimi K2.6。此外，团队还现场演示了该模型指挥一个四足机器人执行任务的能力。

智能体模型发布编码

IT之家（RSS）

让机器人拥有"肌肉记忆"，智元推出新一代二阶段 BFM-2 基座模型

智元于5月23日发布新一代二阶段运动控制基座模型BFM-2，其核心特点是让机器人具备“肌肉记忆”。该模型使机器人能在静态、预设动作或随机输入等任意状态下，自主完成高稳定性的动作插值与动态任务闭环，为具身智能提供可靠的运动基础。演示视频显示，搭载该模型的机器人在被击倒后能快速自主站起并恢复平衡。

具身智能数据/训练模型发布

IT之家（RSS）

微软推出 Fara1.5 系列浏览器 AI 智能体模型，72% 任务成功率超 OpenAI Operator

微软研究院发布了 Fara1.5 系列浏览器 AI 智能体模型，包含 4B、9B 和 27B 三个版本。该模型专为浏览器操作设计，能读取截图并输出鼠标键盘指令。其 27B 版本在 Online-Mind2Web 基准测试中取得 72% 的任务成功率，显著超过 OpenAI Operator（58.3%）和 Gemini 2.5 Computer Use（57.3%）。模型基于约 200 万样本微调训练，并具备安全机制，在关键操作前会主动向用户确认。

智能体Microsoft模型发布

Hugging Face：Blog（RSS）

精选63

NVIDIA 发布 Nemotron-Labs Diffusion 系列模型，支持三种生成模式

NVIDIA 发布 Nemotron-Labs Diffusion 系列，含 3B、8B、14B 文本模型和 8B 视觉-语言模型（VLM），均采用商用友好的 NVIDIA Nemotron Open Model License 或 NVIDIA Source Code License。模型支持自回归、扩散（逐块并行生成后逐步精炼）和自推测（扩散草拟候选 token 再自回归验证）三种模式。8B 模型平均准确率比 Qwen3 8B 提升 1.2%，扩散模式每次前向传递的 token 数（TPF）达自回归的 2.6 倍，自推测达 6–6.4 倍。模型在 1.3T tokens 上预训练、45B tokens 上微调，代码与模型已发布于 HuggingFace 和 GitHub，推理将获 SGLang 支持。

多模态推理模型发布

推荐理由：自推测模式让文本生成速度飙到AR模型的4倍，而且输出质量无损。NVIDIA这次开源的不仅是个新模型，更是一套能直接用在现有流程里的加速方案。

🚨 AI News | TestingCatalog@testingcatalog

Anthropic在Project Glasswing项目最新进展中宣布，Mythos级模型在开发出更强的安全防护措施后，预计将向公众开放。此前，Anthropic与合作伙伴通过该项目已发现超过一万个关键或高危软件漏洞。这为模型后续的强安全防护开发提供了重要背景与方向。

Anthropic: Last month we launched Project Glasswing, our collaborative AI cybersecurity initiative. Since then, we and our partners...

Anthropic安全/对齐模型发布

Rohan Paul@rohanpaul_ai

精选75

首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布

ModelBest、清华大学与OpenBMB社区联合发布了BitCPM-CANN，这是全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三元大模型。其核心创新在于采用仅含三种权重状态的极低比特量化技术，使模型内存占用相比BF16降低约6倍，可高效部署于手机、电脑、车载设备等边缘端。更关键的是，整个训练全栈（从量化算子到框架）均在昇腾上原生构建与验证，而非简单移植。该模型家族（0.5B-8B）在多项基准测试上保持了全精度模型95-97%的性能，为资源受限环境下部署和复现大模型提供了可落地的解决方案。

OpenBMB: 🚀 BitCPM-CANN by ModelBest × @Tsinghua_Uni × OpenBMB is here - and it's not about stacking parameters. Memory costs are...

开源/仓库模型发布端侧

推荐理由：首个开源的1.58-bit三元LLM，直接在昇腾芯片上原生训练，内存压缩到BF16的六分之一，8B模型就能跑在手机上，做端侧部署的可以立刻上手试试了。

IT之家（RSS）

阿里千问 App、PC 端及网页端接入全新一代大模型 Qwen3.7-Max

5月22日，阿里千问App官方宣布，千问App、PC端及网页端接入全新一代大模型Qwen3.7-Max。用户需将千问App更新至6.9.7及以上版本，即可免费体验该模型。Qwen3.7-Max定位为全能的智能体基座，核心能力覆盖编程开发、办公流程自动化及超长周期任务执行。官方实测显示，在一项长达35小时、包含超过1000次工具调用的全自主内核优化实验中，该模型保持了连贯推理。此外，模型具备跨框架泛化能力，并即将通过阿里云百炼平台提供API调用服务。

智能体MCP/工具模型发布

关联讨论 10 条

Alibaba Cloud@alibaba_cloud

Qwen3.7-Max现已在Model Studio上线，限时五折（5月22日至6月22日）！可靠的跨框架支持。专为一键部署和无缝集成到现有技术栈而设计。 🚀 立即体验：https：//int.alibabacloud.com/m/1000413314/

模型发布部署/工程

关联讨论 10 条

Alibaba Cloud@alibaba_cloud

Qwen3.7-Max现已登陆Model Studio，限时五折（5月22日至6月22日）！ 100万上下文窗口。专为在长上下文智能体推理中，无缝处理和保留大规模企业数据流而构建。 🚀 立即体验：https：//int.alibabacloud.com/m/1000413314/

推理模型发布

关联讨论 10 条

Alibaba Cloud@alibaba_cloud

Qwen3.7-Max现已登陆Model Studio，限时五折（5月22日至6月22日）！旗舰级编程智能体性能。专为可靠、多步骤的软件执行而设计，最大限度减少人工干预。 🚀 立即体验：https：//int.alibabacloud.com/m/1000413314/

智能体模型发布编码

关联讨论 10 条

Qwen@Alibaba_Qwen

⚡️⚡️ 【引用 @OpenRouter】：来自 @Alibaba_Qwen 的全新 Qwen3.7-Max 已在 OpenRouter 上线。作为 Qwen3.7 系列的旗舰模型，专为以智能体为中心的工作而构建：编程、办公与生产力任务，以及长周期自主执行。在编程和智能体基准测试中较 Qwen3.6 有显著提升，并支持显式的提示缓存以处理重复上下文。

OpenRouter: The new Qwen3.7-Max from @Alibaba_Qwen is live on OpenRouter. The flagship of the Qwen3.7 series, built for agent-centri...

智能体模型发布编码

关联讨论 10 条

IT之家（RSS）

精选70

网易有道"子曰4"多模态模型、语音合成模型全量开源

网易有道宣布将其“子曰”大模型4.0的多模态模型与语音合成模型面向全球全量开源。其中，多模态模型（27B参数）专注于教育场景，在处理高难度视觉数理问题上达到行业顶尖水平，纯文本中文数理难题准确率为81.4%。该模型通过思维链优化，将输出长度压缩43.2%，有效降低了推理成本。同时开源的语音合成模型支持跨语种音色与情感迁移克隆，3秒内即可完成零样本复制，准确度超97%，并支持包括中、英、日、韩在内的14种语言。

多模态开源生态推理模型发布

推荐理由：有道把垂直教育的多模态模型全量开源，27B参数在视觉数理上做到SOTA，还把思维链压缩了43%，推理成本实打实下降，做教育应用的可以拿来做二次开发；TTS的跨语种情感克隆也实用，3秒克隆14种语言。

MarkTechPost（RSS）

微软发布Fara1.5浏览器操作智能体系列：性能超越OpenAI Operator与Gemini 2.5

微软研究院近日推出Fara1.5系列浏览器操作智能体，包含4B、9B和27B三种参数规模。其中最大模型Fara1.5-27B在Online-Mind2Web基准测试中达到72%的准确率，显著优于OpenAI Operator、Gemini 2.5 Computer Use等主流模型。此次发布同步推出FaraGen1.5合成数据流水线，可在受控环境中高效训练智能体，为自动化浏览器操作提供了新解决方案。

智能体MCP/工具Microsoft模型发布

IT之家（RSS）

美团开源 LongCat-Video-Avatar 1.5：数字人视频从"彩排"走向"真舞台"，生成 10 秒视频仅需 1 分钟

美团技术团队开源了数字人视频生成模型 LongCat-Video-Avatar 1.5。该版本在唇形同步、物理合理性、长视频稳定性和多人互动方面全面升级，支持复杂语音输入与多种主体。通过 DMD 蒸馏技术，推理效率提升约 15 倍，生成 10 秒视频仅需约 1 分钟。在性能评测中，模型在四个关键维度表现领先，用户偏好对比中胜率均超 54%，旨在推动数字人视频从技术演示走向商业应用。

开源生态推理模型发布视频

关联讨论 1 条

小互@xiaohu

网易有道开源双模型，聚焦工程精度与落地成本

网易有道开源Confucius4双模型，包括一个专注数学视觉推理的多模态模型，以及一个用于语音克隆的TTS模型。此次开源直接提供完整权重，而非仅提供API，强调在工程精度和实际部署成本上的投入，而非单纯追求参数规模。模型已发布于HuggingFace和GitHub平台。

GitHubHugging Face多模态开源生态

IT之家（RSS）

"拼好模"：字节跳动开源轻量原生统一多模态 AI 模型 Lance

字节跳动开源了轻量级多模态模型Lance，其激活参数量为3B。该模型采用原生统一架构，在训练阶段即整合图像与视频的理解、生成及跨模态编辑功能。Lance通过双流专家设计和模态感知旋转位置编码等技术，平衡了理解任务所需的高层语义与生成任务所需的低层连续表示。模型训练共分四阶段，数据规模约1.9T标记，计算预算控制在128张GPU内。基准测试表明，Lance在图像生成、视频生成、图像编辑及视频理解等多项任务中表现突出。该模型权重已依据Apache 2.0协议开源。

多模态开源生态模型发布

公众号：龙猫LongCat（美团）

从高拟真到真可用，LongCat-Video-Avatar 1.5 正式开源

美团技术团队正式开源 LongCat-Video-Avatar 1.5，该版本从高拟真走向真可用，将视频头像生成从室内彩排演练推向千人千面的真实应用场景。

图像生成模型发布视频

karminski-牙医@karminski3

400 TPS！实测智谱 GLM-5.1 以10倍速狂飙

智谱近期推出GLM-5.1-Highspeed模型，实测输出速度达300+ tokens/s，首token延迟约1秒，相较于标准版GLM-5.1的35 tps和9秒延迟，性能提升约10倍。技术上，智谱联合TileRT团队重构了推理链路，通过将整个推理流程编译为常驻GPU的大kernel，大幅减少CPU调度与数据搬运开销，并优化单卡内的计算、IO分配及多卡间任务协作，显著提升GPU利用效率。该模型单次激活40B参数，高性能运行需依托多卡并行，建议现有用户切换使用以获得更实时的生成体验。

推理模型发布

Alibaba Cloud@alibaba_cloud

阿里云与Novita AI达成合作，在Novita AI平台首发推出Qwen3.7-Max模型，标志着双方共同推进Agent时代的发展。该模型专为智能体时代设计，强调从"回答"到"执行"的能力跃升。核心优势包括：强大的代码生成与软件工程工作流能力；可靠的智能体编排与多智能体系统协作能力；支持长周期、自主化的复杂任务执行；且具备框架与技术栈无关的兼容性，可适配多种主流开发环境。

Novita AI: 🚀 We're launching Qwen3.7-Max from @AlibabaGroup on Novita AI as a Day-0 launch partner. Built for the Agent Era - wher...

智能体模型发布

关联讨论 10 条

karminski-牙医@karminski3

腾讯近期发布了三款翻译专用大模型（Hy-MT2系列）。其中，Hy-MT2-30B-A3B在金融、法律等专业领域的翻译基准测试中，性能超越了DeepSeek-V4-Pro。该系列模型具备强大的多语言翻译能力，可应用于包括特定内容在内的多种翻译场景。

karminski-牙医: 这一波估计XX词典凉的透透的了... 刚看到这个图坐不住了, 30B-A3B 的小模型跑分碾压 DeepSeek-V4-Pro? 谁给你的勇气? 然后定睛一看, 原来是翻译专用大模型. 腾讯刚刚放出了3个翻译专用大模型, 分别是 Hy-MT...

开源/仓库模型发布