AIHOT

5月21日

19:29

🚨 AI News | TestingCatalog@testingcatalog

Alibaba Group: Qwen3.7-Max is live! 🚀 Introducing the latest proprietary model, built for advanced agentic coding, complex reasoning, ...

智能体推理模型发布编码

18:06

IT之家（RSS）

腾讯混元发布新一代翻译模型Hy-MT2，支持手机端本地部署

腾讯混元正式开源新一代多语言翻译模型Hy-MT2，提供1.8B、7B、30B-A3B三种尺寸，支持33种语言及5种民族语言/方言互译。相比上一代，模型在指令遵循与专业领域翻译能力上显著提升。其中1.8B轻量模型仅需440MB存储，可部署于手机芯片进行本地推理，速度提升1.5倍。同步推出的腾讯Hy翻译小程序支持自定义风格、离线翻译，并开源了翻译指令遵循测试集IFMTBench，模型已上架GitHub、HuggingFace等平台。

开源生态模型发布端侧部署/工程

关联讨论 1 条

16:56

Tencent Hy@TencentHunyuan

精选74

腾讯开源Hy-MT2多语言翻译模型

腾讯正式开源Hy-MT2多语言翻译模型，支持33种语言间的无缝互译。其7B与30B-A3B版本在开源模型中达到最先进的翻译性能，超越了许多参数规模大数十倍的模型。更具突破性的是，1.8B轻量级版本性能超越微软等主流商业API，并凭借腾讯AngelSlim 1.25-bit极量化技术，仅需440MB存储空间，即可在主流手机芯片上本地运行，推理速度较前代提升1.5倍，显著降低了高质量AI翻译的部署门槛。

开源生态模型发布端侧

关联讨论 1 条

推荐理由：虽然翻译领域不算最热，腾讯这个1.8B开源模型用1.25位量化直接跑在手机上，效果还超微软商业API，做本地化翻译工具的人值得关注。

16:43

公众号：腾讯混元

腾讯混元全新翻译模型Hy-MT2开源，小程序「腾讯Hy翻译」开放体验

开源生态模型发布

16:28

Artificial Analysis@ArtificialAnlys

阿里云发布Qwen3.7 Max模型，评测得分56.6分

阿里云发布闭源旗舰模型Qwen3.7 Max，在Artificial Analysis智能指数上获得56.6分，较前代Qwen3.6 Max Preview提升4.8分，与国际前沿模型的差距有所缩小。其进步主要体现在科学推理、智能体及编码能力上。值得注意的是，本次评分提升很大程度上源于模型在“AA-Omniscience”基准上主动选择“不回答”的次数增多，从而将幻觉率从44.2%显著降至22.9%。此外，该模型的上下文窗口已扩大至100万token，但仍延续了Max系列的闭源策略。

推理模型发布编码

15:27

MarkTechPost（RSS）

一个模型，三种模态：字节跳动发布 Lance 用于图像与视频的理解、生成和编辑

字节跳动智能创作实验室发布了Lance，这是一款开源的原生统一多模态模型。它能够在单一框架内，同时处理图像与视频的理解、生成和编辑三大任务。该模型仅需激活30亿参数，实现了用一个轻量级模型统一处理多种视觉内容创作与理解的需求。

图像生成多模态开源生态模型发布

05:35

Chubby♨️@kimmonismus

OpenAI即将推出通用型大语言模型，强调其并非为特定问题或数学领域专门训练。该模型通过增加测试时的计算资源，性能实现显著提升，展现了通用模型在扩展计算时的潜力。官方表示当前重点在于快速发布，供用户自主探索，暂未在开放问题上追求极限优化。这标志着大模型发展的一条新路径。

Noam Brown: This is a general-purpose LLM. It wasn't targeted at this problem or even at mathematics. Also, it's not a scaffold. We ...

OpenAI推理模型发布

04:17

Google DeepMind@GoogleDeepMind

精选84

Gemini 3.5 Flash 已正式发布。

Google多模态模型发布

关联讨论 2 条

推荐理由：Google 在 Gemini 3.5 上继续扩展 Flash 线，这种轻量模型对成本和延迟敏感场景很关键，如果你在等一个便宜的 Gemini API，该看了。

00:44

Google Gemini@GeminiApp

精选74

Gemini 3.5 Flash能快速提供整理好的结果，无论输入多么混乱。看看Gemini如何将与客户的聊天和文本，转化为您小企业可用的文档。

Google推理模型发布

关联讨论 14 条

推荐理由：Gemini 3.5 Flash 的核心不是刷榜，而是解决现实中‘信息像一堆垃圾’的问题，这种从杂乱输入直接生成文档的能力，对小企业和自由职业者比 SOTA 更有用。

00:36

Rohan Paul@rohanpaul_ai

商汤开源统一多模态模型SenseNova U1

商汤科技近日开源了SenseNova U1，其核心创新在于架构设计。该模型摒弃了传统的视觉编码器与变分自编码器分离结构，采用单一共享表示空间原生处理图像与文本，极大减少了模块间转换导致的信息损耗。这一设计使模型能够连贯地同时生成图文内容，在信息图、海报、漫画等需要高一致性的密集视觉内容创作上优势显著。性能方面，其信息图生成速度在同等质量下约为Qwen-Image-2.0/Seedream-4.5的两倍。

图像生成多模态开源/仓库模型发布

00:06

Artificial Analysis@ArtificialAnlys

Cohere推出开源权重模型Command A+，智能指数得分达37

Cohere发布了开源权重模型Command A+，其在AI分析智能指数上的得分与Claude 4.5 Haiku持平。该模型核心优势为极低的幻觉率，在相关榜单上以86%领先，体现出模型“知其不知”的可靠性。在速度方面，其API输出速度超过GPT-5.4 nano等多款模型，但仍略逊于Gemini 3.1 Flash-Lite。模型在科学推理与代码生成等高难度任务上表现稍弱，但具备视觉推理能力，性能位于Claude 4.5 Haiku与GPT-5.4 nano之间。

开源/仓库模型发布评测/基准

5月20日

23:56

IT之家（RSS）

精选71

Stability AI 推出音频模型 Stability Audio 3.0，可生成最长 6 分钟专业级歌曲

Stability AI 推出 Stability Audio 3.0 音频生成模型家族，包含四款不同规格模型，参数从45900万到27亿。小型模型专注设备端运行，可本地生成两分钟以内的音频；中型和大型模型支持创作超过6分20秒的完整音乐，

多模态开源/仓库模型发布

推荐理由：Stability Audio 3.0 把AI音乐从几十秒的demo拉到了六分钟的完整歌曲，而且中小模型直接开源，任何一个能跑模型的设备都能玩，音乐创作的门槛继续被踩低。

23:03

The Decoder：AI News（RSS）

Stability AI 发布 Stable Audio 3.0，支持长达六分钟音轨并开放权重

Stability AI正式推出Stable Audio 3.0音频生成模型套件。该系列包含三个已开放模型权重的版本，能够生成最长六分钟的连贯音乐音轨。公司强调，所有模型均完全基于授权音乐数据集进行训练，确保了生成内容的合规性。此次发布标志着在AI音乐生成领域的技术进步，为音乐创作者和开发者提供了更长时长、更开放可用的工具。

多模态模型发布

23:00

TechCrunch：AI（RSS）

Stability AI发布可生成6分钟音频的新模型

Stability AI正式推出Stability Audio 3.0 small模型，该模型可在用户设备本地运行，生成时长最高达两分钟的音乐音轨。与此前云端生成较长音频的方案不同，此次更新强调了模型的轻量化与端侧部署能力，降低了对云计算资源的依赖。

多模态开源生态模型发布

22:02

Hacker News 热门（buzzing.cc 中文翻译）

精选81

Qwen3.7-Max：智能代理的前沿

智能代理领域迎来新突破，Qwen3.7-Max于2026年5月20日发布，标志着前沿技术的演进。该模型聚焦智能代理创新，具体细节可通过qwen.ai博客获取。发布消息在Hacker News上获得128个关注点，显示技术社区的广泛兴趣。尽管未披露详细性能指标，但Qwen3.7-Max的推出暗示了在自主代理架构或任务处理能力上的提升，推动AI向更高效、智能的方向发展。

智能体推理模型发布编码

关联讨论 10 条

推荐理由：Qwen3.7-Max 在多个 agent 基准上达到甚至超越 Opus 4.6 水平，长程自主优化 35 小时跑出 10 倍速度提升，证明 agent 长跑能力不是概念，做自动化工具的值得跟进。

18:46

SenseTime@SenseTime_AI

精选68

将你的想法转化为激发故事的视觉画面 🧨 【引用 @Adamaestr0_】：大多数AI工具可以写作或生成图像。但这个能同时做这两件事。向你介绍 SenseNova U1。一个能同时思考文本和图像的AI。这改变了一切 🧵

Adam: La mayoría de las herramientas de IA pueden escribir o generar imágenes. Pero esta hace AMBAS cosas a la vez. Te present...

多模态模型发布

推荐理由：商汤发了 SenseNova U1，主打文本和图像同时生成的「全模态」，但宣传语太简略，没给任何性能数据或技术细节，暂时看不出是真突破还是常规迭代，先标记关注。