AIHOT

5月17日

06:54

Berryxia.AI@berryxia

Claude Mythos模型悄然现身Google Cloud Console，预示企业级发布

Claude Mythos模型近日悄然出现在Google Cloud Console中，其预览标签已消失，发布模式与之前Opus 4.7类似，预示可能即将正式落地。Anthropic曾称该模型“太危险”不适合公开发布，但目前迹象表明，公司可能不会推出公开版本，而是转而作为模型提供商，通过Google Cloud Platform让已接入的企业客户直接在自有环境中调用和使用。这一举动被视为Anthropic以最安静的方式将其高级思考模型推向生产环境，并逆转了此前关于该模型危险的叙事。

🚨 AI News | TestingCatalog: ANTHROPIC 🔥: Claude Mythos model has been spotted on Google Cloud Console. -claude-mythos 👀 It is hard to imagine that...

Anthropic推理模型发布

05:43

🚨 AI News | TestingCatalog@testingcatalog

Anthropic的Claude Mythos模型已被发现在谷歌云控制台出现，且其预览标签已消失。这一迹象与之前Opus 4.7发布前的模式相似，引发了关于Anthropic可能准备公开发布该模型的猜测。尽管作者认为Anthropic改变主意直接向公众发布的可能性不大，但推测其可能作为模型提供商，为有权限的公司提供在谷歌云平台上运行该模型的服务。

AiBattle: Claude Mythos now appears in the Google Cloud console, which was not the case yesterday The preview label is also gone. ...

Anthropic模型发布

00:51

Ant Ling@AntLingAGI

精选80

又一次Day0协作，又一次社区胜利。感谢@vllm_project团队始终可靠的支持~ 🫡🫡

vLLM: Congrats to @AntLingAGI on Ring-2.6-1T going open! 🎉 The thinking sibling of Ling-2.6-1T - trillion-scale, built for ag...

智能体开源生态推理模型发布

推荐理由：蚂蚁百灵把万亿参数的 thinking 模型开源，vLLM 第一天就能跑，想自己搭 agent 推理服务的可以直接动手了，开源生态的齿轮转得比想象中快。

00:51

Ant Ling@AntLingAGI

Ring-2.6-1T万亿参数旗舰模型正式发布，专注于处理复杂现实世界任务，并在SGLang平台获得Day-0即时支持，得益于与@lmsysorg的合作。该模型具备增强的智能体执行能力，可稳定处理多步骤、工具调用和长流程工作。用户可通过推理努力控制的高与极高模式，灵活调节推理深度、速度和成本。训练采用异步强化学习与IcePop技术，确保万亿参数强化学习训练的效率和稳定性。目前，该模型在OpenRouter平台提供限时75%折扣，供用户体验最新功能。

LMSYS Org: 🎉 Congrats on the release of Ring-2.6-1T, a trillion-parameter flagship for complex, real-world tasks. Day-0 support is...

智能体开源/仓库推理模型发布

关联讨论 1 条

00:51

Ant Ling@AntLingAGI

精选76

蚂蚁集团发布万亿参数推理模型Ring-2.6-1T，专为现实世界智能体工作流构建。该模型采用MIT许可，上下文长度通过YaRN技术从128K扩展至256K，并采用Async RL与IcePop混合训练架构。其核心特点是具备双推理努力模式："high"模式用于快速智能体循环，"xhigh"模式用于深度推理，旨在实现更好的成本与性能平衡。模型已开源，欢迎社区反馈。

Adina Yakup: Ant group just dropped Ring-2.6-1T 🔥 1T reasoning model, built for real world agent workflows. ✨ MIT license ✨ 128K >> ...

智能体Hugging Face开源生态推理

关联讨论 1 条

推荐理由：蚂蚁把1T推理模型以MIT许可开源，还专门为Agent循环做了高低推理双模式，做开源Agent的团队直接多了一个强力基座可选。

00:21

Ant Ling@AntLingAGI

Ring-2.6-1T模型现已开源，并上线OpenRouter平台，5月底前享有75%折扣。该模型由AntLingAGI开发，是一个为现实世界智能体构建的万亿级推理模型，其核心设计目标不仅是回答问题，更是执行任务。它专注于规划步骤、使用工具、维持上下文和完成复杂工作流，具备强大的智能体执行能力和高推理模式，并采用了Async RL与IcePop训练方法。

Novita AI: 🚀 Ring-2.6-1T is now open source (from @AntLingAGI). Now 90% off on @OpenRouter via @novita_labs - a great time to star...

智能体开源生态推理模型发布

关联讨论 1 条

5月16日

14:42

AYi@AYi_AInotes

Anthropic神秘模型Mythos Preview展现颠覆性漏洞挖掘能力

Anthropic的神秘AI模型Mythos Preview在网络安全领域取得突破性进展。该模型仅用五天就成功构造出针对苹果硬件级安全防线MIE的macOS内核漏洞利用程序，而同类任务通常需要Google Project Zero团队平均六个月完成。Mythos不仅能自主阅读代码、提出假设并验证，还能独立完成从漏洞发现到编写完整利用链的全过程。这标志着AI正将漏洞挖掘的技术门槛急剧降低，预示着未来网络安全攻防可能演变为AI之间的自动化竞赛。相关技术报告已提交苹果，修复后将公开。

Anthropic安全/对齐推理模型发布

关联讨论 1 条

02:37

Rohan Paul@rohanpaul_ai

Elon Musk表示，Grok基础模型V8与V9之间存在巨大差距。内部开发的V9是一个1.5万亿参数模型，在数据质量、训练方法、规模等各方面均远超V8，并针对Blackwells架构优化，旨在与顶级编码智能体竞争。而当前公开的v4.2版本基于仅0.5万亿参数、在Hoppers上训练的V8基础模型，其训练数据在质量、全面性和均衡性上存在显著不足。

Elon Musk: The version numbers are a little confusing and deserve some explanation. Internally, we are working on version 9 of our ...

数据/训练模型发布

01:07

MiniMax (official)@MiniMax_AI

M2.7已在@OrcaRouter上线--可通过单一OpenAI兼容API访问。今天就来试试吧！🐋

OrcaRouter 🐳: MiniMax M2.7 is now on OrcaRouter 🐋 One of the strongest open-source models available today - now accessible through a ...

开源生态模型发布

00:22

SenseTime@SenseTime_AI

SenseNova发布增强版信息图表生成模型SenseNova-U1-8B-MoT-Infographic

SenseNova近日推出专为信息图表生成设计的增强模型SenseNova-U1-8B-MoT-Infographic。该模型能够根据指令生成多种视觉格式内容，包括海报、图表、食谱卡、明信片以及学术风格的arXiv页面等。在性能方面，模型在BizGenEval（困难版）和IGenBench（Q-ACC）两项基准测试上表现突出，相比其基础U1模型分别提升了6.8分和18.2分。目前，该模型已在Hugging Face平台开源，并提供了超过100个多样化的生成示例，供开发者和研究者参考与试用。

Hugging Face图像生成模型发布

关联讨论 1 条

5月15日

20:54

Berryxia.AI@berryxia

Qwen 3.6 Plus &amp； OpenCode 免费开整啊！！！

开源生态模型发布编码

18:27

向阳乔木@vista8

面壁智能推出仅1.3B参数的视觉语言模型MiniCPM-V 4.6。该模型采用LLaVA-UHD v4技术，将视觉编码成本降低55%，专为消费级和移动硬件优化，支持高效边缘部署。其在关键多模态和Artificial Analysis基准测试中，性能超越了Gemma4-E2B-it和Qwen3.5-0.8B等更大模型，且仅消耗后者2.5%的token预算。在处理高分辨率图像时，其首token生成时间比Qwen3.5-0.8B快2.2倍，在单张RTX 4090上的token吞吐量约为后者的1.5倍。模型已在Hugging Face、ModelScope等平台开源发布。

OpenBMB: 1/5 MiniCPM-V 4.6 (1.3B) is now live 🚀🚀 High-res visual processing, optimized for consumer-grade and mobile hardware. ...

多模态模型发布端侧

17:41

🚨 AI News | TestingCatalog@testingcatalog

GOOGLE 🔥：Gemini Spark新截图展示高级工具使用和技能创建流程。目前看来除了复制粘贴外，似乎没有导入SKILL MD文件的选项。目前也没有浏览器或计算机使用功能的迹象。

Just a dragon: The new Gemini Spark model will have Agent mode / Chat mode. New advanced use of tools.

智能体GoogleMCP/工具模型发布

12:54

Berryxia.AI@berryxia

蚂蚁集团开源万亿参数思考模型Ring-2.6-1T，推动企业级AI本地部署

蚂蚁集团AGI团队开源了万亿参数旗舰思考模型Ring-2.6-1T。该模型专为处理Agent工作流、代码工程、长时序执行等复杂任务设计，具备上下文理解、规划与工具调用能力，并提供高效与极致两种推理模式。其采用IcePop算法稳定训练，并借助MoE架构降低部署门槛。完全开源允许企业将模型部署于本地或端侧，确保数据不出域，有效解决了金融、政务等敏感领域对数据安全与合规的迫切需求。模型已在Hugging Face和ModelScope平台发布。

智能体开源生态推理模型发布

关联讨论 1 条

07:34

Artificial Analysis@ArtificialAnlys

中国移动发布专有模型JT-35B-Flash，智能指数显著提升

中国移动近日发布了专有的350亿参数非推理模型JT-35B-Flash，其Artificial Analysis智能指数达到36，较前代JT-MINI大幅提升11分。该模型在面向电信客服场景的工具使用评测τ²-Bench中以99%的得分领先，并展现出较高的令牌效率，运行智能指数仅消耗约1700万输出令牌。JT-35B-Flash拥有256K上下文窗口，目前主要面向企业客户提供。作为全球主要电信运营商，此举标志着中国移动在开发更强大专有模型方面的持续投入。

MCP/工具模型发布

00:06

Rohan Paul@rohanpaul_ai

Google 准备在周二的年度 I/O 大会上宣布一个新的 Gemini 模型，其性能被认为大致与 GPT-5.5 匹配。

Google模型发布

5月14日

23:45

Ant Ling@AntLingAGI

Ring-2.6-1T开源：万亿级思考模型支持复杂任务执行

Ring-2.6-1T 正式开源，这是一个专为现实世界复杂任务构建的万亿规模旗舰思考模型。其设计目标超越单纯的“回答”，转向任务执行，能够理解上下文、规划步骤、调用工具，并在长任务链中保持稳定。模型重点支持高级智能体工作流，提供不同级别的推理努力配置：常规任务采用高级别，复杂推理则启用更高强度。通过 IcePop 算法实现了可扩展的异步强化学习，从而支撑了面向长周期智能体任务的稳定万亿规模训练。

智能体开源生态推理模型发布

关联讨论 1 条

20:01

Chubby♨️@kimmonismus

传闻即将发布的Gemini 3.2 Flash模型在编码和推理任务上达到了GPT-5.5约92%的性能水平，同时推理成本降低了15至20倍。其延迟表现也极为出色，多数查询响应时间低于200毫秒。这主要得益于DeepMind的蒸馏和稀疏化技术，成功将前沿模型压缩为"Flash"变体，而避免了通常伴随的质量大幅下降。

Bindu Reddy: Gemini 3.2 Flash - Capitalizing on DeepMind's clever distillation techniques... Rumors are that benchmarks show it's hit...

Google推理模型发布编码

19:15

SenseTime@SenseTime_AI

精选77

由联合创始人兼首席科学家李沐博士领导的团队发布了SenseNova U1技术报告，详细阐述了其架构、训练方案与创新突破。此次开源同步发布了基于混合专家模型（MoE）的新权重，旨在推动AI领域的透明度、可复现性与进一步创新。团队希望通过开放共享促进整个社区的技术发展。

Dahua Lin: Proud to announce the release of the SenseNova U1 Tech Report - together with the a new set of model weights based on Mo...

开源/仓库开源生态数据/训练模型发布

关联讨论 1 条

推荐理由：商汤这次把SenseNova U1的MoE权重和完整技术报告一起开源，比常规PR多了些诚意，做模型选型和微调的值得翻翻。

16:01

Chubby♨️@kimmonismus

让我们开始：Google 的下一个 Gemini 模型预计将与 GPT-5.5 竞争。据报道，Google 正准备在 I/O 上发布一个新的 Gemini 模型，将其定位接近 OpenAI 最近的 GPT-5.5，而不是更难以捉摸的 Anthropic Mythos。 Google I/O 变得更加令人兴奋了。

Google模型发布

14:14

Kimi.ai@Kimi_Moonshot

Kimi K2.6 现已成为 Finance Agent Benchmark V2 开源权重排名第一。【引用 @ValsAI】：AI 能胜任金融分析师的工作吗？

Vals AI: Can AI do the job of a financial analyst? We just released V2 of our Finance Agent Benchmark and tested the frontier mod...

智能体模型发布

13:58

Xiaomi MiMo@XiaomiMiMo

MiMo V2.5 Pro （Thinking）模型在Design Arena的开放权重模型总排行榜中位列第三，相比前代MiMo-V2.5跃升了8个名次。其在前端编码任务上的表现已与Claude Sonnet 4.6处于同一性能区间。团队对测试者表示感谢，并承诺将持续改进模型。

Design Arena: BREAKING: MiMo V2.5 Pro (Thinking) takes 3rd overall out of open weights models on Design Arena. MiMo V2.5 Pro (Thinking...

推理编码评测/基准

关联讨论 1 条

13:32

Krea@krea_ai

Krea: this is Krea 2. our first foundation model, built completely from scratch for aesthetic diversity and stylistic control....

图像生成模型发布

09:51

Berryxia.AI@berryxia

Gemini 3.2 Pro与Flash发布在即，案例重复引不满

Google Gemini 3.2 Pro 和Flash 已经蓄势待发了。每次都是这几个Case 真的烦了，能不能整点炸裂一点的Case。据说是就近期要发布，但是看着样子也是赶鸭子上架，应该放鸽子啥的也是常有的事儿。

can: 🚨 FIRST GEMINI 3.2 PRO OUTPUTS From yours truly. I'll share more today, I can test your prompts too if you guys want. I...

Google多模态模型发布

04:01

Alibaba Cloud@alibaba_cloud

如果AI角色能够记忆、共情并主动交互呢？✨ 交互式AI的未来已来。无论您是为游戏、虚拟AI伴侣还是自适应学习进行开发，Qwen-Character都能打造沉浸式角色扮演体验，推动参与度加深50%以上并提升用户终身价值 👉 观看完整视频了解运作原理：https：//int.alibabacloud.com/m/1000412854/ #AlibabaCloud #Qwen #QwenCharacter #ModelStudio #AI

智能体模型发布

01:31

Krea@krea_ai

精选73

Krea 2 访问码发放！ K2-PRFUF8 / K2-NRWW9E / K2-CAP48S - 每个码可使用50次。访问链接如下 👇 【引用 @krea_ai】：this is Krea 2. our first foundation model， built completely from scratch for aesthetic diversity and stylistic control. learn more and get early access 👇

Krea: this is Krea 2. our first foundation model, built completely from scratch for aesthetic diversity and stylistic control....

图像生成模型发布

推荐理由：Krea 从套壳到自研模型这一步走得关键，专攻美学多样性和风格控制，对设计师来说是个值得立刻上手试的新选择。

00:29

Chubby♨️@kimmonismus

GPT-5.6 来得那么快，这不在我的预料之中。

leo 🐾: 🚨 SCOOP: The development cycle for GPT-5.6 is now in full swing at OpenAI. The first checkpoints of the model began tes...

OpenAI模型发布

5月13日

14:43

SenseTime@SenseTime_AI

精选72

SenseNova-U1 技术报告深度发布：前沿原生多模态模型构建全指南

SenseNova-U1 技术报告详尽披露了构建前沿原生多模态模型的方法，核心包括原生多模态统一建模、无损视觉接口、联合自回归与像素空间流匹配训练、以及原生混合专家骨干网络。报告提供了六阶段训练方案、强化学习后训练与蒸馏的完整实践指南。其开源版本 SenseNova-U1-A3B-MoT 基于混合专家架构，仅激活30亿参数，实现了高效快速的性能。相关资源已全面开放，涵盖技术报告、模型权重、代码和演示平台。

多模态开源/仓库模型发布

关联讨论 1 条

推荐理由：商汤把原生多模态模型的训练细节全公开了，无视觉编码器、原生MoE架构，还开源了38B-A3B权重，做多模态模型的可以直接照着技术报告复现。

11:55

Tencent Hy@TencentHunyuan

精选76

Hy3 预览版现已登陆 @gmi_cloud。🙌

GMI Cloud: Hy3 preview from @TencentHunyuan is now live on GMI #1 on OpenRouter's LLM leaderboard, open-sourced, and the strongest ...

智能体开源生态推理模型发布

推荐理由：腾讯混元 Hy3 开源且登顶 OpenRouter 排行榜，295B MoE 架构在推理和代码上提升明显，不是小厂的刷榜产品，搞 agent 和 coding 的可以认真试试。

08:49

Berryxia.AI@berryxia

Jina发布首个统一多模态Embedding模型v5-omni

Jina发布了其首个统一的多模态Embedding模型jina-embeddings-v5-omni，能够处理文本、图像、音频和视频。模型提供Small和Nano两种尺寸，分别具有1.57B和0.95B参数，并支持Matryoshka截断技术。关键优势在于完全向后兼容：现有jina-embeddings-v5-text的索引无需重新构建，可直接替换为v5-omni，在同一向量空间内实现对多媒体内容的搜索。该模型性能强劲，小尺寸即可媲美或超越参数量更大的开源模型。目前已上线Hugging Face、Jina API和Elastic Inference Service。

Jina AI: jina-embeddings-v5-omni is here! Our first universal embedding model for text, images, audio, and video. Available in tw...

Hugging Face检索增强多模态开源生态

05:03

DogeDesigner@cb_doge

xAI的Grok Voice Think Fast 1.0刚刚以73.7%的得分在Telecom Pass@1评测中夺得第一名🥇

xAI模型发布语音

03:54

StepFun@StepFun_ai

Step Image Edit 2图像模型发布，性能领先且高效

Step Image Edit 2模型正式发布。这是一个35亿参数的图像模型，在指令式图像编辑的权威基准KRIS-Bench中，于综合、事实和概念类别均排名第一，性能超越参数量为其5-6倍的模型。其核心能力包括文生图、基于指令的图像编辑、精准的中英双语文字渲染以及保持主体一致性的风格迁移。该模型生成速度快，单次编辑成本低，目前已上线Stepfun开放平台。

图像生成多模态模型发布

02:30

ClaudeDevs@ClaudeDevs

精选76

Claude Opus 4.7的快速模式现已在API和Claude Code中开放研究预览。

Anthropic推理模型发布编码

关联讨论 2 条

推荐理由：Opus 4.7 加推 Fast mode，编程场景延迟会降一大截，Claude Code 可以直接用，对天天在终端敲代码的人是个实在提升。

00:33

OpenRouter@OpenRouter

精选69

Perceptron Mk1已在OpenRouter上线，由@perceptroninc开发。前沿视频与具身推理的视觉语言模型。以动态帧率（最高2 FPS）分析视频，具备32k多模态上下文，采用混合推理和结构化空间基元（点、框、多边形、片段）作为首要输出。

多模态推理模型发布

推荐理由：将视频理解提升到结构化空间输出，动态帧率分析让模型能真正「看懂」动作，做具身智能的开发者可以关注。

5月12日

22:30

Krea@krea_ai

精选68

这是Krea 2。我们的首个基础模型，完全从零构建，旨在实现美学多样性和风格控制。了解更多并获取早期访问权限👇

图像生成模型发布

推荐理由：Krea 终于自研基础模型了，而且是从零开始做，专门为美学多样性和风格控制优化的，对做视觉内容的人来说多了一个风格自由度的选择，值得试试 early access。

21:31

Microsoft Research@MSFTResearch

MatterSim正在拓展AI在材料科学中的应用边界--从更快速的大规模模拟，到全新多任务模型MatterSim-MT，可模拟超越势能面的多种物性。https：//msft.it/6017vPamT

Microsoft模型发布

12:42

SenseTime@SenseTime_AI

SenseNova U1是一款高效统一语言与视觉的单模型，具备语义理解、像素级生成和复杂信息图创作能力。该模型被描述为能够阅读文本、生成图像、编辑照片及处理图文交错任务的"任意到任意"Transformer，如同集成了创意工作室功能，重新定义了多模态AI。开发者社区对其反响热烈。

Hugging Models: Imagine a single AI that can read text, generate images, edit photos, and even handle interleaved text+image tasks. Sens...

多模态模型发布

关联讨论 1 条

12:01

Rohan Paul@rohanpaul_ai

Thinking Machines 推出"始终在场"AI模型，革新传统轮替式交互

Thinking Machines公司发布了TML-Interaction-Small模型，旨在以“始终在场”的AI取代传统的轮替式对话AI。该模型采用混合专家架构，将音频、视频和文本流切分为200毫秒的微轮次，使其能在交互过程中并行执行聆听、观看、说话、绘图、搜索及调用工具等操作。其核心设计理念是让人工智能像人类一样实时并行处理多任务。模型在保持低延迟（0.40秒）的同时，保留了强大的推理与指令遵循能力，且交互性直接内建于模型架构，而非依赖外部组件拼凑实现。

Thinking Machines: People talk, listen, watch, think, and collaborate at the same time, in real time. We've designed an AI that works with ...

多模态模型发布语音

10:49

歸藏(guizang.ai)@op7418

Thinking Machines发布原生多模态"交互模型"，实现实时人机协作

前OpenAI CTO Mira创立的Thinking Machines公司发布了一种创新的“交互模型”。该模型能原生、持续地接收音频、视频和文本等多模态输入，并实时思考与响应，而非通过Agent串联多个独立模型。其架构分为两部分：前台交互模型以200毫秒为节点处理输入并维持用户“在场感”，支持随时打断；后台推理模型则处理长程规划、工具调用等复杂任务。两者协同工作，最终呈现为一个既能实时交互又能处理重度任务的统一界面。

Thinking Machines: People talk, listen, watch, think, and collaborate at the same time, in real time. We've designed an AI that works with ...

多模态推理模型发布

10:49

歸藏(guizang.ai)@op7418

谷歌或即将发布新一代视频模型Veo 4，功能全面升级

谷歌可能即将推出新一代视频生成模型，暂称Veo 4或类似名称。该模型被描述为类似Sora 2.0的全能参考模型，支持对现有视频进行修改参考和内容替换等操作。在文字生成质量上，它被认为比Sora 2.0略有优势，清晰度和细节可能也稍有提升。据透露，这款即将到来的Gemini Omni视频模型在视频编辑功能上将更为先进，能够完成去除水印、替换视频内物体等复杂任务。谷歌预计会发布该模型的两个版本，包括一个性能更强的Pro变体，而目前展示的样本可能并非Pro版本。

🚨 AI News | TestingCatalog: GOOGLE 🔥: An upcoming Gemini Omni video model from Google is expected to be much more advanced in video editing, capabl...

Google模型发布视频