AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
5月29日周五
5月28日周四
5月27日周三
5月26日周二
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月29日
01:06
Claude@claudeai
82
介绍 Claude Opus 4.8:它在 Opus 4.7 基础上,拥有更敏锐的判断力、对自身进展更诚实,并且能比前代更长时间独立工作。 今日发布,价格不变。
Anthropic推理模型发布
关联讨论 16 条X:OpenRouter (@OpenRouter)X:Thariq (@trq212)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)X:opencode (@opencode)X:Rohan Paul (@rohanpaul_ai)X:Boris Cherny (@bcherny)The Decoder:AI News(RSS)MarkTechPost(RSS)X:邵猛 (@shao__meng)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:宝玉 (@dotey)
01:06
swyx@swyx
67
开发者可以在任务执行过程中更新Claude的指令,而不会破坏提示词缓存或需要通过用户轮次来传递更新。

Claude: Introducing Claude Opus 4.8: it builds on Opus 4.7 with sharper judgment, more honesty about its own progress, and the a...

Anthropic推理模型发布
01:05
Anthropic:Newsroom(网页)
精选85
Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级

Anthropic 发布了新一代模型 Claude Opus 4.8,作为 Opus 4.7 的升级版本,其在编码、智能体技能、推理和实用知识工作等各项基准测试中均取得进步。Claude Opus 4.8 现已可用,价格与前代相同。同步推出的新功能包括:用户可控制任务投入程度、Claude Code 新增“动态工作流”特性,以及 Opus 4.8 的 2.5 倍速模式价格降低为以往的三分之一。早期测试者反馈其在智能体任务中的判断力更可靠、工具调用更高效。该模型在 Online-Mind2Web 测评中得分 84%,超越了 Opus 4.7 和 GPT-5.5。此外,其诚实度与对齐表现也得到提升,代码错误漏检率降低了约 75%。

智能体Anthropic推理模型发布
关联讨论 16 条X:OpenRouter (@OpenRouter)X:Thariq (@trq212)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)X:opencode (@opencode)X:Rohan Paul (@rohanpaul_ai)X:Boris Cherny (@bcherny)The Decoder:AI News(RSS)MarkTechPost(RSS)X:邵猛 (@shao__meng)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:宝玉 (@dotey)
推荐理由:Opus 4.8看着是常规升级,但动态工作流让Claude Code能啃下跨十万行代码迁移这种硬骨头,快速模式降价三倍更是直接拉低了实时场景的入场券。
00:31
AYi@AYi_AInotes
46
Claude桌面端代码模型选择器中已出现"Opus 4.8"选项。用户据此推测,新版本可能即将迎来偷袭式发布。

AYi: http://x.com/i/article/2057668634579714048

Anthropic模型发布
00:13
Chubby♨️@kimmonismus
70
来吧:是Opus 4.8加上Codex更新!

Gabriel Chua: CODEX

Anthropic推理模型发布
00:06
SenseTime@SenseTime_AI
精选65
SenseNova信息图表生成模型升级:文本、布局与图表质量全面增强

SenseNova-U1-8B-MoT-Infographic 是一个升级后的8B参数信息图表生成模型。其核心提升在于:增强了文本的准确性与可读性,减少了重复和不自然的放大;改进了布局的一致性与合理性,背景更稳定;提升了图表与示意图的渲染质量;并新增了学术内容的渲染支持。

Hugging Face图像生成多模态模型发布
关联讨论 1 条X:商汤 SenseTime (@SenseTime_AI)
推荐理由:商汤这个8B信息图生成模型升级了,文本和布局都更稳,对常做数据图表和学术配图的人算个实用的小迭代,没有到改变游戏规则的程度。
5月28日
23:38
Xiaomi MiMo@XiaomiMiMo
精选69
MiMo-V2.5现已在OpenCode上线--限时免费。🎉 【引用 @opencode】:OpenCode x MiMo V2.5 - 限时免费 1M上下文 • 推理 • 文本 • 图像

OpenCode: OpenCode x MiMo V2.5 - Free for a limited time 1M context • reasoning • text • image

多模态推理模型发布
关联讨论 1 条X:opencode (@opencode)
推荐理由:MiMo-V2.5在OpenCode免费开放,1M上下文加多模态推理,小米的模型迭代不算大新闻,但趁免费白嫖一下国产模型的机会别错过。如果你正在选型,跑个分试试。
23:36
SenseTime@SenseTime_AI
精选68
商汤发布信息图生成模型升级,增强多项核心能力

商汤科技介绍了其升级后的信息图生成模型 SenseNova-U1-8B-MoT-Infographic。该模型参数为8B,在四个关键维度进行了优化:文本准确性与可读性增强,减少了重复和不当放大;布局的一致性与合理性提升,背景更稳定;图表与示意图的质量提高;并新增了学术内容的渲染支持。推文提供了在 Hugging Face 上的模型页面链接及能力展示页面。

图像生成模型发布
关联讨论 1 条X:商汤 SenseTime (@SenseTime_AI)
推荐理由:信息图生成赛道又出新货,商汤这次把文本渲染和布局稳定性真正做好了,做学术图表或运营配图的人可以直接去HuggingFace试用,效果肉眼可见的提升。
23:19
IT之家(RSS)
60
消息称微软下周将推全新编程模型,以争取开发者群体认可

微软计划在下周Build大会发布多款自研AI模型,旨在争取开发者认可。其中将包含一款编程专用模型,以提升GitHub Copilot的竞争力,应对Cursor与Claude Code等对手的挑战。同时,微软还将推出多款不同规格的新模型,具备语音转写、逻辑推理、语音处理及图像生成等技能。

Microsoft多模态模型发布编码
23:18
🚨 AI News | TestingCatalog@testingcatalog
62
ANTHROPIC 🔥:Claude Opus 4.8 已在源代码中被发现。 它会在今天发布吗?👀

Tensor: Opus 4.8 has been found staged in the claude code model selector on the desktop app. It should be releasing today! lets ...

Anthropic模型发布
22:12
Chubby♨️@kimmonismus
66
天啊,来了:Opus 4.8 出现在桌面应用的 Claude Code 模型选择器里了。 看起来今天就是发布日!!

Tensor: Opus 4.8 has been found staged in the claude code model selector on the desktop app. It should be releasing today! lets ...

智能体Anthropic模型发布
18:10
Chubby♨️@kimmonismus
32
什么?!Opus 4.8 要来了?!天啊

leo 🐾: happy claude opus 4.8 day to those who celebrate

Anthropic模型发布
15:37
The Decoder:AI News(RSS)
60
ElevenLabs Music v2 实现从歌剧到重金属的流派转换而不失音乐连贯性

ElevenLabs 发布了升级版 AI 音乐生成模型 Music v2。该模型支持跨流派创作,单首乐曲可实现从歌剧到重金属再到说唱的风格转换,并保持音乐连贯性。新功能支持音乐局部重新生成,允许用户在不修改乐曲其他部分的情况下,对特定片段进行重写。

多模态模型发布
04:35
Krea@krea_ai
62
Krea 2现已内置到Hermes中。

Nous Research: Krea is now built in to Hermes Agent as an image generation API provider, allowing your agent to use Krea 2: a new found...

智能体图像生成模型发布
关联讨论 1 条X:Krea AI (@krea_ai)
04:05
Krea@krea_ai
精选73
Krea 2现已登陆Comfy! KREA的首个基础图像模型--从零训练--具备可调节的创造力、风格参考和情绪板条件控制。

ComfyUI: KREA 2 Image is now a Partner Node in ComfyUI KREA's first foundation image model - trained from scratch - with tunable ...

图像生成模型发布
关联讨论 1 条X:Krea AI (@krea_ai)
推荐理由:Krea 终于掏出自己的基础图像模型,不再只是包装别人模型。ComfyUI 原生节点让工作流玩家可以立刻上手折腾,自研模型的风格控制是个新鲜变量。
02:35
The Decoder:AI News(RSS)
55
微软 MAI-Image-2.5 在基准测试中追平谷歌 Nano Banana 2

微软的 MAI-Image-2.5 在 Arena 文本生成图像排行榜上排名第三,与谷歌的 Nano Banana 2 持平,但仍落后于 OpenAI 的 Image-2。该模型相比其前代产品有显著提升,特别是在渲染图像内文字和商业视觉效果方面。

Microsoft多模态模型发布
01:34
Krea@krea_ai
58
Krea 2 现已在 Runware 上线! - 两个版本:Large(照片级写实,创意控制)和 Medium(插画、动漫、设计) - 每次生成最多支持 10 张加权参考图 - 内置创意控制功能 - 支持情绪板和风格迁移 - 支持文生图和图生图模式

Runware: Krea 2 is now on Runware 🖌️ - two variants: Large (photorealism, creative control) & Medium (illustration, anime, desig...

图像生成模型发布
5月27日
22:37
TechCrunch:AI(RSS)
59
ElevenLabs 的新音乐生成模型能中途切换音乐风格

ElevenLabs 发布的新模型支持用户对歌曲的任意片段进行重新生成,且修改过程不会影响该曲目的其他部分。

多模态模型发布
16:27
Emad@EMostaque
69
很高兴看到 @poolsideai(美国实验室)承诺未来将开源其基础模型。 Laguna 是一个有趣的发布,去看看吧。

Jason Warner: @Shaughnessy119 https://poolside.ai/blog/introducing-laguna-xs2-m1 All models will be open going forward

开源生态模型发布编码
14:14
IT之家(RSS)
62
9.4 秒生成 512×512 图像,Bonsai Image 4B 生图 AI 登陆苹果 iPhone 17 Pro Max
图像生成模型发布端侧
14:14
IT之家(RSS)
63
微软最强生图 AI 模型 MAI-Image-2.5 冲上 Arena 第三:更强文字生成
Microsoft图像生成多模态模型发布
14:03
Alibaba Cloud@alibaba_cloud
78
100万上下文窗口。更智能的推理。更多可能性。很高兴看到 Qwen3.7 Max 现已通过 @opencode 支持 Go 语言调用 🚀

OpenCode: Qwen3.7 Max now available in Go - text only - 1M context - smartest model in the Qwen family to date

推理模型发布
关联讨论 9 条X:OpenRouter (@OpenRouter)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)X:阿里云 / Alibaba Cloud (@alibaba_cloud)Qwen:Blog Retrieval(API)X:通义千问 / Qwen (@Alibaba_Qwen)X:Kim (@kimmonismus)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)
10:33
歸藏(guizang.ai)@op7418
62
MiniMax M3模型要上了,好久没发新模型了他们

MiniMax (official): #MSA #OpenSource #M3 🫣😎

开源生态模型发布
09:31
Qwen@Alibaba_Qwen
精选68
🚀🚀 Qwen3.7-Max 刚刚在 Code Arena 上升至第 4 名,与 Claude Opus 4.6 持平,是榜单上排名最高的中国实验室!@arena 更多内容即将发布。敬请期待。🕶️

Arena.ai: Qwen3.7 Max (20250517) debuts at #4 in Code Arena: Frontend - the top-ranked Chinese lab on the board, surpassing GLM-5....

模型发布编码评测/基准
关联讨论 9 条X:OpenRouter (@OpenRouter)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)X:阿里云 / Alibaba Cloud (@alibaba_cloud)Qwen:Blog Retrieval(API)X:通义千问 / Qwen (@Alibaba_Qwen)X:Kim (@kimmonismus)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)
推荐理由:Qwen3.7-Max 在 Code Arena 前端任务上排第四,跟 Claude Opus 4.6 打平,国产模型第一次在 agentic web dev 摸到第一梯队,做 Web Agent 的可以认真看看。
08:27
Berryxia.AI@berryxia
55
M3动态稀疏注意力架构实现百万token上下文9.7倍加速

MiniMax即将发布M3模型。其核心架构为基于GQA的动态块稀疏注意力机制,通过轻量索引分支筛选相关token块进行稀疏注意力计算。性能方面,在1M token上下文窗口下,Prefill速度相比M2提升9.7倍,解码速度提升15.6倍。该设计旨在大幅降低处理超长上下文的算力成本,使百万token级别的Agent应用得以更高效落地。

Skyler Miao: Something BIG is coming

推理模型发布
07:37
Artificial Analysis@ArtificialAnlys
67
OpenBMB发布1B参数模型MiniCPM5-1B,在小规模开源模型中表现最优

OpenBMB发布了MiniCPM5-1B(Non-reasoning),一款1B参数的稠密大语言模型。该模型在Artificial Analysis Intelligence Index上获得17.9分,成为1B及以下开源模型中得分最高者。其得分领先同规模模型Qwen3.5 0.8B(10.5分)和Qwen3.5 2B(16.3分),性能超越前代模型MiniCPM-V 4.6 1.3B(12.7分)。MiniCPM5-1B为纯文本模型,上下文窗口128K,采用Apache 2.0许可证。在AA-Omniscience测试中,其通过选择“拒绝回答”而非猜测,避免了模型幻觉惩罚,获得了同尺寸类别的最高分。

开源生态模型发布端侧
07:27
Berryxia.AI@berryxia
71
PrismML发布Bonsai Image 4B极致压缩版本

PrismML发布了Bonsai Image 4B扩散模型的1-bit和Ternary两个极致压缩版本。1-bit版本仅0.93GB,比全精度模型缩小8.3倍;Ternary版本为1.21GB,采用-1、0、+1三元权重。两者在Mac M4 Pro上的生成速度最高可提升5.6倍,且生成质量可与更大模型相媲美。同时,PrismML推出了配套的iOS应用Bonsai Studio,支持在iPhone上完全离线、本地生成图像。

PrismML: Today we're releasing 1-bit and Ternary Bonsai Image 4B. A new family of image-generation models designed to run high-qu...

图像生成模型发布端侧
06:37
MarkTechPost(RSS)
61
Stability AI 发布 Stable Audio 3:用于音频生成与编辑的快速潜在扩散模型家族

Stability AI 发布了 Stable Audio 3,这是一个用于器乐和音效生成的潜在扩散模型家族。此次发布包含 Small 和 Medium 两个开放权重变体。Small 变体可在 MacBook Pro M4 CPU 上运行,Medium 变体适配 8GB 显存的消费级显卡。两者均采用流匹配、蒸馏预热和对抗后训练的三阶段流水线,以生成 44.1 kHz 的立体声音频。在 BBC Sound Effects 基准测试(5秒片段)中,SA3 Medium 的 FAD 得分为 0.369,优于论文中评估的所有开放权重基线。

多模态模型发布语音
02:39
🚨 AI News | TestingCatalog@testingcatalog
49
MiniMax M3 已被预告 🔥 > MiniMax M3 将基于新的稀疏注意力架构 > MiniMax M3 预计将开源 很快? 👀

MiniMax (official): #MSA #OpenSource #M3 🫣😎

开源/仓库模型发布
02:10
OpenCode@opencode
66
Qwen3.7 Max 现已在 Go 平台上线 - 仅支持文本 - 1M 上下文 - 迄今为止 Qwen 家族中最智能的模型
模型发布编码
关联讨论 9 条X:OpenRouter (@OpenRouter)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)X:阿里云 / Alibaba Cloud (@alibaba_cloud)Qwen:Blog Retrieval(API)X:通义千问 / Qwen (@Alibaba_Qwen)X:Kim (@kimmonismus)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)
00:01
Chubby♨️@kimmonismus
70
MiniMax发布M3稀疏注意力,1M上下文下解码加速15.6倍

MiniMax预览了其M3架构采用的新稀疏注意力(Sparse Attention)技术。测试显示,在1M token上下文下,该技术相比M2实现了9.7倍的预填充(prefilling)加速和15.6倍的解码(decoding)加速。M2曾为保证生产环境就绪而采用全注意力机制,M3则采用了新的两阶段方法:先用轻量级索引分支选择数据块,再仅对相关的KV块执行稀疏注意力。这是开源领域的新进展。

MiniMax (official): #MSA #OpenSource #M3 🫣😎

开源生态推理模型发布
5月26日
23:11
MiniMax (official)@MiniMax_AI
41
#MSA #开源 #M3 🫣😎

Skyler Miao: Something BIG is coming

开源生态模型发布
14:59
Alibaba Cloud@alibaba_cloud
68
Qwen3.7-Max 正式成为全球第二大 AI 编程模型。在 Code Arena 上得分 1541,仅次于 Claude。专为生产环境打造:可运行 35 小时任务、1000+ 次工具调用,并在数小时内交付两周的项目。
推理模型发布编码
关联讨论 9 条X:OpenRouter (@OpenRouter)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)X:阿里云 / Alibaba Cloud (@alibaba_cloud)Qwen:Blog Retrieval(API)X:通义千问 / Qwen (@Alibaba_Qwen)X:Kim (@kimmonismus)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)
14:28
向阳乔木@vista8
70
网易有道子曰4全模态模型开源,27B参数,TTS支持3秒声音克隆

网易有道发布子曰4,一个27B参数的全模态大语言模型,在视觉数理方向达到同规模SOTA,纯文本数理难题准确率为81.4%。该模型在27B“甜点级”参数规模下,实现了多模态与纯文本数理推理的双重优势。同时,子曰4全模态模型和TTS引擎已同步开源,开放参数权重,支持本地部署与二次训练。其TTS模型只需3秒即可克隆原声,支持14种语言,克隆准确度超97%,音色还原度达95%以上。

多模态开源生态模型发布语音
14:11
IT之家(RSS)
精选76
面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上

面壁智能开源其新一代端侧大语言模型MiniCPM5-1B。该模型仅1B参数,在AA-Index榜单上超越所有2B参数以下模型,相比3个月前的Qwen3.5-2B效果更优且参数量减半。经INT4量化后权重仅0.5GB,支持在手机和浏览器上运行。其Base Model版本由面壁智能自主研发的AI训练框架ForgeTrain预训练完成,现已全面开源模型权重、训练数据集与部署方案。

开源生态模型发布端侧
关联讨论 1 条IT之家(RSS)
推荐理由:1B参数干翻所有2B以下模型,量化后0.5GB就能塞进手机和浏览器,这个效率把端侧模型的门槛又压低了,做移动端AI的值得跟进。
13:11
IT之家(RSS)
精选77
谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题
智能体DeepMind开源生态推理

推荐理由:AlphaProof Nexus 不是刷榜,是真解了 Erdős 难题,56 年悬而未决的那两道——这说明 AI 开始从具身数学题爬向纯数学研究了,做理论的人该认真看一眼。
13:11
IT之家(RSS)
67
昆仑万维天工 AI 发布 SkyClaw-v1.0:面向真实工作流的百万上下文 Agent 模型

昆仑万维天工AI近日正式推出高性能智能体模型SkyClaw-v1.0及其轻量化版本SkyClaw-v1.0-lite。该模型支持百万token上下文,深度适配真实智能体工作场景,重点优化了复杂工具调用、多轮任务执行与代码生成等能力。在多项智能体基准测试中,其性能超越了MiniMax 2.7、DeepSeek V4 Flash等开源模型,并接近DeepSeek V4 Pro、Claude Opus 4.6等更大规模模型。该模型定价极具竞争力,已接入天工Skywork,并提供2至4周免费试用。

智能体模型发布编码
11:35
公众号:面壁智能(MiniCPM)
59
面壁智能联合清华大学、OpenBMB发布端侧文本基座模型MiniCPM5-1B

面壁智能联合清华大学、OpenBMB开源社区发布并开源MiniCPM5-1B,一款1B参数的端侧文本基座大模型。其在AA-Index榜单得分17.9分,超越所有2B以下参数模型,包括Qwen3.5-2B(16.3分),验证了智能密度约每3.5个月翻一番的密度定律。INT4量化后权重仅0.5GB,可运行于手机、浏览器等终端。Base Model由AI训练框架ForgeTrain(全球首个完全由AI编写,训练速度比Megatron快10%)在华为昇腾上预训练完成。模型全面开源权重、训练数据集Ultra-FineWeb-L3及部署方案,支持Llama_factory、SGLang、vLLM等主流框架。

Hugging Face开源生态推理模型发布
关联讨论 1 条公众号:面壁智能(MiniCPM)
11:30
公众号:昆仑万维(天工)
53
天工AI发布SkyClaw-v1.0:面向真实工作流的百万上下文Agent模型

天工AI今日推出SkyClaw-v1.0及轻量版SkyClaw-v1.0-lite,支持百万token上下文,深度适配复杂工具调用、多轮任务执行、代码生成与文件编辑等智能体场景。模型在主流Agent benchmark上全面超越Minimax 2.7、DeepSeek V4 Flash及Qwen 3.6,在OpenClaw任务上接近更大规模模型,定价低于Minimax 2.7与Qwen 3.6一半。训练采用大规模mid-train、合成轨迹SFT与端到端Agentic RL优化,适配OpenClaw、Hermes、Claude Code等主流Agent框架。模型已于5月22日接入天工Skywork,开放2至4周免费试用,并提供兼容OpenAI格式的免费API调用。

智能体模型发布编码
10:59
Tencent Hy@TencentHunyuan
69
腾讯混元新翻译模型双榜亮眼,小程序发布

腾讯混元发布翻译模型 Hy-MT2,在 Hugging Face 开源模型趋势排行榜上表现突出:1.8B 版本排名第一,30B-A3B(MoE)版本排名第四,下载量已超 7K。官方同步推出了基于该模型的“腾讯混译”微信小程序,支持语音输入与离线翻译,并可自定义翻译风格与指令。模型代码与权重已开源。

Hugging Face开源生态模型发布
关联讨论 2 条X:腾讯混元 (@TencentHunyuan)IT之家(RSS)
‹ 上一页
1…910111213…27
下一页 ›