Introducing Claude Opus 4.8: it builds on Opus 4.7 with sharper judgment, more honesty about its own progress, and the a...
Anthropic 发布了新一代模型 Claude Opus 4.8,作为 Opus 4.7 的升级版本,其在编码、智能体技能、推理和实用知识工作等各项基准测试中均取得进步。Claude Opus 4.8 现已可用,价格与前代相同。同步推出的新功能包括:用户可控制任务投入程度、Claude Code 新增“动态工作流”特性,以及 Opus 4.8 的 2.5 倍速模式价格降低为以往的三分之一。早期测试者反馈其在智能体任务中的判断力更可靠、工具调用更高效。该模型在 Online-Mind2Web 测评中得分 84%,超越了 Opus 4.7 和 GPT-5.5。此外,其诚实度与对齐表现也得到提升,代码错误漏检率降低了约 75%。
关联讨论 16 条X:OpenRouter (@OpenRouter)X:Thariq (@trq212)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)X:opencode (@opencode)X:Rohan Paul (@rohanpaul_ai)X:Boris Cherny (@bcherny)The Decoder:AI News(RSS)MarkTechPost(RSS)X:邵猛 (@shao__meng)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:宝玉 (@dotey)http://x.com/i/article/2057668634579714048
SenseNova-U1-8B-MoT-Infographic 是一个升级后的8B参数信息图表生成模型。其核心提升在于:增强了文本的准确性与可读性,减少了重复和不自然的放大;改进了布局的一致性与合理性,背景更稳定;提升了图表与示意图的渲染质量;并新增了学术内容的渲染支持。
关联讨论 1 条X:商汤 SenseTime (@SenseTime_AI)OpenCode x MiMo V2.5 - Free for a limited time 1M context • reasoning • text • image
关联讨论 1 条X:opencode (@opencode)商汤科技介绍了其升级后的信息图生成模型 SenseNova-U1-8B-MoT-Infographic。该模型参数为8B,在四个关键维度进行了优化:文本准确性与可读性增强,减少了重复和不当放大;布局的一致性与合理性提升,背景更稳定;图表与示意图的质量提高;并新增了学术内容的渲染支持。推文提供了在 Hugging Face 上的模型页面链接及能力展示页面。
关联讨论 1 条X:商汤 SenseTime (@SenseTime_AI)微软计划在下周Build大会发布多款自研AI模型,旨在争取开发者认可。其中将包含一款编程专用模型,以提升GitHub Copilot的竞争力,应对Cursor与Claude Code等对手的挑战。同时,微软还将推出多款不同规格的新模型,具备语音转写、逻辑推理、语音处理及图像生成等技能。
Opus 4.8 has been found staged in the claude code model selector on the desktop app. It should be releasing today! lets ...
Opus 4.8 has been found staged in the claude code model selector on the desktop app. It should be releasing today! lets ...
ElevenLabs 发布了升级版 AI 音乐生成模型 Music v2。该模型支持跨流派创作,单首乐曲可实现从歌剧到重金属再到说唱的风格转换,并保持音乐连贯性。新功能支持音乐局部重新生成,允许用户在不修改乐曲其他部分的情况下,对特定片段进行重写。
Krea is now built in to Hermes Agent as an image generation API provider, allowing your agent to use Krea 2: a new found...
关联讨论 1 条X:Krea AI (@krea_ai)KREA 2 Image is now a Partner Node in ComfyUI KREA's first foundation image model - trained from scratch - with tunable ...
关联讨论 1 条X:Krea AI (@krea_ai)微软的 MAI-Image-2.5 在 Arena 文本生成图像排行榜上排名第三,与谷歌的 Nano Banana 2 持平,但仍落后于 OpenAI 的 Image-2。该模型相比其前代产品有显著提升,特别是在渲染图像内文字和商业视觉效果方面。
Krea 2 is now on Runware 🖌️ - two variants: Large (photorealism, creative control) & Medium (illustration, anime, desig...
ElevenLabs 发布的新模型支持用户对歌曲的任意片段进行重新生成,且修改过程不会影响该曲目的其他部分。
@Shaughnessy119 https://poolside.ai/blog/introducing-laguna-xs2-m1 All models will be open going forward
Qwen3.7 Max now available in Go - text only - 1M context - smartest model in the Qwen family to date
关联讨论 9 条X:OpenRouter (@OpenRouter)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)X:阿里云 / Alibaba Cloud (@alibaba_cloud)Qwen:Blog Retrieval(API)X:通义千问 / Qwen (@Alibaba_Qwen)X:Kim (@kimmonismus)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen3.7 Max (20250517) debuts at #4 in Code Arena: Frontend - the top-ranked Chinese lab on the board, surpassing GLM-5....
关联讨论 9 条X:OpenRouter (@OpenRouter)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)X:阿里云 / Alibaba Cloud (@alibaba_cloud)Qwen:Blog Retrieval(API)X:通义千问 / Qwen (@Alibaba_Qwen)X:Kim (@kimmonismus)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)MiniMax即将发布M3模型。其核心架构为基于GQA的动态块稀疏注意力机制,通过轻量索引分支筛选相关token块进行稀疏注意力计算。性能方面,在1M token上下文窗口下,Prefill速度相比M2提升9.7倍,解码速度提升15.6倍。该设计旨在大幅降低处理超长上下文的算力成本,使百万token级别的Agent应用得以更高效落地。
Something BIG is coming
OpenBMB发布了MiniCPM5-1B(Non-reasoning),一款1B参数的稠密大语言模型。该模型在Artificial Analysis Intelligence Index上获得17.9分,成为1B及以下开源模型中得分最高者。其得分领先同规模模型Qwen3.5 0.8B(10.5分)和Qwen3.5 2B(16.3分),性能超越前代模型MiniCPM-V 4.6 1.3B(12.7分)。MiniCPM5-1B为纯文本模型,上下文窗口128K,采用Apache 2.0许可证。在AA-Omniscience测试中,其通过选择“拒绝回答”而非猜测,避免了模型幻觉惩罚,获得了同尺寸类别的最高分。
PrismML发布了Bonsai Image 4B扩散模型的1-bit和Ternary两个极致压缩版本。1-bit版本仅0.93GB,比全精度模型缩小8.3倍;Ternary版本为1.21GB,采用-1、0、+1三元权重。两者在Mac M4 Pro上的生成速度最高可提升5.6倍,且生成质量可与更大模型相媲美。同时,PrismML推出了配套的iOS应用Bonsai Studio,支持在iPhone上完全离线、本地生成图像。
Today we're releasing 1-bit and Ternary Bonsai Image 4B. A new family of image-generation models designed to run high-qu...
Stability AI 发布了 Stable Audio 3,这是一个用于器乐和音效生成的潜在扩散模型家族。此次发布包含 Small 和 Medium 两个开放权重变体。Small 变体可在 MacBook Pro M4 CPU 上运行,Medium 变体适配 8GB 显存的消费级显卡。两者均采用流匹配、蒸馏预热和对抗后训练的三阶段流水线,以生成 44.1 kHz 的立体声音频。在 BBC Sound Effects 基准测试(5秒片段)中,SA3 Medium 的 FAD 得分为 0.369,优于论文中评估的所有开放权重基线。
#MSA #OpenSource #M3 🫣😎
MiniMax预览了其M3架构采用的新稀疏注意力(Sparse Attention)技术。测试显示,在1M token上下文下,该技术相比M2实现了9.7倍的预填充(prefilling)加速和15.6倍的解码(decoding)加速。M2曾为保证生产环境就绪而采用全注意力机制,M3则采用了新的两阶段方法:先用轻量级索引分支选择数据块,再仅对相关的KV块执行稀疏注意力。这是开源领域的新进展。
#MSA #OpenSource #M3 🫣😎
网易有道发布子曰4,一个27B参数的全模态大语言模型,在视觉数理方向达到同规模SOTA,纯文本数理难题准确率为81.4%。该模型在27B“甜点级”参数规模下,实现了多模态与纯文本数理推理的双重优势。同时,子曰4全模态模型和TTS引擎已同步开源,开放参数权重,支持本地部署与二次训练。其TTS模型只需3秒即可克隆原声,支持14种语言,克隆准确度超97%,音色还原度达95%以上。
面壁智能开源其新一代端侧大语言模型MiniCPM5-1B。该模型仅1B参数,在AA-Index榜单上超越所有2B参数以下模型,相比3个月前的Qwen3.5-2B效果更优且参数量减半。经INT4量化后权重仅0.5GB,支持在手机和浏览器上运行。其Base Model版本由面壁智能自主研发的AI训练框架ForgeTrain预训练完成,现已全面开源模型权重、训练数据集与部署方案。
关联讨论 1 条IT之家(RSS)昆仑万维天工AI近日正式推出高性能智能体模型SkyClaw-v1.0及其轻量化版本SkyClaw-v1.0-lite。该模型支持百万token上下文,深度适配真实智能体工作场景,重点优化了复杂工具调用、多轮任务执行与代码生成等能力。在多项智能体基准测试中,其性能超越了MiniMax 2.7、DeepSeek V4 Flash等开源模型,并接近DeepSeek V4 Pro、Claude Opus 4.6等更大规模模型。该模型定价极具竞争力,已接入天工Skywork,并提供2至4周免费试用。
面壁智能联合清华大学、OpenBMB开源社区发布并开源MiniCPM5-1B,一款1B参数的端侧文本基座大模型。其在AA-Index榜单得分17.9分,超越所有2B以下参数模型,包括Qwen3.5-2B(16.3分),验证了智能密度约每3.5个月翻一番的密度定律。INT4量化后权重仅0.5GB,可运行于手机、浏览器等终端。Base Model由AI训练框架ForgeTrain(全球首个完全由AI编写,训练速度比Megatron快10%)在华为昇腾上预训练完成。模型全面开源权重、训练数据集Ultra-FineWeb-L3及部署方案,支持Llama_factory、SGLang、vLLM等主流框架。
关联讨论 1 条公众号:面壁智能(MiniCPM)天工AI今日推出SkyClaw-v1.0及轻量版SkyClaw-v1.0-lite,支持百万token上下文,深度适配复杂工具调用、多轮任务执行、代码生成与文件编辑等智能体场景。模型在主流Agent benchmark上全面超越Minimax 2.7、DeepSeek V4 Flash及Qwen 3.6,在OpenClaw任务上接近更大规模模型,定价低于Minimax 2.7与Qwen 3.6一半。训练采用大规模mid-train、合成轨迹SFT与端到端Agentic RL优化,适配OpenClaw、Hermes、Claude Code等主流Agent框架。模型已于5月22日接入天工Skywork,开放2至4周免费试用,并提供兼容OpenAI格式的免费API调用。
腾讯混元发布翻译模型 Hy-MT2,在 Hugging Face 开源模型趋势排行榜上表现突出:1.8B 版本排名第一,30B-A3B(MoE)版本排名第四,下载量已超 7K。官方同步推出了基于该模型的“腾讯混译”微信小程序,支持语音输入与离线翻译,并可自定义翻译风格与指令。模型代码与权重已开源。
关联讨论 2 条X:腾讯混元 (@TencentHunyuan)IT之家(RSS)