AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
5月26日周二
5月25日周一
5月24日周日
5月23日周六
5月22日周五
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月26日
11:35
公众号:面壁智能(MiniCPM)
59
面壁智能联合清华大学、OpenBMB发布端侧文本基座模型MiniCPM5-1B

面壁智能联合清华大学、OpenBMB开源社区发布并开源MiniCPM5-1B,一款1B参数的端侧文本基座大模型。其在AA-Index榜单得分17.9分,超越所有2B以下参数模型,包括Qwen3.5-2B(16.3分),验证了智能密度约每3.5个月翻一番的密度定律。INT4量化后权重仅0.5GB,可运行于手机、浏览器等终端。Base Model由AI训练框架ForgeTrain(全球首个完全由AI编写,训练速度比Megatron快10%)在华为昇腾上预训练完成。模型全面开源权重、训练数据集Ultra-FineWeb-L3及部署方案,支持Llama_factory、SGLang、vLLM等主流框架。

Hugging Face开源生态推理模型发布
关联讨论 1 条公众号:面壁智能(MiniCPM)
11:30
公众号:昆仑万维(天工)
53
天工AI发布SkyClaw-v1.0:面向真实工作流的百万上下文Agent模型

天工AI今日推出SkyClaw-v1.0及轻量版SkyClaw-v1.0-lite,支持百万token上下文,深度适配复杂工具调用、多轮任务执行、代码生成与文件编辑等智能体场景。模型在主流Agent benchmark上全面超越Minimax 2.7、DeepSeek V4 Flash及Qwen 3.6,在OpenClaw任务上接近更大规模模型,定价低于Minimax 2.7与Qwen 3.6一半。训练采用大规模mid-train、合成轨迹SFT与端到端Agentic RL优化,适配OpenClaw、Hermes、Claude Code等主流Agent框架。模型已于5月22日接入天工Skywork,开放2至4周免费试用,并提供兼容OpenAI格式的免费API调用。

智能体模型发布编码
10:59
Tencent Hy@TencentHunyuan
69
腾讯混元新翻译模型双榜亮眼,小程序发布

腾讯混元发布翻译模型 Hy-MT2,在 Hugging Face 开源模型趋势排行榜上表现突出:1.8B 版本排名第一,30B-A3B(MoE)版本排名第四,下载量已超 7K。官方同步推出了基于该模型的“腾讯混译”微信小程序,支持语音输入与离线翻译,并可自定义翻译风格与指令。模型代码与权重已开源。

Hugging Face开源生态模型发布
关联讨论 2 条X:腾讯混元 (@TencentHunyuan)IT之家(RSS)
09:55
Alibaba Cloud@alibaba_cloud
16
Anthropic发布了Claude Code的更新,现在它可以在后台运行任务。
模型发布
09:11
IT之家(RSS)
59
Anthropic 或公开最强模型 Mythos,曾短暂现身多款产品

据科技媒体报道,Anthropic 似乎准备公开上线其前沿模型 Claude Mythos 预览版。该模型名称“claude-mythos-1-preview”曾短暂出现在 Claude Code 和 Claude Security 的公开版本中。Claude Mythos 定位为面向计算机安全任务的模型,相比现有旗舰模型 Opus 4.7,在代码推理和自主执行方面有显著提升。但因其能力过强,Anthropic 担忧公开发布可能带来安全风险,目前尚未全面开放。同时,Anthropic 还在推进名为“Glasswing”的联合项目,旨在保护关键软件系统。

Anthropic安全/对齐模型发布
03:20
Emad@EMostaque
58
xAI的Grok基础模型V9-Medium(1.5T参数)已完成训练,评测结果良好。在补充训练中加入了大量Cursor数据。该模型即将开始微调,几天后启动强化学习,预计2至3周后向公众发布。这将是相较于目前服务所有Grok生产流量的0.5T参数v8-small模型的重大改进,尤其在复杂编码任务上。有人推测其后训练可能使用了类似Cursor调整Kimi时远超预训练的计算量。

Elon Musk: Grok foundation model V9-Medium (1.5T) has finished training. Evals look good. A lot of Cursor data was added in supplem...

xAI模型发布编码
5月25日
15:11
IT之家(RSS)
52
马斯克宣布 Grok V9-Medium 1.5T 模型完成训练:加入大量 Cursor 数据,两到三周内发布
xAI模型发布编码
15:08
🚨 AI News | TestingCatalog@testingcatalog
48
Grok基础模型V9-Medium(参数规模1.5T)已完成训练,评估结果良好,预计2-3周内向公众发布。该模型相较于当前服务所有Grok生产流量的0.5T v8-Small版本有巨大改进,尤其针对高难度编码任务。训练中加入了大量Cursor数据,并且未来还会有更多补充训练。目前微调已进行,强化学习将在几天内开始。

Elon Musk: Grok foundation model V9-Medium (1.5T) has finished training. Evals look good. A lot of Cursor data was added in supplem...

xAI模型发布编码
13:50
Elon Musk@elonmusk
精选71
Grok基础模型V9-Medium(1.5T)已完成训练。评估结果良好。补充训练中加入了大量Cursor数据,后续还会有更多。 微调正在进行中,强化学习将在几天后开始。预计2到3周内公开发布。 这将比当前服务所有Grok生产流量的0.5T v8-small模型有重大改进,尤其在复杂编码任务上。
xAI模型发布编码

推荐理由:Grok 参数翻到 1.5T,还专门喂了 Cursor 代码数据,这波升级明显奔着 coding 去的。如果 evals 不注水,两周后的 coding 排行榜可能变天。
13:21
小互@xiaohu
61
影眸科技发布 Rodin Gen-2.5 3D 生成模型

影眸科技推出 Rodin Gen-2.5,号称全球首个千万面级 3D 生成模型。该模型提供从极低(4秒)到极高(80秒)的五档思考模式,以平衡生成速度与细节精度。其原生 3D 贴图算法能在三维空间直接生成纹理,支持 PBR 材质与 360° 无死角覆盖,并提供 Faithful(贴合参考)与 Creative(自动优化)两种贴图模式。该模型已获 SIGGRAPH 2025 最佳论文奖。

多模态模型发布
12:11
IT之家(RSS)
精选72
面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN
开源生态模型发布端侧

推荐理由:谁说国产算力只能跑小模型?面壁这个1.58-bit模型在昇腾上原生训练,直接把8B塞进旗舰手机,开源全套训练底座,做端侧的该看一眼。
11:35
公众号:面壁智能(MiniCPM)
59
面壁智能联合清华开源中国首个基于昇腾训练的1.58-bit端侧大模型 BitCPM-CANN

面壁智能联合清华大学正式开源中国首个基于昇腾训练的1.58-bit端侧大模型BitCPM-CANN,实现6倍显存效率提升,可将60B参数大模型封装进手机等端侧设备。

推理模型发布端侧
07:06
MarkTechPost(RSS)
61
阶跃星辰发布StepAudio 2.5 Realtime:一款具有角色扮演RLHF和副语言理解的端到端语音模型

阶跃星辰于2026年5月发布StepAudio 2.5 Realtime,这是一款支持完全可定制个性化角色的端到端实时语音大语言模型。该模型通过WebSocket API提供服务,支持中英文。在2026年4月进行的五个基准测试维度中均排名第一,具体包括80.41的人类评测得分和82.18的副语言理解得分。

模型发布语音
06:27
Chubby♨️@kimmonismus
71
Google DeepMind的AlphaProof Nexus自主解决多个开放数学问题

Google DeepMind的AlphaProof Nexus系统自主解决了9个开放的Erdős问题(部分问题存在56年),每个问题的成本约几百美元。它还证明了44个OEIS猜想,解决了一个15年的代数几何问题,并在优化理论中发现了新算法参数。其核心机制是将大语言模型的推理能力与Lean形式化验证系统结合,Lean自动检查每一步逻辑,无需人工复核。研究发现,一个仅交替使用大语言模型生成与编译器反馈的基础智能体,便能复现全部9个Erdős问题的成功。该系统还能检测并修正现有数学文献中的表述错误。其局限在于成功案例集中于Lean数学库成熟的领域(如组合、数论),仍无法解决需要全新理论的大问题。

DeepMind开源生态推理模型发布
5月24日
16:06
MarkTechPost(RSS)
56
NVIDIA发布Gated DeltaNet-2:解耦Delta规则中擦除与写入的线性注意力层

NVIDIA推出了改进的线性注意力模型Gated DeltaNet-2。其核心创新在于将Delta规则中控制记忆擦除与写入的单一门控机制,解耦为两个独立的通道级门控。该模型参数规模为1.3B,在100B个FineWeb-Edu令牌数据上训练。实验表明,它在语言建模、常识推理和长上下文检索等任务中全面超越了Mamba-2、Gated DeltaNet、KDA及Mamba-3等现有模型,尤其在RULER S-NIAH和多关键针检索任务中取得了最显著的性能提升。

推理搜索模型发布
07:07
🚨 AI News | TestingCatalog@testingcatalog
65
ANTHROPIC 🔥:Mythos 1,即"claude-mythos-1-preview",正准备在Claude Code和Claude Security上发布。 该模型曾在Claude上短暂可见;此外,新增了提及Mythos的字符串。 > 在Claude Code和Claude Security中访问Claude Mythos模型。 根据Anthropic之前的沟通,这仍不意味着公众将能访问此确切模型。 更多详情请见下方 👇
Anthropic推理模型发布
06:49
StepFun@StepFun_ai
精选76
StepAudio实时语音发布,能听懂你的语气与言外之意

StepAudio 2.5 Realtime 是一款实时语音交互模型。其核心优势在于能感知用户的副语言特征,如语气、节奏、停顿甚至轻叹,从而理解话语背后的真实意图。该模型支持通过 API 高度定制角色人格与说话风格,内置超过10,000种可组合的预置角色,并提供5种开箱即用的预设角色供体验。同时,模型经过RLHF优化,能在复杂的角色扮演压力测试中稳定保持设定的人设。支持中英文双语交互。

模型发布语音
关联讨论 1 条X:阶跃星辰 StepFun (@StepFun_ai)
推荐理由:StepFun 这个语音模型把副语言感知做进了实时 API,产品人想搞点情感化语音交互的可以试试,预设角色能省不少调 prompt 的功夫。
05:27
Chubby♨️@kimmonismus
56
看起来 GPT-5.6 的发布非常接近了。真的很期待。5.5 已经是一个极其出色的模型了。希望它在"感觉"上能再好一点。 【引用 @synthwavedd】:我非常激动地宣布,看起来他们开始在 GPT-5.6 的 UI 去臃肿化方面取得进展了!🥹 这是第一个没有任何 UI 指引("默认")的提示词效果--我们正在取得进展……

leo 🐾: i am absolutely THRILLED to announce that it appears they're beginning to make strides on UI de-slopification with GPT-5...

OpenAI模型发布
00:57
Chubby♨️@kimmonismus
66
在Google Vertex上发现了Opus 4.8。不过这一点尚无法确认。 然而,自数据泄露以来,Sonnet 4.8即将到来已是众所周知。 Opus 4.8出现在Vertex上让我感到意外--不过,考虑到加速的发布节奏和GPT-5.5的巨大成功,这确实有可能。 简直太令人兴奋了!

can: claude-opus-4.8 is on Google Vertex 👀

Anthropic模型发布行业动态
5月23日
18:27
The Decoder:AI News(RSS)
65
阿里巴巴最新AI模型自主运行35小时为自研芯片优化代码

阿里巴巴云千问团队发布Qwen3.7-Max,这是一款专为长时间自主智能体任务设计的闭源模型。该模型曾在单次会话中持续运行35小时,为阿里巴巴自研的专用芯片优化代码。在标准基准测试中,Qwen3.7-Max的表现与Claude Opus 4.6持平,并超越了国内竞品如DeepSeek V4 Pro和Kimi K2.6。此外,团队还现场演示了该模型指挥一个四足机器人执行任务的能力。

智能体模型发布编码
15:09
IT之家(RSS)
56
让机器人拥有"肌肉记忆",智元推出新一代二阶段 BFM-2 基座模型

智元于5月23日发布新一代二阶段运动控制基座模型BFM-2,其核心特点是让机器人具备“肌肉记忆”。该模型使机器人能在静态、预设动作或随机输入等任意状态下,自主完成高稳定性的动作插值与动态任务闭环,为具身智能提供可靠的运动基础。演示视频显示,搭载该模型的机器人在被击倒后能快速自主站起并恢复平衡。

具身智能数据/训练模型发布
11:09
IT之家(RSS)
65
微软推出 Fara1.5 系列浏览器 AI 智能体模型,72% 任务成功率超 OpenAI Operator

微软研究院发布了 Fara1.5 系列浏览器 AI 智能体模型,包含 4B、9B 和 27B 三个版本。该模型专为浏览器操作设计,能读取截图并输出鼠标键盘指令。其 27B 版本在 Online-Mind2Web 基准测试中取得 72% 的任务成功率,显著超过 OpenAI Operator(58.3%)和 Gemini 2.5 Computer Use(57.3%)。模型基于约 200 万样本微调训练,并具备安全机制,在关键操作前会主动向用户确认。

智能体Microsoft模型发布
08:16
Hugging Face:Blog(RSS)
精选63
NVIDIA 发布 Nemotron-Labs Diffusion 系列模型,支持三种生成模式

NVIDIA 发布 Nemotron-Labs Diffusion 系列,含 3B、8B、14B 文本模型和 8B 视觉-语言模型(VLM),均采用商用友好的 NVIDIA Nemotron Open Model License 或 NVIDIA Source Code License。模型支持自回归、扩散(逐块并行生成后逐步精炼)和自推测(扩散草拟候选 token 再自回归验证)三种模式。8B 模型平均准确率比 Qwen3 8B 提升 1.2%,扩散模式每次前向传递的 token 数(TPF)达自回归的 2.6 倍,自推测达 6–6.4 倍。模型在 1.3T tokens 上预训练、45B tokens 上微调,代码与模型已发布于 HuggingFace 和 GitHub,推理将获 SGLang 支持。

多模态推理模型发布

推荐理由:自推测模式让文本生成速度飙到AR模型的4倍,而且输出质量无损。NVIDIA这次开源的不仅是个新模型,更是一套能直接用在现有流程里的加速方案。
06:37
🚨 AI News | TestingCatalog@testingcatalog
65
Anthropic在Project Glasswing项目最新进展中宣布,Mythos级模型在开发出更强的安全防护措施后,预计将向公众开放。此前,Anthropic与合作伙伴通过该项目已发现超过一万个关键或高危软件漏洞。这为模型后续的强安全防护开发提供了重要背景与方向。

Anthropic: Last month we launched Project Glasswing, our collaborative AI cybersecurity initiative. Since then, we and our partners...

Anthropic安全/对齐模型发布
5月22日
22:56
Rohan Paul@rohanpaul_ai
精选75
首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布

ModelBest、清华大学与OpenBMB社区联合发布了BitCPM-CANN,这是全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三元大模型。其核心创新在于采用仅含三种权重状态的极低比特量化技术,使模型内存占用相比BF16降低约6倍,可高效部署于手机、电脑、车载设备等边缘端。更关键的是,整个训练全栈(从量化算子到框架)均在昇腾上原生构建与验证,而非简单移植。该模型家族(0.5B-8B)在多项基准测试上保持了全精度模型95-97%的性能,为资源受限环境下部署和复现大模型提供了可落地的解决方案。

OpenBMB: 🚀 BitCPM-CANN by ModelBest × @Tsinghua_Uni × OpenBMB is here - and it's not about stacking parameters. Memory costs are...

开源/仓库模型发布端侧

推荐理由:首个开源的1.58-bit三元LLM,直接在昇腾芯片上原生训练,内存压缩到BF16的六分之一,8B模型就能跑在手机上,做端侧部署的可以立刻上手试试了。
22:19
Runway@runwayml
71
昨日我们发布了Aleph 2.0,这是我们升级后的视频编辑模型,可让您在保持其他内容不变的情况下,精确修改所需部分。该模型现已集成于全新的Edit Studio中,支持处理最长30秒、1080p分辨率的多镜头序列。 立即通过Runway Academy学习如何开始使用。
模型发布视频
关联讨论 3 条X:Runway (@runwayml)Runway:Changelog(网页)Runway:News(网页)
20:09
IT之家(RSS)
75
阿里千问 App、PC 端及网页端接入全新一代大模型 Qwen3.7-Max

5月22日,阿里千问App官方宣布,千问App、PC端及网页端接入全新一代大模型Qwen3.7-Max。用户需将千问App更新至6.9.7及以上版本,即可免费体验该模型。Qwen3.7-Max定位为全能的智能体基座,核心能力覆盖编程开发、办公流程自动化及超长周期任务执行。官方实测显示,在一项长达35小时、包含超过1000次工具调用的全自主内核优化实验中,该模型保持了连贯推理。此外,模型具备跨框架泛化能力,并即将通过阿里云百炼平台提供API调用服务。

智能体MCP/工具模型发布
关联讨论 10 条X:OpenRouter (@OpenRouter)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)Qwen:Blog Retrieval(API)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:Kim (@kimmonismus)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)X:opencode (@opencode)
19:20
Alibaba Cloud@alibaba_cloud
69
Qwen3.7-Max现已在Model Studio上线,限时五折(5月22日至6月22日)! 可靠的跨框架支持。专为一键部署和无缝集成到现有技术栈而设计。 🚀 立即体验:https://int.alibabacloud.com/m/1000413314/
模型发布部署/工程
关联讨论 10 条X:OpenRouter (@OpenRouter)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)Qwen:Blog Retrieval(API)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:Kim (@kimmonismus)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)X:opencode (@opencode)
19:20
Alibaba Cloud@alibaba_cloud
79
Qwen3.7-Max现已登陆Model Studio,限时五折(5月22日至6月22日)! 100万上下文窗口。专为在长上下文智能体推理中,无缝处理和保留大规模企业数据流而构建。 🚀 立即体验:https://int.alibabacloud.com/m/1000413314/
推理模型发布
关联讨论 10 条X:OpenRouter (@OpenRouter)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)Qwen:Blog Retrieval(API)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:Kim (@kimmonismus)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)X:opencode (@opencode)
18:50
Alibaba Cloud@alibaba_cloud
82
Qwen3.7-Max现已登陆Model Studio,限时五折(5月22日至6月22日)! 旗舰级编程智能体性能。专为可靠、多步骤的软件执行而设计,最大限度减少人工干预。 🚀 立即体验:https://int.alibabacloud.com/m/1000413314/
智能体模型发布编码
关联讨论 10 条X:OpenRouter (@OpenRouter)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)Qwen:Blog Retrieval(API)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:Kim (@kimmonismus)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)X:opencode (@opencode)
18:19
Qwen@Alibaba_Qwen
77
⚡️⚡️ 【引用 @OpenRouter】:来自 @Alibaba_Qwen 的全新 Qwen3.7-Max 已在 OpenRouter 上线。 作为 Qwen3.7 系列的旗舰模型,专为以智能体为中心的工作而构建:编程、办公与生产力任务,以及长周期自主执行。在编程和智能体基准测试中较 Qwen3.6 有显著提升,并支持显式的提示缓存以处理重复上下文。

OpenRouter: The new Qwen3.7-Max from @Alibaba_Qwen is live on OpenRouter. The flagship of the Qwen3.7 series, built for agent-centri...

智能体模型发布编码
关联讨论 10 条X:OpenRouter (@OpenRouter)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)Qwen:Blog Retrieval(API)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:Kim (@kimmonismus)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)X:opencode (@opencode)
18:09
IT之家(RSS)
精选70
网易有道"子曰4"多模态模型、语音合成模型全量开源

网易有道宣布将其“子曰”大模型4.0的多模态模型与语音合成模型面向全球全量开源。其中,多模态模型(27B参数)专注于教育场景,在处理高难度视觉数理问题上达到行业顶尖水平,纯文本中文数理难题准确率为81.4%。该模型通过思维链优化,将输出长度压缩43.2%,有效降低了推理成本。同时开源的语音合成模型支持跨语种音色与情感迁移克隆,3秒内即可完成零样本复制,准确度超97%,并支持包括中、英、日、韩在内的14种语言。

多模态开源生态推理模型发布

推荐理由:有道把垂直教育的多模态模型全量开源,27B参数在视觉数理上做到SOTA,还把思维链压缩了43%,推理成本实打实下降,做教育应用的可以拿来做二次开发;TTS的跨语种情感克隆也实用,3秒克隆14种语言。
16:35
MarkTechPost(RSS)
66
微软发布Fara1.5浏览器操作智能体系列:性能超越OpenAI Operator与Gemini 2.5

微软研究院近日推出Fara1.5系列浏览器操作智能体,包含4B、9B和27B三种参数规模。其中最大模型Fara1.5-27B在Online-Mind2Web基准测试中达到72%的准确率,显著优于OpenAI Operator、Gemini 2.5 Computer Use等主流模型。此次发布同步推出FaraGen1.5合成数据流水线,可在受控环境中高效训练智能体,为自动化浏览器操作提供了新解决方案。

智能体MCP/工具Microsoft模型发布
15:09
IT之家(RSS)
70
美团开源 LongCat-Video-Avatar 1.5:数字人视频从"彩排"走向"真舞台",生成 10 秒视频仅需 1 分钟

美团技术团队开源了数字人视频生成模型 LongCat-Video-Avatar 1.5。该版本在唇形同步、物理合理性、长视频稳定性和多人互动方面全面升级,支持复杂语音输入与多种主体。通过 DMD 蒸馏技术,推理效率提升约 15 倍,生成 10 秒视频仅需约 1 分钟。在性能评测中,模型在四个关键维度表现领先,用户偏好对比中胜率均超 54%,旨在推动数字人视频从技术演示走向商业应用。

开源生态推理模型发布视频
关联讨论 1 条美团 LongCat:HuggingFace 新模型
14:47
小互@xiaohu
71
网易有道开源双模型,聚焦工程精度与落地成本

网易有道开源Confucius4双模型,包括一个专注数学视觉推理的多模态模型,以及一个用于语音克隆的TTS模型。此次开源直接提供完整权重,而非仅提供API,强调在工程精度和实际部署成本上的投入,而非单纯追求参数规模。模型已发布于HuggingFace和GitHub平台。

GitHubHugging Face多模态开源生态
14:09
IT之家(RSS)
62
"拼好模":字节跳动开源轻量原生统一多模态 AI 模型 Lance

字节跳动开源了轻量级多模态模型Lance,其激活参数量为3B。该模型采用原生统一架构,在训练阶段即整合图像与视频的理解、生成及跨模态编辑功能。Lance通过双流专家设计和模态感知旋转位置编码等技术,平衡了理解任务所需的高层语义与生成任务所需的低层连续表示。模型训练共分四阶段,数据规模约1.9T标记,计算预算控制在128张GPU内。基准测试表明,Lance在图像生成、视频生成、图像编辑及视频理解等多项任务中表现突出。该模型权重已依据Apache 2.0协议开源。

多模态开源生态模型发布
14:02
公众号:龙猫LongCat(美团)
54
从高拟真到真可用,LongCat-Video-Avatar 1.5 正式开源

美团技术团队正式开源 LongCat-Video-Avatar 1.5,该版本从高拟真走向真可用,将视频头像生成从室内彩排演练推向千人千面的真实应用场景。

图像生成模型发布视频
11:12
karminski-牙医@karminski3
71
400 TPS!实测智谱 GLM-5.1 以10倍速狂飙

智谱近期推出GLM-5.1-Highspeed模型,实测输出速度达300+ tokens/s,首token延迟约1秒,相较于标准版GLM-5.1的35 tps和9秒延迟,性能提升约10倍。技术上,智谱联合TileRT团队重构了推理链路,通过将整个推理流程编译为常驻GPU的大kernel,大幅减少CPU调度与数据搬运开销,并优化单卡内的计算、IO分配及多卡间任务协作,显著提升GPU利用效率。该模型单次激活40B参数,高性能运行需依托多卡并行,建议现有用户切换使用以获得更实时的生成体验。

推理模型发布
10:49
Alibaba Cloud@alibaba_cloud
76
阿里云与Novita AI达成合作,在Novita AI平台首发推出Qwen3.7-Max模型,标志着双方共同推进Agent时代的发展。该模型专为智能体时代设计,强调从"回答"到"执行"的能力跃升。核心优势包括:强大的代码生成与软件工程工作流能力;可靠的智能体编排与多智能体系统协作能力;支持长周期、自主化的复杂任务执行;且具备框架与技术栈无关的兼容性,可适配多种主流开发环境。

Novita AI: 🚀 We're launching Qwen3.7-Max from @AlibabaGroup on Novita AI as a Day-0 launch partner. Built for the Agent Era - wher...

智能体模型发布
关联讨论 10 条X:OpenRouter (@OpenRouter)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)Qwen:Blog Retrieval(API)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:Kim (@kimmonismus)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)X:opencode (@opencode)
10:42
karminski-牙医@karminski3
61
腾讯近期发布了三款翻译专用大模型(Hy-MT2系列)。其中,Hy-MT2-30B-A3B在金融、法律等专业领域的翻译基准测试中,性能超越了DeepSeek-V4-Pro。该系列模型具备强大的多语言翻译能力,可应用于包括特定内容在内的多种翻译场景。

karminski-牙医: 这一波估计XX词典凉的透透的了... 刚看到这个图坐不住了, 30B-A3B 的小模型跑分碾压 DeepSeek-V4-Pro? 谁给你的勇气? 然后定睛一看, 原来是翻译专用大模型. 腾讯刚刚放出了3个翻译专用大模型, 分别是 Hy-MT...

开源/仓库模型发布
‹ 上一页
1…1011121314…27
下一页 ›