Google 发布 Diffusion Gemma，支持多模态输入，针对 4090/5090 优化

karminski-牙医@karminski3

2026-06-12 07:51·3天前

AI 摘要

Google 发布 Diffusion Gemma，模型大小 26B，激活参数量 4B。与 NVIDIA 合作优化 RTX 4090/5090，5090 每秒可生成 700+ token。支持文本、图片、视频多模态输入。AIME 2026 数学测试达 Gemma4-26B-A4B 的 94%，tau2 bench Agent 测试达 82%。输出质量略逊于传统大模型但速度更快。4bit 量化版本仅需 16GB 显存即可运行。

另外忘了说了，这个模型支持多模态输入！文本，图片，视频都可以，是真的夯

karminski-牙医单卡 700TPS! Diffusion Gemma 来了! Google 刚刚发布了 Gemma 小模型的 Diffusion 版本! 大小26B, 激活参数量4B, 最重要的是, 这次还跟 NVIDIA 合作针对4090和5090优化了一波, 5090每秒能生成700+token! 给不知道什么是 Diffusio...

Google多模态推理模型发布

在 X 查看原推

karminski-牙医@karminski3 · X

2026-06-12 07:51·3天前

AI 摘要

另外忘了说了，这个模型支持多模态输入！文本，图片，视频都可以，是真的夯

Google多模态推理模型发布

在 X 查看原推x.com