Google 发布实验性开源模型 DiffusionGemma(Apache 2.0),采用并行 diffusion 方式代替传统自回归“逐词预测”,可同时起草、纠错和精炼整块文本,生成速度达 4 倍提升(1000+ token/s)。模型在 18GB 消费级显卡即可本地运行,适用于代码、数学、复杂编辑等任务,已开源权重至 Hugging Face。
兄弟们,Google 这个新"模型"有点意思!
DiffusionGemma一口气把文本生成干到4倍速,还彻底开源Apache 2.0,谁都能本地玩。
它不用传统自回归那种"吐一个词想下一个"的老办法。
而是直接用diffusion先扔一堆噪声,然后整块整块地同时起草、同时纠错、同时精炼,1000+ token/s的速度直接起飞。
18GB消费级显卡就能顺滑跑,代码、数学、复杂编辑这些最烦人的活儿。
它现在能实时补空、格式化、自我修复,速度快到你感觉AI终于开始"思考整段"而不是"一个字一个字憋"。
以前大家都默认更快就得牺牲质量,结果Google这次直接告诉你:并行diffusion才是文本生成的下一章,把整个生成范式从串行憋词翻篇成了并行炼句。
开源权重已经在Hugging Face放出,开发者现在就能把这玩意儿拖回家自己改、自己玩、自己加速日常workflow。
这波一出,AI生成速度的天花板可能要被彻底重写了。