# Google DiffusionGemma：4倍速文本生成开源模型

- 来源：Berryxia.AI (@berryxia)
- 发布时间：2026-06-11 06:53
- AIHOT 分数：64
- AIHOT 链接：https://aihot.virxact.com/items/cmq8ol7ar04cislld2lqz8tef
- 原文链接：https://x.com/berryxia/status/2064843418925433274

## AI 摘要

Google 发布实验性开源模型 DiffusionGemma（Apache 2.0），采用并行 diffusion 方式代替传统自回归“逐词预测”，可同时起草、纠错和精炼整块文本，生成速度达 4 倍提升（1000+ token/s）。模型在 18GB 消费级显卡即可本地运行，适用于代码、数学、复杂编辑等任务，已开源权重至 Hugging Face。

## 正文

兄弟们，Google 这个新"模型"有点意思！

DiffusionGemma一口气把文本生成干到4倍速，还彻底开源Apache 2.0，谁都能本地玩。

它不用传统自回归那种"吐一个词想下一个"的老办法。

而是直接用diffusion先扔一堆噪声，然后整块整块地同时起草、同时纠错、同时精炼，1000+ token/s的速度直接起飞。

18GB消费级显卡就能顺滑跑，代码、数学、复杂编辑这些最烦人的活儿。

它现在能实时补空、格式化、自我修复，速度快到你感觉AI终于开始"思考整段"而不是"一个字一个字憋"。

以前大家都默认更快就得牺牲质量，结果Google这次直接告诉你：并行diffusion才是文本生成的下一章，把整个生成范式从串行憋词翻篇成了并行炼句。

开源权重已经在Hugging Face放出，开发者现在就能把这玩意儿拖回家自己改、自己玩、自己加速日常workflow。

这波一出，AI生成速度的天花板可能要被彻底重写了。

### 引用推文

> Google：Meet DiffusionGemma ⚡ Our latest experimental open model (Apache 2.0) that generates text up to 4x faster. Instead of predicting and typing just one word at a t...