6月11日

00:43

fofr@fofrAI

DiffusionGemma，大语言模型一次性选出所有词。速度快4倍。你可以从这里获取权重和说明开始使用： https://huggingface.co/google/diffusiongemma-26B-A4B-it

Google Hugging Face 推理模型发布

00:40

Google DeepMind：Blog（RSS）

精选72

DiffusionGemma：文本生成速度提升4倍的开源扩散模型

Google DeepMind 发布开源实验模型 DiffusionGemma，采用文本扩散技术，突破自回归逐 token 生成方式，每次前向并行生成 256 个 token。该 26B MoE 模型推理时仅激活 3.8B 参数，量化后适配 18GB 显存消费级 GPU。在 H100 上达 1000+ tokens/s，RTX 5090 上 700+ tokens/s，速度提升 4 倍。具备双向注意力和自我修正能力，面向内联编辑、代码填充等本地交互工作流，以 Apache 2.0 许可证开放。

Google 开源生态推理模型发布

关联讨论 5 条

推荐理由：DiffusionGemma 虽为实验性质，但它把文本生成从“串行打字机”变成了“并行印刷机”，本地推理速度 4 倍提升，对需要实时交互的开发者是个值得关注的方向。

00:39

Google Developers Blog（RSS）

DiffusionGemma 开发者指南

DiffusionGemma 是 Google 基于 Gemma 4 架构的实验性文本生成模型，采用扩散式并行生成替代逐 token 自回归，实现更快推理、双向上下文感知和实时自我修正，并可在消费级 GPU 上部署。模型通过迭代去噪并行生成并细化 256-token 块，在处理数独等复杂约束任务上优于传统语言模型，且微调效果显著。它已集成 vLLM 等推理框架，为开发者提供一种高性能、高效长上下文扩展且易于定制部署的非自回归新方法。

Google 推理模型发布部署/工程

关联讨论 5 条

00:24

elvis@omarsar0

太棒了！我最近花了很多时间在研究扩散大语言模型上，所以这个时机恰到好处。我觉得文本扩散领域还有很多未被充分探索的研究问题。权重已在 HuggingFace 上可用。

Google DeepMind: DiffusionGemma is our new experimental open model with up to 4x faster output on dedicated GPUs. Instead of predicting w...

Google 推理模型发布

00:20

Sundar Pichai@sundarpichai

DiffusionGemma 是一个开放的实验性模型，它将我们的文本扩散研究引入 Gemma 4。它是一匹赛马 🏇，通过同时生成整块文本（而非逐 token（逐词）预测输出）实现高达 4 倍更快的推理速度！

Google 开源/仓库推理模型发布

00:19

The Verge：AI（RSS）

精选74

Google将保存用户的Lens图片、Search Live录音和Translate音频用于AI训练

Google更新搜索交互数据保存方式，新增“Search Services History”设置，用于保存用户搜索时使用的图片、文件、音频和视频，包括Google Lens搜索的图片、实时搜索工具Search Live的录音、语音搜索和Translate中的语音片段。这些数据将被用于“提供、改进和开发AI模型”。用户可关闭该设置并禁用“Save Media”选项以避免保存。

Google 产品更新搜索数据/训练

推荐理由：Google这回悄悄把图片、录音存下来训练AI，默认开启，虽然可以关，但灰度操作值得每个用搜索的人看一眼。

6月10日