# Google 发布 Diffusion Gemma，支持多模态输入，针对 4090/5090 优化

- 来源：karminski-牙医 (@karminski3)
- 发布时间：2026-06-12 07:51
- AIHOT 分数：62
- AIHOT 链接：https://aihot.virxact.com/items/cmqa61jx10igssllda6dajv9g
- 原文链接：https://x.com/karminski3/status/2065220428365443403

## AI 摘要

Google 发布 Diffusion Gemma，模型大小 26B，激活参数量 4B。与 NVIDIA 合作优化 RTX 4090/5090，5090 每秒可生成 700+ token。支持文本、图片、视频多模态输入。AIME 2026 数学测试达 Gemma4-26B-A4B 的 94%，tau2 bench Agent 测试达 82%。输出质量略逊于传统大模型但速度更快。4bit 量化版本仅需 16GB 显存即可运行。

## 正文

另外忘了说了，这个模型支持多模态输入！文本，图片，视频都可以，是真的夯

### 引用推文

> karminski-牙医：单卡 700TPS! Diffusion Gemma 来了! Google 刚刚发布了 Gemma 小模型的 Diffusion 版本! 大小26B, 激活参数量4B, 最重要的是, 这次还跟 NVIDIA 合作针对4090和5090优化了一波, 5090每秒能生成700+token! 给不知道什么是 Diffusio...
