Artificial Analysis@ArtificialAnlys

精选

2026-04-03 01:09·91天前

精选理由

Google发布多模态开源模型Gemma 4，单卡H100可跑且科学推理能力突出

AI 摘要

Google DeepMind推出Gemma 4系列四款多模态开源模型，支持文本、图像及视频输入。31B（密集架构）与26B A4B（MoE架构）拥有256k上下文窗口，可在单张H100运行；另两款较小模型支持128k上下文。GPQA Diamond测试中，Gemma 4 31B（Reasoning）获85.7%，仅次于Qwen3.5 27B，但输出token仅约1.2M，效率更优；26B A4B（Reasoning）得分79.2%，超越gpt-oss-120B。

AI 翻译 · 中文

Google 发布了 Gemma 4，这是一个新的多模态开放权重模型系列，包括 Gemma 4 E2B、Gemma 4 E4B、Gemma 4 31B 和 Gemma 4 26B A4B。

@GoogleDeepMind 的新 Gemma 4 系列引入了四个多模态模型，支持文本、图像和视频输入。我们评估了 Gemma 4 31B（稠密型）和 Gemma 4 26B A4B（MoE），两者都拥有 256k 上下文窗口，而另外两个更小的模型支持最多 128k。分别拥有 31B 和 26B 参数，这两个评估模型都可以在单个 H100 上运行。

在我们的科学推理评测 GPQA Diamond 上，Gemma 4 31B（推理型）取得了 85.7% 的得分，这是我们记录中参数少于 40B 的开放权重模型取得的第二高结果，仅略低于 Qwen3.5 27B（推理型，85.8%）。它仅用了约 1.2M 的输出模型 token 就达到了这一分数，少于 Qwen3.5 27B（约 1.5M）和 Qwen3.5 35B A3B（约 1.6M）。Gemma 4 26B A4B（推理型）得分 79.2%，领先于 gpt-oss-120B（高设置，76.2%），但落后于 Qwen3.5 9B（推理型，80.6%）。

我们目前正在对所有四个 Gemma 4 模型运行 Artificial Analysis Intelligence Index，一旦结果完成，我们将分享完整的更新。

Artificial Analysis@ArtificialAnlys · X

精选导出 Markdown