Google发布多模态开源模型Gemma 4,单卡H100可跑且科学推理能力突出
Google DeepMind推出Gemma 4系列四款多模态开源模型,支持文本、图像及视频输入。31B(密集架构)与26B A4B(MoE架构)拥有256k上下文窗口,可在单张H100运行;另两款较小模型支持128k上下文。GPQA Diamond测试中,Gemma 4 31B(Reasoning)获85.7%,仅次于Qwen3.5 27B,但输出token仅约1.2M,效率更优;26B A4B(Reasoning)得分79.2%,超越gpt-oss-120B。
Google 发布了 Gemma 4,这是一个新的多模态开放权重模型系列,包括 Gemma 4 E2B、Gemma 4 E4B、Gemma 4 31B 和 Gemma 4 26B A4B。
@GoogleDeepMind 的新 Gemma 4 系列引入了四个多模态模型,支持文本、图像和视频输入。我们评估了 Gemma 4 31B(稠密型)和 Gemma 4 26B A4B(MoE),两者都拥有 256k 上下文窗口,而另外两个更小的模型支持最多 128k。分别拥有 31B 和 26B 参数,这两个评估模型都可以在单个 H100 上运行。
在我们的科学推理评测 GPQA Diamond 上,Gemma 4 31B(推理型)取得了 85.7% 的得分,这是我们记录中参数少于 40B 的开放权重模型取得的第二高结果,仅略低于 Qwen3.5 27B(推理型,85.8%)。它仅用了约 1.2M 的输出模型 token 就达到了这一分数,少于 Qwen3.5 27B(约 1.5M)和 Qwen3.5 35B A3B(约 1.6M)。Gemma 4 26B A4B(推理型)得分 79.2%,领先于 gpt-oss-120B(高设置,76.2%),但落后于 Qwen3.5 9B(推理型,80.6%)。
我们目前正在对所有四个 Gemma 4 模型运行 Artificial Analysis Intelligence Index,一旦结果完成,我们将分享完整的更新。