# 人们过于痴迷开源模型的基准测试，成功的关键其实是工具支持与可微调性

- 来源：Nathan Lambert (@natolambert)
- 发布时间：2026-04-04 02:10
- AIHOT 标记：精选
- AIHOT 链接：https://aihot.virxact.com/items/cmnw1ytoi014wslc3faof480u
- 原文链接：https://x.com/natolambert/status/2040129705655820687

## 精选理由

HF研究员指出开源模型成功关键在工具链与微调支持而非基准分数

## AI 摘要

开源模型成功的核心并非基准分数，而是即时且长期的工具支持与可微调性。Gemma 过去在这些方面表现挣扎，而 Qwen 则表现出色，这才是决定模型成败的关键因素。

## 正文

人们过于痴迷于开放模型的基准测试。成功的核心决定因素往往是：1. 即时和长期工具支持。2. 微调能力。

说实话，Gemma 过去在这方面一直很吃力。通义千问（Qwen）则表现出色。这正是胜者加冕之处。https://t.co/LkGb3tHjA3

### 引用推文

> Interconnects：Gemma 4 and what makes an open model succeed Hint: it's not benchmark scores. https://www.interconnects.ai/p/gemma-4-and-what-makes-an-open-model