# 性能飞跃但成本激增，Gemini 3.5 Flash重新定义"轻量"？

- 来源：Berryxia.AI (@berryxia)
- 发布时间：2026-05-20 21:32
- AIHOT 分数：72
- AIHOT 链接：https://aihot.virxact.com/items/cmpe4zu6509khslk1v1tzpoqq
- 原文链接：https://x.com/berryxia/status/2057092043982422445

## AI 摘要

Google发布的Gemini 3.5 Flash在性能上实现飞跃，智能指数达55分，超越Grok 4.3等竞品，幻觉率大幅下降，输出速度超280 tokens/s。然而，其运行成本是前代的5.5倍，定价显著提高，引发对“Flash”是否仍代表“便宜”的讨论。该模型已在ZenMux平台开放免费体验，实际测试显示效果惊艳，在多项Agent和多模态榜单中表现顶尖，标志着顶级智能与极致速度的新结合。

## 正文

特么现在Flash ≠便宜了啊？
仅仅是快了吧~

Google把Gemini 3.5 Flash直接扔出来后，Artificial Analysis测完直接给出了最扎心的结论：

它在Intelligence vs Speed的Pareto前沿上，把整个行业又往前推了一大截。

Intelligence Index拿到55分，比Gemini 3 Flash高9分，直接超过Grok 4.3和Claude Sonnet 4.6。

Agentic任务（GDPval-AA）Elo评分飙到1656，远超前代。

幻觉率从92%暴降到61%。

输出速度超280 tokens/s，比上一代快70%。

多模态也继续领跑，MMMU-Pro 84%。

看起来几乎完美。

但代价是：跑一次Artificial Analysis Intelligence Index的成本，是Gemini 3 Flash的5.5倍，比Gemini 3.1 Pro贵75%。
定价直接3倍（$1.5/$9 per 1M input/output）。

"Flash"这个名字，本来代表又快又便宜。

现在它代表：你终于可以用更快的速度，拿到真正旗舰级的智能，但你得为这个组合付更多钱。

Google这次是把顶级智能塞进了Flash系列，还是在用价格重新定义什么叫"轻量"？

完整基准在这里：https://artificialanalysis.ai/models/gemini-3-5-flash

### 引用推文

> Berryxia.AI：兄弟们! 今天已经可以在ZenMux上免费体验Gemini 3.5 Flash 了! 我第一时间用它跑了那个经典的「AI模型递归二叉树生长测试」. 同一个 Prompt ,不同模型画出的树形态完全不一样。(见视频-Prompt见评论区) Gemini 3.5 Flash 从输入提示词到生成完整 HTML 动画网页(树干...
