karminski-牙医@karminski3

2026-06-29 13:18·3天前

AI 摘要

推文对三款Flash级模型（Gemini-3.5-Flash、Step-3.7-Flash、DeepSeek-V4-Flash）进行横评。这些模型定位为多智能体系统和RAG系统的驱动模型。评测维度包括Agent Loop迭代能力、Agent能力、前端/后端、空间理解、美学、性价比等。Gemini-3.5-Flash更适合前端页面、建模等“漂亮活”。Step-3.7-Flash极具性价比，在Agent测试中Token效率极高（用最少Token完成最多任务），适合作为OpenClaw、Hermes等Agent框架的驱动模型。DeepSeek-V4-Flash后端能力出色，适合写脚本或驱动ClaudeCode用于AI-Ops。

给大家带来 Flash 系列模型横评！

各个厂商除了旗舰级别模型，也都有Flash级别的模型，而这些模型的定位主要都是多智能体系统的驱动模型和RAG系统的驱动模型. 那么现有这些Flash模型应该怎么选？给大家带来本篇评测！

本次主要从 Agent Loop 迭代能力， Agent 能力，前端，后端，空间理解，美学，性价比等多个角度评测了 Gemini-3.5-Flash， Step-3.7-Flash， DeepSeek-V4-Flash 这三个模型.

从测试来看， Gemini-3.5-Flash 更适合干"漂亮活"，比如前端页面，建模等.

而 Step-3.7-Flash 则极具性价比，在Agent测试中取得了比旗舰模型还要高的Token效率（用最少的token干最多的事情）. 所以特别适合用在Agent框架中（比如OpenClaw或者Hermes），或者复杂的Agent系统中用来做驱动模型.

DeepSeek-V4-Flash 则后端能力很不错，很适合用来写脚本，甚至给服务器安装一个 DeepSeek-V4-Flash 驱动的 ClaudeCode，用来 AI-Ops.

#flash模型 #step37flash #deepseekv4flash #gemini35flash #AgentLoop