# Step 3.7 Flash：可运行于桌面级设备的198B视觉模型

- 来源：StepFun (@StepFun_ai)
- 发布时间：2026-05-31 14:51
- AIHOT 分数：80
- AIHOT 标记：精选
- AIHOT 链接：https://aihot.virxact.com/items/cmptg4k4t09zzsluzw0x9fbxd
- 原文链接：https://x.com/StepFun_ai/status/2060977545672335816

## 精选理由

把 198B 的视觉模型塞进一台桌面盒子，还跑通了，这本身就是个小里程碑。更关键的是，这篇实战直接帮你绕开了三个大坑，省下的三小时够你喝杯咖啡慢慢试了。

## AI 摘要

阶跃星辰发布了Step 3.7 Flash，这是一款198B参数的视觉模型，旨在DGX Spark等桌面设备上运行。用户实测表明，128GB统一内存是运行门槛，模型占用约104GB。部署无需官方专用llama.cpp分支，主线版本即可。在上下文长度上存在权衡：启用视觉功能时，基于q8 KV cache的64K为上限；若要使用最高256K上下文，则需禁用视觉并切换至q4 KV cache，此时模型与缓存共占约114GB内存。该模型是推理模型，思考过程可能消耗大量max_tokens，需注意设置。

## 正文

一个198B参数的视觉模型，运行在桌面上的一个小机箱里。这就是我们打造 Step 3.7 Flash 的目的。

精彩的拆解分析 @sudoingX — 为大家省去了几个小时的困惑时间 🎉

### 引用推文

> Sudo su：i am running stepfun's new step 3.7 flash on a dgx spark right now. 198b vision model, on a box that sits on a desk. here's how to save yourself about 3 hours o...
