StepFun@StepFun_ai

2026-05-29 08:32·35天前

AI 摘要

阶跃星辰发布了 Step-3.7-Flash 模型，vLLM 在模型发布当天即提供支持。该模型是一个 198B 参数的稀疏 MoE 视觉语言模型，每个 token 约有 11B 激活参数，支持原生图像与文本输入。其上下文窗口达到 256K，适用于长文档、多文件代码库及密集视觉界面。模型提供 FP8 和 NVFP4 量化权重版本，并内置 MTP 推测解码、原生工具调用及推理解析功能。

Day-0 vLLM support. Thanks @vllm_project 🤝

vLLM🎉 Congrats to @StepFun_ai on releasing Step-3.7-Flash, with day-0 support in vLLM. - 198B sparse MoE vision-language model, ~11B active params per token, nativ...

多模态推理模型发布部署/工程

在 X 查看原推导出 Markdown

StepFun@StepFun_ai · X

79导出 Markdown

2026-05-29 08:32·35天前

在 X 看原推· x.com

AI 摘要

Day-0 vLLM support. Thanks @vllm_project 🤝

vLLM🎉 Congrats to @StepFun_ai on releasing Step-3.7-Flash, with day-0 support in vLLM. - 198B sparse MoE vision-language model, ~11B active params per token, nativ...

多模态推理模型发布部署/工程