meng shao@shao__meng

2026-05-20 08:24·44天前

Kimi K2.6 终于有高速推理平台了 👍🏻

这是 @cerebras 在 GPT 5.3 Codex Spark 之后，又一次对主流 LLM 做高速推理

在 Groq Kimi K2 之后，K2.5 和 K2.6 一直都是模型很强，但官方推理实在太慢。。Groq 被 Nvidia 收购后也没有再跟进主流模型推理

现在 Cerebras 把 Kimi K2.6 这个超过 1T 参数的模型，推理速度拉到了 ~1000 tokens/s，这速度就太舒服了，用起来！！

CerebrasCerebras is now running Kimi K2.6 - a trillion parameter model - in enterprise trials. At ~1,000 tokens/s, this is the fastest frontier model performance ever m...

产品更新推理部署/工程

在 X 查看原推导出 Markdown

meng shao@shao__meng · X

56导出 Markdown