Kimi K2.6 终于有高速推理平台了 👍🏻
这是 @cerebras 在 GPT 5.3 Codex Spark 之后,又一次对主流 LLM 做高速推理
在 Groq Kimi K2 之后,K2.5 和 K2.6 一直都是模型很强,但官方推理实在太慢。。Groq 被 Nvidia 收购后也没有再跟进主流模型推理
现在 Cerebras 把 Kimi K2.6 这个超过 1T 参数的模型,推理速度拉到了 ~1000 tokens/s,这速度就太舒服了,用起来!!
Cerebras is now running Kimi K2.6 - a trillion parameter model - in enterprise trials. At ~1,000 tokens/s, this is the fastest frontier model performance ever m...