DeepSeek V4 进行了一次更新。 新推出了投机解码(Speculative Decoding)框架 DSpark,推理速度提升 80%。 DSpark 已被部署在 DeepSeek-V4(Flash 和 Pro)的真实线上流量中。 报告:《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》 https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf
DeepSeek V4 进行了一次更新。 新推出了投机解码(Speculative Decoding)框架 DSpark,推理速度提升 80%。
DSpark 已被部署在 DeepSeek-V4(Flash 和 Pro)的真实线上流量中。
报告:《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》 https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf