SemiAnalysis@SemiAnalysis_

2026-07-02 07:30·23小时前

AI 摘要

本周 InferenceX 团队讨论了将 DeepSeek V4 部署到 InferenceX 所需的工作、模型架构的变化、什么是 MegaKernel，以及在包括华为昇腾 NPU 在内的各种加速器上的初始性能。

This week the InferenceX team discusses what it took to get DeepSeek V4 on InferenceX， changes in the model architecture， what is a MegaKernel， and initial performance on various accelerators including Huawei Ascend NPUs.

DeepSeek 推理评测/基准部署/工程

在 X 查看原推导出 Markdown

SemiAnalysis@SemiAnalysis_ · X

57导出 Markdown

2026-07-02 07:30·23小时前

在 X 看原推· x.com

AI 摘要

DeepSeek 推理评测/基准部署/工程