9月29日

00:00

LMSYS：Blog（Chatbot Arena 团队）

SGLang 在发布首日即支持 DeepSeek-V3.2，该模型基于 DeepSeek-V3.1-Terminus 引入 DeepSeek Sparse Attention (DSA) 机制。DSA 通过 Lightning Indexer 和 Top-k Token Selection 将注意力复杂度从 O(L²) 降至 O(Lk)，在 128K 长上下文下实现训练与推理效率大幅提升且质量损失可忽略。SGLang 实现了专用缓存与 Native Sparse Attention 后端，并提供了面向 NVIDIA、AMD MI350X/MI355X 及 NPU 的部署方案与容器镜像。

DeepSeek 开源/仓库开源生态部署/工程

9月26日

00:00

LMSYS：Blog（Chatbot Arena 团队）

蚂蚁集团联合SGLang：H20-96G部署DeepSeek-R1最佳实践

蚂蚁集团联合SGLang提出H20-96G部署DeepSeek-R1的工业级方案。针对H20高内存带宽、低计算吞吐特性，采用硬件感知策略：单节点TP-8处理prefill，小规模EP-16处理decode。结合FlashMLA-FP8、DeepGEMM swapAB内核优化与异步Expert Affinity负载均衡技术，在4096 token序列上实现单节点16.5k输入/5.7k输出token/秒的吞吐，达H20平台SOTA性能。

DeepSeek 推理论文/研究部署/工程

9月25日

00:00

LMSYS：Blog（Chatbot Arena 团队）

GB200 NVL72部署DeepSeek V3/R1（二）：PD分离与大规模EP实现3.8倍Prefill、4.8倍Decode吞吐

SGLang团队基于GB200 NVL72优化DeepSeek V3/R1推理，采用FP8 Attention、NVFP4 MoE、大规模专家并行及PD分离等技术。2000 token输入下，单卡Prefill达26,156 tokens/s，Decode达13,386 tokens/s，较H100提升3.8倍和4.8倍。BF16/FP8配置下仍达18,471/9,087 tokens/s。FP8与NVFP4低精度内核分别带来1.8倍和1.9倍加速且精度损失可忽略。

DeepSeek 开源/仓库推理部署/工程

9月22日

21:15

公众号：DeepSeek（深度求索）

DeepSeek-V3.1 版本更新

DeepSeek-V3.1 版本更新发布，主要包括修复若干已知问题，Agent 能力进一步提升。这是本次版本更新的核心内容，旨在优化用户体验。

智能体 DeepSeek 模型发布

9月1日

17:30

公众号：DeepSeek（深度求索）

DeepSeek关于AI生成合成内容标识的公告

DeepSeek已在平台内对AI生成合成内容添加标识，并明确提醒用户相关内容由AI生成。

DeepSeek 产品更新

8月21日

14:25

公众号：DeepSeek（深度求索）

精选63

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

DeepSeek-V3.1 以混合推理模型形式开源，用户可一键切换思考模式，同时 Agent 智能体支持性能得到增强。

智能体 DeepSeek 开源生态推理

推荐理由：DeepSeek V3.1 不是小修小补，混合推理和 Agent 支持让它从‘对话模型’转向‘行动模型’，开源这一步让 Agent 开发有了新底座。

6月16日

00:00

LMSYS：Blog（Chatbot Arena 团队）

在GB200 NVL72上部署DeepSeek 671B：PD与大规模EP架构实现2.7倍解码加速

SGLang团队在GB200 NVL72集群部署DeepSeek 671B模型，采用预填充-解码分离（PD）与大规模专家并行（EP）架构，结合Blackwell专用优化组件（DeepGEMM、DeepEP等），实现单GPU解码吞吐7,583 tokens/秒。在2,000 token输入下，性能较H100提升2.7倍，整体加速比达2.5-3.4倍。系统利用NVLink全互联降低通信延迟，依托更大显存支持高批次处理，显著提升MoE模型推理效率。

DeepSeek 开源/仓库推理部署/工程

5月29日

20:11

DeepSeek@deepseek_ai

精选68

🚀 DeepSeek-R1-0528 现已发布！ 🔹 基准测试性能提升 🔹 前端能力增强 🔹 减少幻觉现象 🔹 支持 JSON 输出与函数调用 ✅ 立即试用：https://chat.deepseek.com/ 🔌 API 使用方式不变 - 文档在此：https://api-docs.deepseek.com/guides/reasoning_model 🔗 开源权重：https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

DeepSeek 开源生态推理模型发布

关联讨论 1 条

推荐理由：DeepSeek-R1 的常规迭代，幻觉降低和 JSON 输出是实用改进，但距离代际跃迁还差得远。开源权重直接可用，做推理链产品的团队值得花半小时跑一下。

20:06

公众号：DeepSeek（深度求索）

DeepSeek-R1 更新，思考更深，推理更强

DeepSeek-R1 更新，思考更深，推理更强。开启“深度思考”功能即可体验新版 R1 更加强大的思考与推理能力。

DeepSeek 推理模型发布

3月25日

21:23

公众号：DeepSeek（深度求索）

同事件精选64

DeepSeek-V3 模型更新，各项能力全面进阶

DeepSeek-V3 新版已发布，关闭深度思考模式即可体验，模型权重同步开源。

DeepSeek 开源/仓库推理模型发布

同一事件，精选展示《DeepSeek-V3 正式发布》

推荐理由：DeepSeek-V3 发布时是开源模型的有力竞争者，但这条一年多前的旧闻如今毫无新意，对关注 AI 动态的你来说，可以直接跳过。

2月28日

09:06

DeepSeek@deepseek_ai

DeepSeek开源3FS并行文件系统与Smallpond框架

DeepSeek发布开源并行文件系统3FS（Fire-Flyer File System），专为现代SSD和RDMA网络优化。180节点集群可实现6.6 TiB/s聚合读取吞吐量，25节点GraySort测试达3.66 TiB/min，单节点KVCache查找峰值超40 GiB/s。采用分离式架构与强一致性语义，支持训练数据预处理、检查点存取及V3/R1推理的KVCache查找。同步开源Smallpond数据处理框架。

DeepSeek 开源/仓库数据/训练部署/工程

2月27日

10:05

DeepSeek@deepseek_ai

🚀 #开源周第4天：优化的并行策略 ✅ DualPipe - 一种用于V3/R1训练中计算-通信重叠的双向流水线并行算法。 🔗 https://github.com/deepseek-ai/DualPipe ✅ EPLB - 适用于V3/R1的专家并行负载均衡器。 🔗 https://github.com/deepseek-ai/eplb 📊 分析V3/R1中的计算-通信重叠情况。 🔗 https://github.com/deepseek-ai/profile-data

DeepSeek 开源/仓库部署/工程

2月26日

19:25

DeepSeek@deepseek_ai

🚨 非高峰折扣提醒！即日起，每日 UTC 16：30-00：30，DeepSeek API 平台享受非高峰折扣： 🔹 DeepSeek-V3 五折 🔹 DeepSeek-R1 高达 75% 折扣更智能地最大化资源利用--在这些高价值时段节省更多！

DeepSeek 产品更新部署/工程

19:15

公众号：DeepSeek（深度求索）

DeepSeek API 错峰优惠，R1 价格降至1/4

DeepSeek API 推出错峰优惠，夜间空闲时间价格大幅下调，R1 模型价格降至原价的四分之一，即日起可享受流畅优惠体验。

DeepSeek 产品更新部署/工程

09:00

DeepSeek@deepseek_ai

🚀 #OpenSourceWeek 第三天：DeepGEMM 推出 DeepGEMM - 一个支持 dense 和 MoE GEMM 的 FP8 GEMM 库，为 V3/R1 的训练和推理提供支持。 ⚡ 在 Hopper GPU 上可达 1350+ FP8 TFLOPS ✅ 无繁重依赖，简洁如教程 ✅ 完全 Just-In-Time 编译 ✅ 核心逻辑仅约 300 行 - 却在大多数矩阵尺寸上超越专家调优的 kernel ✅ 支持 dense 布局及两种 MoE 布局 🔗 GitHub： https://github.com/deepseek-ai/DeepGEMM

DeepSeek 开源/仓库部署/工程

2月25日

10:24

DeepSeek@deepseek_ai

DeepSeek开源DeepEP：首个MoE专家并行通信库

DeepSeek开源周第二日推出DeepEP，这是首个面向MoE模型训练与推理的开源EP通信库。该库针对专家并行场景优化，支持NVLink和RDMA的all-to-all通信，既提供高吞吐kernel用于训练与推理预填充，也提供低延迟kernel用于解码阶段。同时原生支持FP8精度，并允许灵活的GPU资源控制以实现计算与通信重叠，显著提升MoE模型效率。

DeepSeek 开源/仓库部署/工程

2月24日

09:34

DeepSeek@deepseek_ai

🚀 #OpenSourceWeek 第一天：FlashMLA 很荣幸分享 FlashMLA -- 我们针对 Hopper GPU 的高效 MLA 解码内核，针对变长序列优化，现已投入生产。 ✅ 支持 BF16 ✅ 分页 KV 缓存（块大小 64） ⚡ 在 H800 上达 3000 GB/s 内存受限与 580 TFLOPS 计算受限 🔗 在 GitHub 上探索：https://github.com/deepseek-ai/FlashMLA

DeepSeek 开源/仓库推理部署/工程

2月21日

12:00

DeepSeek@deepseek_ai

DeepSeek 启动开源周：将开源 5 个 AGI 探索代码库

DeepSeek AI 预告开源周活动，将于下周起陆续开源 5 个代码仓库。作为探索 AGI 的小团队，他们计划透明分享那些已在生产环境中实战验证的代码模块。团队相信开源社区的集体力量能加速行业进步，强调此次发布将摒弃象牙塔式的封闭开发，以"车库能量"和社区驱动创新的形式呈现。

DeepSeek 开源/仓库开源生态部署/工程

2月18日

15:04

DeepSeek@deepseek_ai

精选

NSA：硬件对齐的稀疏注意力新机制

NSA是一种硬件对齐且原生可训练的稀疏注意力机制，专为超快速长上下文训练与推理设计。其核心采用动态分层稀疏策略，结合粗粒度token压缩与细粒度token选择。通过针对现代硬件的优化，NSA在加速推理、降低预训练成本的同时不损失性能，在通用基准、长上下文任务及指令推理中匹配或超越Full Attention模型。

DeepSeek 推理论文/研究部署/工程

推荐理由：DeepSeek 推出硬件对齐稀疏注意力 NSA，长上下文训练推理双提速，预训练成本显著降低

2月6日

19:45

公众号：DeepSeek（深度求索）

DeepSeek官方信息发布及服务渠道说明

DeepSeek发布官方说明：任何非官方账号发布的信息均不代表其观点，提醒用户切勿轻信。用户应通过官方渠道获取准确信息。

DeepSeek 行业动态

1月28日

12:57

DeepSeek@deepseek_ai

为防止任何潜在危害，我们重申 @deepseek_ai 是我们在 Twitter/X 上的唯一官方账号。任何账号： - 代表我们 - 使用相同头像 - 使用相似名称均为仿冒。请保持警惕，避免被误导！

DeepSeek 行业动态

1月27日

18:00

公众号：DeepSeek（深度求索）

金鳞耀岁，共启新程 | DeepSeek 乙巳新年春节AI贺词

DeepSeek 行业动态

1月20日

20:10

公众号：DeepSeek（深度求索）

精选64

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版。模型遵循 MIT License 开放 API，训练技术同步公开。

DeepSeek 推理模型发布

推荐理由：虽已是旧闻，但 DeepSeek-R1 作为首个开源对齐 o1 的模型，其训练技术至今仍有参考价值，做推理方向的值得回溯。

1月15日

17:39

公众号：DeepSeek（深度求索）

DeepSeek 官方 App 正式发布，iOS/Android 各应用市场均已上线

DeepSeek 推出官方移动端 App，目前已在 iOS 和 Android 各大应用商店上架。该 App 由 DeepSeek-V3 模型驱动，面向所有用户免费开放使用，用户可通过官网或应用市场直接下载。

DeepSeek 产品更新端侧

12月26日

19:17

公众号：DeepSeek（深度求索）

精选67

DeepSeek-V3 正式发布

深度求索正式发布 DeepSeek-V3 模型，性能比肩世界顶尖模型，速度跃升，价格更新。

DeepSeek 开源/仓库模型发布

关联讨论 1 条

推荐理由：DeepSeek-V3 是 2024 年底国产模型的一次真正跃迁，首次亮剑就逼近闭源顶尖，开源权重更是直接改变了开发者生态。时隔一年半回头看，它仍是理解 DeepSeek 路径的起点。

12月13日

20:22

DeepSeek@deepseek_ai

精选

🎉 DeepSeek-VL2 来了！我们的下一代视觉-语言模型进入 MoE 时代。 🤖 DeepSeek-MoE 架构 + 动态图像分块 ⚡ 3B/16B/27B 规模，灵活使用 🏆 在所有基准测试中表现优异 🧵 1/n

DeepSeek 多模态模型发布端侧

推荐理由：DeepSeek 开源 VL2 视觉模型，3B 轻量版可端侧部署，MoE 架构支持动态图像分块

20:14

公众号：DeepSeek（深度求索）

久等了，DeepSeek-VL2

DeepSeek 多模态模型发布

12月10日

20:27

DeepSeek@deepseek_ai

精选

🚀 DeepSeek-V2.5-1210：盛大终章 🎉 🌐 联网搜索现已上线网页版！访问 https://chat.deepseek.com/ 并开启"联网搜索"获取实时回答。🕒 🧵（1/3）

DeepSeek 产品更新搜索

推荐理由：DeepSeek 网页版上线联网搜索，开启后可实时获取最新信息

20:26

公众号：DeepSeek（深度求索）

DeepSeek V2 系列收官，联网搜索上线官网

DeepSeek V2.5 模型迭代完成，官网正式上线全新联网搜索功能，V2 系列至此收官。

DeepSeek 产品更新搜索

12月4日

00:00

LMSYS：Blog（Chatbot Arena 团队）

SGLang v0.4：零开销批处理调度器、缓存感知负载均衡器及更快的结构化输出

SGLang v0.4版本正式发布，通过零开销批处理调度器将CPU调度与GPU计算重叠，吞吐量提升1.1倍，较其他基线快1.3倍。新版本引入缓存感知负载均衡器，预测KV缓存命中率，使吞吐量最高提升1.9倍，缓存命中率从20%提升至75%。针对DeepSeek模型的数据并行注意力机制带来1.9倍解码吞吐量提升，XGrammar结构化输出速度提升达10倍。

DeepSeek 开源/仓库部署/工程

11月20日

19:59

公众号：DeepSeek（深度求索）

精选66

DeepSeek 推理模型预览版上线，推理性能媲美 o1-preview，公开完整思维链

DeepSeek 上线推理模型预览版，其推理性能与 OpenAI 的 o1-preview 相当，并公开了模型的完整思维链。

DeepSeek 推理模型发布

推荐理由：虽然已是旧闻，但 DeepSeek 首次公开推理模型完整思维链，对理解 o1 类模型的内部机制是个重要线索，做推理模型研究的值得回看。

9月18日

20:06

公众号：DeepSeek（深度求索）

DeepSeek-V2.5 登上 LMSYS ChatBotArena，创国产模型历史最高分

DeepSeek-V2.5 在 LMSYS ChatBotArena（全球大模型竞技场）榜单中上榜，创下国产大模型在该竞技场的最高得分记录。

DeepSeek 开源生态模型发布评测/基准

9月6日

19:38

公众号：DeepSeek（深度求索）

精选61

DeepSeek-V2.5：融合通用与代码能力的全新开源模型

DeepSeek-V2.5 保留原有 Chat 模型的通用对话能力和 Coder 模型的代码处理能力，并更好地对齐人类偏好。

DeepSeek OpenAI 开源/仓库模型发布

推荐理由：DeepSeek首次将通用对话与代码能力合一的开源模型，当时直接拉低了多任务成本，今天看仍是模型混合能力演变的早期标杆。

9月4日

00:00

LMSYS：Blog（Chatbot Arena 团队）

SGLang v0.3 发布：DeepSeek MLA 吞吐量提升 7 倍，支持多模态视频理解

SGLang v0.3 正式发布，实现显著性能提升与新架构支持。针对 DeepSeek MLA 机制深度优化，采用权重吸收、FP8 量化等技术，在 H100 GPU 上吞吐量最高提升 7 倍。集成 torch.compile 使批量 1-32 场景延迟降低 1.5 倍。新增 LLaVA-OneVision 支持，可处理交错文本、多图像及视频输入，速度提升 4.5 倍。同时全面支持 Gemma-2 的 8K 上下文与交错窗口注意力，突破 4K 限制。

DeepSeek 开源/仓库部署/工程

8月16日

20:46

公众号：DeepSeek（深度求索）

DeepSeek 发布开源数学定理证明模型

DeepSeek 发布了一款开源数学定理证明模型，目标是加速“数学定理证明的 AlphaGo 时代”的到来。

DeepSeek 开源/仓库推理模型发布

8月2日

20:24

公众号：DeepSeek（深度求索）

DeepSeek API 创新采用硬盘缓存，价格再降一个数量级

DeepSeek 产品更新