AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态一手 · 49 条
全部一手资讯X论文
标签「DeepSeek」清除
6月29日周一
18:10公众号:蚂蚁百灵(Ling)51如何优雅地给 MLA 加上 QK-Norm?
6月25日周四
22:30公众号:DeepSeek(深度求索)38DeepSeek 寻找闪亮发光的你
6月19日周五
08:00OpenRouter:Announcements(RSS)73精选DeepSeek V4 智能体 token 份额持续增长
6月16日周二
22:01Nathan Lambert:Interconnects(RSS)52前沿大模型后训练配方回顾:与 Finbarr Timbers 对谈
6月14日周日
00:17OpenRouter:Announcements(RSS)73同事件精选OpenRouter融合预算模型面板超越GPT-5.5和Claude Opus 4.8同一事件,精选展示《OpenRouter融合预算模型性能超越GPT-5.5与Claude Opus 4.7》
6月9日周二
00:41Tomer Tunguz 博客(VC 分析)56精选AI 替代浪潮:三大力量重塑成本结构
6月8日周一
19:12公众号:火山引擎28火山方舟Coding Plan与Agent Plan升级,限时2.5折
5月21日周四
16:08公众号:火山引擎46Agent Plan、Coding Plan上新:新增DeepSeek V4
5月17日周日
01:32Nathan Lambert:Interconnects(RSS)53最新开源成果(#21):开源模型盛宴!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。基于CAISI的V4评估。
4月24日周五
10:55公众号:DeepSeek(深度求索)59DeepSeek-V4 预览版:迈入百万上下文普惠时代
08:00Hugging Face:Blog(RSS)78精选DeepSeek-V4:智能体可实际使用的百万token上下文
3月25日周三
00:00LMSYS:Blog(Chatbot Arena 团队)Elastic EP:实现DeepSeek MoE部署的部分故障容忍
2月19日周四
00:00LMSYS:Blog(Chatbot Arena 团队)GB300 NVL72部署DeepSeek R1优化方案:长上下文推理性能突破
2月16日周一
18:00公众号:DeepSeek(深度求索)10骏骥迎春,同驰新境 | DeepSeek 丙午新年春节 AI 贺词
2月3日周二
23:03Hugging Face:Blog(RSS)80精选全球开源AI生态系统的未来:从 DeepSeek 到 AI+
1月27日周二
23:01Hugging Face:Blog(RSS)83精选中国开源AI生态中的架构选择:构建超越DeepSeek的未来
1月20日周二
23:02Hugging Face:Blog(RSS)58"DeepSeek时刻"一周年
12月10日周三
00:00LMSYS:Blog(Chatbot Arena 团队)让张量飞起来 -- 用 R-Fork 加速大模型权重加载
12月1日周一
18:52公众号:DeepSeek(深度求索)66同事件精选DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理同一事件,精选展示《DeepSeek-V3 正式发布》
10月22日周三
00:00LMSYS:Blog(Chatbot Arena 团队)SGLang集成KTransformers:基于AMX优化与专家延迟的MoE混合推理加速
10月14日周二
00:00LMSYS:Blog(Chatbot Arena 团队)SGLang与NVIDIA携手加速SemiAnalysis InferenceMAX及GB200优化
9月29日周一
18:01公众号:DeepSeek(深度求索)59DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价
00:00LMSYS:Blog(Chatbot Arena 团队)SGLang 发布首日支持 DeepSeek-V3.2:集成稀疏注意力机制
9月26日周五
00:00LMSYS:Blog(Chatbot Arena 团队)蚂蚁集团联合SGLang:H20-96G部署DeepSeek-R1最佳实践
9月25日周四
00:00LMSYS:Blog(Chatbot Arena 团队)GB200 NVL72部署DeepSeek V3/R1(二):PD分离与大规模EP实现3.8倍Prefill、4.8倍Decode吞吐
9月22日周一
21:15公众号:DeepSeek(深度求索)40DeepSeek-V3.1 版本更新
9月1日周一
17:30公众号:DeepSeek(深度求索)33DeepSeek关于AI生成合成内容标识的公告
8月21日周四
14:25公众号:DeepSeek(深度求索)63精选DeepSeek-V3.1 发布,迈向 Agent 时代的第一步
6月16日周一
00:00LMSYS:Blog(Chatbot Arena 团队)在GB200 NVL72上部署DeepSeek 671B:PD与大规模EP架构实现2.7倍解码加速
5月29日周四
20:06公众号:DeepSeek(深度求索)51DeepSeek-R1 更新,思考更深,推理更强
3月25日周二
21:23公众号:DeepSeek(深度求索)64同事件精选DeepSeek-V3 模型更新,各项能力全面进阶同一事件,精选展示《DeepSeek-V3 正式发布》
2月26日周三
19:15公众号:DeepSeek(深度求索)33DeepSeek API 错峰优惠,R1 价格降至1/4
2月6日周四
19:45公众号:DeepSeek(深度求索)37DeepSeek官方信息发布及服务渠道说明
1月27日周一
18:00公众号:DeepSeek(深度求索)21金鳞耀岁,共启新程 | DeepSeek 乙巳新年春节AI贺词
1月20日周一
20:10公众号:DeepSeek(深度求索)64精选DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
1月15日周三
17:39公众号:DeepSeek(深度求索)50DeepSeek 官方 App 正式发布,iOS/Android 各应用市场均已上线
12月26日周四
19:17公众号:DeepSeek(深度求索)67精选DeepSeek-V3 正式发布
12月13日周五
20:14公众号:DeepSeek(深度求索)47久等了,DeepSeek-VL2
12月10日周二
20:26公众号:DeepSeek(深度求索)52DeepSeek V2 系列收官,联网搜索上线官网
12月4日周三
00:00LMSYS:Blog(Chatbot Arena 团队)SGLang v0.4:零开销批处理调度器、缓存感知负载均衡器及更快的结构化输出
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月29日
18:10
公众号:蚂蚁百灵(Ling)
51
如何优雅地给 MLA 加上 QK-Norm?

DeepSeek 的 MLA 通过只缓存低维潜向量压缩 KV Cache,但 QK-Norm 需归一化高维 Key,若缓存归一化结果则打破低维优势。文章提出数学等效变换:将 QK-Norm 中动态逆 RMS 标量和静态仿射权重合并到 Query 侧,推理时每个 token 只需额外缓存一个逆 RMS 标量,即可严格等价实现 QK-Norm,不牺牲显存效率。在 400M/1B 模型训练 100B tokens 实验中,QK-Normed MLA 相比 QK-clipping loss 更低(1B 模型 gap ~0.02),训练更稳定且收敛更快。

DeepSeek推理教程/实践数据/训练
6月25日
22:30
公众号:DeepSeek(深度求索)
38
DeepSeek 寻找闪亮发光的你
DeepSeek行业动态
6月19日
08:00
OpenRouter:Announcements(RSS)
精选73
DeepSeek V4 智能体 token 份额持续增长

DeepSeek 于4月24日发布新一代旗舰模型 V4 系列。OpenRouter 数据显示,V4 发布后其 token 份额从年初的9%增长至6月初的18%,自5月中旬起成为 OpenRouter 最受欢迎模型。V4 是首个足以胜任智能体工作负载的 DeepSeek 模型,到5月底 V4-Flash 已占 DeepSeek 智能体 token 流量的70%。V4-Flash 最便宜端点价格为每百万 token 输入 $0.09、输出 $0.18,远低于 GPT-5.5 的 $5/$30。中国模型整体 token 份额于6月初超过美国模型,DeepSeek 是主要驱动力。

智能体DeepSeek开源生态现象/趋势

推荐理由:OpenRouter 独家数据展示了代际转折:DeepSeek V4 靠性价比吃下代理负载,中国模型 token 份额首次超过美国,这个信号比任何 benchmark 排名都真实,做应用选型的人该重新算账了。
6月16日
22:01
Nathan Lambert:Interconnects(RSS)
52
前沿大模型后训练配方回顾:与 Finbarr Timbers 对谈

Interconnects 播客邀请 Finbarr Timbers 回顾后训练配方的演变:从 InstructGPT 的 SFT→奖励模型→RL 三阶段,到 Llama 3 / Tülu 3 的 SFT→DPO→可验证奖励 RL,再至 DeepSeek R1 以大规模 RL 为核心。2026 年配方分化为多个领域专家模型再合并回统一模型。新出现模式为 Multi-teacher On-Policy Distillation(MOPD):训练 N 个领域专家(经 SFT 和领域 RL),再通过在线采样、逐 token 最小化反向 KL 散度训练通用学生模型。MiMo Flash V2 率先引入,DeepSeek V4 与 Nemotron 3 Ultra 扩展至超过 10 个教师。MOPD 兴起源于单一 RL 流程在多领域间产生能力冲突,而专家模型易于并行训练,在线蒸馏技术日趋成熟。

DeepSeek大佬观点开源生态推理
6月14日
00:17
OpenRouter:Announcements(RSS)
同事件精选73
OpenRouter融合预算模型面板超越GPT-5.5和Claude Opus 4.8

通过OpenRouter融合的一组预算模型,在100个复杂研究任务上得分超过GPT-5.5和Claude Opus 4.8。

AnthropicDeepSeekOpenAI产品更新
同一事件,精选展示《OpenRouter融合预算模型性能超越GPT-5.5与Claude Opus 4.7》
推荐理由:OpenRouter 的 Fusion API 用多个模型合成输出,基准测试里预算模型组合能接近前沿,这个思路对有质量要求又在意成本的开发者挺实用。
6月9日
00:41
Tomer Tunguz 博客(VC 分析)
精选56
AI 替代浪潮:三大力量重塑成本结构

三大力量重塑 AI 成本:前沿闭源模型持续涨价,开源模型在多数场景已足够好,买家开始替代。Coinbase 将提示词路由至更便宜模型,成本持平但 token 用量指数增长。Lindy 全切至 DeepSeek v4,节省数百万美元且多项核心性能提升。Harvey 在 Legal Agent Benchmark 上通过 SFT 使 Kimi 2.6 all-pass 率达 15%,超越 Opus 的 14%,同一 100 任务成本 $84 vs $954(约 11 倍价差)。Cursor 后训练 Kimi K2.5 得到 Composer 2.5,称其“性能优异且效率高达同类模型 10 倍”。闭源越来越贵,开源平价且性能接近,选择决定企业单位经济学的斜率。

AnthropicDeepSeek开源生态推理

推荐理由:Tunguz 用 Coinbase、Lindy 等真实案例,把「用开源/便宜模型替代昂贵前沿模型」的趋势讲透了,做 AI 应用的人该重新算一下单位经济账。
6月8日
19:12
公众号:火山引擎
28
火山方舟Coding Plan与Agent Plan升级,限时2.5折

火山方舟Coding Plan与Agent Plan升级,集成MiniMax M3、DeepSeek V4系列、GLM-5.1等多款三方模型。即日起至2026年8月7日,新购/升级/续费40元、200元档位可享首两月2.5折(9.9元/月、49.9元/月)。MiniMax M3为新一代旗舰,支持100万token上下文窗口及原生多模态理解。Agent Plan为业界首个Agent套餐包,整合字节自研Seed系列模型与Harness工具,免费提供联网搜索和Embedding记忆能力,可配合Claude Code、OpenClaw、TRAE等工具使用。

智能体DeepSeek产品更新多模态
5月21日
16:08
公众号:火山引擎
46
Agent Plan、Coding Plan上新:新增DeepSeek V4

火山引擎的Agent Plan和Coding Plan产品新增支持DeepSeek V4模型,用户可在相关计划中调用该模型进行开发与部署。

智能体DeepSeek产品更新编码
5月17日
01:32
Nathan Lambert:Interconnects(RSS)
53
最新开源成果(#21):开源模型盛宴!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。基于CAISI的V4评估。

本月开源AI模型领域迎来密集发布,包括Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5和GLM-5.1等一系列重要新版本。这些模型均在CAISI的V4评估框架下进行了性能评测。多个团队几乎同期推出旗舰级更新,反映出开源社区当前高速迭代的竞争态势。

DeepSeekGoogle大佬观点开源生态
4月24日
10:55
公众号:DeepSeek(深度求索)
59
DeepSeek-V4 预览版:迈入百万上下文普惠时代

DeepSeek-V4 预览版发布,支持百万级上下文窗口,提供顶级长文本记忆能力,模型配置选择更灵活。

DeepSeek模型发布
08:00
Hugging Face:Blog(RSS)
精选78
DeepSeek-V4:智能体可实际使用的百万token上下文

DeepSeek发布新一代模型DeepSeek-V4,其核心突破在于实现了长达百万token的上下文窗口,并确保智能体能够有效利用这一扩展的上下文能力。该模型延续了通过开源与开放科学推动人工智能发展与普及的使命,标志着大模型在长上下文理解和实际应用方面迈出重要一步。

智能体DeepSeek开源生态模型发布
关联讨论 3 条Simon Willison 博客Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)
推荐理由:DeepSeek 把上下文窗口推到百万 token 不稀奇,关键是「agent 能实际用」这六个字。如果实测成立,RAG 的很多工程妥协可以扔掉了,做长文档和复杂 agent 的人该第一时间跑一遍。
3月25日
00:00
LMSYS:Blog(Chatbot Arena 团队)
Elastic EP:实现DeepSeek MoE部署的部分故障容忍

Mooncake团队与Volcano Engine在SGLang框架中推出Elastic EP功能,解决大规模DeepSeek MoE模型"宽"专家并行部署的可靠性瓶颈。该技术通过解耦专家与GPU的刚性绑定并维护冗余副本,可在32 GPU集群中容忍最多16个rank故障,将服务恢复时间从2-3分钟缩短至10秒以内,降幅达90%。基准测试显示,该方案在实现极端韧性的同时,吞吐量、TTFT和TPOT等关键指标与标准DeepEP持平,实现零静态性能损耗。

DeepSeek开源/仓库部署/工程
2月19日
00:00
LMSYS:Blog(Chatbot Arena 团队)
GB300 NVL72部署DeepSeek R1优化方案:长上下文推理性能突破

NVIDIA与SGLang团队发布DeepSeek R1-NVFP4在GB300 NVL72上的优化部署方案,针对128K/8K长上下文推理实现显著性能提升。通过PD分离、分块流水线并行、宽专家并行及多Token预测(MTP)等技术,系统在GB300上达226 TPS/GPU峰值吞吐量,较GB200提升1.53倍;相同延迟下性能领先1.4–1.6倍。MTP可再提升每用户TPS达1.87倍,128K预填充首Token延迟降至8.6秒。

DeepSeek开源/仓库推理部署/工程
2月16日
18:00
公众号:DeepSeek(深度求索)
10
骏骥迎春,同驰新境 | DeepSeek 丙午新年春节 AI 贺词
DeepSeek其他
2月3日
23:03
Hugging Face:Blog(RSS)
精选80
全球开源AI生态系统的未来:从 DeepSeek 到 AI+

Hugging Face 在其官方博客发布文章,展望了全球开源人工智能生态系统的发展路径与未来趋势。文章以 DeepSeek 等代表性开源模型为例,探讨了开源社区如何推动技术民主化与创新加速。核心观点指向一个更加开放、协作的“AI+”未来生态,其中开源框架、模型和工具将深度融入各行各业,降低开发门槛并促进多样化应用场景的涌现。

DeepSeekHugging Face开源生态现象/趋势

推荐理由:开源AI核心平台对生态走向的判断,直接影响开发者技术选型和投资方向
1月27日
23:01
Hugging Face:Blog(RSS)
精选83
中国开源AI生态中的架构选择:构建超越DeepSeek的未来

Hugging Face发布博客文章,探讨中国开源人工智能生态系统的核心架构选择与发展路径。文章聚焦于如何构建一个超越现有模型(如DeepSeek)的可持续技术体系,分析了中国开发者在模型架构、训练框架、部署工具和社区协作等方面的关键决策。文中指出,中国开源社区正致力于打造独立且互操作的技术栈,以应对大规模模型训练与推理的独特挑战,并推动全球AI生态的多元化发展。

DeepSeek开源生态现象/趋势

推荐理由:揭示中国开源AI架构演进,帮助开发者把握生态趋势与选型方向。
1月20日
23:02
Hugging Face:Blog(RSS)
58
"DeepSeek时刻"一周年

Hugging Face在其官方博客发布文章,回顾“DeepSeek时刻”过去一年的影响。文章指出,自DeepSeek系列模型发布以来,开源大模型生态发生了显著变化。模型能力快速逼近甚至在某些任务上超越了闭源模型,社区参与度和模型下载量均创下新高。这一趋势降低了AI技术的使用门槛,并推动了更多商业化应用的探索。开源与闭源模型的竞争格局正在被重塑。

DeepSeekHugging Face现象/趋势
12月10日
00:00
LMSYS:Blog(Chatbot Arena 团队)
让张量飞起来 -- 用 R-Fork 加速大模型权重加载

蚂蚁集团 DeepXPU 团队与 SGLang 团队联合发布 Tensor R-Fork(Tensor Remote Fork)技术,通过 GPU-Direct RDMA 实现节点间设备到设备的零拷贝权重传输。该技术可将 Deepseek-R1 模型的加载时间从数分钟缩短至数秒,减少约 600GB 的本地磁盘与 DRAM 存储占用,并提供 NCCL 和 TransferEngine 两种后端方案,后者可在不干扰线上推理服务的情况下完成权重迁移。

DeepSeek开源/仓库开源生态部署/工程
12月1日
18:52
公众号:DeepSeek(深度求索)
同事件精选66
DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理
智能体DeepSeek推理模型发布
同一事件,精选展示《DeepSeek-V3 正式发布》
推荐理由:半年前的这版更新,把 Agent 和思考推理揉进了开源模型,回头看算是 DeepSeek 在智能体能力上的关键一刀,做 Agent 开发的至今绕不开它。
10月22日
00:00
LMSYS:Blog(Chatbot Arena 团队)
SGLang集成KTransformers:基于AMX优化与专家延迟的MoE混合推理加速

SGLang现已集成KTransformers后端,为DeepSeek-V3等稀疏MoE模型提供CPU/GPU混合推理加速。该技术采用Intel AMX优化内核,使单路Xeon算力达21.3 TFLOPS,较PyTorch原生实现快3.9倍;通过NUMA感知张量并行和CUDA Graph调度,双路服务器解码吞吐量提升63%,GPU内核启动开销从20%降至接近零;专家延迟机制支持跨层重排计算以重叠CPU与GPU执行,在精度变化低于0.5%的情况下使解码吞吐量再提高1.45倍。

DeepSeek开源/仓库推理部署/工程
10月14日
00:00
LMSYS:Blog(Chatbot Arena 团队)
SGLang与NVIDIA携手加速SemiAnalysis InferenceMAX及GB200优化

SGLang与NVIDIA针对Blackwell架构(GB200 NVL72)深度优化,在DeepSeek R1模型上实现每GPU 26k输入与13k输出tokens/秒的高吞吐。通过Prefill-Decode分离架构、大规模专家并行及FP8/NVFP4内核优化,SGLang在SemiAnalysis InferenceMAX基准测试中较Hopper代际获得4倍性能提升,并被选为该基准在NVIDIA与AMD硬件上运行DeepSeek模型的默认推理引擎。

DeepSeek开源/仓库部署/工程
9月29日
18:01
公众号:DeepSeek(深度求索)
59
DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价
DeepSeek推理模型发布
00:00
LMSYS:Blog(Chatbot Arena 团队)
SGLang 发布首日支持 DeepSeek-V3.2:集成稀疏注意力机制

SGLang 在发布首日即支持 DeepSeek-V3.2,该模型基于 DeepSeek-V3.1-Terminus 引入 DeepSeek Sparse Attention (DSA) 机制。DSA 通过 Lightning Indexer 和 Top-k Token Selection 将注意力复杂度从 O(L²) 降至 O(Lk),在 128K 长上下文下实现训练与推理效率大幅提升且质量损失可忽略。SGLang 实现了专用缓存与 Native Sparse Attention 后端,并提供了面向 NVIDIA、AMD MI350X/MI355X 及 NPU 的部署方案与容器镜像。

DeepSeek开源/仓库开源生态部署/工程
9月26日
00:00
LMSYS:Blog(Chatbot Arena 团队)
蚂蚁集团联合SGLang:H20-96G部署DeepSeek-R1最佳实践

蚂蚁集团联合SGLang提出H20-96G部署DeepSeek-R1的工业级方案。针对H20高内存带宽、低计算吞吐特性,采用硬件感知策略:单节点TP-8处理prefill,小规模EP-16处理decode。结合FlashMLA-FP8、DeepGEMM swapAB内核优化与异步Expert Affinity负载均衡技术,在4096 token序列上实现单节点16.5k输入/5.7k输出token/秒的吞吐,达H20平台SOTA性能。

DeepSeek推理论文/研究部署/工程
9月25日
00:00
LMSYS:Blog(Chatbot Arena 团队)
GB200 NVL72部署DeepSeek V3/R1(二):PD分离与大规模EP实现3.8倍Prefill、4.8倍Decode吞吐

SGLang团队基于GB200 NVL72优化DeepSeek V3/R1推理,采用FP8 Attention、NVFP4 MoE、大规模专家并行及PD分离等技术。2000 token输入下,单卡Prefill达26,156 tokens/s,Decode达13,386 tokens/s,较H100提升3.8倍和4.8倍。BF16/FP8配置下仍达18,471/9,087 tokens/s。FP8与NVFP4低精度内核分别带来1.8倍和1.9倍加速且精度损失可忽略。

DeepSeek开源/仓库推理部署/工程
9月22日
21:15
公众号:DeepSeek(深度求索)
40
DeepSeek-V3.1 版本更新

DeepSeek-V3.1 版本更新发布,主要包括修复若干已知问题,Agent 能力进一步提升。这是本次版本更新的核心内容,旨在优化用户体验。

智能体DeepSeek模型发布
9月1日
17:30
公众号:DeepSeek(深度求索)
33
DeepSeek关于AI生成合成内容标识的公告

DeepSeek已在平台内对AI生成合成内容添加标识,并明确提醒用户相关内容由AI生成。

DeepSeek产品更新
8月21日
14:25
公众号:DeepSeek(深度求索)
精选63
DeepSeek-V3.1 发布,迈向 Agent 时代的第一步

DeepSeek-V3.1 以混合推理模型形式开源,用户可一键切换思考模式,同时 Agent 智能体支持性能得到增强。

智能体DeepSeek开源生态推理

推荐理由:DeepSeek V3.1 不是小修小补,混合推理和 Agent 支持让它从‘对话模型’转向‘行动模型’,开源这一步让 Agent 开发有了新底座。
6月16日
00:00
LMSYS:Blog(Chatbot Arena 团队)
在GB200 NVL72上部署DeepSeek 671B:PD与大规模EP架构实现2.7倍解码加速

SGLang团队在GB200 NVL72集群部署DeepSeek 671B模型,采用预填充-解码分离(PD)与大规模专家并行(EP)架构,结合Blackwell专用优化组件(DeepGEMM、DeepEP等),实现单GPU解码吞吐7,583 tokens/秒。在2,000 token输入下,性能较H100提升2.7倍,整体加速比达2.5-3.4倍。系统利用NVLink全互联降低通信延迟,依托更大显存支持高批次处理,显著提升MoE模型推理效率。

DeepSeek开源/仓库推理部署/工程
5月29日
20:06
公众号:DeepSeek(深度求索)
51
DeepSeek-R1 更新,思考更深,推理更强

DeepSeek-R1 更新,思考更深,推理更强。开启“深度思考”功能即可体验新版 R1 更加强大的思考与推理能力。

DeepSeek推理模型发布
3月25日
21:23
公众号:DeepSeek(深度求索)
同事件精选64
DeepSeek-V3 模型更新,各项能力全面进阶

DeepSeek-V3 新版已发布,关闭深度思考模式即可体验,模型权重同步开源。

DeepSeek开源/仓库推理模型发布
同一事件,精选展示《DeepSeek-V3 正式发布》
推荐理由:DeepSeek-V3 发布时是开源模型的有力竞争者,但这条一年多前的旧闻如今毫无新意,对关注 AI 动态的你来说,可以直接跳过。
2月26日
19:15
公众号:DeepSeek(深度求索)
33
DeepSeek API 错峰优惠,R1 价格降至1/4

DeepSeek API 推出错峰优惠,夜间空闲时间价格大幅下调,R1 模型价格降至原价的四分之一,即日起可享受流畅优惠体验。

DeepSeek产品更新部署/工程
2月6日
19:45
公众号:DeepSeek(深度求索)
37
DeepSeek官方信息发布及服务渠道说明

DeepSeek发布官方说明:任何非官方账号发布的信息均不代表其观点,提醒用户切勿轻信。用户应通过官方渠道获取准确信息。

DeepSeek行业动态
1月27日
18:00
公众号:DeepSeek(深度求索)
21
金鳞耀岁,共启新程 | DeepSeek 乙巳新年春节AI贺词
DeepSeek行业动态
1月20日
20:10
公众号:DeepSeek(深度求索)
精选64
DeepSeek-R1 发布,性能对标 OpenAI o1 正式版

DeepSeek-R1 发布,性能对标 OpenAI o1 正式版。模型遵循 MIT License 开放 API,训练技术同步公开。

DeepSeek推理模型发布

推荐理由:虽已是旧闻,但 DeepSeek-R1 作为首个开源对齐 o1 的模型,其训练技术至今仍有参考价值,做推理方向的值得回溯。
1月15日
17:39
公众号:DeepSeek(深度求索)
50
DeepSeek 官方 App 正式发布,iOS/Android 各应用市场均已上线

DeepSeek 推出官方移动端 App,目前已在 iOS 和 Android 各大应用商店上架。该 App 由 DeepSeek-V3 模型驱动,面向所有用户免费开放使用,用户可通过官网或应用市场直接下载。

DeepSeek产品更新端侧
12月26日
19:17
公众号:DeepSeek(深度求索)
精选67
DeepSeek-V3 正式发布

深度求索正式发布 DeepSeek-V3 模型,性能比肩世界顶尖模型,速度跃升,价格更新。

DeepSeek开源/仓库模型发布

推荐理由:DeepSeek-V3 是 2024 年底国产模型的一次真正跃迁,首次亮剑就逼近闭源顶尖,开源权重更是直接改变了开发者生态。时隔一年半回头看,它仍是理解 DeepSeek 路径的起点。
12月13日
20:14
公众号:DeepSeek(深度求索)
47
久等了,DeepSeek-VL2
DeepSeek多模态模型发布
12月10日
20:26
公众号:DeepSeek(深度求索)
52
DeepSeek V2 系列收官,联网搜索上线官网

DeepSeek V2.5 模型迭代完成,官网正式上线全新联网搜索功能,V2 系列至此收官。

DeepSeek产品更新搜索
12月4日
00:00
LMSYS:Blog(Chatbot Arena 团队)
SGLang v0.4:零开销批处理调度器、缓存感知负载均衡器及更快的结构化输出

SGLang v0.4版本正式发布,通过零开销批处理调度器将CPU调度与GPU计算重叠,吞吐量提升1.1倍,较其他基线快1.3倍。新版本引入缓存感知负载均衡器,预测KV缓存命中率,使吞吐量最高提升1.9倍,缓存命中率从20%提升至75%。针对DeepSeek模型的数据并行注意力机制带来1.9倍解码吞吐量提升,XGrammar结构化输出速度提升达10倍。

DeepSeek开源/仓库部署/工程
‹ 上一页
12
下一页 ›