AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「DeepSeek」清除
9月29日周一
00:00LMSYS:Blog(Chatbot Arena 团队)SGLang 发布首日支持 DeepSeek-V3.2:集成稀疏注意力机制
9月26日周五
00:00LMSYS:Blog(Chatbot Arena 团队)蚂蚁集团联合SGLang:H20-96G部署DeepSeek-R1最佳实践
9月25日周四
00:00LMSYS:Blog(Chatbot Arena 团队)GB200 NVL72部署DeepSeek V3/R1(二):PD分离与大规模EP实现3.8倍Prefill、4.8倍Decode吞吐
9月22日周一
21:15公众号:DeepSeek(深度求索)40DeepSeek-V3.1 版本更新
9月1日周一
17:30公众号:DeepSeek(深度求索)33DeepSeek关于AI生成合成内容标识的公告
8月21日周四
14:25公众号:DeepSeek(深度求索)63精选DeepSeek-V3.1 发布,迈向 Agent 时代的第一步
6月16日周一
00:00LMSYS:Blog(Chatbot Arena 团队)在GB200 NVL72上部署DeepSeek 671B:PD与大规模EP架构实现2.7倍解码加速
5月29日周四
20:11DeepSeek68精选DeepSeek-R1-0528发布 性能全面升级
20:06公众号:DeepSeek(深度求索)51DeepSeek-R1 更新,思考更深,推理更强
3月25日周二
21:23公众号:DeepSeek(深度求索)64同事件精选DeepSeek-V3 模型更新,各项能力全面进阶同一事件,精选展示《DeepSeek-V3 正式发布》
2月28日周五
09:06DeepSeekDeepSeek开源3FS并行文件系统与Smallpond框架
2月27日周四
10:05DeepSeek59开源周第四日:优化并行策略发布
2月26日周三
19:25DeepSeek🚨 非高峰折扣提醒! 即日起,每日 UTC 16:30-00:30,DeepSeek API 平台享受非高峰折扣: 🔹 DeepSeek-V3 五折 🔹 DeepSeek-R1 高达 75% 折扣 更智能地最大化资源利用--在这些高价值时段节省更多!
19:15公众号:DeepSeek(深度求索)33DeepSeek API 错峰优惠,R1 价格降至1/4
09:00DeepSeek🚀 #OpenSourceWeek 第三天:DeepGEMM 推出 DeepGEMM - 一个支持 dense 和 MoE GEMM 的 FP8 GEMM 库,为 V3/R1 的训练和推理提供支持。 ⚡ 在 Hopper GPU 上可达 1350+ FP8 TFLOPS ✅ 无繁重依赖,简洁如教程 ✅ 完全 Just-In-Time 编译 ✅ 核心逻辑仅约 300 行 - 却在大多数矩阵尺寸上超越专家调优的 kernel ✅ 支持 dense 布局及两种 MoE 布局 🔗 GitHub: https://github.com/deepseek-ai/DeepGEMM
2月25日周二
10:24DeepSeekDeepSeek开源DeepEP:首个MoE专家并行通信库
2月24日周一
09:34DeepSeek🚀 #OpenSourceWeek 第一天:FlashMLA 很荣幸分享 FlashMLA -- 我们针对 Hopper GPU 的高效 MLA 解码内核,针对变长序列优化,现已投入生产。 ✅ 支持 BF16 ✅ 分页 KV 缓存(块大小 64) ⚡ 在 H800 上达 3000 GB/s 内存受限与 580 TFLOPS 计算受限 🔗 在 GitHub 上探索:https://github.com/deepseek-ai/FlashMLA
2月21日周五
12:00DeepSeekDeepSeek 启动开源周:将开源 5 个 AGI 探索代码库
2月18日周二
15:04DeepSeek精选NSA:硬件对齐的稀疏注意力新机制
2月6日周四
19:45公众号:DeepSeek(深度求索)37DeepSeek官方信息发布及服务渠道说明
1月28日周二
12:57DeepSeek为防止任何潜在危害,我们重申 @deepseek_ai 是我们在 Twitter/X 上的唯一官方账号。 任何账号: - 代表我们 - 使用相同头像 - 使用相似名称 均为仿冒。 请保持警惕,避免被误导!
1月27日周一
18:00公众号:DeepSeek(深度求索)21金鳞耀岁,共启新程 | DeepSeek 乙巳新年春节AI贺词
1月20日周一
20:10公众号:DeepSeek(深度求索)64精选DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
1月15日周三
17:39公众号:DeepSeek(深度求索)50DeepSeek 官方 App 正式发布,iOS/Android 各应用市场均已上线
12月26日周四
19:17公众号:DeepSeek(深度求索)67精选DeepSeek-V3 正式发布
12月13日周五
20:22DeepSeek精选🎉 DeepSeek-VL2 来了!我们的下一代视觉-语言模型进入 MoE 时代。 🤖 DeepSeek-MoE 架构 + 动态图像分块 ⚡ 3B/16B/27B 规模,灵活使用 🏆 在所有基准测试中表现优异 🧵 1/n
20:14公众号:DeepSeek(深度求索)47久等了,DeepSeek-VL2
12月10日周二
20:27DeepSeek精选🚀 DeepSeek-V2.5-1210: 盛大终章 🎉 🌐 联网搜索现已上线网页版!访问 https://chat.deepseek.com/ 并开启"联网搜索"获取实时回答。🕒 🧵(1/3)
20:26公众号:DeepSeek(深度求索)52DeepSeek V2 系列收官,联网搜索上线官网
12月4日周三
00:00LMSYS:Blog(Chatbot Arena 团队)SGLang v0.4:零开销批处理调度器、缓存感知负载均衡器及更快的结构化输出
11月20日周三
19:59公众号:DeepSeek(深度求索)66精选DeepSeek 推理模型预览版上线,推理性能媲美 o1-preview,公开完整思维链
9月18日周三
20:06公众号:DeepSeek(深度求索)56DeepSeek-V2.5 登上 LMSYS ChatBotArena,创国产模型历史最高分
9月6日周五
19:38公众号:DeepSeek(深度求索)61精选DeepSeek-V2.5:融合通用与代码能力的全新开源模型
9月4日周三
00:00LMSYS:Blog(Chatbot Arena 团队)SGLang v0.3 发布:DeepSeek MLA 吞吐量提升 7 倍,支持多模态视频理解
8月16日周五
20:46公众号:DeepSeek(深度求索)53DeepSeek 发布开源数学定理证明模型
8月2日周五
20:24公众号:DeepSeek(深度求索)48DeepSeek API 创新采用硬盘缓存,价格再降一个数量级
7月26日周五
15:00公众号:DeepSeek(深度求索)44DeepSeek API 升级,支持续写、FIM、Function Calling、JSON Output
7月23日周二
16:08公众号:DeepSeek(深度求索)35DeepSeek顶尖人才招聘
7月18日周四
20:36公众号:DeepSeek(深度求索)46DeepSeek-V2-0628 荣登「全球大模型竞技场」开源榜首
没有更多了
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
9月29日
00:00
LMSYS:Blog(Chatbot Arena 团队)
SGLang 发布首日支持 DeepSeek-V3.2:集成稀疏注意力机制

SGLang 在发布首日即支持 DeepSeek-V3.2,该模型基于 DeepSeek-V3.1-Terminus 引入 DeepSeek Sparse Attention (DSA) 机制。DSA 通过 Lightning Indexer 和 Top-k Token Selection 将注意力复杂度从 O(L²) 降至 O(Lk),在 128K 长上下文下实现训练与推理效率大幅提升且质量损失可忽略。SGLang 实现了专用缓存与 Native Sparse Attention 后端,并提供了面向 NVIDIA、AMD MI350X/MI355X 及 NPU 的部署方案与容器镜像。

DeepSeek开源/仓库开源生态部署/工程
9月26日
00:00
LMSYS:Blog(Chatbot Arena 团队)
蚂蚁集团联合SGLang:H20-96G部署DeepSeek-R1最佳实践

蚂蚁集团联合SGLang提出H20-96G部署DeepSeek-R1的工业级方案。针对H20高内存带宽、低计算吞吐特性,采用硬件感知策略:单节点TP-8处理prefill,小规模EP-16处理decode。结合FlashMLA-FP8、DeepGEMM swapAB内核优化与异步Expert Affinity负载均衡技术,在4096 token序列上实现单节点16.5k输入/5.7k输出token/秒的吞吐,达H20平台SOTA性能。

DeepSeek推理论文/研究部署/工程
9月25日
00:00
LMSYS:Blog(Chatbot Arena 团队)
GB200 NVL72部署DeepSeek V3/R1(二):PD分离与大规模EP实现3.8倍Prefill、4.8倍Decode吞吐

SGLang团队基于GB200 NVL72优化DeepSeek V3/R1推理,采用FP8 Attention、NVFP4 MoE、大规模专家并行及PD分离等技术。2000 token输入下,单卡Prefill达26,156 tokens/s,Decode达13,386 tokens/s,较H100提升3.8倍和4.8倍。BF16/FP8配置下仍达18,471/9,087 tokens/s。FP8与NVFP4低精度内核分别带来1.8倍和1.9倍加速且精度损失可忽略。

DeepSeek开源/仓库推理部署/工程
9月22日
21:15
公众号:DeepSeek(深度求索)
40
DeepSeek-V3.1 版本更新

DeepSeek-V3.1 版本更新发布,主要包括修复若干已知问题,Agent 能力进一步提升。这是本次版本更新的核心内容,旨在优化用户体验。

智能体DeepSeek模型发布
9月1日
17:30
公众号:DeepSeek(深度求索)
33
DeepSeek关于AI生成合成内容标识的公告

DeepSeek已在平台内对AI生成合成内容添加标识,并明确提醒用户相关内容由AI生成。

DeepSeek产品更新
8月21日
14:25
公众号:DeepSeek(深度求索)
精选63
DeepSeek-V3.1 发布,迈向 Agent 时代的第一步

DeepSeek-V3.1 以混合推理模型形式开源,用户可一键切换思考模式,同时 Agent 智能体支持性能得到增强。

智能体DeepSeek开源生态推理

推荐理由:DeepSeek V3.1 不是小修小补,混合推理和 Agent 支持让它从‘对话模型’转向‘行动模型’,开源这一步让 Agent 开发有了新底座。
6月16日
00:00
LMSYS:Blog(Chatbot Arena 团队)
在GB200 NVL72上部署DeepSeek 671B:PD与大规模EP架构实现2.7倍解码加速

SGLang团队在GB200 NVL72集群部署DeepSeek 671B模型,采用预填充-解码分离(PD)与大规模专家并行(EP)架构,结合Blackwell专用优化组件(DeepGEMM、DeepEP等),实现单GPU解码吞吐7,583 tokens/秒。在2,000 token输入下,性能较H100提升2.7倍,整体加速比达2.5-3.4倍。系统利用NVLink全互联降低通信延迟,依托更大显存支持高批次处理,显著提升MoE模型推理效率。

DeepSeek开源/仓库推理部署/工程
5月29日
20:11
DeepSeek@deepseek_ai
精选68
🚀 DeepSeek-R1-0528 现已发布! 🔹 基准测试性能提升 🔹 前端能力增强 🔹 减少幻觉现象 🔹 支持 JSON 输出与函数调用 ✅ 立即试用:https://chat.deepseek.com/ 🔌 API 使用方式不变 - 文档在此:https://api-docs.deepseek.com/guides/reasoning_model 🔗 开源权重:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
DeepSeek开源生态推理模型发布
关联讨论 1 条X:DeepSeek (@deepseek_ai)
推荐理由:DeepSeek-R1 的常规迭代,幻觉降低和 JSON 输出是实用改进,但距离代际跃迁还差得远。开源权重直接可用,做推理链产品的团队值得花半小时跑一下。
20:06
公众号:DeepSeek(深度求索)
51
DeepSeek-R1 更新,思考更深,推理更强

DeepSeek-R1 更新,思考更深,推理更强。开启“深度思考”功能即可体验新版 R1 更加强大的思考与推理能力。

DeepSeek推理模型发布
3月25日
21:23
公众号:DeepSeek(深度求索)
同事件精选64
DeepSeek-V3 模型更新,各项能力全面进阶

DeepSeek-V3 新版已发布,关闭深度思考模式即可体验,模型权重同步开源。

DeepSeek开源/仓库推理模型发布
同一事件,精选展示《DeepSeek-V3 正式发布》
推荐理由:DeepSeek-V3 发布时是开源模型的有力竞争者,但这条一年多前的旧闻如今毫无新意,对关注 AI 动态的你来说,可以直接跳过。
2月28日
09:06
DeepSeek@deepseek_ai
DeepSeek开源3FS并行文件系统与Smallpond框架

DeepSeek发布开源并行文件系统3FS(Fire-Flyer File System),专为现代SSD和RDMA网络优化。180节点集群可实现6.6 TiB/s聚合读取吞吐量,25节点GraySort测试达3.66 TiB/min,单节点KVCache查找峰值超40 GiB/s。采用分离式架构与强一致性语义,支持训练数据预处理、检查点存取及V3/R1推理的KVCache查找。同步开源Smallpond数据处理框架。

DeepSeek开源/仓库数据/训练部署/工程
2月27日
10:05
DeepSeek@deepseek_ai
59
🚀 #开源周 第4天:优化的并行策略 ✅ DualPipe - 一种用于V3/R1训练中计算-通信重叠的双向流水线并行算法。 🔗 https://github.com/deepseek-ai/DualPipe ✅ EPLB - 适用于V3/R1的专家并行负载均衡器。 🔗 https://github.com/deepseek-ai/eplb 📊 分析V3/R1中的计算-通信重叠情况。 🔗 https://github.com/deepseek-ai/profile-data
DeepSeek开源/仓库部署/工程
2月26日
19:25
DeepSeek@deepseek_ai
🚨 非高峰折扣提醒! 即日起,每日 UTC 16:30-00:30,DeepSeek API 平台享受非高峰折扣: 🔹 DeepSeek-V3 五折 🔹 DeepSeek-R1 高达 75% 折扣 更智能地最大化资源利用--在这些高价值时段节省更多!
DeepSeek产品更新部署/工程
19:15
公众号:DeepSeek(深度求索)
33
DeepSeek API 错峰优惠,R1 价格降至1/4

DeepSeek API 推出错峰优惠,夜间空闲时间价格大幅下调,R1 模型价格降至原价的四分之一,即日起可享受流畅优惠体验。

DeepSeek产品更新部署/工程
09:00
DeepSeek@deepseek_ai
🚀 #OpenSourceWeek 第三天:DeepGEMM 推出 DeepGEMM - 一个支持 dense 和 MoE GEMM 的 FP8 GEMM 库,为 V3/R1 的训练和推理提供支持。 ⚡ 在 Hopper GPU 上可达 1350+ FP8 TFLOPS ✅ 无繁重依赖,简洁如教程 ✅ 完全 Just-In-Time 编译 ✅ 核心逻辑仅约 300 行 - 却在大多数矩阵尺寸上超越专家调优的 kernel ✅ 支持 dense 布局及两种 MoE 布局 🔗 GitHub: https://github.com/deepseek-ai/DeepGEMM
DeepSeek开源/仓库部署/工程
2月25日
10:24
DeepSeek@deepseek_ai
DeepSeek开源DeepEP:首个MoE专家并行通信库

DeepSeek开源周第二日推出DeepEP,这是首个面向MoE模型训练与推理的开源EP通信库。该库针对专家并行场景优化,支持NVLink和RDMA的all-to-all通信,既提供高吞吐kernel用于训练与推理预填充,也提供低延迟kernel用于解码阶段。同时原生支持FP8精度,并允许灵活的GPU资源控制以实现计算与通信重叠,显著提升MoE模型效率。

DeepSeek开源/仓库部署/工程
2月24日
09:34
DeepSeek@deepseek_ai
🚀 #OpenSourceWeek 第一天:FlashMLA 很荣幸分享 FlashMLA -- 我们针对 Hopper GPU 的高效 MLA 解码内核,针对变长序列优化,现已投入生产。 ✅ 支持 BF16 ✅ 分页 KV 缓存(块大小 64) ⚡ 在 H800 上达 3000 GB/s 内存受限与 580 TFLOPS 计算受限 🔗 在 GitHub 上探索:https://github.com/deepseek-ai/FlashMLA
DeepSeek开源/仓库推理部署/工程
2月21日
12:00
DeepSeek@deepseek_ai
DeepSeek 启动开源周:将开源 5 个 AGI 探索代码库

DeepSeek AI 预告开源周活动,将于下周起陆续开源 5 个代码仓库。作为探索 AGI 的小团队,他们计划透明分享那些已在生产环境中实战验证的代码模块。团队相信开源社区的集体力量能加速行业进步,强调此次发布将摒弃象牙塔式的封闭开发,以"车库能量"和社区驱动创新的形式呈现。

DeepSeek开源/仓库开源生态部署/工程
2月18日
15:04
DeepSeek@deepseek_ai
精选
NSA:硬件对齐的稀疏注意力新机制

NSA是一种硬件对齐且原生可训练的稀疏注意力机制,专为超快速长上下文训练与推理设计。其核心采用动态分层稀疏策略,结合粗粒度token压缩与细粒度token选择。通过针对现代硬件的优化,NSA在加速推理、降低预训练成本的同时不损失性能,在通用基准、长上下文任务及指令推理中匹配或超越Full Attention模型。

DeepSeek推理论文/研究部署/工程

推荐理由:DeepSeek 推出硬件对齐稀疏注意力 NSA,长上下文训练推理双提速,预训练成本显著降低
2月6日
19:45
公众号:DeepSeek(深度求索)
37
DeepSeek官方信息发布及服务渠道说明

DeepSeek发布官方说明:任何非官方账号发布的信息均不代表其观点,提醒用户切勿轻信。用户应通过官方渠道获取准确信息。

DeepSeek行业动态
1月28日
12:57
DeepSeek@deepseek_ai
为防止任何潜在危害,我们重申 @deepseek_ai 是我们在 Twitter/X 上的唯一官方账号。 任何账号: - 代表我们 - 使用相同头像 - 使用相似名称 均为仿冒。 请保持警惕,避免被误导!
DeepSeek行业动态
1月27日
18:00
公众号:DeepSeek(深度求索)
21
金鳞耀岁,共启新程 | DeepSeek 乙巳新年春节AI贺词
DeepSeek行业动态
1月20日
20:10
公众号:DeepSeek(深度求索)
精选64
DeepSeek-R1 发布,性能对标 OpenAI o1 正式版

DeepSeek-R1 发布,性能对标 OpenAI o1 正式版。模型遵循 MIT License 开放 API,训练技术同步公开。

DeepSeek推理模型发布

推荐理由:虽已是旧闻,但 DeepSeek-R1 作为首个开源对齐 o1 的模型,其训练技术至今仍有参考价值,做推理方向的值得回溯。
1月15日
17:39
公众号:DeepSeek(深度求索)
50
DeepSeek 官方 App 正式发布,iOS/Android 各应用市场均已上线

DeepSeek 推出官方移动端 App,目前已在 iOS 和 Android 各大应用商店上架。该 App 由 DeepSeek-V3 模型驱动,面向所有用户免费开放使用,用户可通过官网或应用市场直接下载。

DeepSeek产品更新端侧
12月26日
19:17
公众号:DeepSeek(深度求索)
精选67
DeepSeek-V3 正式发布

深度求索正式发布 DeepSeek-V3 模型,性能比肩世界顶尖模型,速度跃升,价格更新。

DeepSeek开源/仓库模型发布
关联讨论 1 条公众号:DeepSeek(深度求索)
推荐理由:DeepSeek-V3 是 2024 年底国产模型的一次真正跃迁,首次亮剑就逼近闭源顶尖,开源权重更是直接改变了开发者生态。时隔一年半回头看,它仍是理解 DeepSeek 路径的起点。
12月13日
20:22
DeepSeek@deepseek_ai
精选
🎉 DeepSeek-VL2 来了!我们的下一代视觉-语言模型进入 MoE 时代。 🤖 DeepSeek-MoE 架构 + 动态图像分块 ⚡ 3B/16B/27B 规模,灵活使用 🏆 在所有基准测试中表现优异 🧵 1/n
DeepSeek多模态模型发布端侧

推荐理由:DeepSeek 开源 VL2 视觉模型,3B 轻量版可端侧部署,MoE 架构支持动态图像分块
20:14
公众号:DeepSeek(深度求索)
47
久等了,DeepSeek-VL2
DeepSeek多模态模型发布
12月10日
20:27
DeepSeek@deepseek_ai
精选
🚀 DeepSeek-V2.5-1210: 盛大终章 🎉 🌐 联网搜索现已上线网页版!访问 https://chat.deepseek.com/ 并开启"联网搜索"获取实时回答。🕒 🧵(1/3)
DeepSeek产品更新搜索

推荐理由:DeepSeek 网页版上线联网搜索,开启后可实时获取最新信息
20:26
公众号:DeepSeek(深度求索)
52
DeepSeek V2 系列收官,联网搜索上线官网

DeepSeek V2.5 模型迭代完成,官网正式上线全新联网搜索功能,V2 系列至此收官。

DeepSeek产品更新搜索
12月4日
00:00
LMSYS:Blog(Chatbot Arena 团队)
SGLang v0.4:零开销批处理调度器、缓存感知负载均衡器及更快的结构化输出

SGLang v0.4版本正式发布,通过零开销批处理调度器将CPU调度与GPU计算重叠,吞吐量提升1.1倍,较其他基线快1.3倍。新版本引入缓存感知负载均衡器,预测KV缓存命中率,使吞吐量最高提升1.9倍,缓存命中率从20%提升至75%。针对DeepSeek模型的数据并行注意力机制带来1.9倍解码吞吐量提升,XGrammar结构化输出速度提升达10倍。

DeepSeek开源/仓库部署/工程
11月20日
19:59
公众号:DeepSeek(深度求索)
精选66
DeepSeek 推理模型预览版上线,推理性能媲美 o1-preview,公开完整思维链

DeepSeek 上线推理模型预览版,其推理性能与 OpenAI 的 o1-preview 相当,并公开了模型的完整思维链。

DeepSeek推理模型发布

推荐理由:虽然已是旧闻,但 DeepSeek 首次公开推理模型完整思维链,对理解 o1 类模型的内部机制是个重要线索,做推理模型研究的值得回看。
9月18日
20:06
公众号:DeepSeek(深度求索)
56
DeepSeek-V2.5 登上 LMSYS ChatBotArena,创国产模型历史最高分

DeepSeek-V2.5 在 LMSYS ChatBotArena(全球大模型竞技场)榜单中上榜,创下国产大模型在该竞技场的最高得分记录。

DeepSeek开源生态模型发布评测/基准
9月6日
19:38
公众号:DeepSeek(深度求索)
精选61
DeepSeek-V2.5:融合通用与代码能力的全新开源模型

DeepSeek-V2.5 保留原有 Chat 模型的通用对话能力和 Coder 模型的代码处理能力,并更好地对齐人类偏好。

DeepSeekOpenAI开源/仓库模型发布

推荐理由:DeepSeek首次将通用对话与代码能力合一的开源模型,当时直接拉低了多任务成本,今天看仍是模型混合能力演变的早期标杆。
9月4日
00:00
LMSYS:Blog(Chatbot Arena 团队)
SGLang v0.3 发布:DeepSeek MLA 吞吐量提升 7 倍,支持多模态视频理解

SGLang v0.3 正式发布,实现显著性能提升与新架构支持。针对 DeepSeek MLA 机制深度优化,采用权重吸收、FP8 量化等技术,在 H100 GPU 上吞吐量最高提升 7 倍。集成 torch.compile 使批量 1-32 场景延迟降低 1.5 倍。新增 LLaVA-OneVision 支持,可处理交错文本、多图像及视频输入,速度提升 4.5 倍。同时全面支持 Gemma-2 的 8K 上下文与交错窗口注意力,突破 4K 限制。

DeepSeek开源/仓库部署/工程
8月16日
20:46
公众号:DeepSeek(深度求索)
53
DeepSeek 发布开源数学定理证明模型

DeepSeek 发布了一款开源数学定理证明模型,目标是加速“数学定理证明的 AlphaGo 时代”的到来。

DeepSeek开源/仓库推理模型发布
8月2日
20:24
公众号:DeepSeek(深度求索)
48
DeepSeek API 创新采用硬盘缓存,价格再降一个数量级
DeepSeek产品更新
7月26日
15:00
公众号:DeepSeek(深度求索)
44
DeepSeek API 升级,支持续写、FIM、Function Calling、JSON Output

DeepSeek API 新增续写、FIM、Function Calling 和 JSON Output 功能,所有新功能均可通过 deepseek-chat 和 deepseek-coder 模型调用。

DeepSeek产品更新推理部署/工程
7月23日
16:08
公众号:DeepSeek(深度求索)
35
DeepSeek顶尖人才招聘

DeepSeek启动顶尖人才招聘,以“Diving into the Unknown”为招募口号,面向AI领域招募优秀人才。

DeepSeek行业动态
7月18日
20:36
公众号:DeepSeek(深度求索)
46
DeepSeek-V2-0628 荣登「全球大模型竞技场」开源榜首

DeepSeek-V2-0628在「全球大模型竞技场」榜单更新中位列开源模型榜首,成为全球开源大模型性能第一。

DeepSeek开源生态行业动态
‹ 上一页
1…789
下一页 ›