AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态一手 · 49 条
全部一手资讯X论文
标签「DeepSeek」清除
11月20日周三
19:59公众号:DeepSeek(深度求索)66精选DeepSeek 推理模型预览版上线,推理性能媲美 o1-preview,公开完整思维链
9月18日周三
20:06公众号:DeepSeek(深度求索)56DeepSeek-V2.5 登上 LMSYS ChatBotArena,创国产模型历史最高分
9月6日周五
19:38公众号:DeepSeek(深度求索)61精选DeepSeek-V2.5:融合通用与代码能力的全新开源模型
9月4日周三
00:00LMSYS:Blog(Chatbot Arena 团队)SGLang v0.3 发布:DeepSeek MLA 吞吐量提升 7 倍,支持多模态视频理解
8月16日周五
20:46公众号:DeepSeek(深度求索)53DeepSeek 发布开源数学定理证明模型
8月2日周五
20:24公众号:DeepSeek(深度求索)48DeepSeek API 创新采用硬盘缓存,价格再降一个数量级
7月26日周五
15:00公众号:DeepSeek(深度求索)44DeepSeek API 升级,支持续写、FIM、Function Calling、JSON Output
7月23日周二
16:08公众号:DeepSeek(深度求索)35DeepSeek顶尖人才招聘
7月18日周四
20:36公众号:DeepSeek(深度求索)46DeepSeek-V2-0628 荣登「全球大模型竞技场」开源榜首
没有更多了
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
11月20日
19:59
公众号:DeepSeek(深度求索)
精选66
DeepSeek 推理模型预览版上线,推理性能媲美 o1-preview,公开完整思维链

DeepSeek 上线推理模型预览版,其推理性能与 OpenAI 的 o1-preview 相当,并公开了模型的完整思维链。

DeepSeek推理模型发布

推荐理由:虽然已是旧闻,但 DeepSeek 首次公开推理模型完整思维链,对理解 o1 类模型的内部机制是个重要线索,做推理模型研究的值得回看。
9月18日
20:06
公众号:DeepSeek(深度求索)
56
DeepSeek-V2.5 登上 LMSYS ChatBotArena,创国产模型历史最高分

DeepSeek-V2.5 在 LMSYS ChatBotArena(全球大模型竞技场)榜单中上榜,创下国产大模型在该竞技场的最高得分记录。

DeepSeek开源生态模型发布评测/基准
9月6日
19:38
公众号:DeepSeek(深度求索)
精选61
DeepSeek-V2.5:融合通用与代码能力的全新开源模型

DeepSeek-V2.5 保留原有 Chat 模型的通用对话能力和 Coder 模型的代码处理能力,并更好地对齐人类偏好。

DeepSeekOpenAI开源/仓库模型发布

推荐理由:DeepSeek首次将通用对话与代码能力合一的开源模型,当时直接拉低了多任务成本,今天看仍是模型混合能力演变的早期标杆。
9月4日
00:00
LMSYS:Blog(Chatbot Arena 团队)
SGLang v0.3 发布:DeepSeek MLA 吞吐量提升 7 倍,支持多模态视频理解

SGLang v0.3 正式发布,实现显著性能提升与新架构支持。针对 DeepSeek MLA 机制深度优化,采用权重吸收、FP8 量化等技术,在 H100 GPU 上吞吐量最高提升 7 倍。集成 torch.compile 使批量 1-32 场景延迟降低 1.5 倍。新增 LLaVA-OneVision 支持,可处理交错文本、多图像及视频输入,速度提升 4.5 倍。同时全面支持 Gemma-2 的 8K 上下文与交错窗口注意力,突破 4K 限制。

DeepSeek开源/仓库部署/工程
8月16日
20:46
公众号:DeepSeek(深度求索)
53
DeepSeek 发布开源数学定理证明模型

DeepSeek 发布了一款开源数学定理证明模型,目标是加速“数学定理证明的 AlphaGo 时代”的到来。

DeepSeek开源/仓库推理模型发布
8月2日
20:24
公众号:DeepSeek(深度求索)
48
DeepSeek API 创新采用硬盘缓存,价格再降一个数量级
DeepSeek产品更新
7月26日
15:00
公众号:DeepSeek(深度求索)
44
DeepSeek API 升级,支持续写、FIM、Function Calling、JSON Output

DeepSeek API 新增续写、FIM、Function Calling 和 JSON Output 功能,所有新功能均可通过 deepseek-chat 和 deepseek-coder 模型调用。

DeepSeek产品更新推理部署/工程
7月23日
16:08
公众号:DeepSeek(深度求索)
35
DeepSeek顶尖人才招聘

DeepSeek启动顶尖人才招聘,以“Diving into the Unknown”为招募口号,面向AI领域招募优秀人才。

DeepSeek行业动态
7月18日
20:36
公众号:DeepSeek(深度求索)
46
DeepSeek-V2-0628 荣登「全球大模型竞技场」开源榜首

DeepSeek-V2-0628在「全球大模型竞技场」榜单更新中位列开源模型榜首,成为全球开源大模型性能第一。

DeepSeek开源生态行业动态
‹ 上一页
12
下一页 ›