6月23日

13:13

HuggingFace Daily Papers（社区热门论文）

针对长序列转录中KV缓存累积导致显存增加和速度下降的问题，研究团队提出Unlimited OCR。该模型以DeepSeek OCR为基线，用提出的Reference Sliding Window Attention（R-SWA）替换解码器所有注意力层，在保持恒定KV缓存的同时降低注意力计算成本。结合DeepSeek OCR编码器的高压缩率，Unlimited OCR在32K标准最大长度下单次前向可转录数十页文档。R-SWA是一种通用解析注意力机制，同样适用于ASR、翻译等任务。代码和模型权重已开源。

DeepSeek 多模态论文/研究

11:14

Berryxia.AI@berryxia

百度开源 Unlimited OCR：单次解析多页 PDF，疑似挖角 DeepSeek 技术骨干

百度在 HuggingFace 开源 Unlimited OCR 模型，核心卖点为 One-Shot Long-Horizon Parsing（单次长时解析），一次前向推理即可转录几十页 PDF 或图像。其创新机制 R-SWA（参考滑动窗口注意力）模拟人类抄写时的注意力模式——每个 token 看到完整图像，输出端只维护前 128 个状态，32K 上下文，KV Cache 大小恒定不随文档长度增长。技术报告披露灵感与 DeepSeek-OCR 架构有密切联系，核心贡献者中技术总监 YY 疑为近期从 DeepSeek 离职的研究者。模型已在 GitHub 和 HuggingFace 开放。

DeepSeek 多模态开源/仓库模型发布

04:10

Artificial Analysis@ArtificialAnlys

AA-Briefcase基准测试：开放权重模型主导成本-性能帕累托前沿

Artificial Analysis发布AA-Briefcase智能体知识工作基准测试，评估模型在长期任务中的表现。任务成本差异超700倍，最高性能模型Claude Fable 5每任务超$20。成本-性能帕累托前沿上，除Anthropic两个最高分模型外，其余大部分由开放权重模型占据。关键性价比：GLM 5.2 (max)每任务$2.40，得分仅比Claude Opus 4.8低90 Elo，成本低65%；DeepSeek V4 Pro (max)每任务$0.08，得分比Gemini 3.5 Flash高约60 Elo，成本低98%以上。

智能体 Anthropic DeepSeek 推理

01:12

Berryxia.AI@berryxia

百度开源Unlimited-OCR：可一次性处理数百页文档

百度PaddlePaddle在HuggingFace发布Unlimited-OCR，核心创新R-SWA（Reference Sliding Window Attention）使解码时KV Cache保持恒定，避免随页数爆炸。该模型可一次性处理数百页文档，速度和稳定性优于逐页处理。在OmniDocBench上得分93%，比DeepSeek-OCR高出6个百分点。这使长文档OCR从“分块+拼接”变为端到端一镜到底，直接理解整篇文档结构与布局。

Adina Yakup: Unlimited-OCR 🔥New OCR from @PaddlePaddle It can parse hundreds of pages in a single pass while maintaining stable spee...

DeepSeek Hugging Face 多模态开源/仓库

6月22日

21:08

AYi@AYi_AInotes

DeepSeek V4 Flash 限时全免费

DeepSeek V4 Flash 登陆 OpenModel 平台，开启限时免费活动。该模型为 284B MoE 架构，支持 1M 超长上下文，编码与智能体能力突出。活动期间输入输出均为 $0.00/M，无任何调用门槛。平台其他模型同步享受 20%–80% 折扣。免费窗口期至 6 月 28 日截止。

OpenModel: DeepSeek-V4-Flash is FREE until June 28! OpenModel Limited-Time Event: → Input: $0.00 / M → Output: $0.00 / M Powerful 2...

智能体 DeepSeek 编码行业动态

00:06

向阳乔木@vista8

DeepSeek Harness组（新成立部门）仍在大量招聘，共开放三种职位：Harness研究员（实习/全职）、Harness工程师（实习/全职）、Harness产品经理（仅全职）。候选人大致需通过一轮笔试和三轮面试，终面由部门负责人@tianyi主持。职位空缺较大，招聘门槛与DeepSeek其他组一致。投递链接及私信渠道已附。

Tianyi Cui: 作为新成立的部门,DeepSeek Harness 组的目标远大、工作繁重,仍然非常缺人。我每天都在面试,以及各种地方张贴小广告......一共有三种职位: Harness 研究员(实习全职均可):https://app.mokahr.co...

DeepSeek 行业动态

6月21日

22:35

宝玉@dotey

DeepSeek Harness 新部门正在招人，共三种职位：Harness 研究员（实习/全职均可）、Harness 工程师（实习/全职均可）、Harness 产品经理（限全职）。招聘门槛与 DeepSeek 其他组一致，流程为一轮笔试加三轮面试，终面由 @tianyi 负责。有意者可私信投递简历，具体链接详见推文。

DeepSeek 行业动态

21:35

meng shao@shao__meng

DeepSeek Harness 组（新成立部门）仍在大量招聘。职位包括：Harness 研究员（实习/全职）、Harness 工程师（实习/全职）、Harness 产品经理（仅全职）。招聘流程与 DeepSeek 其他组一致：一轮笔试加三轮面试，终面由 @tianyi 负责。可私信投递简历。

智能体 DeepSeek 行业动态

20:09

Berryxia.AI@berryxia

DeepSeek-V4-Flash免费至6月28日

兄弟们，喜大普奔哈哈！ DeepSeek-V4-Flash 免费到6月28号，直接冲啊！ 284B MoE，1M上下文，编码和Agent能力都不错，直接可以用起来，截止日期到6月28号。链接：https://www.openmodel.ai

OpenModel: DeepSeek-V4-Flash is FREE until June 28! OpenModel Limited-Time Event: → Input: $0.00 / M → Output: $0.00 / M Powerful 2...

智能体 DeepSeek 编码行业动态

20:05

AYi@AYi_AInotes

感觉GLM 5.2太强了，有点国产Fable 5的感觉了，会不会是下一个DeepSeek时刻，然后接棒DeepSeek成为中国大模型的新一代大哥和门店担当

DeepSeek 开源生态现象/趋势

6月20日

20:30

The Decoder：AI News（RSS）

NYU教授Damodaran：AI回调冲击或超互联网泡沫

纽约大学金融教授Aswath Damodaran在播客中警告，AI行业若发生回调，冲击可能比2000年互联网泡沫破裂更痛苦。他指出AI需巨额物理基础设施投资且多依赖债务融资，损失将波及社会。Damodaran质疑AI商业模式能否规模化，因AI每次使用都消耗算力，规模经济弱于Netflix、更像Spotify；中国Deepseek等对手带来价格侵蚀，利润率本已很低。他还警告，若AI实现替代整个岗位的愿景，将导致一半白领失业，带来巨大社会成本。科技巨头因重注AI进入不熟悉的资本密集型领域，苹果的谨慎态度在他看来更明智。

DeepSeek 现象/趋势

16:27

Hacker News 热门（buzzing.cc 中文翻译）

同事件精选72

GPT-5.5幻觉率达86%，GLM-5.2仅28%--大模型越大越不可靠

GLM-5.2（MIT开源，753B参数，约40B活跃）在AA Intelligence Index上仅比GPT-5.5低4分、比Claude Fable 5低9分，但其幻觉率仅28%，远低于GPT-5.5的86%和DeepSeek V4 Pro（1.6T参数，49B活跃）的94%。后者在AA-Omniscience基准上仅6%的问题会承认不知道。实际代码测试中，GLM-5.2用12秒和800个推理token识别出技术悖论，而DeepSeek V4 Pro耗费3分26秒和近10倍推理token后仍给出错误答案。模型规模增长正导致幻觉率飙升而非智力提升。

DeepSeek OpenAI 数据/训练现象/趋势

同一事件，精选展示《GLM-5.2 上线并开源：专注 Coding 与长程任务》

推荐理由：这篇实测对比揭示了大型模型的致命幻觉问题，GPT-5.5 幻觉率高达 86% 远超 GLM-5.2 的 28%，模型选型不能只看 Benchmark 排名，「会不会不懂装懂」才是真分水岭。

16:01

AYi@AYi_AInotes

微软两头通吃：GPT卖中国，DeepSeek卖西方

微软凭借与OpenAI的特殊合同获得全球自由转售权，将OpenAI模型卖给中国客户（最大客户字节跳动每年在Azure和AI服务上投入超10亿美元），模型通过新加坡数据中心访问，同时监控防蒸馏。另一边，微软正在测试DeepSeek-R1和DeepSeek-V4，准备反向卖给西方客户。这一“双向AI模型贸易网络”凸显中美地缘壁垒下商业套利空间巨大。

AYi: 还得是微软会闷声发大财啊,它现在已经成为全球最大的 AI 中间商,oh no ,是最大的中转站, 不仅把ChatGPT卖给中国企业,也把DeepSeek 反向卖给西方客户😁 以上来自彭博社的最新报道,绝对权威可信,看完让我意外的不仅仅是微...

DeepSeek Microsoft OpenAI 现象/趋势

15:01

AYi@AYi_AInotes

精选75

微软双向转售GPT与DeepSeek成全球最大AI中间商

彭博社报道，微软已成为全球最大AI模型中转站，既将ChatGPT卖给中国企业，也反向将DeepSeek模型卖给西方客户。报道称微软正在测试DeepSeek-R1和DeepSeek-V4，计划向西方客户提供这些中国模型。这一模式构建起跨中美AI模型的双向贸易网络。

DeepSeek Microsoft 开源生态行业动态

推荐理由：微软做起了跨中美模型的双向经销商，这事比表面看起来意义大——它可能绕过限制，把最先进的模型分发到原本接触不到的市场，全球 AI 供应链要改写了。

6月19日

19:19

Chubby♨️@kimmonismus

某人在Reddit上搭建了一个WoW私服，包含1800个机器人，并通过DeepSeek API实现AI聊天。死互联网理论，但可玩。一个没有真实玩家的MMORPG，却不知何故仍然感觉像人类。

智能体 DeepSeek 现象/趋势

12:19

AYi@AYi_AInotes

精选76

DeepSeek研究员开源AutoResearch：AI自主跑通285B模型RL研究闭环

DeepSeek研究员Deli Chen将AutoResearch协议开源，并发布Self-play综述论文。其AI智能体首次完全自主地在DeepSeek 285B模型上完成完整RL研究闭环——从实验设计、写代码、提交GPU任务、debug到结论总结，全程零人工干预。系统调用了GRPO工具，被视为持续学习研究的开端。

Deli Chen: 🧵 Deli AutoResearch SKILL is now officially open source! 🎉 https://victorchen96.github.io/auto_research/framework.html...

智能体 DeepSeek 开源/仓库

推荐理由：Deli Chen 开源的不是模型，是能让 AI 自己跑通 RL 研究全流程的「后厨系统」，从实验设计到 debug 全自动，五个工程思路可以直接抄作业。

08:16

IT之家（RSS）

IT早报 0619：宁德时代利润超7家车企总和；首部L3/L4自动驾驶国标公示；DeepSeek识图模式上线

DeepSeek识图模式在网页和App端正式上线。阿里千问团队将推出“千问输入法”独立App。宁德时代单季净利润207亿元，超过奇瑞、吉利、比亚迪等7家车企利润总和（约175亿元）。工信部公示我国首部L3/L4自动驾驶强制性国标，要求从证明能力转向论证安全，2027年7月起实施。此外，开发者测试发现一句“你好”消耗约5万Token（约0.125元），15元套餐不到1小时见底；DeepSeek向投资人提出“不挖人”要求；市场监管总局督导货拉拉整改，退还不合理费用1.2亿元。

DeepSeek 行业动态

08:00

OpenRouter：Announcements（RSS）

精选73

DeepSeek V4 智能体 token 份额持续增长

DeepSeek 于4月24日发布新一代旗舰模型 V4 系列。OpenRouter 数据显示，V4 发布后其 token 份额从年初的9%增长至6月初的18%，自5月中旬起成为 OpenRouter 最受欢迎模型。V4 是首个足以胜任智能体工作负载的 DeepSeek 模型，到5月底 V4-Flash 已占 DeepSeek 智能体 token 流量的70%。V4-Flash 最便宜端点价格为每百万 token 输入 $0.09、输出 $0.18，远低于 GPT-5.5 的 $5/$30。中国模型整体 token 份额于6月初超过美国模型，DeepSeek 是主要驱动力。

智能体 DeepSeek 开源生态现象/趋势

推荐理由：OpenRouter 独家数据展示了代际转折：DeepSeek V4 靠性价比吃下代理负载，中国模型 token 份额首次超过美国，这个信号比任何 benchmark 排名都真实，做应用选型的人该重新算账了。

6月18日

23:20

🚨 AI News | TestingCatalog@testingcatalog

微软正评估GLM、MiniMax、Kimi等多款开源模型用于Copilot Cowork，旨在降低推理成本。据Axios报道，微软考虑托管DeepSeek V4作为更便宜选项，同时将Copilot Cowork从无限定价转为按使用量计费。微软称用户每周执行数百任务，成本可能很高。若采用DeepSeek，模型将是可选、经微调和安全防护，并完全托管在Azure上。微软推动模型"可互换"策略，未来部分任务可能移至本地执行。

Chubby♨️: Axios reports that Microsoft is considering a Microsoft-hosted version of DeepSeek V4 as a cheaper model option for Copi...

DeepSeek Microsoft 开源生态行业动态

22:14

IT之家（RSS）

DeepSeek 首次融资估值超 500 亿美元，传创始人向投资人提"不挖人"要求

DeepSeek 本周完成首次外部融资，估值超 500 亿美元。公司此前拒绝外部融资，因部分核心人才流失后启动融资。有传闻称，创始人梁文锋今年 5 月在投资者线上会议中向潜在资方提出要求：投资 DeepSeek 的前提之一是承诺不挖走其员工、不鼓励另起炉灶。该消息尚未核实。去年底，开发 DeepSeek V3 的罗福莉转投小米负责 MiMo AI 团队，该团队后续 AI 模型在基准测试中已超越 DeepSeek。此外，腾讯挖来曾在 OpenAI 工作的姚顺雨担任首席 AI 科学家。

DeepSeek 行业动态

20:14

IT之家（RSS）

DeepSeek 识图模式正式上线，无法识别创始人梁文锋

DeepSeek 识图模式于 6 月 18 日在 App 和网页端上线。IT之家测试发现，该模式无法正确识别创始人梁文锋的照片，多次将其识别为董宇辉、张雪峰或雷军；而雷军照片可正常上传并准确识别。原因可能是梁文锋网络公开照片和信息较少，模型难以形成稳定识别特征，说明 DeepSeek 未针对自家老板做特殊识别优化。

DeepSeek 产品更新多模态

16:49

X.PIN@thexpin

中美AI角色悄然互换

微软向字节跳动出售OpenAI服务（每年超10亿美元），蚂蚁、美团、腾讯使用Azure。截至2025年6月财年，Azure中国AI收入增长约3倍。同时，美国开发者转向中国模型降本：Cursor（马斯克据称想收购的AI编程工具）使用Qwen和Kimi；Claude一小时编码约10美元，DeepSeek不到50美分。

DeepSeek Microsoft OpenAI 现象/趋势

16:14

IT之家（RSS）

精选72

DeepSeek 识图模式正式上线 App 和网页端

DeepSeek 识图模式于6月18日在网页和 App 端正式上线，与快速模式、专家模式并列。开启后用户可直接上传图片让 DeepSeek 识别图像，能力超越简单文字提取。目前 App 端仍显示“图片理解功能内测中”，网页端无此提示。该模式背后的多模态模型技术细节于今年4月公开，核心框架为“Thinking with Visual Primitives（以视觉原语思考）”。

DeepSeek 产品更新多模态

推荐理由：DeepSeek的识图模式终于从内测进了正式版，虽然是补课而非破圈，但对中文用户来说，让AI直接看图比打字描述常用太多，日常工作和内容处理都更顺手了。

03:06

Hacker News 热门（buzzing.cc 中文翻译）

美国暂未将DeepSeek列入黑名单，逾100家企业被认定为安全风险

据路透社报道，美国政府目前未将中国AI公司DeepSeek列入黑名单，但同时有超过100家企业被认定构成安全风险。这一决定显示了美方在出口管制上的谨慎态度，但目前仍保留了其他企业的大量限制措施。

DeepSeek 政策/监管

6月17日

23:07

IT之家（RSS）

同事件精选74

DeepSeek 以 4000 亿元估值完成首轮外部融资：510 亿元到账，投资方含梁文锋、腾讯、宁德时代等

企查查数据显示，DeepSeek 于 2026 年 6 月 16 日完成首轮外部融资，规模约 510 亿元，估值近 4000 亿元。投资方包括创始人梁文锋、腾讯、宁德时代、网易、京东、Monolith 砺思资本、IDG 资本、正心谷投资、拾象科技及国家人工智能产业投资基金。DeepSeek 成立于 2023 年 7 月，主营大语言模型及多模态 AI 技术研发，此前由幻方量化全资支持。本轮融资将用于扩展 AI 基础设施、加强研发、提供股权激励及加快商业化。国家人工智能产业投资基金直接入股并享有投票权，其余投资者均不享有投票权且设有五年锁定期。

DeepSeek 开源生态行业动态

同一事件，精选展示《DeepSeek 推进 700 亿元融资，梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》

推荐理由：DeepSeek 首轮融资估值 4000 亿，腾讯、宁德时代、京东及国资等入局，但梁文锋设了五年锁定期且不给投票权，这种资本条款在头部 AI 公司里很少见，值得一看。

16:38

X.PIN@thexpin

显然，微软再也用不起商业API了。他们正在考虑使用自托管的DeepSeek-V4版本来驱动Copilot的智能体AI。我想我们都还记得，特朗普政府曾威胁要封禁DeepSeek。此外，Anthropic刚刚阻止了外国用户使用Fable 5和Mythos 5。在这一切发生之际，我很好奇美国人是如何看待的。

DeepSeek 行业动态

13:09

SemiAnalysis@SemiAnalysis_

POV： @ohnePixel 为 DeepSeek V4 首日部署获得一个平台。了解更多：https://semianalysis.substack.com/p/deepseekv4-16t-day-0-to-day-43-performance

DeepSeek 推理评测/基准

11:03

IT之家（RSS）

Anthropic 和 OpenAI 模型太贵，微软智能体考虑使用 DeepSeek V4 微调版

微软将 Copilot Cowork 智能体转为基于使用量的定价，并考虑使用 DeepSeek V4 微调版或另一种开源模型，作为 Anthropic 和 OpenAI 模型的更低成本替代方案。该模型完全托管在 Azure 上，客户数据留在微软云端，受企业级安全与合规控制。价格方面，Anthropic Fable 5 输出定价 50 美元/百万 token，DeepSeek V4 Pro 输出定价 0.87 美元/百万 token（永久 25 折后），价差约 57 倍。微软预计未来几周内推出更低成本模型。

智能体 DeepSeek Microsoft 行业动态

09:06

meng shao@shao__meng

微软 Copilot Cowork 全球可用，拟引入 Azure 托管 DeepSeek V4 降本

微软 Copilot Cowork 正式全球可用，支持多模型。为控制成本，正评估引入微调版 DeepSeek V4 作为 Anthropic/OpenAI 模型的低成本替代，按算力/用量计费。模型完全托管于 Azure，数据不出微软云，已加入安全层，数周内公布。同时指出，Agent 任务反复调用模型致 token 消耗大幅增加，包月无限用模式已不可行。

Satya Nadella: Copilot Cowork is now generally available worldwide, now with multi-model support! Every organization can put long-runni...

智能体 DeepSeek Microsoft 产品更新

08:03

IT之家（RSS）

IT早报：DeepSeek完成超70亿美元融资，英伟达员工考公上岸，央视关注运营商不同权

DeepSeek完成超70亿美元融资，投资方包括腾讯、宁德时代、京东、网易，但无投票权，梁文峰仍掌控公司。英伟达上海员工考公上岸引热议。央视关注三大运营商新老用户不同权问题，更换套餐困难。中国移动将陆续上线通话字幕、可视菜单等升级。鸿蒙智行引入中创新航、国轩高科作为电池二供。宁德时代曾毓群称2030年前固态电池百万级装车可能性很小。

DeepSeek 行业动态

05:05

Rohan Paul@rohanpaul_ai

DeepSeek获74亿美元融资，估值500亿美元成中国AI第一

DeepSeek完成74亿美元融资，估值达500亿美元，成为中国估值最高的AI初创公司。创始人梁文峰在融资前持股近90%，并以约30亿美元个人出资成为最大投资方。本轮主要投资者包括腾讯（约15亿美元）、宁德时代（约7.4亿美元）以及国家人工智能产业投资基金（约1.5亿美元）。DeepSeek计划继续推进开源模型和AGI研究，同时帮助华为等国内芯片制造商在美国芯片限制下运行强大模型。

DeepSeek 开源生态行业动态

03:35

The Decoder：AI News（RSS）

微软 Copilot Cowork 转向按用量计费，考虑采用 DeepSeek V4

微软正考虑采用自托管微调版 DeepSeek V4 作为 Copilot Cowork 的更廉价模型选项，同时将 Cowork 改为按使用量计费。Cowork 基于 Anthropic 的 Claude 技术。Copilot EVP Charles Lamanna 表示固定费率因高频用户推高成本而不可持续。微软已在 GitHub Copilot 上实施类似调整。DeepSeek 将作为可选模型，完全托管于 Azure 并配备偏见防护，客户数据不出微软云。最终决定预计数周内做出。CEO Satya Nadella 此前发文支持企业可挑选并微调的多模型生态。

DeepSeek Microsoft 产品更新部署/工程

02:24

Chubby♨️@kimmonismus

精选75

微软考虑为 Copilot Cowork 集成 DeepSeek V4

微软正考虑为 Copilot Cowork 提供微软托管的 DeepSeek V4 版本，作为更便宜的模型选项。Copilot Cowork 将放弃无限定价，转向按使用量计费，原因是成本过高（用户每周执行数百项任务导致费用激增）。若采用 DeepSeek，该模型将是可选的、经过微调与安全防护，并完全托管于 Azure。Axios 报道称微软已微调了一个可用模型，最终决定待定。

Ina Fried: New @axios: Microsoft eyes DeepSeek for Copilot Cowork as it also joins the shift to usage based pricing. Says final dec...

DeepSeek Microsoft 开源生态行业动态

推荐理由：微软考虑在 Copilot Cowork 中引入 DeepSeek V4 作为便宜选项，同时转向按用量计价。如果落地，这不仅是成本策略的转向，更可能打破企业 AI 对开源模型的信任壁垒，定价变革也会给全行业施加压力。

6月16日

22:01

Nathan Lambert：Interconnects（RSS）

前沿大模型后训练配方回顾：与 Finbarr Timbers 对谈

Interconnects 播客邀请 Finbarr Timbers 回顾后训练配方的演变：从 InstructGPT 的 SFT→奖励模型→RL 三阶段，到 Llama 3 / Tülu 3 的 SFT→DPO→可验证奖励 RL，再至 DeepSeek R1 以大规模 RL 为核心。2026 年配方分化为多个领域专家模型再合并回统一模型。新出现模式为 Multi-teacher On-Policy Distillation（MOPD）：训练 N 个领域专家（经 SFT 和领域 RL），再通过在线采样、逐 token 最小化反向 KL 散度训练通用学生模型。MiMo Flash V2 率先引入，DeepSeek V4 与 Nemotron 3 Ultra 扩展至超过 10 个教师。MOPD 兴起源于单一 RL 流程在多领域间产生能力冲突，而专家模型易于并行训练，在线蒸馏技术日趋成熟。

DeepSeek 大佬观点开源生态推理

21:51

Nathan Lambert@natolambert

Nathan Lambert联合Finbarr Timbers发布新播客，调研GLM 5.1等模型后训练配方

Nathan Lambert与Finbarr Timbers合作推出新播客，系统调研GLM 5.1、Kimi K2.6、DeepSeek V4、Xiaomi MiMo V2.5、Nemotron Ultra等模型的最新后训练方法。核心讨论包括：行业转向多教师在线策略蒸馏（MOPD）的原因；Olmo风格配方需改进的方向；后训练如何适配大型组织；以及在AGI早期阶段的职业建议。播客章节涵盖历史回顾、2026年模型配方（MiMo Flash、DeepSeek V4、GLM 5、Kimi K2.6等）及开放式后训练讨论。

DeepSeek 大佬观点数据/训练

18:00

IT之家（RSS）

腾讯云 DeepSeek-V3.2 模型 7 月 16 日下线，官方建议迁移至 V4 系列

腾讯云今日公告，DeepSeek-V3.2 模型将于 2026 年 7 月 16 日 00:00 正式下线，届时不再提供接入服务，推荐迁移至能力更优的 DeepSeek-V4 系列。未完成迁移的用户，系统将自动切换至最新模型。此前 6 月 3 日，腾讯云对 DeepSeek-V4 系列大幅降价：V4-Pro 推理输入与输出价格降幅达 75%，缓存命中价格降幅高达 97.5%；V4-Flash 缓存命中价格降幅达 90%。

DeepSeek 行业动态

17:57

The Decoder：AI News（RSS）

同事件精选72

DeepSeek 完成首轮外部融资，估值超 500 亿美元

中国 AI 初创公司 DeepSeek 完成首轮外部融资，募资超 500 亿元人民币（约 74 亿美元），估值超 500 亿美元。投资结构特殊：多数投资者将资金投入 CEO 梁文锋管理的有限合伙企业，无投票权且锁定期五年；仅国资 AI 基金直接投资并保留投票权。创始人梁文锋个人投入约 200 亿元，腾讯和宁德时代为主要外部投资者。梁文锋表示优先基础 AI 研究与 AGI 开发，将继续开源。DeepSeek 去年初凭 V3、R1 模型获全球关注，今年 4 月发布运行于华为芯片的最大开源权重模型 V4，并将 V4 Pro 永久折扣 75%，输入价格约为 OpenAI GPT-5.5 的 1/11，输出价格约为 1/35。

DeepSeek 开源生态行业动态

同一事件，精选展示《DeepSeek 推进 700 亿元融资，梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》

推荐理由：DeepSeek 首次外部融资估值冲到 500 亿美元，交易结构却排除了投资人话语权，看得出梁文锋仍把控制权抓得很紧，开源路线和极致性价比是最大的筹码。

16:00

IT之家（RSS）

OpenRouter 发布 Fusion API，多模型协同以一半成本接近 Claude Fable 5 性能

AI 模型 API 聚合平台 OpenRouter 于 6 月 14 日推出 Fusion API，将用户请求并行发送至多个模型，经审查模型分析后由调用模型生成统一回答。官方测试显示，Claude Opus 4.8 + GPT-5.5 + Gemini 3.1 Pro 组合得分 68.3%，超过单独 Claude Fable 5 的 65.3%；双 Claude Opus 4.8 组合得 65.5% 同样高于 Fable 5。低成本组合 Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro 得分 64.7%，以约 Claude Fable 5 一半的成本将分数差距控制在 1% 以内。

DeepSeek OpenAI 产品更新推理

15:00

IT之家（RSS）

DeepSeek 完成超 70 亿美元融资，腾讯、宁德时代等参投但无投票权

DeepSeek 完成超 70 亿美元（约 474 亿元）融资，估值超 500 亿美元，创中国 AI 行业单轮融资纪录。投资者获经济权益但无投票权，面临五年锁定期且不获董事会席位；国家人工智能产业投资基金例外，直接注资 10 亿元并享投票权。腾讯、宁德时代、京东、网易及 IDG 资本参与。据路透社此前报道，创始人梁文峰自掏 200 亿元，腾讯拟投 100 亿元，宁德时代拟出资 50 亿元。DeepSeek 凭 V3 与 R1 模型成中国 AI 标杆。

DeepSeek 行业动态

13:00

IT之家（RSS）

谷歌更新Android Bench榜单：Gemini 3.5 Flash成本最贵，约为DeepSeek V4 Flash的17.5倍

谷歌更新Android Bench榜单，GPT-5.5以74分居首，GPT-5.4与Gemini 3.1 Pro Preview并列第二（72.4分），Claude Opus 4.7（68.7分）和Opus 4.6（66.6分）分列第四、第五。谷歌自家Gemini 3.5 Flash仅获63.7分排第六，平均Token消耗3.559亿，单次运行成本147.1美元，为榜单最贵模型。成本仅为其约1/3的Gemini 3.1 Pro Preview性价比更高。DeepSeek V4 Flash以52.7分排第12，单次运行成本仅8.4美元，后者成本仅为前者的1/17.5。

DeepSeek Google 编码评测/基准