6月3日

00:29

OpenRouter@OpenRouter

精选68

⚡ 新增服务商：DigitalOcean 的 AI-Native Cloud 现已在 OpenRouter 上线。提供高性能推理，覆盖热门开源权重模型。在 DeepSeek V3.2 的输出速度和延迟方面排名第一（数据来自 @ArtificialAnlys）。查看其数据并试用模型：https://openrouter.ai/provider/digitalocean

DeepSeek 产品更新推理部署/工程

推荐理由：OpenRouter 新上线的 DigitalOcean 推理服务，把 DeepSeek V3.2 的延迟压到了全场最低，比官方还快，做实时应用的值得立刻切过去试一下。

6月2日

17:07

IT之家（RSS）

腾讯云智能体开发平台 DeepSeek-V4 系列模型明日起大幅降价，最高降幅 97.5%

腾讯云智能体开发平台宣布，自2026年6月3日起下调DeepSeek-V4系列模型的调用价格，其中DeepSeek-V4-Pro模型的推理输入与输出价格降幅达75%，缓存命中价格降幅高达97.5%；DeepSeek-V4-Flash模型的缓存命中价格降幅达90%。DeepSeek-V4系列模型发布于2026年4月，采用混合专家架构，总参数达1.6万亿，支持100万Token上下文长度。本次降价是在DeepSeek官方此前已调价基础上的平台层面调整。

DeepSeek 行业动态部署/工程

10:47

Berryxia.AI@berryxia

Memo软件与沉浸式翻译工具使用体验分享

推文分享作者日常使用的两个AI翻译工具及工作流。1. Memo软件（免费开源）：用于处理本地视频。流程为下载视频后，使用Whisper本地模型进行转录以节省成本，再接入DeepSeek-V4-Flash API进行翻译。该软件支持字幕烧录、编辑和导出，但在X平台上传速度慢。2. 沉浸式翻译：主要用于网页、YouTube视频及图书翻译，优点是格式保持较好。两者均支持接入用户自定义的API模型。

Berryxia.AI: 特么终于搞完了,太费劲了! 整整花了1晚上才把它翻译中文、剪辑、上传完毕。富人也有富人的烦恼,只是我们的烦恼不一样罢了! 这两天刷屏的Ivanka Trump (特朗普的长女千金)的长播客采访。整个播客中有些观点不能说多么锐利,但是也从...

DeepSeek 多模态开源/仓库教程/实践

6月1日

08:41

Berryxia.AI@berryxia

中国AI公司估值泡沫？高估值与低收入的巨大落差

国内五家纯LLM公司的总估值已高达2260亿美元，约Anthropic最新一轮估值的四分之一，但其收入运行率仅为Anthropic的四十分之一。这一数据凸显了国内厂商普遍采用的“低价+开放权重”融资与商业模式，与海外主流的闭源高定价模式形成鲜明对比。该现象将AI行业的核心矛盾——市场究竟为何为模型支付溢价以及估值逻辑在模型能力商品化后如何演变——直接摆上台面。

Kevin Simback 🍷: The Chinese LLM companies are raising at eye popping numbers Total valuation of the top 5 pure plays is $226B - about 1/...

Anthropic DeepSeek 现象/趋势

02:59

OpenCode@opencode

DeepSeek V4 Flash 现已在 OpenCode Zen 上线。

DeepSeek 产品更新编码

5月31日

12:13

宝玉@dotey

呼吁编程工具转型通用办公Agent

推文呼吁 Kimi Code、DeepSeek Harness 等 AI 编程工具应尽早提供图形界面（GUI），并拓展对通用办公任务的支持，以进化为通用 Agent。作者认为，仅在终端界面（TUI）和单一编程能力上竞争没有前途，尽管编程是核心基础。同时，推文引用并关注了另一个新选手 Grok Build，指出其更新迅速、潜力较大。

踏雪寻仙: @dotey 还有两个新选手值得关注:Kimi Code、Grok Build。更新速度都很快,潜力不小

智能体 DeepSeek 大佬观点编码

5月30日

08:40

Hacker News 热门（buzzing.cc 中文翻译）

神秘的大语言模型 Hy3 以巨大优势领跑 OpenRouter 模型排行榜

根据2026年5月29日发布的一则消息，一个名为 Hy3 的神秘大语言模型（LLM）在 OpenRouter 模型排行榜上取得了显著领先优势，位居榜首。OpenRouter 是一个 AI 模型聚合平台，其排行榜反映了不同模型的综合表现。该信息最初发布于 minimaxir.com，并获得了科技社区 HN 的关注。然而，关于该模型的具体技术细节、开发者信息以及性能评分，原文并未提供更多说明。

DeepSeek 开源生态现象/趋势部署/工程

5月29日

21:14

The Decoder：AI News（RSS）

新综述论文认为：代码是AI智能体的思考与行动方式，而非仅仅是其产出

一篇新综述论文提出，自主AI智能体的真正瓶颈并非语言模型本身，而是工具、内存、测试与权限边界等构成的软件层。这一“约束层”将无状态模型转化为能行动的工作智能体。DeepSeek已在北京组建专门的Harness团队，其“模型加约束层等于AI智能体”的公式印证了该观点。

智能体 DeepSeek MCP/工具论文/研究

11:34

Berryxia.AI@berryxia

文本频率定律的发现与验证

脸谱心智（FaceMind）的研究发现，在保持语义不变的前提下，使用大模型预训练语料中出现频率更高的表达方式，能显著提升模型表现。该规律被命名为Adam’s Law（文本频率定律）。核心实验显示：在数学推理任务中，仅换用高频表述可使准确率平均提升；在机器翻译任务中，使用DeepSeek-V3测试100种语言到英语的翻译，绝大多数语言对在BLEU指标上获得提升。该研究指出现有数据工程忽视了“文本频率”这一维度。Anthropic的Claude Opus 4.7使用新分词器，被业界视为对低频token退化问题的间接验证。

Anthropic DeepSeek 数据/训练论文/研究

09:42

ginobefun@hongming731

DeepSeek V4日处理近5000万token，单日成本仅20余元

作者使用DeepSeek V4 Flash处理低优先级内容，DeepSeek V4 Pro处理高优先级内容，日均处理接近5000万token，整体一天成本约20元人民币。关键在于缓存命中率很高，显著降低了使用成本。相比此前使用的Gemini，DeepSeek的性价比表现更为突出。

DeepSeek 教程/实践部署/工程

08:21

IT之家（RSS）

同事件精选71

IT早报 0529：估值 450 亿美元，曝大基金领投 DeepSeek 首轮融资；比亚迪发 4nm 璇玑 A3 芯片并推城市领航兜底；京沪联手指导美团、淘宝、京东三大外卖平台…

DeepSeek 获国家集成电路产业投资基金（国家大基金）领投的首轮融资，投前估值 450 亿美元。豆包官方就“新手父母听建议每顿只喂60ml奶”一事作出回应，称其建议符合国家喂养指南，指出原报道存在上下文缺失。微信 Win / Mac 4.1.10 正式版发布，新增“边写边译”功能。

DeepSeek 行业动态

同一事件，精选展示《DeepSeek 推进 700 亿元融资，梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》

推荐理由：国家大基金领投DeepSeek首轮融资，估值450亿美元，这既是政治背书也是资本对国产大模型商业化的真金白银投票，意味着DeepSeek将加速从开源挑战者转向平台化扩张。

5月28日

19:06

X.PIN@thexpin

同事件精选77

独家：DeepSeek计划在完成当前约500亿美元（3500亿人民币）融资轮后，立即申请科创板（A股）IPO。来源：参与本轮融资的一位大型基金经理。

DeepSeek 行业动态

同一事件，精选展示《DeepSeek 推进 700 亿元融资，梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》

推荐理由：DeepSeek冲刺科创板，3500亿估值，我好奇的是上市后会怎么改变烧钱打法，以及那些拿了期权的人终于能变现了。

11:15

IT之家（RSS）

DeepSeek 服务"部分中断"半小时，现已修复

DeepSeek 服务于 2026 年 5 月 28 日上午发生故障，网页对话和 API 均受影响。官方状态页面显示为“部分中断”，问题于 10:21 定位，10:50 修复，服务中断约半小时。这已是 DeepSeek 本月第五次出现服务问题，其中有两次为“完全中断”。

DeepSeek 行业动态

08:00

HuggingFace Daily Papers（社区热门论文）

ESPO：早停近端策略优化

ESPO（Early-Stopping Proximal Policy Optimization）是一种强化学习算法，它能在生成过程中实时检测失败轨迹并提前终止，以节省计算资源。该方法通过计算代理后悔值，当平滑后的累积后悔值显著超过预期时便停止生成。被截断的轨迹被视为吸收失败状态。在针对DeepSeek-R1-Distill-Qwen-7B模型的数学推理训练中，ESPO在AIME 2024、AMC 2023和MATH-500等基准上的表现均优于PPO，并累计节省了超过20%的回滚token。

arXiv DeepSeek 推理论文/研究

06:37

Rohan Paul@rohanpaul_ai

科技前沿速递

华为披露新的芯片设计突破，旨在缩小与台积电及英特尔的差距。阿里巴巴与南京大学的论文提出，标准大语言模型可通过选择性稀疏注意力机制更高效地处理长上下文。对DeepSeek的深度分析指出，其核心价值并非提供更廉价的聊天机器人，而是将硬件稀缺性转化为战略优势的架构设计。Meta、斯坦福及伊利诺伊大学的调查论文主张，当代码成为AI智能体的主要工作层时，其效能会更高。Anthropic联合创始人警示AI导致的失业将引发历史性道德危机。xAI为SuperGrok与X Premium+用户推出了终端原生的智能体AI产品“Grok Build”。

智能体 DeepSeek xAI 行业动态

5月27日

18:35

Chubby♨️@kimmonismus

DeepSeek与小米MiMo大模型降价的技术根源

DeepSeek V4-Pro宣布永久降价75%，小米MiMo V2.5降价高达99%。此次降价核心是架构革新带来的成本结构性降低。DeepSeek V4通过混合注意力架构大幅压缩了长上下文推理的KV缓存，使其在100万token时仅为V3.2的10%，单token推理FLOPs降至27%。小米MiMo团队则通过SGLang HiCache实现滑动窗口注意力，将KV缓存跨内存数据传输量减少至约1/7。这些架构优化使V4-Pro定价降至$0.87/百万输出token，MiMo V2.5-Pro约为$3/百万，两者均为拥有百万上下文窗口的前沿级模型。降价源于推理与缓存成本的实质性下降。

DeepSeek 大佬观点推理部署/工程

5月26日

23:03

Rohan Paul@rohanpaul_ai

Bloomberg：中国正将最强私营部门AI研究人员视为战略资产，据报道，阿里巴巴和DeepSeek的顶尖员工出国旅行前需获得国家批准。该政策将公司工程师更紧密地纳入国家安全规则，将部分员工视为敏感国家技术的持有者。 --- bloomberg .com/news/articles/2026-05-26/china-expands-travel-curbs-to-top-ai-talent-at-private-firms

DeepSeek 政策/监管

22:31

The Decoder：AI News（RSS）

据报道中国要求顶尖AI研究人员出境前须获许可

中国正在限制阿里巴巴、DeepSeek等私营企业顶尖AI研究人员的出境旅行，受影响人员需获得官方批准方可离境。此举是出于对数据泄露、技术窃取和人才流失的担忧，北京方面正加强对国内AI产业的管控。

DeepSeek 政策/监管

22:28

Nathan Lambert@natolambert

中国开始限制关键机构顶尖AI人才出境（此前仅传闻针对DeepSeek）。

DeepSeek 政策/监管行业动态

5月25日

09:21

meng shao@shao__meng

DeepSeek 以简单低价和长期主义挑战行业现状

推文赞扬 DeepSeek 践行长期主义与大道至简，指出其通过提供足够低价的 API 及几乎可忽略的缓存命中价格来赢得用户，而非像国内其他厂商那样设计复杂的套餐与促销策略。这被视作将底层技术做扎实、积累长期用户反馈的体现。推文还引用观点，将 Anthropic 描述为“每个人都讨厌但又害怕的黄鼠狼”，并希望 DeepSeek 能改变这一行业格局。

DeepSeek 现象/趋势编码

04:27

Rohan Paul@rohanpaul_ai

路透社报道，深度求索宣布其旗舰模型V4-Pro的API价格永久下调75%，但未直接确认这是由于华为昇腾芯片供应改善。报道分析，此举时机恰逢中国AI算力栈从受限的Nvidia芯片向华为昇腾硬件迁移带来的成本下降。据引述分析，DeepSeek的核心战略是通过架构创新（如MoE、DSA，以及V4-Pro的CSA/HCA技术）大幅降低对高端HBM GPU的依赖，其技术指标显示1M-token推理FLOPs和KV cache显著降低。其目标在于优化模型，使更多样的硬件（如LPDDR、NAND、定制ASIC）能够运行前沿AI，以适应不同的工业基础。

Rohan Paul: Great article here on DeepSeek. Their real story is not cheaper chatbots, but architecture that turns hardware scarcity ...

DeepSeek 大佬观点推理

02:27

Hacker News 热门（buzzing.cc 中文翻译）

精选74

DeepSeek将对其旗舰AI模型实施永久性75%折扣

DeepSeek 开源生态行业动态

推荐理由：DeepSeek把API价格永久砍掉75%，这是对OpenAI和Anthropic的直接价格战，做应用的该重新算算成本账了。

00:27

Hacker News 热门（buzzing.cc 中文翻译）

DeepSeek reasonix，一款具有高缓存效率和低成本的 DeepSeek 本机编码代理

DeepSeek reasonix是DeepSeek推出的本机编码代理，以高缓存效率和低成本为特点，在Hacker News获得102分。

DeepSeek 开源/仓库编码

00:18

Berryxia.AI@berryxia

DeepSeek算法突围：压缩显存、重塑生态，冲击万亿美元估值

DeepSeek面对GPU禁运，通过算法创新实现突围。核心成果包括：将KV Cache压缩至1/10，使1M上下文仅需5.48GB HBM；将MoE训练成本降低40-50%。其推出的Engram模块可利用LPDDR内存以O(1)查找换取算力。技术突破还涵盖MLA（KV Cache削减90%）、DSA/CSA/HCA等注意力机制重构，以及GRPO算法。效果显著：在1M上下文显存需求对比中，其V4 Pro（5.48GB）远低于GLM5（60GB）和Qwen3-235B（89GB）。该战略旨在盘活中国NAND与LPDDR资源，降低对HBM依赖，并已开源TileLang以打破CUDA壁垒。其V4 Pro模型1M上下文长缓存价格不足Sonnet 4.6的3%。

GDP: http://x.com/i/article/2057886253249662976

DeepSeek 开源生态推理现象/趋势

5月24日

18:57

Rohan Paul@rohanpaul_ai

封装与架构创新突破硬件限制

华为在先进NAND芯片受限的背景下，未直接追赶三星主导的高层数堆叠技术，而是采用“Die-on-Board”封装方案，通过将NAND裸片直接安装在电路板上提升存储密度，推出122.88TB AI SSD并计划推出245TB版本。与此同时，DeepSeek通过MoE、CSA/HCA等架构优化，大幅降低模型对HBM和算力的依赖，使国产硬件更适配前沿AI需求。两者路径形成呼应：华为从封装层面绕过芯片性能差距，DeepSeek从算法层面缓解硬件稀缺压力，共同体现了在外部限制下通过底层技术创新开辟新赛道的战略思维。

Rohan Paul: Great article here on DeepSeek. Their real story is not cheaper chatbots, but architecture that turns hardware scarcity ...

DeepSeek 推理现象/趋势部署/工程

14:40

Orange AI@oran_ge

DeepSeek推低成本缓存技术，大模型应用或迎变局

DeepSeek v4 Pro 虽然并非最强模型，但其核心优势在于采用了几乎零成本的缓存技术。该技术被视为大模型领域的重要突破，若应用于如 Claude Opus 等顶级模型，可使运营成本下降约10倍。文章认为这是所有大模型都需要的关键技术。此外，随着未来 v4.1 版本使用更真实的训练数据，其性能预计会快速提升。

宝玉: http://x.com/i/article/2058418354415644672

DeepSeek 大佬观点推理

13:57

Rohan Paul@rohanpaul_ai

DeepSeek：将硬件稀缺性转化为可编程的战略优势

DeepSeek的核心战略并非开发廉价聊天机器人，而是通过一系列架构创新（如MoE动态激活、DSA优化、CSA/HCA技术）显著降低对高端HBM GPU的依赖。此举旨在将硬件稀缺性转化为技术优势，使次优芯片、LPDDR内存及定制ASIC能支持前沿AI，从而优化AI以适配不同的工业基础。这一路径已产生实际商业影响，如V4-Pro大幅降价并与国产硬件生态形成联动，最终目标是实现“硬件稀缺性可编程”。

GDP: http://x.com/i/article/2057886253249662976

DeepSeek 开源生态推理现象/趋势

13:49

宝玉@dotey

DeepSeek的万亿美元战略：以技术创新驱动硬件生态

DeepSeek的核心战略并非销售应用服务，而是通过一系列底层技术创新，特别是MLA等注意力机制大幅压缩KV缓存需求，来重塑AI硬件生态。其技术能将1.6T参数模型在1M上下文下的内存占用降至5.48GB HBM，远低于同类模型。这直接降低了推理成本，并催生两大机会：一是将KV缓存转存至SSD，利好长江存储；二是其架构适配LPDDR内存进行权重缓存，利好长鑫存储。DeepSeek通过开源这些高效架构，正在构建一个以中国存储产业链为核心的新生态，最终目标是带动一个10万亿美元的AI硬件产业，并自身实现万亿美元市值。

DeepSeek 大佬观点开源生态现象/趋势

09:11

IT之家（RSS）

无需更新系统：努比亚星云 AIOS 2.0 机型已支持 DeepSeek-V4，覆盖 Z60 / 70 / 80 等系列

DeepSeek 端侧行业动态

08:11

IT之家（RSS）

神舟二十三号今晚发射；苹果iPhone 17系列领跑Q1全球畅销榜；人形机器人全生命周期管理平台发布；小米冠名三大汽车赛事

神舟二十三号载人飞船瞄准5月24日23:08发射，朱杨柱任指令长，香港航天员黎家盈将首飞。苹果iPhone 17系列领跑2026年Q1全球畅销榜，前十机型贡献25%出货量。闻泰科技声明安世荷兰剥夺控制权并阻挠审计。全国首个人形机器人管理平台发布，已为超2.8万台机器人赋予唯一“身份证号”。DeepSeek API完成扩容，默认支持500并发。小米宣布冠名中国三大汽车赛事，其YU7 GT医疗车首次亮相赛道。

DeepSeek 编码行业动态部署/工程

01:27

The Decoder：AI News（RSS）

DeepSeek 将 75% 折扣永久化，输出 token 定价至少低于 GPT-5.5 的 34 倍

DeepSeek 将针对其旗舰模型 V4-Pro 的 75% 折扣调整为永久性降价。调整后，输入 token 的价格为每百万 0.435 美元，相比 GPT-5.5 至少便宜 11.5 倍；输出 token 的价格优势更为显著，至少低 34 倍。如此激进的定价策略，对于 token 消耗量巨大的智能体系统而言，将对西方人工智能服务商构成显著的价格压力。

DeepSeek OpenAI 行业动态部署/工程

5月23日

20:09

IT之家（RSS）

DeepSeek API 完成输出提速与服务扩容，默认支持 500 并发同时在线

DeepSeek 宣布其API完成输出提速与服务扩容，服务更加稳定，默认支持500个并发同时在线，企业用户可申请更高并发。同时，DeepSeek-V4-Pro模型API价格将于2026年5月31日优惠结束后调整为原定价的1/4，具体价格调整为：输入（缓存命中）0.025元/百万Tokens，输入（缓存未命中）3元/百万Tokens，输出6元/百万Tokens。

DeepSeek 产品更新部署/工程

11:05

Artificial Analysis@ArtificialAnlys

DeepSeek永久性下调V4 Pro API价格

DeepSeek已将其V4 Pro API的临时75%降价转为永久性调价。新定价下，输入、输出及缓存输入价格均大幅降低，混合均价约为每百万token 0.18美元。根据测算，以新价格运行V4 Pro的综合成本仅约268美元，成本优势显著：约为Gemini 3.1 Pro Preview的三分之一，GPT-5.5的十二分之一，以及Claude Opus 4.7的十九分之一。此次调价使V4 Pro在“智能指数”与“运行成本”的帕累托前沿上占据了极具竞争力的位置。

DeepSeek 产品更新

03:57

Chubby♨️@kimmonismus

DeepSeek正在进行一轮102.9亿美元的融资。好消息是：梁文锋依然专注于构建开源AI模型，而非追逐短期商业化。 Via Bloomberg

DeepSeek 开源生态行业动态

03:27

Hacker News 热门（buzzing.cc 中文翻译）

DeepSeek 将 V4 Pro 的价格优惠永久化

DeepSeek在2026年5月22日宣布，将其AI模型V4 Pro的价格优惠从临时调整为永久有效。这意味着该产品的定价将长期维持在更具吸引力的水平，具体的费用明细可通过其官方定价页面查询。

DeepSeek 行业动态

02:16

AYi@AYi_AInotes

DeepSeek宣布V4-Pro模型永久降价

DeepSeek将其高性能模型V4-Pro的限时75%折扣宣布为永久性调整，输出价格降至0.87美元/百万tokens，远低于行业主流定价区间。此举不仅是促销，更被视为争夺定价权的战略行动，标志着AI模型的商业模式正从服务转向类似水电煤的基础设施逻辑。DeepSeek通过“永久”降价，意图以低单价换取海量使用数据、开发者生态及行业定价话语权，追求规模优先的路径。

DeepSeek: We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀

DeepSeek 现象/趋势

01:56

Rohan Paul@rohanpaul_ai

同事件精选78

Bloomberg：DeepSeek在融资谈判中优先考虑AGI而非商业化他们正推进102.9亿美元的融资轮，梁文锋承诺继续开发开源AI模型，而非追求短期商业化目标

DeepSeek 开源生态行业动态

同一事件，精选展示《DeepSeek 推进 700 亿元融资，梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》

推荐理由：DeepSeek 百亿融资押注开源 AGI 而非短期变现，在这个闭源收费风潮里是个重要信号，做开源的可以看看。

01:37

🚨 AI News | TestingCatalog@testingcatalog

DeepSeek永久下调DeepSeek V4 Pro定价75%！ &gt；每百万输入token $0.003625（使用缓存） &gt；每百万输入token $0.435。 &gt；每百万输出token $0.87。缓存几乎免费 👀

DeepSeek: We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀

DeepSeek 推理行业动态

01:26

Chubby♨️@kimmonismus

让我们稍作思考。 DeepSeek v4 pro 降价75%。永久有效！输入：$0.43 输出：$0.87 如果你读过 DeepSeek v4 的技术论文，就会知道这个模型在效率方面表现惊人。相比 v3.2，它仅需 27% 的算力和 10% 的缓存。SemiAnalysis 写了一篇很好的文章。 DeepSeek 现在专注于成本/token 效率。

DeepSeek: We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀

DeepSeek 大佬观点开源生态

01:26

The Decoder：AI News（RSS）

据报道，Deepseek 尽管获得数十亿美元资金，仍优先 AGI 研究而非快速盈利

Deepseek 即将完成约100亿美元的融资，这将使这家中国AI初创公司的估值达到约450亿美元。创始人梁文峰向投资者明确表示，公司战略将优先推进AGI（通用人工智能）的研究，而非追求短期利润。这一举动凸显了在AI竞赛中，Deepseek 坚持长期技术投入，即使获得巨额资金支持，也选择以突破性研究为导向，而非立即商业化盈利。

DeepSeek 行业动态

关联讨论 2 条