腾讯云智能体开发平台宣布,自2026年6月3日起下调DeepSeek-V4系列模型的调用价格,其中DeepSeek-V4-Pro模型的推理输入与输出价格降幅达75%,缓存命中价格降幅高达97.5%;DeepSeek-V4-Flash模型的缓存命中价格降幅达90%。DeepSeek-V4系列模型发布于2026年4月,采用混合专家架构,总参数达1.6万亿,支持100万Token上下文长度。本次降价是在DeepSeek官方此前已调价基础上的平台层面调整。
推文分享作者日常使用的两个AI翻译工具及工作流。1. Memo软件(免费开源):用于处理本地视频。流程为下载视频后,使用Whisper本地模型进行转录以节省成本,再接入DeepSeek-V4-Flash API进行翻译。该软件支持字幕烧录、编辑和导出,但在X平台上传速度慢。2. 沉浸式翻译:主要用于网页、YouTube视频及图书翻译,优点是格式保持较好。两者均支持接入用户自定义的API模型。
特么终于搞完了,太费劲了! 整整花了1晚上才把它翻译中文、剪辑、上传完毕。 富人也有富人的烦恼,只是我们的烦恼不一样罢了! 这两天刷屏的Ivanka Trump (特朗普的长女千金)的长播客采访。 整个播客中有些观点不能说多么锐利,但是也从...
国内五家纯LLM公司的总估值已高达2260亿美元,约Anthropic最新一轮估值的四分之一,但其收入运行率仅为Anthropic的四十分之一。这一数据凸显了国内厂商普遍采用的“低价+开放权重”融资与商业模式,与海外主流的闭源高定价模式形成鲜明对比。该现象将AI行业的核心矛盾——市场究竟为何为模型支付溢价以及估值逻辑在模型能力商品化后如何演变——直接摆上台面。
The Chinese LLM companies are raising at eye popping numbers Total valuation of the top 5 pure plays is $226B - about 1/...
推文呼吁 Kimi Code、DeepSeek Harness 等 AI 编程工具应尽早提供图形界面(GUI),并拓展对通用办公任务的支持,以进化为通用 Agent。作者认为,仅在终端界面(TUI)和单一编程能力上竞争没有前途,尽管编程是核心基础。同时,推文引用并关注了另一个新选手 Grok Build,指出其更新迅速、潜力较大。
@dotey 还有两个新选手值得关注:Kimi Code、Grok Build。更新速度都很快,潜力不小
根据2026年5月29日发布的一则消息,一个名为 Hy3 的神秘大语言模型(LLM)在 OpenRouter 模型排行榜上取得了显著领先优势,位居榜首。OpenRouter 是一个 AI 模型聚合平台,其排行榜反映了不同模型的综合表现。该信息最初发布于 minimaxir.com,并获得了科技社区 HN 的关注。然而,关于该模型的具体技术细节、开发者信息以及性能评分,原文并未提供更多说明。
一篇新综述论文提出,自主AI智能体的真正瓶颈并非语言模型本身,而是工具、内存、测试与权限边界等构成的软件层。这一“约束层”将无状态模型转化为能行动的工作智能体。DeepSeek已在北京组建专门的Harness团队,其“模型加约束层等于AI智能体”的公式印证了该观点。
脸谱心智(FaceMind)的研究发现,在保持语义不变的前提下,使用大模型预训练语料中出现频率更高的表达方式,能显著提升模型表现。该规律被命名为Adam’s Law(文本频率定律)。核心实验显示:在数学推理任务中,仅换用高频表述可使准确率平均提升;在机器翻译任务中,使用DeepSeek-V3测试100种语言到英语的翻译,绝大多数语言对在BLEU指标上获得提升。该研究指出现有数据工程忽视了“文本频率”这一维度。Anthropic的Claude Opus 4.7使用新分词器,被业界视为对低频token退化问题的间接验证。
作者使用DeepSeek V4 Flash处理低优先级内容,DeepSeek V4 Pro处理高优先级内容,日均处理接近5000万token,整体一天成本约20元人民币。关键在于缓存命中率很高,显著降低了使用成本。相比此前使用的Gemini,DeepSeek的性价比表现更为突出。
DeepSeek 获国家集成电路产业投资基金(国家大基金)领投的首轮融资,投前估值 450 亿美元。豆包官方就“新手父母听建议每顿只喂60ml奶”一事作出回应,称其建议符合国家喂养指南,指出原报道存在上下文缺失。微信 Win / Mac 4.1.10 正式版发布,新增“边写边译”功能。
同一事件,精选展示《DeepSeek 推进 700 亿元融资,梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》DeepSeek 服务于 2026 年 5 月 28 日上午发生故障,网页对话和 API 均受影响。官方状态页面显示为“部分中断”,问题于 10:21 定位,10:50 修复,服务中断约半小时。这已是 DeepSeek 本月第五次出现服务问题,其中有两次为“完全中断”。
ESPO(Early-Stopping Proximal Policy Optimization)是一种强化学习算法,它能在生成过程中实时检测失败轨迹并提前终止,以节省计算资源。该方法通过计算代理后悔值,当平滑后的累积后悔值显著超过预期时便停止生成。被截断的轨迹被视为吸收失败状态。在针对DeepSeek-R1-Distill-Qwen-7B模型的数学推理训练中,ESPO在AIME 2024、AMC 2023和MATH-500等基准上的表现均优于PPO,并累计节省了超过20%的回滚token。
华为披露新的芯片设计突破,旨在缩小与台积电及英特尔的差距。阿里巴巴与南京大学的论文提出,标准大语言模型可通过选择性稀疏注意力机制更高效地处理长上下文。对DeepSeek的深度分析指出,其核心价值并非提供更廉价的聊天机器人,而是将硬件稀缺性转化为战略优势的架构设计。Meta、斯坦福及伊利诺伊大学的调查论文主张,当代码成为AI智能体的主要工作层时,其效能会更高。Anthropic联合创始人警示AI导致的失业将引发历史性道德危机。xAI为SuperGrok与X Premium+用户推出了终端原生的智能体AI产品“Grok Build”。
DeepSeek V4-Pro宣布永久降价75%,小米MiMo V2.5降价高达99%。此次降价核心是架构革新带来的成本结构性降低。DeepSeek V4通过混合注意力架构大幅压缩了长上下文推理的KV缓存,使其在100万token时仅为V3.2的10%,单token推理FLOPs降至27%。小米MiMo团队则通过SGLang HiCache实现滑动窗口注意力,将KV缓存跨内存数据传输量减少至约1/7。这些架构优化使V4-Pro定价降至$0.87/百万输出token,MiMo V2.5-Pro约为$3/百万,两者均为拥有百万上下文窗口的前沿级模型。降价源于推理与缓存成本的实质性下降。
中国正在限制阿里巴巴、DeepSeek等私营企业顶尖AI研究人员的出境旅行,受影响人员需获得官方批准方可离境。此举是出于对数据泄露、技术窃取和人才流失的担忧,北京方面正加强对国内AI产业的管控。
推文赞扬 DeepSeek 践行长期主义与大道至简,指出其通过提供足够低价的 API 及几乎可忽略的缓存命中价格来赢得用户,而非像国内其他厂商那样设计复杂的套餐与促销策略。这被视作将底层技术做扎实、积累长期用户反馈的体现。推文还引用观点,将 Anthropic 描述为“每个人都讨厌但又害怕的黄鼠狼”,并希望 DeepSeek 能改变这一行业格局。
Great article here on DeepSeek. Their real story is not cheaper chatbots, but architecture that turns hardware scarcity ...
DeepSeek reasonix是DeepSeek推出的本机编码代理,以高缓存效率和低成本为特点,在Hacker News获得102分。
DeepSeek面对GPU禁运,通过算法创新实现突围。核心成果包括:将KV Cache压缩至1/10,使1M上下文仅需5.48GB HBM;将MoE训练成本降低40-50%。其推出的Engram模块可利用LPDDR内存以O(1)查找换取算力。技术突破还涵盖MLA(KV Cache削减90%)、DSA/CSA/HCA等注意力机制重构,以及GRPO算法。效果显著:在1M上下文显存需求对比中,其V4 Pro(5.48GB)远低于GLM5(60GB)和Qwen3-235B(89GB)。该战略旨在盘活中国NAND与LPDDR资源,降低对HBM依赖,并已开源TileLang以打破CUDA壁垒。其V4 Pro模型1M上下文长缓存价格不足Sonnet 4.6的3%。
http://x.com/i/article/2057886253249662976
华为在先进NAND芯片受限的背景下,未直接追赶三星主导的高层数堆叠技术,而是采用“Die-on-Board”封装方案,通过将NAND裸片直接安装在电路板上提升存储密度,推出122.88TB AI SSD并计划推出245TB版本。与此同时,DeepSeek通过MoE、CSA/HCA等架构优化,大幅降低模型对HBM和算力的依赖,使国产硬件更适配前沿AI需求。两者路径形成呼应:华为从封装层面绕过芯片性能差距,DeepSeek从算法层面缓解硬件稀缺压力,共同体现了在外部限制下通过底层技术创新开辟新赛道的战略思维。
Great article here on DeepSeek. Their real story is not cheaper chatbots, but architecture that turns hardware scarcity ...
DeepSeek v4 Pro 虽然并非最强模型,但其核心优势在于采用了几乎零成本的缓存技术。该技术被视为大模型领域的重要突破,若应用于如 Claude Opus 等顶级模型,可使运营成本下降约10倍。文章认为这是所有大模型都需要的关键技术。此外,随着未来 v4.1 版本使用更真实的训练数据,其性能预计会快速提升。
http://x.com/i/article/2058418354415644672
DeepSeek的核心战略并非开发廉价聊天机器人,而是通过一系列架构创新(如MoE动态激活、DSA优化、CSA/HCA技术)显著降低对高端HBM GPU的依赖。此举旨在将硬件稀缺性转化为技术优势,使次优芯片、LPDDR内存及定制ASIC能支持前沿AI,从而优化AI以适配不同的工业基础。这一路径已产生实际商业影响,如V4-Pro大幅降价并与国产硬件生态形成联动,最终目标是实现“硬件稀缺性可编程”。
http://x.com/i/article/2057886253249662976
DeepSeek的核心战略并非销售应用服务,而是通过一系列底层技术创新,特别是MLA等注意力机制大幅压缩KV缓存需求,来重塑AI硬件生态。其技术能将1.6T参数模型在1M上下文下的内存占用降至5.48GB HBM,远低于同类模型。这直接降低了推理成本,并催生两大机会:一是将KV缓存转存至SSD,利好长江存储;二是其架构适配LPDDR内存进行权重缓存,利好长鑫存储。DeepSeek通过开源这些高效架构,正在构建一个以中国存储产业链为核心的新生态,最终目标是带动一个10万亿美元的AI硬件产业,并自身实现万亿美元市值。
神舟二十三号载人飞船瞄准5月24日23:08发射,朱杨柱任指令长,香港航天员黎家盈将首飞。苹果iPhone 17系列领跑2026年Q1全球畅销榜,前十机型贡献25%出货量。闻泰科技声明安世荷兰剥夺控制权并阻挠审计。全国首个人形机器人管理平台发布,已为超2.8万台机器人赋予唯一“身份证号”。DeepSeek API完成扩容,默认支持500并发。小米宣布冠名中国三大汽车赛事,其YU7 GT医疗车首次亮相赛道。
DeepSeek 将针对其旗舰模型 V4-Pro 的 75% 折扣调整为永久性降价。调整后,输入 token 的价格为每百万 0.435 美元,相比 GPT-5.5 至少便宜 11.5 倍;输出 token 的价格优势更为显著,至少低 34 倍。如此激进的定价策略,对于 token 消耗量巨大的智能体系统而言,将对西方人工智能服务商构成显著的价格压力。
DeepSeek 宣布其API完成输出提速与服务扩容,服务更加稳定,默认支持500个并发同时在线,企业用户可申请更高并发。同时,DeepSeek-V4-Pro模型API价格将于2026年5月31日优惠结束后调整为原定价的1/4,具体价格调整为:输入(缓存命中)0.025元/百万Tokens,输入(缓存未命中)3元/百万Tokens,输出6元/百万Tokens。
DeepSeek已将其V4 Pro API的临时75%降价转为永久性调价。新定价下,输入、输出及缓存输入价格均大幅降低,混合均价约为每百万token 0.18美元。根据测算,以新价格运行V4 Pro的综合成本仅约268美元,成本优势显著:约为Gemini 3.1 Pro Preview的三分之一,GPT-5.5的十二分之一,以及Claude Opus 4.7的十九分之一。此次调价使V4 Pro在“智能指数”与“运行成本”的帕累托前沿上占据了极具竞争力的位置。
DeepSeek在2026年5月22日宣布,将其AI模型V4 Pro的价格优惠从临时调整为永久有效。这意味着该产品的定价将长期维持在更具吸引力的水平,具体的费用明细可通过其官方定价页面查询。
DeepSeek将其高性能模型V4-Pro的限时75%折扣宣布为永久性调整,输出价格降至0.87美元/百万tokens,远低于行业主流定价区间。此举不仅是促销,更被视为争夺定价权的战略行动,标志着AI模型的商业模式正从服务转向类似水电煤的基础设施逻辑。DeepSeek通过“永久”降价,意图以低单价换取海量使用数据、开发者生态及行业定价话语权,追求规模优先的路径。
We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀
We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀
We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀
Deepseek 即将完成约100亿美元的融资,这将使这家中国AI初创公司的估值达到约450亿美元。创始人梁文峰向投资者明确表示,公司战略将优先推进AGI(通用人工智能)的研究,而非追求短期利润。这一举动凸显了在AI竞赛中,Deepseek 坚持长期技术投入,即使获得巨额资金支持,也选择以突破性研究为导向,而非立即商业化盈利。
关联讨论 2 条IT之家(RSS)The Decoder:AI News(RSS)