DeepSeek v4 Pro 虽然并非最强模型,但其核心优势在于采用了几乎零成本的缓存技术。该技术被视为大模型领域的重要突破,若应用于如 Claude Opus 等顶级模型,可使运营成本下降约10倍。文章认为这是所有大模型都需要的关键技术。此外,随着未来 v4.1 版本使用更真实的训练数据,其性能预计会快速提升。
http://x.com/i/article/2058418354415644672
DeepSeek v4 Pro 虽然并非最强模型,但其核心优势在于采用了几乎零成本的缓存技术。该技术被视为大模型领域的重要突破,若应用于如 Claude Opus 等顶级模型,可使运营成本下降约10倍。文章认为这是所有大模型都需要的关键技术。此外,随着未来 v4.1 版本使用更真实的训练数据,其性能预计会快速提升。
http://x.com/i/article/2058418354415644672
DeepSeek的核心战略并非开发廉价聊天机器人,而是通过一系列架构创新(如MoE动态激活、DSA优化、CSA/HCA技术)显著降低对高端HBM GPU的依赖。此举旨在将硬件稀缺性转化为技术优势,使次优芯片、LPDDR内存及定制ASIC能支持前沿AI,从而优化AI以适配不同的工业基础。这一路径已产生实际商业影响,如V4-Pro大幅降价并与国产硬件生态形成联动,最终目标是实现“硬件稀缺性可编程”。
http://x.com/i/article/2057886253249662976
DeepSeek的核心战略并非销售应用服务,而是通过一系列底层技术创新,特别是MLA等注意力机制大幅压缩KV缓存需求,来重塑AI硬件生态。其技术能将1.6T参数模型在1M上下文下的内存占用降至5.48GB HBM,远低于同类模型。这直接降低了推理成本,并催生两大机会:一是将KV缓存转存至SSD,利好长江存储;二是其架构适配LPDDR内存进行权重缓存,利好长鑫存储。DeepSeek通过开源这些高效架构,正在构建一个以中国存储产业链为核心的新生态,最终目标是带动一个10万亿美元的AI硬件产业,并自身实现万亿美元市值。
DeepSeek已将其V4 Pro API的临时75%降价转为永久性调价。新定价下,输入、输出及缓存输入价格均大幅降低,混合均价约为每百万token 0.18美元。根据测算,以新价格运行V4 Pro的综合成本仅约268美元,成本优势显著:约为Gemini 3.1 Pro Preview的三分之一,GPT-5.5的十二分之一,以及Claude Opus 4.7的十九分之一。此次调价使V4 Pro在“智能指数”与“运行成本”的帕累托前沿上占据了极具竞争力的位置。
DeepSeek将其高性能模型V4-Pro的限时75%折扣宣布为永久性调整,输出价格降至0.87美元/百万tokens,远低于行业主流定价区间。此举不仅是促销,更被视为争夺定价权的战略行动,标志着AI模型的商业模式正从服务转向类似水电煤的基础设施逻辑。DeepSeek通过“永久”降价,意图以低单价换取海量使用数据、开发者生态及行业定价话语权,追求规模优先的路径。
We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀
We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀
We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀
We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀
We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀
We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀
The DeepSeek-V4-Pro discount has been extended until May 31, 2026, 15:59 UTC!
我所在的 DeepSeek Harness 团队招人啦!目前开放的职位包括研发工程师和产品经理,可以在官网投递。如果想做 Harness 方向的前沿研究,也可以投递研究员职位。全职实习均可。地点限北京。 申请链接: https://app....
DeepSeek V4 Flash has topped the weekly leaderboard
🚀 We're hiring! DeepSeek is forming a new Harness team to build Code Harness from the ground up-may be you can call it ...
🚀 We're hiring! DeepSeek is forming a new Harness team to build Code Harness from the ground up-may be you can call it ...
Hermes 支持配置多种国内外主流 AI 模型,包括 OpenAI GPT-5.5、xAI Grok-4.3、谷歌 Gemini 系列、DeepSeek V4 系列、智谱 GLM-5 系列、Kimi K2.6 以及小米 Mimo V2.5-pro。用户需通过相应服务的订阅或 API 进行配置,完成后可使用 /model 指令指定模型及提供者来切换对话模型,例如输入“/model gpt-5.5 --provider openai-codex”即可切换至对应模型。该功能方便用户根据需求灵活调用不同模型的优势。
DeepSeek招聘Agent Harness产品经理,旨在将其前沿模型能力转化为领先的Agent产品。该职位需规划产品路线图,连接研究员、工程师与社区,定义并衡量Agent帮助用户的核心指标,推动模型与Harness共同进化。候选人需是Agent产品高强度用户,熟悉Claude Code、GitHub Copilot等工具,理解LLM与Agent技术原理,并具备数据分析和产品设计能力。
人工智能分析发布编码代理基准指数,评估不同模型与执行框架组合在三大编码基准中的表现。Opus 4.7在Cursor CLI中以61分领先,GPT-5.5与Opus 4.7在其它框架中得分60紧随其后。开源模型GLM-5.1在Claude Code中获得53分,表现竞争但仍显著落后顶尖闭源模型。经济性差异悬殊:每任务成本从Composer 2的0.07美元到GLM-5.1的2.26美元不等,后者因任务循环令牌使用高达480万;任务耗时差异超7倍,Opus 4.7仅需6分钟而Kimi K2.6需40分钟。缓存命中率普遍较高,影响实际运行成本。
Redis创始人Antirez开源了专为DeepSeek V4 Flash设计的原生推理引擎ds4。该引擎仅用几千行C代码,通过三项关键技术:对MoE专家进行不对称2-bit量化、将KV Cache移至高速SSD突破内存限制、为Apple Silicon进行纯Metal原生优化,成功在128GB MacBook Pro上流畅运行具备1M上下文窗口的模型,实测达27 tok/s。此举将原本依赖云端GPU集群的前沿AI能力,通过极致工程优化 democratize 至个人设备,展现了开源社区推动技术平民化的强大潜力。
Downloading now... 1M token context window with supposedly usable coding agent capability all on a 128GB Macbook Pro is ...
作者因被孙宇晨回关而引发讨论,指出其AI中转站项目B.AI并非简单的低价API竞争。该项目上线一个月注册用户破160万,提供大幅折扣的DeepSeek-V4等模型,并支持加密钱包支付。核心观点认为,孙宇晨的战略目标是通过低价策略抢占入口,最终旨在成为未来AI Agent时代的“中央银行”,而非仅赚取API差价。
http://x.com/i/article/2051958484304891904
卧槽,说个颠覆我认知的事, 现在AI 把算命这件事,已经干到了全球大赛接近人类顶尖的水平,直接把通用大模型都甩开了一大截! 说实话,我一开始看到这个消息, 第一反应是又来个蹭玄学流量的 AI 噱头, 直到翻完它的完整技术报告和大赛数据, 才...
DeepSeek正以500亿美元估值进行高达70亿美元的融资,创下中国AI领域最大单轮融资纪录。创始人梁文锋个人出资30亿美元,占本轮融资的40%,同时仍保留公司90%的所有权。该公司最初诞生于其本人成功的对冲基金内部。本轮融资将主要用于获取大规模计算资源,以加速发布V4.1等新模型,并投资企业级产品,目标是推动公司实现营收转正,其发展路径与OpenAI和Anthropic类似。
Just published an exclusive on LatePost. A few highlights: - Kimi (Moonshot AI) is closing a new $2B funding round at a ...
DeepSeek估值在数周内从200亿美元跃升至450亿美元,本轮融资由国家大基金领投,腾讯有意跟投,创始人梁文锋也参与出资。此举标志着国家队首次公开投资本土大模型公司,具有强烈的战略象征意义。这被视为官方将AI大模型正式纳入“半导体国家战略”的关键信号,向市场传递了国家全力支持国产AI发展的明确信息,预示着行业将进入新的发展阶段。