AI 摘要
DeepSeek v4 Pro 虽然并非最强模型,但其核心优势在于采用了几乎零成本的缓存技术。该技术被视为大模型领域的重要突破,若应用于如 Claude Opus 等顶级模型,可使运营成本下降约10倍。文章认为这是所有大模型都需要的关键技术。此外,随着未来 v4.1 版本使用更真实的训练数据,其性能预计会快速提升。
这篇文章的核心就是这一张图了 deepseek v4 pro 虽然不是最好的模型 但是缓存基本不要钱 这是所有大模型都需要的技术 opus 用这个技术成本都能下降10倍 同时相信 v4.1 有了真实的 harness 数据进行训练之后,一定会很快变好
http://x.com/i/article/2058418354415644672