DeepSeek V4 智能体 token 份额持续增长
阅读原文· openrouter.aiOpenRouter 独家数据展示了代际转折:DeepSeek V4 靠性价比吃下代理负载,中国模型 token 份额首次超过美国,这个信号比任何 benchmark 排名都真实,做应用选型的人该重新算账了。
DeepSeek 于4月24日发布新一代旗舰模型 V4 系列。OpenRouter 数据显示,V4 发布后其 token 份额从年初的9%增长至6月初的18%,自5月中旬起成为 OpenRouter 最受欢迎模型。V4 是首个足以胜任智能体工作负载的 DeepSeek 模型,到5月底 V4-Flash 已占 DeepSeek 智能体 token 流量的70%。V4-Flash 最便宜端点价格为每百万 token 输入 $0.09、输出 $0.18,远低于 GPT-5.5 的 $5/$30。中国模型整体 token 份额于6月初超过美国模型,DeepSeek 是主要驱动力。
DeepSeek V4 正在赢得智能体 Token 份额
OpenRouter ·2026/6/19

- 模型作者推动当前的 Token 使用量
- V4 是首个足以胜任智能体工作负载的 DeepSeek 模型
- DeepSeek 与中国模型的崛起
- 方法论
对于许多人来说,DeepSeek 这家公司仍然是大语言模型开源的代名词,它于 4 月 24 日发布了其新的旗舰级 V4 模型。
V4 是否让 DeepSeek 重回 AI 对话的前沿——还是说,智能体能力的爆发已经把开源抛在了后面?
模型作者推动当前的 Token 使用量

DeepSeek 在年初时持有 OpenRouter 上周 Token 流量略低于 10% 的份额。随着智能体工作在 2 月和 3 月开始兴起,以前所未有的速度推动 Token 使用量增长,DeepSeek 实际上下降到了总 Token 量的 5%。该公司正在受到上方闭源模型和下方一波其他开源大语言模型的挤压。
V4 模型系列的发布立即产生了积极影响。到 6 月初,DeepSeek 已赢得近 20% 的 Token 份额,并且正如《华尔街日报》所报道的那样,自 5 月中旬以来一直是 OpenRouter 上排名最高的模型。

2026 年 1 月与 6 月的直接对比显示,模型作者之间的偏好变化速度之快。DeepSeek 在此期间有效翻倍了其 Token 份额(从 9% 到 18%),但许多其他模型提供商的命运经历了重大波动。
包括小米、MiniMax 和腾讯在内的一批中国开源模型,在过去 6 个月中,它们的 Token 份额均有所上升。这似乎是以几家领先的美国模型公司为代价,尤其是 Google 和 OpenAI。

DeepSeek 的翻倍增长并不局限于单一用户类型。到 6 月初,各类公司和个人都在使用越来越多的 DeepSeek Token。业余爱好者用户(他们通常通过面向消费者的应用程序类别,如角色扮演、通用聊天、个人智能体等,有大量使用量)现在将近三分之一的 Token 都路由到了 DeepSeek 模型。
即使在AI原生公司或大型机构的用户中——这两类用户原本可能都更倾向于优先使用前沿封闭模型——他们在6月初流向DeepSeek的token流量也远高于年初。

DeepSeek V4 Flash在最便宜的端点上,每百万token输入成本0.09美元,输出成本0.18美元。作为对比,GPT-5.5当前每百万token定价为输入5美元、输出30美元。
因此,看到V4的token量突然飙升并未导致支出占比出现同等幅度的增长,也就不足为奇了。V4的性价比与输出质量比达到了业界最佳——事实上,它的表现足够出色,以至于各种规模的组织都开始信任DeepSeek来处理真实的智能体任务。
V4是首个足以胜任智能体工作负载的DeepSeek模型。

我们按API密钥维度将token流量划分为三大类别(智能体型、混合型、人工型)。这些类别根据一个包含7项信号加权综合评分来分配,评分依据包括工具调用率、轮次数量、间隔时间等输入指标。
大家都知道,智能体工作消耗的token比正常的人类AI使用要多得多(根据OpenRouter数据,每次请求大约多出15倍)。但需要记住的是,这种智能体token的爆发式增长是2026年的现象,实际上直到今年2月初才真正开始。
不过,即使这样说,对某些模型厂商而言也过于笼统了。

大约在2月1日左右,智能体工作负载消耗的token超过了人类使用的token。起初,智能体工作负载只集中在少数几个模型厂商身上,而DeepSeek并不在其中。
V4的发布标志着DeepSeek正式加入智能体工作流程的竞争。

并非所有工作负载都会同时切换到最新模型。上图显示,在今年前5个月里,DeepSeek token使用中的人类活动始终与DeepSeek V3.2绑定。
然而,智能体工作负载则选择了V4作为首选模型。截至5月底——距离发布仅一个月——V4-Flash已占DeepSeek使用中智能体token流量的70%。
DeepSeek与中国模型的崛起

模型 token 流向了两个国家创建的大语言模型:美国和中国(其他国家的 tiny 份额由那一小片浅色条带代表)。2026 年 token 总量爆发式增长,但这种增长并未扩散到其他国家的 LLM。

2025 年属于美国 token 的年份,来自美国的模型贡献了约四分之三的 token 用量。2026 年的竞争则激烈得多,中国模型实际上早在 6 月初就在 token 份额上超越了美国模型。

毫不意外,自 4 月底 DeepSeek V4 发布以来,它在中国模型中一直领跑。虽然部分美国头部模型的 token 用量在过去六周内趋于平稳,但多家中国竞争对手的 token 用量在 6 月初开始激增。
随着高性价比 token 用量的报道占据夏季头条,我们预计这些更便宜但依然强大的开源模型将持续吸引更多 token。《华尔街日报》在最近一篇引用 OpenRouter 数据的报道中提到:“创业公司和科技巨头都在混合搭配使用 AI 模型,以避免支付溢价。”
DeepSeek V4 必定是其中一员。
方法论
- 数据来源:OpenRouter 的请求日志
- 样本量:2026 年 1 月 1 日至 2026 年 6 月 14 日期间超过 457 万亿个 token
- 活动类型:我们按 API 密钥级别将 token 流量分为三大类(智能体类、混合类和人工类)。分类依据是一个包含 7 个信号的加权综合得分,输入指标包括工具调用率、对话轮次、间隔时长等。