DeepSeek 把 1M 上下文和 MoE 架构同时推到开源可用状态,Pro 版 49B 激活参数对标闭源顶级,Flash 版 13B 给了中小团队一个真正能跑的长上下文方案。这是开源阵营第一次在百万 token 级别跟闭源正面掰手腕。
DeepSeek正式推出并开源了DeepSeek-V4预览版,标志着高性价比的百万上下文长度时代到来。该系列包含两个模型:DeepSeek-V4-Pro拥有1.6万亿总参数和490亿活跃参数,性能可媲美全球顶尖闭源模型;DeepSeek-V4-Flash则拥有2840亿总参数和130亿活跃参数,主打快速、高效与经济。模型现已在官方聊天平台通过专家模式和即时模式开放试用,API也已同步更新。技术报告和开源权重已在Hugging Face平台发布。
🚀 DeepSeek-V4 Preview 正式上线并开源!欢迎进入性价比极高的 100 万上下文窗口时代。
🔹 DeepSeek-V4-Pro:总参数量 1.6T / 激活参数 49B。性能可与全球顶尖闭源模型媲美。 🔹 DeepSeek-V4-Flash:总参数量 284B / 激活参数 13B。你的快速、高效且经济的选择。
立即通过 http://chat.deepseek.com 的专家模式/即时模式体验。API 已于今日更新并可用!
📄 技术报告:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf 🤗 开放权重:https://huggingface.co/collections/deepseek-ai/deepseek-v4