百度推出ERNIE 5.1模型,核心突破在于参数与成本的大幅压缩。其总参数和激活参数分别压缩至原规模的约1/3和1/2,预训练成本仅为同规模模型的约6%,同时保持了领先性能。模型在Agent能力上超越DeepSeek-V4-Pro,世界知识与创意写作接近领先闭源模型及Gemini 3.1 Pro,推理能力仅次于Gemini 3.1 Pro,深度搜索位列全球第四。技术创新包括提升参数效率的弹性预训练、增强可扩展性的异步强化学习训练等。模型已上线ERNIE平台和Baidu AI Studio。
Baidu ERNIE 推出了 ERNIE 5.1。
这次升级最硬核的地方在于参数和成本的极致压缩!
总参数压缩到原来的 ~1/3,激活参数压缩到 ~1/2,而预训练成本仅为同规模模型的 ~6%,却依然实现了同级别领先性能。
核心亮点如下:
- Agent 能力逼近前沿:ERNIE 5.1 在 τ3-bench 和 SpreadsheetBench-Verified 上都超越了 DeepSeek-V4-Pro,真正迈入了强 Agent 阵营。
- 世界知识 + 创意写作大幅提升:GPQA 和 MMLU-Pro 逼近领先闭源模型,创意写作能力接近 Gemini 3.1 Pro。
- 推理能力顶尖:带工具情况下 AIME26 拿到 99.6 分,仅次于 Gemini 3.1 Pro。
- 深度搜索能力突出:5月9日 Arena Search 排行榜全球第4、中国模型第1,分数1223。
技术创新上也干货拉满: