# 蚂蚁百灵UFP4：FP4训练关键在网格几何

- 来源：Ant Ling (@AntLingAGI)
- 发布时间：2026-06-24 19:58
- AIHOT 分数：53
- AIHOT 链接：https://aihot.virxact.com/items/cmqs1h8f30q5uslp5f2fugfb6
- 原文链接：https://x.com/AntLingAGI/status/2069751980072067348

## AI 摘要

我们最近发布了一篇论文，表明UFP4，我们的均匀网格FP4训练方案，在密集1.5B、MoE 7.9B和MoE 124B长程预训练中，比强E2M1基线更接近BF16。
关键洞察：FP4训练质量不仅与比特宽度有关，还与网格几何有关。

## 正文

We recently released a paper showing that UFP4， our uniform-grid FP4 training recipe， stays closer to BF16 than strong E2M1 baselines across Dense 1.5B， MoE 7.9B， and MoE 124B long-run pretraining.
The key insight： FP4 training quality is not only about bit width， but also grid geometry.
