# Test-Time Scaling 使 Overtraining 达到 Compute-Optimal

- 来源：AK (@_akhaliq)
- 发布时间：2026-04-07 01:55
- AIHOT 链接：https://aihot.virxact.com/items/cmnw1xt9m00bpslc3ch6umh9f
- 原文链接：https://x.com/_akhaliq/status/2041213187714850955

## AI 摘要

新论文提出，Test-Time Scaling（测试时扩展）可让 Overtraining（过度训练）实现 Compute-Optimal。传统 Chinchilla 最优假设训练与推理计算固定，而该研究表明，若允许推理阶段增加计算，过度训练模型在总成本下反而性能更优。

## 正文

Test-Time Scaling Makes Overtraining Compute-Optimal

paper： https://huggingface.co/papers/2604.01411
