一步梯度延迟并非大规模异步流水线并行LLM预训练的障碍 · AI HOT