大模型为何能学会更多:容量、干扰与罕见任务保持效应 · AI HOT