强化学习双刃剑效应:已知领域提升性能,未知领域易致模型幻觉 · AI HOT