OpenAI新论文:通过RL训练做好事可泛化至多领域,提升模型诚实性 · AI HOT