通过可验证多项选择重构将RLVR扩展至开放式任务 · AI HOT