Krea AI用Tinker原型奖励模型并进行RL训练 · AI HOT