# Krea AI用Tinker原型奖励模型并进行RL训练

- 来源：Krea (@krea_ai)
- 发布时间：2026-07-03 03:36
- AIHOT 分数：33
- AIHOT 链接：https://aihot.virxact.com/items/cmr3xmki9002dslw2nzypx6s0
- 原文链接：https://x.com/krea_ai/status/2072766343888392449

## AI 摘要

感谢Thinking Machines团队，我们使用Tinker原型化了我们的奖励模型，并通过RL训练了提示词扩展器。

更多信息，请阅读关于Krea 2背后数据、架构和训练的完整技术报告 👇

## 正文

thanks to the Thinking Machines team， we used Tinker to prototype our reward models and train the prompt expander via RL.

for more information， read the full technical report on the data， architecture， and training behind Krea 2 👇

### 引用推文

> Tinker：Training image models requires a surprising amount of Tinkering: prototyping reward models, training a prompt expander, and creating the RL environment. We love...
