> "rae 无法扩展" > "rae 无法泛化到 imagenet 之外" > "rae 无法处理细节" > 没有在网上争论 > 学生们埋头苦干 > 在真正的 t2i 规模上尝试 > 结果出来了 > 看起来非常乐观 > 向 peter、boyang、austin > 以及所有交付成果的人致敬 > 代码、模型、数据 > 全部开源 👇 [引用 @TongPetersb]:去年十月,我们提出了 Representation Autoencoders (RAE),展示了在冻结的语义表示上训练扩散模型是可行的,并且在 ImageNet 上优于 VAEs。 我们收到了很多问题:这能否扩展到像 T2I 这样的复杂场景?优势是否依然存在? 答案是肯定的。🧵
"rae can't scale" "rae can't generalize past imagenet" "rae can't do details"
instead of arguing online students put heads down try it at real t2i scale results come back look extremely bullish
shoutout to peter, boyang, austin and everyone who shipped
code, model, data all open-sourced 👇