如果你在构建视频扩散/世界模拟器,试试这个新采样器。 时间一致性将视频固定在总像素空间中的低维流形上。 自精炼采样使它们保持在那里。 [引用 @jangsangwon7]:如果你的视频生成器能在推理时自我精炼会怎样? ❌无需新模型。❌无需重新训练。❌无需外部验证器。 💡 推出自精炼视频采样 通过将预训练生成器(Wan2.2、Cosmos)重新解释为去噪自编码器,我们实现了推理时的迭代自精炼 ➡️ 显著提升物理真实感,并获得超过70%的人类偏好! 🧵
if you are building video diffusion / world simulators, try this new sampler. temporal consistency pins videos to a low-dimensional manifold in the total pixel space. self-refinement sampling keeps them there.