Saining Xie@sainingxie

2026-01-30 07:19·154天前

AI 摘要

如果你在构建视频扩散/世界模拟器，试试这个新采样器。时间一致性将视频固定在总像素空间中的低维流形上。自精炼采样使它们保持在那里。 [引用 @jangsangwon7]：如果你的视频生成器能在推理时自我精炼会怎样？ ❌无需新模型。❌无需重新训练。❌无需外部验证器。 💡 推出自精炼视频采样通过将预训练生成器（Wan2.2、Cosmos）重新解释为去噪自编码器，我们实现了推理时的迭代自精炼 ➡️ 显著提升物理真实感，并获得超过70%的人类偏好！ 🧵

if you are building video diffusion / world simulators， try this new sampler. temporal consistency pins videos to a low-dimensional manifold in the total pixel space. self-refinement sampling keeps them there.

Sangwon JangWhat if your video generator could refine itself-at inference time? ❌No new models. ❌No retraining. ❌No external verifier. 💡 Introducing Self-Refining Video Sa...

推理视频论文/研究

在 X 查看原推导出 Markdown

Saining Xie@sainingxie · X

导出 Markdown

2026-01-30 07:19·154天前

在 X 看原推· x.com

AI 摘要

Sangwon JangWhat if your video generator could refine itself-at inference time? ❌No new models. ❌No retraining. ❌No external verifier. 💡 Introducing Self-Refining Video Sa...

推理视频论文/研究