NVIDIA研究员把4-bit长视频生成的全套设施端出来了,45.7FPS跑5B模型,做视频工程的可以直接拿来魔改,这是把长视频的成本打下来的关键一步。
NVIDIA研究员开源LongLive 2.0,这是首个支持4-bit量化、覆盖训练与推理全流程的端到端长视频生成基础设施。其核心技术包括FP4量化与并行加速,在5B模型上实现45.7 FPS的生成速度。该框架支持真实视频训练、蒸馏、多镜头生成、序列并行、KV缓存优化及异步解码部署,旨在解决以往长视频生成速度慢或仅限短片的瓶颈。
兄弟们,NVIDIA研究员Yukang Chen刚刚把LongLive 2.0直接开源了!
这是全球第一个端到端、支持4-bit的超长视频生成基础设施,训练和推理全流程打通。
核心技术:FP4量化 + 并行加速,在5B模型上硬生生跑到45.7 FPS!
它还能做真实视频训练、few-step蒸馏、多shot训练/推理、序列并行、NVFP4 KV cache、异步VAE解码部署……
全套高效打法一次给你安排明白。
以前做长视频生成,要么慢得要死,要么只能生成短片,现在NVIDIA直接把4-bit长视频实时生成推向开源。
代码见评论区👇