5月28日

08:00

HuggingFace Daily Papers（社区热门论文）

SANA-Streaming：基于混合扩散Transformer的实时流式视频编辑

SANA-Streaming是一个为消费级GPU设计的高分辨率实时流式视频到视频编辑框架。其核心包含三点：采用混合Diffusion Transformer架构，结合softmax注意力与线性层效率；引入Cycle-Reverse Regularization训练策略，通过从生成内容预测源帧提升时序一致性；以及结合针对NVIDIA Blackwell（RTX 5090）优化的融合GDN内核与混合精度量化（MPQ）实现的高效系统协同设计。该系统在单张RTX 5090上可实现1280x704分辨率、端到端24FPS的实时编辑，其DiT核心可达58FPS。实验表明，其在时序连贯性和系统吞吐量上显著优于现有SOTA方法。

图像生成视频论文/研究

06:07

Chubby♨️@kimmonismus

我刚看了@arrakis_ai制作的片段，对Google的Omni印象深刻。你可以在任意帧暂停，宝可梦卡牌上的文字都保持完美清晰且未改变。这种一致性和连续性是顶级水平。

Google 大佬观点视频

05:52

Google Gemini@GeminiApp

同事件精选77

使用 Gemini Omni 轻松将您的视频转换为新的视觉风格。只需上传视频或照片，并要求 Gemini 为您的最终输出应用某种外观或风格。

Google 产品更新多模态视频

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：Gemini 终于把图像风格迁移做到视频上了，并且直接集成到 Omni 里，不需要任何剪辑软件，对短视频创作者是个小但实用的更新。

05:03

Hacker News 热门（buzzing.cc 中文翻译）

YouTube将自动标注AI生成的视频

Google 产品更新视频

02:00

Hao AI Lab@haoailab

精选70

🚀仅需7秒即可生成30秒1080p视频！我们开源了FastVideo Dreamverse：基于单张NVIDIA B200 GPU和LTX-2模型，实现实时视频生成的氛围引导工具。 Repo： https://github.com/hao-ai-lab/FastVideo/tree/main/apps/dreamverse Blog： https://haoailab.com/blogs/fastvideo-dreamverse-release/

GitHub 开源/仓库视频部署/工程

推荐理由：7秒钟出30秒1080p视频，而且完全开源，视频生成速度被拉到实时边缘，虽然B200不是人人有，但路线值得所有做视频产品的同行研究。

01:42

Luma@LumaLabsAI

前线的狐狸。掌舵的海象。治愈病患的水獭。每个人都有自己的使命，有时你只需开始寻找。开始创作 → http://lumalabs.ai/app

产品更新多模态视频

01:04

The Decoder：AI News（RSS）

YouTube将尝试从本月开始自动标记AI视频

YouTube将上线一套新的AI内容标签系统，旨在使标签位置更显眼：长视频的标签将显示在播放器下方，Shorts的标签将作为叠加层显示。从2026年5月开始，该平台将启动自动检测系统，即使创作者未主动披露，也会对AI生成内容进行标记。该系统对视频的推荐和变现没有影响。

Google 产品更新视频

00:27

Berryxia.AI@berryxia

AI智能体自主完成视频处理任务的实践

用户发布任务，要求三个AI智能体独立从链接下载视频并添加中文字幕。最终，一个AI智能体100%完成，一个只输出了部分成果，另一个则遇到API限流。整个流程虽耗时，但用户仅需“动动嘴”下达指令，全程零干预即可验收结果。评论称赞这种自主性（Agency）令人舒服，宛如“成精”。

Berryxia.AI: 麻蛋,Agent成精了。但就是,我想要的状态。这种Agency,真实令人舒服啊!

智能体教程/实践视频

5月27日

23:51

Google Gemini@GeminiApp

添加文本、视频或最多五张图片作为素材，Gemini Omni可以将它们全部组合成一个连贯的十秒视频。今天就来试试，并在回复中分享你的创作。👇

Google 产品更新多模态视频

关联讨论 19 条

23:27

Berryxia.AI@berryxia

这种GPT&Seedance 2.0打斗的视频一直可以火。这恰巧是SD2.0最擅长的，视觉效果也拉满。做游戏Demo展示太好了！

图像生成大佬观点视频

23:10

Kling AI@Kling_ai

Kling AI戛纳电影节探讨AI影视制作应用

快手旗下Kling AI在第79届戛纳电影节举办访谈，邀请中国、美国和韩国的创作者，共同探讨AI如何进入真实的电影制作工作流。对谈内容涵盖了从好莱坞规模的剧集制作，到全AI生成的剧情电影，以及AI动画电影等不同形式的影视创作。创作者们分享了AI在其实际叙事创作中的应用视角。

多模态现象/趋势视频

22:30

Runway@runwayml

推出 Runway MCP。现在你可以将 Runway 直接连接到 Claude、ChatGPT、Cursor、Replit 等平台。使用最先进的模型（如 Gen-4.5、Seedance 2.0、GPT Images 2.0、Kling 等）生成精美的图像和视频，直接在你当前的工作环境中完成。通过下方链接，几秒钟内即可将 MCP 连接到你的智能体。

MCP/工具产品更新图像生成视频

关联讨论 1 条