6月4日

17:11

IT之家（RSS）

周星驰旗下比高集团战略入股苏州互动之星，双方围绕 AI 剧集、互动影游、真人影视、IP 全产业链运营展开深度合作。互动之星手握 20 余部顶级 IP 全版权，涵盖《凡人修仙传》《绍宋》《悟空传》等。合作重点发力 AI 剧集核心赛道，联合打造 AI 漫剧、AI 拟真人剧。互动影游《绍宋》定档暑期上线，多部横屏 AI 剧集已在制作中，一批真人中剧、短剧进入前期筹备。

行业动态视频

16:18

The Decoder：AI News（RSS）

xAI 更新 Grok Imagine 至 1.5，新增 720p 图像转视频生成

xAI 发布 grok-imagine-video-1.5-preview 图像转视频模型，能将静态图片转换为最高 720p 分辨率的影视级视频，支持文本提示控制，多个片段可拼接为更长的场景。

xAI 图像生成模型发布视频

14:28

🚨 AI News | TestingCatalog@testingcatalog

HeyGen 宣布了新的 FRAME.md 格式，可将品牌指南文件 DESIGN.md 转换为专为视频和动态设计的规范。原有 DESIGN.md 适用于静态屏幕，但应用到视频时，AI 智能体会误将其解读为网页和幻灯片。FRAME.md 教会智能体如何生成真正的品牌视频。该项目已以开源仓库发布，任何品牌均可使用，通过 FRAME.md 文件来引导视频生成智能体。

HeyGen: Introducing frame.md, a spec built for videos & motion design.md kept your brand consistent across screens but when appl...

智能体产品更新开源生态视频

14:00

歸藏(guizang.ai)@op7418

又发现一个 Codex 好用的点！我发这个视频，抖音说我违规，我实在不知道哪句话违规了。然后就让 Codex 直接根据我的视频和我的字幕，帮我视频剪一个不违规的版本，牛逼，果然过审了。

OpenAI 教程/实践视频

12:37

Elon Musk@elonmusk

Grok Imagine Video 1.5 在视频竞技场排行榜上位列第一。主推文：Grok Imagine 1.5 排名第一。

DogeDesigner: Grok Imagine Video 1.5 is now ranked #1 on the Video Arena Leaderboard. 🥇

xAI 多模态行业动态视频

12:00

DogeDesigner@cb_doge

Grok Imagine Video 1.5 现在在 Video Arena 排行榜上排名第一。🥇

Elon Musk: Iliad (Troy) trailer made by Grok Imagine 1.5, which was just released

多模态模型发布视频

10:42

HuggingFace Daily Papers（社区热门论文）

精选79

Echo-Infinity：学习演化记忆实现实时无限视频生成

Echo-Infinity 是一个自回归（AR）框架，用于实时无限视频生成。它用可学习的演化记忆替代人工缓存策略，通过注意力机制和门控更新 Memory Query，与视频扩散 Transformer（DiTs）端到端优化，支持任意压缩比且计算量不随视频长度增加。同时引入 Unified Relative RoPE Recipe，锚定 sink 帧从 id 0 开始、最新帧 id 不超过预训练最大时间 RoPE id，解除有限 RoPE 约束并缩小外推差距。在长/短视频生成中达到 SOTA，首次实现 24 小时（超 130 万帧）实时滚动生成。

arXiv 视频论文/研究

推荐理由：论文把长视频生成的记忆机制从手动压缩换成了可学习的动态演化，首次做到24小时实时无限生成，这对视频生成走出‘短视频玩具’阶段是个决定性的信号。

10:29

DogeDesigner@cb_doge

Grok Imagine 1.5 视频质量确实令人印象深刻。🔥

xAI 图像生成大佬观点视频

09:36

Josh Woodward@joshwoodward

这些太有趣了！我们当前最喜欢的 Gemini Omni 趋势：使用真实世界镜头创造意想不到的转折。试试自己做一个！🧵

Google Flow: Our current favorite Gemini Omni trend: creating a surprising twist using real world footage. Try creating your own! 🧵

Google 大佬观点视频

09:28

xAI：News（网页）

精选75

xAI 发布 Grok Imagine 1.5 预览版（图像转视频模型）

xAI 通过 API 发布了图像转视频模型 grok-imagine-video-1.5-preview（Grok Imagine 1.5 预览版）。该模型能将单张静态图片转为流畅的电影感视频，用户提供起始帧和描述运动的提示词后，模型可生成包含相机移动、氛围和物理效果的动画，并保持对源图像的忠实。支持生成 720p 片段，可使用自然语言指令控制镜头、节奏和音效，并支持逐帧拼接成长场景。模型目前通过 xAI API 提供预览使用。

xAI 多模态模型发布视频

关联讨论 4 条

推荐理由：xAI的新视频模型从单张图像生成电影级短片，支持自然语言控制运镜和氛围，对视频创作者和开发者是个值得一试的工具。

09:06

Elon Musk@elonmusk

同事件精选72

Vercel 的 AI Gateway 上现已推出 Grok Imagine Video 1.5。该服务支持图生视频并同步音频，一次性完成。示例代码： `await generateVideo（{ model： 'xai/grok-imagine-video-1.5-preview'， prompt： 'a rabbit sprinting through nyc' }）；`

Vercel Developers: Grok Imagine Video 1.5 on AI Gateway. Image-to-video generation with synced audio in one pass. await generateVideo({ mod...

xAI 图像生成模型发布视频

同一事件，精选展示《xAI 发布 Grok Imagine 1.5 预览版（图像转视频模型）》

推荐理由：Grok Imagine Video 1.5 把同步音频塞进了图生视频，一条 prompt 直接出带声短片，做短视频和创意的可以换上这条流水线了。

09:06

Elon Musk@elonmusk

同事件精选73

伊利亚特（特洛伊）预告片由刚刚发布的 Grok Imagine 1.5 制作

xAI 多模态模型发布视频

同一事件，精选展示《xAI 发布 Grok Imagine 1.5 预览版（图像转视频模型）》

推荐理由：Elon 亲自演示 Grok Imagine 1.5，生成的《伊利亚特》预告片质感让我觉得视频生成赛道又要卷一轮，做短片的可以盯一下。

08:00

HuggingFace Daily Papers（社区热门论文）

RhymeFlow：异步去噪流调度实现训练无关视频生成加速

基于扩散Transformer（DiT）的视频生成模型因3D注意力平方复杂度导致高推理延迟。现有加速方法在每个去噪步骤内减少计算，但仍要求所有帧经历完整稠密去噪。RhymeFlow提出训练无关框架，解耦不同帧的去噪轨迹：仅对稀疏关键帧执行逐步骤稠密去噪以保持结构完整性，非关键帧逐步跳过步骤降低计算；同时引入潜在轨迹投影模块，使关键帧与完整时序一致的序列表示交互，避免视觉退化。在现有DiT视频生成模型上，RhymeFlow实现了更高推理速度和更好视觉质量。

视频论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

PhaseLock：两步推理锁定运动先验，避免视觉细化阶段擦除物理一致性

图像到视频扩散模型常生成违反物理定律的运动。研究发现，同一模型的两步生成比50步生成物理一致性更好。频谱分析表明，去噪过程中相位退化约18%，幅度保持稳定。基于此，提出无需训练的PhaseLock框架，从仅两步推理提取运动先验，通过Latent Delta Guidance施加到高保真生成。PhaseLock有效缓解相位退化，在多种模型上平均提升物理一致性6.2点，同时保持视觉保真度，额外开销仅1.06倍时间和1.02倍内存，并减少对外部昂贵引导方法的依赖（约5倍时间）。

多模态视频论文/研究

06:59

DogeDesigner@cb_doge

SpaceXAI 不断刷新标准。🔥 Grok Imagine Video 1.5 预览版现已上线 API，效果看起来极为电影感。📽️ 去亲自试试吧。💻 祝 SpaceXAI 好运。🚀

多模态模型发布视频

00:09

Runway@runwayml

使用 Aleph 2.0 将任何视频转换为绿幕资产或干净底板，无需旋转描摹。通过今天的 Runway Academy 学习操作方法。

产品更新教程/实践视频

关联讨论 2 条

6月3日