6月16日

23:45

Kling AI@Kling_ai

可灵Kling AI宣布作为驱动引擎，支持创意合作伙伴@byarlooo历时约一年打造的作品《Pequena Máquina》。该作品通过Kling AI和Showcraft（来自nurastudios）制作，今日正式公开上线，共包含两集。作者在引用推文中表示，自己倾注一年时间构建了这个世界，现已面向公众开放。

ARLO🟡 🔜ANNECY: 🇧🇷⛩️🌊 For about a year I built a world, packed with everything I wanted to see on screen. Today it goes public and st...

行业动态视频

22:16

Elon Musk@elonmusk

由 Grok Imagine 制作

xAI 产品更新视频

18:18

PixVerse@PixVerse_

用户@heisturnx 用PixVerse等AI工具制作了整条15秒UGC广告，零相机、零摄影棚、零真实产品拍摄。步骤如下：✅ 在PixVerse中用ChatGPT生成首张图片 ✅ Nana Banana Pro 2（Flow AI）完成其余图片 ✅ 在PixVerse中用Kling 3.0制作视频动画 ✅ 在TikTok上精剪完成。这就是品牌现在付费购买的内容。想要完整提示词分解可回复"BLEND"。 PixVerse官方赞叹：太棒了UGC广告！

Turnx: 🤖 made this entire 15-second UGC ad with AI zero camera, zero studio, zero real product shoot. Here's the quick breakdo...

教程/实践视频

11:27

HuggingFace Daily Papers（社区热门论文）

DreamX-World 1.0：通用交互式世界模型

DreamX-World 1.0 是一款通用交互式文图生视频世界模型，支持可控长序列生成、相机导航、回溯已观测区域及提示事件，覆盖写实、游戏和风格化域。其数据引擎结合虚幻引擎渲染、动作丰富的游戏录制及带恢复相机几何的真实视频。相机控制引入 E-PRoPE（PRoPE 投影位置编码的轻量变体）。通过因果强制、DMD 风格蒸馏和长序列训练，将双向视频生成器转为自回归模型。采用记忆条件场景持久性与残差回收，并加入事件指令微调和强化学习对齐。混合精度 DiT、残差重用、75% 剪枝 VAE 解码及异步流水线并行在八块 RTX 5090 GPU 上达 16 FPS。5 秒基础评估中，相机控制得分 73.75，总体 84.76，优于 HY-WorldPlay 1.5（80.79）和 LingBot-World（80.45）。

具身智能视频论文/研究

11:27

HuggingFace Daily Papers（社区热门论文）

VisualClaw：面向物理世界的实时个性化多模态智能体

VisualClaw是一个自进化多模态智能体，通过级联门过滤流式帧与热/冷top-k注入技能库，将单问题API成本降至全帧上传的-98%、均匀8帧基线的-25.9%。技能进化模块从失败中学习并更新技能库，在4个视频QA基准上平均准确率提升+3.85%，EgoSchema上Gemini 3 Flash达+15.80%。研究者构建了VisualClawArena（200场景多模态智能体基准），在该基准上结合计算机使用后端使Codex (GPT-5.5)宏观准确率+2.9%、Claude Code (Sonnet 4.6)+3.2%，成本降低-9.5%。级联机制将1小时流媒体从~3,600次API调用降至5-20次，适合边缘部署。

智能体多模态视频论文/研究

10:00

IT之家（RSS）

精选70

成本砍半，字节跳动推出 Seedance 2.0 Mini 视频生成模型

字节跳动火山引擎旗下火山方舟体验中心于 6 月 15 日上线 Seedance 2.0 Mini 视频生成模型，计划近期开放 API。该模型比 Seedance 2.0 Fast 快 2 倍，输出质量相当。图生视频定价 0.023 元/千 tokens，视频生视频 0.014 元/千 tokens，720P 规格下单秒生成成本约 0.5 元，较 Seedance 2.0 标准版降低约一半。模型面向电商内容生产、营销素材批量生成、UGC 创作及特效玩法等高频率、大规模视频生成场景。

模型发布视频

推荐理由：Seedance 2.0 Mini 把视频生成成本压到 0.5 元/秒，比标准版便宜一半，对做大批量电商素材和 UGC 的团队是个实际信号，值得等 API 开放后看实测。

04:35

fofr@fofrAI

这是什么模组？

大佬观点视频

03:03

Runway@runwayml

在ChatGPT内使用Runway生成并编辑视频与图像。无需切换标签页。

OpenAI 产品更新图像生成视频

00:59

AYi@AYi_AInotes

用户对比Seedance 2.0与Grok的视频生成效果，发现Seedance 2.0价格贵近4倍，质量却不相上下；仅用一句话提示词测试Grok对中国古装风格理解，结果超预期。引用推文指出，GPT Image 2加Grok的混合工作流性价比极高：SuperGrok月费30美元，目前有3个月67%优惠，单条短片几乎零边际成本。角色风格一致性由GPT Image 2把控，出图后丢进Grok做动态效果即可。

AYi: GPT Image 2 加 Grok简直是目前玩AI视频的性价比之王,而且grok还能给你加字幕,真的厉害,@grok bro你还藏了多少我不知道的? 自从Seedance一直涨价我就没续订会员了, 本来以为 Seedance 2.0 是当...

OpenAI xAI 多模态视频

6月15日

23:56

OpenRouter@OpenRouter

新多模态排名页面的预览 👀 Google 的 Veo 3.1 正在视频排行榜上攀升

Google 产品更新多模态视频

23:23

fofr@fofrAI

这里有一个有趣的技巧，可以引导Omni进入一个仅靠提示词难以达到的风格空间： - 取一段视频，将其裁剪为开头/结尾/两端各几秒 - 将剩余帧填充为黑色（24fps，720p） - 提示模型："填充黑色帧"（或类似表述）它会生成一个新视频，大部分保持原始视频的运动和外观。例如，逼真的事物保持逼真，无需编辑。

教程/实践视频

23:23

fofr@fofrAI

这是一个有趣的技巧，能将 Omni 推入一个仅靠提示词难以进入的风格空间： - 取一段视频，在开头/结尾/两端剪辑出几秒 - 将剩余帧填充为黑色（24fps， 720p） - 提示模型："填充黑色帧"（或类似表述）它会生成新视频，基本保持原视频的运动和外观。例如，写实的东西保持写实，无需剪辑。总之，你可以这样做。

fofr: Here's a fun hack that nudges Omni into a style space that it's hard to get to with just a prompt: - take a video and tr...

教程/实践视频

21:43

🚨 AI News | TestingCatalog@testingcatalog

Cutback发布Selects，一款面向长视频的AI编辑助手，支持视频同步、组织与原始素材剪辑。它同时分析转录和视频，几分钟内根据提示构建故事线，每个项目可减少约60%编辑时间。在5位专业编辑的测试中，Selects将原始素材剪辑成几乎与他们手动剪辑一致的版本，其中一位编辑指出它选了他自己使用的同一个开场。该工具被定位为从零为AI智能体重建的Premiere Pro（引用@thetomkim），并非简单的片段生成器，而是能理解素材并做出专业编辑认可剪辑的"真正编辑器"，已由Key & Peele、Beast Games等作品的编辑测试。

Tom Kim: We rebuilt Premiere Pro from scratch for AI agents. Not a toy that generates clips. A real editor that watches footage, ...

产品更新视频

21:18

Chubby♨️@kimmonismus

一款基于Premiere Pro重构的AI视频编辑器，与专业剪辑师共同剪辑同一4小时视频项目，两者84%的剪辑操作相同。AI编辑器可在数分钟内完成草稿，节省约60%的准备工作时间。最后约16%的差异点仍需要人类判断。该工具在Key & Peele、Beast Games等项目幕后剪辑师中进行了测试。

Tom Kim: We rebuilt Premiere Pro from scratch for AI agents. Not a toy that generates clips. A real editor that watches footage, ...

产品更新视频评测/基准

17:02

Alibaba Cloud@alibaba_cloud

真正的创新不会让事情变得更复杂--而是让它们更触手可及。💡 我们设计AI模型Wan和HappyHorse时秉持一个核心理念：每个人都是创作者。看看香港湿货市场的一位海鲜摊主如何仅凭一个简单的提示词就能轻松地将他的想法变为现实。无需编码，无需复杂软件--只需纯粹的想象力和用户友好的技术。✨ 你今天将创作什么？亲自尝试一下：https://www.happyhorse.com

产品更新视频

13:10

公众号：昆仑万维（天工）

智源大会|Skywork首席科学家成宇：SkyReels V4与Mureka V9技术演进

昆仑万维Skywork首席科学家成宇在智源大会上介绍SkyReels V4与Mureka V9。SkyReels V4在Artificial Analysis全球视频生成评测中夺得Text to Video（With Audio）与Image to Video（With Audio）双赛道第一，超越Veo 3.1和Sora 2。其四大突破包括双流MMDiT架构实现毫秒级音画同步、全模态强化学习提升视频逻辑连贯性，以及1080p/32FPS/15秒电影级画质联合生成策略。Mureka V9引入MusiCoT音乐思维链技术，实现段落级文本控制与母带级混音，在旋律性（7.25）、表现力（6.89）等维度排名第一。此外，昆仑万维以“4+3”AGI战略支撑AI短剧、AI音乐、AI游戏三大AI原生娱乐经济体。

多模态大佬观点开源生态视频

10:10

公众号：卡尔的AI沃茨

实测OiiOii 2.0：智能画布、一键拉片复刻与skill库上线

OiiOii 2.0新增智能画布、一键拉片复刻和skill库三个功能。一键拉片复刻可将输入片段拆解为含关键帧、叙事要素、镜头语言等维度的拉片表格，用户替换角色、场景、元素后，半小时内可复刻出镜头设计一致度达90%的动画片段。智能画布支持直接点击素材唤醒Agent对话修改，不同素材可并行调用多个Agent同步推进任务。skill库内置自媒体、广告营销、周边设计等类型，电商广告skill可指定卖点并上传商品图生成专业短片，3C数码广告skill也能通过自然语言对话逐步调优，另有世界杯搞笑玩梗skill可直接生成搞怪视频。

智能体教程/实践视频

09:10

PixVerse@PixVerse_

看不见的怪物。傩戏与街头文化相遇。 Divine Agent by TEAM 88GO - 20 天，双女主，全城狩猎。工作流开源。转发+关注+回复 = 150 Creds 和工作流私信发送（仅限 72 小时）

行业动态视频

02:29

Hacker News 热门（buzzing.cc 中文翻译）

我使用搭载 M1 Max 芯片的电脑和本地机器学习模型，对 669 GB 的 GoPro 视频进行了索引

Hacker News 上一则 Ask HN 帖子显示，用户利用搭载 M1 Max 芯片的电脑和本地机器学习模型，成功索引了 669 GB 的 GoPro 视频。该帖子获得 105 个 HN 点数。

OpenAI 教程/实践端侧视频

01:06

PixVerse@PixVerse_

他偷了一把圣剑。假装是天选之人。然后龙相信了他--谎言变成了现实。《吹牛英雄》--PixVerse原创系列S1。一部由@A.O.Galaxy制作的受动漫启发的奇幻作品。基于PixVerse Canvas构建。转发+关注+回复=150 Creds & Workflow私信（仅限24小时）

其他图像生成视频

6月14日

22:14

The Decoder：AI News（RSS）

微软研究院 Mirage：赋予视频生成持久空间记忆，不遗忘"转角后的场景"

微软研究院与多所高校联合开发的视频世界模型 Mirage 将场景信息直接存储在潜在空间中，而非基于像素的点云。这大幅降低了计算时间和图形显存消耗，同时能在长镜头移动中保持场景空间一致性。不过，该模型目前仍无法可靠地跨片段跟踪运动物体。

Microsoft 多模态视频论文/研究

12:46

AYi@AYi_AInotes

GPT Image 2 + Grok 混合工作流成 AI 视频性价比之选；Claude Fable 管制实因本土对手越狱演示

用户推荐 GPT Image 2 + Grok 混合工作流制作 AI 视频，称性价比极高。SuperGrok 月费 30 美元，当前 3 个月优惠 67%，单条短片零边际成本；GPT Image 2 把控角色风格一致性，Grok 负责动态效果。另提及 Claude 的 Fable 模型被美国政府管制，真正触发原因并非防中国，而是美国本土竞争对手提交越狱演示证明其安全层 Mythos 可被绕过。Anthropic 事后复测称此漏洞狭窄且非通用。

AYi: 很多人都以为Fable5下架是为了防中国,但其实真正触发管制的,是美国本土的竞争对手, 大家都被官方的国家安全话术带偏了,默认下架是防范技术外流的常规操作。实际上真正触发这次管制的,是美国本土一家公司提交的越狱演示,他们证明Mythos的...

xAI 图像生成教程/实践视频

10:35

PixVerse@PixVerse_

令人印象深刻的幽默鸽子钻石盗窃视频，由@FutureVibesAi制作--在PixVerse上表现很棒！

Future AI 🧩: Bro committed grand theft diamond with ZERO exit strategy 😭💎 Created using @PixVerse_ Check the process below of how t...

教程/实践视频

08:00

HuggingFace Daily Papers（社区热门论文）

SpatialAvatar-0：多阶段重建的高质量4D头部头像

SpatialAvatar-0 提出基于 FLAME-mesh 约束的高斯表示，结合前馈生成器与 10K 迭代布局保持的逐主体精化循环。前馈阶段采用无参数 K 源均值池化及单目-时序到多视图-空间两阶段调度；精化阶段冻结 FLAME 绑定与高斯数量，以三组件抗尖峰正则化替代密集化。在 VFHQ/HDTF 跨域零样本测试中，PSNR 超越领域内领先模型 GAGAvatar 1.5 dB；在 SplattingAvatar 单目基准上，所有指标均领先，PSNR 超越 300K 迭代的 GeoAvatar 1.3 dB，且逐主体调度周期比常见 SOTA 基线快 60 倍。

多模态视频论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

Track2View：通过配对3D点轨迹实现4D一致的相机可控视频生成

Track2View将视频扩散Transformer与配对的3D点轨迹条件结合，通过源视图和目标视图中场景点的稀疏轨迹提供显式、时序连续的时空对应。其双视角轨迹调节器利用无参数几何操作和时序聚合转移视觉上下文，能泛化到任意相机轨迹。在含400个视频（静态和动态场景）的基准测试中，Track2View在视觉质量、视图同步和相机精度上均达最优，旋转误差比领先基线降低30-65%，平移误差降低61-72%。

视频论文/研究

01:04

PixVerse@PixVerse_

无月之海。木偶海盗。《不请之海》刚刚发布--原始定格动画质感碰撞狂野奇幻节拍。快来看看完整的Canvas工作流！

PixVerse: If the world refuses to give you moonlight, light the moon yourself. The Uninvited Sea - PixVerse Originals S1. Built on...

产品更新图像生成视频

01:04

PixVerse@PixVerse_

一个坚忍的萨满。一个戴着鲨鱼头盔的女孩。以恐惧为食的无形怪物。 Divine Agent - PixVerse Originals S1。由TEAM 88GO @Novva401 打造的奇幻动作惊悚片。基于PixVerse Canvas构建。转发+关注+回复 = 150 Creds + 工作流私信送达（仅限72小时）

产品更新图像生成视频

6月13日

19:27

The Verge：AI（RSS）

好莱坞的未来不在于向普通生成式AI模型输入提示词

生成式AI被宣传将彻底改变电影制作，但至今未出现值得付费观看的AI项目。大多数AI视频模型只能产出短暂且视觉不一致的片段，好莱坞部分重大AI合作也已消失。Google DeepMind使用“Dear Upstairs Neighbors”的概念艺术训练了其Veo和Imagen模型的自定义构建，展示了不同于直接调用通用模型的路径。目前大型制片厂主要产出的仍是短视频垃圾。

Google 现象/趋势视频

17:54

公众号：龙猫LongCat（美团）

WBench：面向交互式视频世界模型的首个系统性多轮评测基准

美团 LongCat 团队推出 WBench，首个面向交互式视频世界模型的系统性多轮评测基准。包含 289 个测试案例、1058 个交互轮次，覆盖导航、主体动作、事件编辑、视角切换四种交互方式，从视频质量、设定遵循度、交互遵循度、一致性、物理真实性五维度评测 20 个前沿模型（包括 Kling 3.0、HY-World 1.5、Genie 3 等）。核心发现：无全能模型，导航能力与画质无关；多轮交互后所有模型性能下降，导航平均分下降 33 点；开源模型 HY-World 1.5 导航能力突出；视角切换最难（平均分 30.7）。WBench 已开源。

arXiv GitHub 开源生态视频

17:54

公众号：火山引擎

TVB×火山引擎达成深度合作，以Seedance 2.0共探华语影视AI新路径

6月12日，TVB与火山引擎达成合作，围绕豆包视频生成模型Seedance 2.0，在影视内容智能化生产、短剧制作、IP商业化及云基础设施等领域展开探索。双方将协同TVB旗下FF工作室，以AI短剧为契机，利用Seedance 2.0的视频生成能力，通过输入提示词快速生成动画分镜、场景参考等素材，辅助编剧与导演在剧本开发、后期制作中验证创意。火山引擎将为TVB提供虚拟机、对象存储、视频云、CDN等云产品，支持其构建混合云架构，推动媒体内容生产、存储、分发环节的云化升级。

多模态行业动态视频

17:54

公众号：可灵AI（快手·视频）

可灵两周年|创作者这样说

可灵AI迎来两周年，与创作者相伴两年，持续推进模型和产品能力升级。国内创作者通过可灵将奇思妙想落地，海外创作者将其应用于影视、音乐与商业制作，从实验阶段走向专业生产流程。部分作品获得奖项认可或进入专业影视项目，成为创作者突破自我的新起点。

行业动态视频

06:47

fofr@fofrAI

我正在尝试一个智能体流程，将 Hyperframes 与 Gemini 视频分析结合起来，制作有趣的注释视频。是啊，这会很有意思。

fofr: I'm messing around with an agent flow for combining Hyperframes with Gemini video analysis to make interesting annotated...

智能体大佬观点视频

03:43

MiniMax (official)@MiniMax_AI

来自@NVIDIAAI的认可意义重大免费GPU加速的M3端点现已上线快来试试👇

NVIDIA AI: Congrats to the @MiniMax_AI team on the release of MiniMax M3, a long-context multimodal model for text, image, and vide...

多模态模型发布视频

03:29

PixVerse@PixVerse_

如果世界拒绝给你月光，那就自己点亮月亮。《不请自来的海》- PixVerse Originals S1，基于 Canvas 构建。由 PixVerse CPP JaneDoeCreates 创作的治愈系音乐动画。转发+关注+回复 = 150 积分及完整电影+工作流私信（仅 72 小时）

其他视频

03:16

fofr@fofrAI

@andrew_n_carr 宣布"编辑视频运动！放弃提示开始导演"，并展示其"通用视频编辑器"工作流：先用 comic 4 捕捉视频，再用运动编辑器修改动作，最后用视频到视频模型（如 Runway、Gemini）重新渲染。他以时装片段为例，希望模特展现高抬腿活力，无需重拍。主推文 fofr 表示，AI视频中精细的3D运动控制已更近一步。

Andrew Carr 🤸: EDIT MOTION IN VIDEOS!!! Quit prompting and start directing I've been shouting for YEARS about 3D as the control layer. ...

多模态教程/实践视频

01:59

PixVerse@PixVerse_

PixVerse 展示 AI 电影制作人 @Shanzyin_ai 使用 Canvas 工作流创作的维多利亚哥特风格短片《THE DREAM EATERS》。短片包含完整节点、多个镜头及项目文件，开放探索。剧情设定为古老庄园中青少年被迫吞噬权贵噩梦，一名有缺陷的新兵将黑暗拖回现实。PixVerse 推出限时活动：转发+关注+回复"DREAM"，72 小时内可获得 150 Credits 及该工作流。

PixVerse: An ancient estate. Teenagers forced to devour the nightmares of the powerful. One defective recruit who drags the darkne...

图像生成教程/实践视频

01:11

Kling AI@Kling_ai

谁是你的比赛日选择？

图像生成行业动态视频

6月12日

22:11

Kling AI@Kling_ai

可灵Kling AI两周年：全球创作者分享体验与代表作

可灵Kling AI迎来上线两周年，多位全球创作者分享使用体验。代表作包括获奖广告《MagicMirror AI》（获WAIFF Seoul 2026广告奖）、短剧《Call in the Sandstorm》和《A Heartbreaking Story Under the Full Moon》（基于Kling 2.6）。关键功能涵盖运动控制与一致性、开始和结束帧工作流、4K细节、微表情与衣物纹理生成，以及同时生成语音、音效和背景音乐。平台持续升级，助力独立创作者和小团队实现电影级视频制作，推动AI创意从实验走向实际生产。

其他视频

20:36

IT之家（RSS）

围绕视频生成模型 Seedance 2.0 的应用落地，TVB 与字节火山引擎达成合作

字节跳动旗下火山引擎与香港电视广播有限公司（TVB）达成深度合作。双方将围绕豆包视频生成模型 Seedance 2.0，在影视内容智能化生产、短剧制作、IP 商业化探索及云基础设施建设等方面展开合作。火山引擎将与 TVB 旗下 FF 工作室协同，基于 Seedance 2.0 的视频生成能力探索 AI 在短剧创作与制作流程中的应用。火山引擎还为 TVB 提供虚拟机、对象存储、网络资源、云数据库、视频云、CDN 内容分发等云产品与服务。

行业动态视频

20:29

PixVerse@PixVerse_

一座古老的庄园。青少年被迫吞噬权贵的噩梦。一个缺陷的新兵将黑暗拖回清醒的世界。《THE DREAM EATERS》--由获奖AI电影人@Shanzyin_ai 制作。基于PixVerse Canvas构建。包含项目文件。转发+关注+回复"DREAM"=150积分和私信工作流（仅72小时）。

行业动态视频