5月7日

23:04

AK@_akhaliq

Stream-R1 面向流式视频生成的可靠性-困惑度感知奖励蒸馏论文： https://huggingface.co/papers/2605.03849

Hugging Face 多模态视频论文/研究

22:41

TestingCatalog News 🗞@testingcatalog

GOOGLE 🚨： Flow平台正在准备全新的智能体模式，用于处理完整的视频制作流程！用户将能够： - 规划场景 - 讨论进行中的项目变更 - 触发生成工作流 - 管理项目级和应用级的创意工具 - 直接通过聊天界面更新项目状态万物皆可智能体 👀

智能体 Google 产品更新视频

20:33

PixVerse@PixVerse_

4K超分功能现已上线！在一处增强您的图像和视频。获得3次免费使用机会，之后享受35%的积分折扣。限时活动：5月7日至14日，UTC时间08：00。转发+关注+回复=私信领取300积分（仅限72小时）。

产品更新图像生成视频

20:01

Chubby♨️@kimmonismus

1/ 这有点疯狂。同一张脸在不同角度、不同剪辑和不同表情下，没有出现那种导致AI视频崩坏的常见漂移现象。

现象/趋势视频

17:38

swyx 🌉@swyx

祝贺 @mattpocockuk 的两场分享在不到两周内获得超100万次观看--这是 @aidotengineer 历史上最快的"破百万速度"记录。

AI Engineer: We're excited to end the week with a @mattpocockuk special double header! - AI Coding for Real Engineers - full workshop...

教程/实践编码视频

07:07

karminski-牙医@karminski3

字节跳动Doubao-Seed-2.0-Lite集成AI电竞教练框架

作者开发的AI电竞教练框架“Harness Agent”被字节跳动官方采用。该框架能分析CS2游戏录屏中的走位、身法、对枪、经济等多维度数据，并提供改进建议。字节跳动将其与自家的Doubao-Seed-2.0-Lite模型结合，进行了长达25小时的不间断对局分析演示，该演示已成为Doubao-Seed-2.0-Lite的官方宣传案例。具体的项目细节视频仍在制作中。

智能体行业动态视频

06:34

Luma@LumaLabsAI

在正确的时间，将正确的信息传递给正确的人。现在你可以构建它的每个版本。定义受众。设置变量。Luma Agents 由此生成每个定向广告。触达所有受众 → http://lumalabs.ai/app

智能体产品更新视频

04:34

Luma@LumaLabsAI

品牌焕新并非从头开始，而是为了更好呈现。定义演进方向，确立发展路径。Luma Agents由此构建新品牌形象的每个元素。立即构建 → http://lumalabs.ai/app

产品更新视频

04:01

Chubby♨️@kimmonismus

约25分钟后Anthropic的YouTube频道将播出对Dario Amodei和Daniela Amodei的访谈可能值得一看

Anthropic 行业动态视频

01:03

Luma@LumaLabsAI

欢迎来卡尔弗城参加AI on the Lot会议。 5月27-28日，为期两天，超过2000名参会者。这是聚焦娱乐产业的最大规模AI媒体会议。通过我们的链接可享九折优惠：https://my.aionthelot.com/invite/LUMA10

行业动态视频

00:02

宝玉@dotey

把视频变成图文博客：Agent + 豆包 Seed2.0 lite 重做 Karpathy 两年前的工作流

作者利用豆包Seed2.0-lite全模态理解模型，重新实践了将长视频自动转换为图文博客的工作流。传统ASR+LLM方案因信息丢失严重而效果不佳，新方案的核心在于模型能同时理解视频的音频、画面和屏幕文字，进行联合推理，从而保留技术视频中的关键视觉信息（如代码、图表）。通过将多模态能力封装为可复用的Agent Skill，并采用四步最佳实践——视频切片、生成结构化素材、反查关键帧配图、生成终稿——解决了传统流程的上下文割裂问题，使输出更接近人类技术编辑的整理成果。

智能体多模态教程/实践视频

5月6日

17:28

Alibaba Cloud@alibaba_cloud

报名延期！用AI重现历史，赢取精彩奖品

阿里云新加坡推出“被发掘的故事：WAN AI视频挑战赛”，邀请参与者使用其WAN模型创作AI视频，重新构想新加坡文化遗产。活动注册期已延长，参与者需选择主题、讲述故事并制作视频，优胜者有机会赢取奖品。为激发创意，可参考ArCH Square的遗产展览获取灵感。该活动旨在推动AI技术与文化遗产的创新结合，涉及技术包括人工智能、大语言模型和通义千问等。立即报名，用科技重现历史。

多模态行业动态视频

16:58

Alibaba Cloud@alibaba_cloud

报名延期！用AI重现历史，赢取精彩奖品

阿里巴巴云新加坡宣布延长“故事发掘：WAN AI视频挑战赛”的注册时间，邀请参与者利用其WAN模型创作AI视频，重新构想新加坡文化遗产。参赛者需选择主题，将故事转化为视频，优秀作品可获奖励。ArCH Square的展览为创作提供灵感来源。活动涉及AI、大语言模型和Qwen等技术，旨在推动创新。参与者可通过指定链接完成注册，确认邮件将随后发送。@Fooyo和@HeritageSG为本次合作方。

行业动态视频

16:37

小互@xiaohu

Runway推出可实时对话的视频角色生成功能

Runway推出Runway Characters功能，用户上传参考图即可生成能实时对话的视频角色。该角色支持高清视频流，可注视摄像头或屏幕共享内容，并允许配置声音、性格与知识库。其核心突破在于将视频生成从预渲染推进至实时交互，使角色能理解对话、依据资料回答问题，并能调用工具执行网页操作或数据查询，支持通过API等方式集成至自有产品。

智能体产品更新视频

14:59

PixVerse@PixVerse_

致敬我们出色的模型！

ART: The Met Gala 2026🎉 2026 theme "Fashion Is Art"🎨 FULL VERSION+Tutorial for creating these with @PixVerse_ C1 reference ...

行业动态视频

12:20

歸藏(guizang.ai)@op7418

两个热门短剧暂成AI内容制作质量标杆

推文指出短剧《Enemy》和《吉时已到》近期热度极高，制作效果出色且成本较低，已成为出圈案例。作者建议，如果从事AI内容或AI短剧制作，可以将这两个剧集视为暂时的质量标杆，以对齐内容创意、制作效率和市场接受度，从而提升AI生成作品的竞争力。

现象/趋势视频

08:01

Luma@LumaLabsAI

推出Uni-1.1 API。它通过简报进行推理，而不仅仅是处理标记。首次生成的结果即可实际交付。无需中间件，无需提示工程。时尚工具。建筑渲染器。漫画制作流程。每个垂直领域都具备电影级品质。可指挥的智能。可交付的审美。→ http://lumalabs.ai/api

产品更新图像生成视频

04:01

Luma@LumaLabsAI

室内设计工作室。时尚工具。珠宝配置器。故事板生成器。所有这些都正在使用Uni-1.1 API构建。无论你在构建什么，智能层已就位。→ http://lumalabs.ai/api

产品更新多模态视频

02:27

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

梦工厂联合创始人杰弗里·卡森伯格预测，AI将在三年内使动画电影制作成本降低90%，所需人力减少至原先的10%。这不仅将彻底颠覆娱乐产业，更将迅速波及所有行业。好莱坞艺术家的反抗凸显了危机感--AI已在艺术创作领域实现从低水平到超人类能力的飞跃。若其在操纵、编程、生物工程等领域取得类似突破，将引发大规模失业潮，可能促使有组织劳工运动复兴。尽管可能带来更多电影产出，但各行各业的游戏规则已被永久改变。

AI Notkilleveryoneism Memes ⏸️: AGI is the Great Flipper of All The Gameboards Dreamworks co-founder Jeff Katzenberg says AI will cut animated movie cos...

现象/趋势视频

5月5日

23:56

Luma@LumaLabsAI

Uni-1.1 API 今日上线。在 API 层面内置提示增强、研究和参考资料收集功能。与好莱坞电影摄影师、视觉特效艺术家以及跨文化形式的世界级艺术家合作训练。价格和延迟仅为同类模型的一半以下。专为在生产环境中部署产品的开发者设计--在 Image Arena 的文本到图像和图像编辑类别中排名前三。开始构建 → https://lumalabs.ai/api

产品更新图像生成视频

15:46

Alibaba Cloud@alibaba_cloud

Happy Horse 1.0发布，AI视频制作告别闪烁与失真

Happy Horse 1.0是一款面向创意工作者的生产级AI视频引擎，旨在解决现有AI视频工具的核心痛点。它主打“像素级一致性”，确保角色和资产在视频中保持稳定，不再出现变形或闪烁。同时，引擎具备企业级效率，在质量、速度和成本上进行了优化。官方将于2026年5月15日在香港举办大师班，演示如何将AI视频工作流程从“实验性”提升至“专业级”。

产品更新视频

13:14

阿绎 AYi@AYi_AInotes

起步成本90美元，30秒一条视频：AI换脸工具带来的低门槛高杠杆生意

文章介绍一款年费89.99美元的在线AI换脸工具Swaptok，用户可通过四步流程在30秒内将TikTok或Reels公开视频中的人脸替换为AI生成的高清人脸，单条成本极低。作者提出四条变现路径：运营AI网红矩阵账号、承接品牌广告外包、为自有产品制作素材以及出售课程或服务。同时指出需进行二次创作避免限流、注意版权风险及把握红利期等关键建议，视其为技术发展催生的新内容生产方式。

图像生成教程/实践视频

11:26

Kling AI@Kling_ai

愿景随Kling AI而动。每一帧，都是心跳。每一个故事，都栩栩如生。欢迎来到Kling AI创作者的四月光影灵感集！🎬

其他视频

10:14

阿绎 AYi@AYi_AInotes

精选74

分享一个免费下载任何 YouTube 视频的GitHub开源项目，非常实用🔥

开源项目Voice-Pro将多语言视频创作流程大幅简化。用户输入YouTube链接后，该工具可在本地自动完成视频下载、人声分离、语音转文字、翻译、声线克隆及配音合成，全程不到两分钟。它将原本需要多个付费工具协作的复杂流程，整合为一个免费、本地化的高效解决方案，显著提升了创作者的工作效率。

GitHub 开源/仓库视频语音

推荐理由：一个开源工具把 yt-dlp + Whisper + 翻译 + 声线克隆六步压缩成一条本地流水线，之前每月烧几百刀订阅费的事现在免费跑在自己机器上，做多语言视频的人可以直接换掉整套工具链。

06:55

Luma@LumaLabsAI

定义概念。设定方向。让Luma Agents将你的想法转化为完整的广告系统。查看概念 → http://lumalabs.ai/app

智能体产品更新视频

05:49

AK@_akhaliq

UniVidX 一个通过扩散先验实现多功能视频生成的统一多模态框架 paper： https://huggingface.co/papers/2605.00658

Hugging Face 多模态视频论文/研究

03:48

PixVerse@PixVerse_

可爱的猫娘对镜瞬间 @Kawaiizice！分享你家宠物面对镜子的搞笑反应--一起传播这份可爱吧！🐱🪞

Kawaiizice: Gatinha e espelho! 😺🪞 Não é curioso? (=^・ω・^=) Quem tem bichinho, tem reações engraçadas com espelhos pra compartilhar...

其他视频

02:48

PixVerse@PixVerse_

水豚足球巨星！😍太有趣了，@FotachuARGUY 继续保持！

Fotachu - AR GUY: MY SUBMISSION TO THE @PixVerse_ "Seedance 1080p on PixVerse" CHALLENGE! CABYBARA SOCCER BALL - EPISODE 1 #SEEDANCE

行业动态视频

01:58

Runway@runwayml

精选69

实时视频智能体已到来。今天，我们将分享如何构建Runway Characters，让你能将一张图片转化为一个完全富有表现力、可对话的视频智能体，以每秒24帧的高清画质流畅播放。端到端延迟仅需1.75秒。了解更多信息请见下文。

产品更新多模态视频

推荐理由：Runway 把 AI 视频从生成拉入实时对话时代，1.75 秒的延迟让视频代理第一次有了「对话感」，做交互设计的同学可以认真看一眼。

5月4日

23:48

Chubby♨️@kimmonismus

初创公司Video Rebirth的文本生成视频模型Bach-1.0 Preview在Artificial Analysis的全球AI视频排行榜上首次亮相即位列第六。其性能与Vidu Q3 Pro、Kling 3.0 Omni 1080p （Pro）及grok-imagine-video等知名模型相当。该模型计划于五月下旬广泛发布。

Artificial Analysis: Bach-1.0 Preview from Video Rebirth debuts at #6 on the Artificial Analysis Text to Video Leaderboard (No Audio)! Bach-1...

模型发布视频评测/基准

22:16

Rohan Paul@rohanpaul_ai

初创公司Video Rebirth凭借其模型Bach-1.0 Preview，在Artificial Analysis的文本转视频榜单中首次进入前六名，打破了该榜单长期由阿里巴巴、字节跳动、xAI等万亿美元级巨头主导的局面。其模型性能与Vidu Q3 Pro、Kling 3.0 Omni 1080p （Pro）及grok-imagine-video等顶尖模型相当，并计划于五月下旬广泛发布。这一突破标志着初创企业在高质量AI视频生成领域取得了显著进展，为该领域的竞争格局带来了新的变数。

Artificial Analysis: Bach-1.0 Preview from Video Rebirth debuts at #6 on the Artificial Analysis Text to Video Leaderboard (No Audio)! Bach-1...

模型发布视频

21:24

小互@xiaohu

传谷歌I/O将发布Omni模型，Gemini或升级为全模态生产力入口

据传谷歌将在I/O大会发布名为“Omni”的新模型，旨在将Gemini从聊天助手升级为集成写作、图片、视频、长上下文记忆与复杂任务流的全模态生产力平台。该模型可能原生支持视频生成与输出，超越现有的Veo 3.1。同时，Gemini 3.2/3.5版本或专注于提升推理速度与效率，而Ultra版本则向长上下文、重记忆及多步骤工作流方向深化。若消息属实，Gemini将成为首个具备视频输出能力的顶级Omni模型。

TestingCatalog News 🗞: GOOGLE I/O 🚨: A NEW OMNI MODEL IS BEING TESTED ON GEMINI FOR VIDEO GENERATION! > "Start with an idea or try a template....

Google 多模态模型发布视频

17:48

Artificial Analysis@ArtificialAnlys

Bach-1.0 Preview from Video Rebirth 在 Artificial Analysis 文本转视频排行榜（无音频）中首次亮相，位列第6！ Bach-1.0 Preview 是来自 @video_rebirth 的最新文本转视频模型，其性能与 Vidu Q3 Pro、Kling 3.0 Omni 1080p （Pro）和 grok-imagine-video 相近。 Bach-1.0 Preview 计划于五月下旬广泛发布。在下方 Artificial Analysis 视频竞技场中查看 Bach-1.0 Preview 的生成示例 🧵

模型发布视频

16:14

阿绎 AYi@AYi_AInotes

精选77

Claude通过第三方平台补足视频分析能力，开启AI应用新生态

借助Algrow的MCP平台，Claude现已能直接分析YouTube等平台的视频内容，自动生成包含数据表格、爆款拆解与留存曲线的深度报告。这标志着大模型竞争重点转向生态建设，第三方开发者通过工具链迅速弥补了Claude的原生视频短板。该功能为内容创作者提供了高效分析竞品、提炼爆款公式的生产力工具，并预示视频研究Agent时代的开启。目前处于免费试用阶段，未来订阅定价亲民。