全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「视频」清除

4月13日周一

08:00HuggingFace Daily Papers（社区热门论文）3DTV：面向实时视角合成的前馈插值网络

08:00HuggingFace Daily Papers（社区热门论文）OmniShow：统一多模态条件的人与物体交互视频生成

06:33Rohan PaulDreamina Seedance 2.0 正式在美国上线

4月12日周日

07:01TestingCatalog News 🗞在 Grok Imagine 上玩 Remix Character 停不下来！

4月11日周六

08:00HuggingFace Daily Papers（社区热门论文）Prompt Relay：面向多事件视频生成的推理时时间控制

03:15Ethan MollickAI 还原拉斐尔《雅典学院》原貌，Seedance 2.0 生动演绎柏拉图与亚里士多德的思想交锋

4月10日周五

12:12Ethan Mollick一切尚未失去。Duckerton 仍有可能。

12:00公众号：生数科技（Vidu·视频）51生数科技完成近20亿元B轮融资，以通用世界模型定义下一代数字与物理世界生产力底座

00:00Runway：News（网页）Runway 扩大与 NYU Tisch 艺术学院合作

4月9日周四

23:43AKINSPATIO-WORLD：基于时空自回归建模的实时 4D 世界模拟器

19:11公众号：生数科技（Vidu·视频）51生数科技Vidu正式上线阿里云百炼

08:00HuggingFace Daily Papers（社区热门论文）ReconPhys：从单视频中重建外观与物理属性

08:00HuggingFace Daily Papers（社区热门论文）Uni-ViGU：基于扩散式视频生成器统一视频生成与理解

02:30AKVideo-MME-v2：迈向全面视频理解基准测试的下一阶段

4月8日周三

20:37公众号：可灵AI（快手·视频）44可灵AI × 清华大学 | 高校原力计划正式启幕

03:00Artificial AnalysisText to Video 与 Image to Video Arenas 新增匿名视频模型 HappyHorse-1.0

4月3日周五

14:14公众号：通义实验室（千问）29Wan2.7-Video 为创作自由而来

00:00Google Blog：AI（RSS）Google Vids 支持免费创建、编辑和分享视频

4月1日周三

12:14公众号：可灵AI（快手·视频）16可灵AI清明短片引用户热议：评论区里人人都有"纸手机"

11:20DeedyGaussian splats：当今除AI外最激动人心的软件技术

00:00Google Blog：AI（RSS）使用 Veo 3.1 Lite 构建：我们成本效益最高的视频生成模型

3月31日周二

19:03公众号：昆仑万维（天工）32昆仑万维（天工）推出「天工短剧工作台」

00:00Runway：News（网页）推出 Runway Builders 计划

00:00Runway：News（网页）Runway 推出 Runway Fund 投资基金

3月28日周六

22:34公众号：昆仑万维（天工）19昆仑万维携 SkyReels V4 与 Mureka V9 亮相2026中关村论坛，获高度赞誉

3月26日周四

12:10公众号：可灵AI（快手·视频）23周杰伦《太阳之子》AIMV创作挑战赛上线

3月25日周三

21:36Gary Marcus：The Road to AI We Can Trust（RSS）战争与 AI、Sora 的消亡，以及今日现场观看的 3 种方式

3月24日周二

15:34公众号：通义实验室（千问）51PrismAudio：声画同频，音效随行

3月23日周一

08:00OpenAI：官网动态（RSS · 排除企业/客户案例）安全使用 Sora 创作

3月20日周五

13:32公众号：生数科技（Vidu·视频）24生数科技：通用世界模型是连接数字世界与物理世界的桥梁

3月19日周四

01:18Hao AI Lab哇！Vera Rubin 的演示看起来很棒，但实时编辑实际上已经可以在单张 B200 上实现了！

3月18日周三

05:19Hao AI Lab精选（1/N）我们正在推出 Dreamverse。大多数 AI 视频模型需要数分钟才能生成一段 5 秒 1080p 的片段。而在 4.5 秒内，我们就能在单张 GPU 上生成 30 秒 1080p 的片段。

05:07Hao AI Lab65精选FastVideo推出Dreamverse原型，实现"氛围导演"式实时视频生成

3月14日周六

03:19Hao AI Lab（1/N）内容创作者被困在昂贵且缓慢的视频生成 API 中太久了。我们再也受不了了。😅😭

3月13日周五

18:07公众号：生数科技（Vidu·视频）37万兴剧厂深度集成Vidu Q3，携手生数科技开启AI漫剧创作新时代

3月12日周四

20:27公众号：生数科技（Vidu·视频）35生数科技与无界动力达成全面战略合作，共创物理AI新范式

00:00Runway：News（网页）负责任地构建交互式 AI 角色

3月11日周三

00:00Runway：News（网页）Runway 成立 Runway Labs 内部孵化器

3月10日周二

14:51公众号：生数科技（Vidu·视频）22Vidu 联合浦光星奕举办首届 AIGC 内容产业大会，聚焦 AI 短剧与视频大模型应用

3月9日周一

00:00Runway：News（网页）精选Runway 推出 Characters：单图实时生成可对话虚拟角色 API

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

4月13日

08:00

HuggingFace Daily Papers（社区热门论文）

3DTV：面向实时视角合成的前馈插值网络

研究团队推出3DTV前馈网络，实现实时稀疏视角插值与视图合成。该方法结合轻量级几何与深度学习，通过Delaunay三元组选择确保角度覆盖，并引入姿态感知深度模块估计多尺度深度金字塔，支持高效特征重投影与遮挡感知混合。与需要场景特定优化的方法不同，3DTV无需再训练即可前馈运行，在挑战性多视角视频数据集上质量与效率均衡，性能优于现有实时基线，适用于AR/VR、远程呈现等低延迟交互场景。

arXiv 视频论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

OmniShow：统一多模态条件的人与物体交互视频生成

OmniShow 是一个面向人与物体交互视频生成（HOIVG）的端到端框架，支持文本、图像、音频和姿态等多模态条件输入。该方法提出统一通道级条件注入（Unified Channel-wise Conditioning）和门控局部上下文注意力（Gated Local-Context Attention）机制，在可控性与生成质量之间取得平衡，并采用解耦后联合训练策略（Decoupled-Then-Joint Training）解决数据稀缺问题。研究团队还建立了 HOIVG-Bench 基准测试。实验表明，OmniShow 在多种多模态条件下均达到行业领先的生成效果。

arXiv 多模态视频论文/研究

06:33

Rohan Paul@rohanpaul_ai

Dreamina Seedance 2.0 结束数月等待正式在美上线。实测体验升级显著，该平台支持从创意到成片的一站式视频创作。

产品更新视频

4月12日

07:01

TestingCatalog News 🗞@testingcatalog

xAI 正为 Grok 移动端开发 Remix Character 功能，允许用户将图片中的任意角色插入到 Grok Imagine 生成的视频中。该功能尚未上线，疑似 Imagine v2 的前瞻。

xAI 产品更新图像生成视频

4月11日

08:00

HuggingFace Daily Papers（社区热门论文）

Prompt Relay：面向多事件视频生成的推理时时间控制

视频扩散模型在生成多事件视频时存在时序控制不足和语义纠缠问题。Prompt Relay 是一种推理时即插即用的解决方法，无需修改模型架构或增加计算开销。该技术通过在交叉注意力机制中引入惩罚项，强制各时间段仅关注对应提示，使模型逐次呈现单一语义概念。该方法显著改善时间提示对齐，减少概念干扰，提升生成视频的视觉质量和叙事连贯性。

arXiv 视频论文/研究

03:15

Ethan Mollick@emollick

Seedance 2.0 用 AI 技术重新诠释拉斐尔名作《雅典学院》，呈现柏拉图与亚里士多德之间的微妙冲突与思想张力。生成效果有趣，可玩性高。

图像生成现象/趋势视频

4月10日

12:12

Ethan Mollick@emollick

Seedance 2.0 可用相同提示词生成 Duckerton 视频（人人头戴活鸭的摄政风场景），证明这种怪诞创作仍有可能。作者讽刺 OpenAI 似乎已认为此类内容不配占用其算力。

Ethan Mollick: My most popular Sora video was "an Elaborate regency romance where everyone is wearing a live duck for a hat (each duck ...

产品更新多模态视频

12:00

公众号：生数科技（Vidu·视频）

51

生数科技完成近20亿元B轮融资，以通用世界模型定义下一代数字与物理世界生产力底座

生数科技完成近20亿元B轮融资，声称将以通用世界模型定义下一代数字与物理世界的生产力底座。

行业动态视频

00:00

Runway：News（网页）

Runway 扩大与 NYU Tisch 艺术学院合作

Runway 扩大与 NYU Tisch 艺术学院合作，向 ITP、IMA 及 Hyper Cinema Lab 学生开放全套 AI 工具，支持课程作业与个人创作。Runway 创始团队曾就读于 ITP，此次合作旨在让新一代创作者掌握 AI 时代的电影与艺术工作流。

行业动态视频

4月9日

23:43

AK@_akhaliq

INSPATIO-WORLD 通过时空自回归建模实现实时 4D 世界模拟，可实时生成动态三维环境并支持交互。技术论文已发布于 Hugging Face。

Hugging Face 多模态视频论文/研究

19:11

公众号：生数科技（Vidu·视频）

51

生数科技Vidu正式上线阿里云百炼

生数科技旗下视频生成模型Vidu已正式上线阿里云百炼平台，标志着从“模型领先”向“生态领先”的转变。双方将联合加速行业发展。

产品更新视频部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

ReconPhys：从单视频中重建外观与物理属性

ReconPhys 是首个可从单目视频联合重建几何、外观与物理属性的前馈框架。该方法采用双分支架构与自监督训练策略，无需真实物理标签即可实现端到端推理。在合成数据集测试中，其未来预测 PSNR 达到 21.64，显著优于现有优化基线的 13.27；Chamfer Distance 从 0.349 降至 0.004。关键突破在于推理速度：仅需不到 1 秒即可完成重建，而传统方法需耗时数小时，为机器人与图形学领域快速生成仿真就绪资产提供了新方案。

arXiv 具身智能视频论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

Uni-ViGU：基于扩散式视频生成器统一视频生成与理解

Uni-ViGU框架通过扩展扩散式视频生成器统一视频生成与理解，反转了传统以理解为中心的多模态模型范式。该框架采用统一流方法，在单一过程中对视频进行连续流匹配、对文本进行离散流匹配；引入模态驱动的MoE架构，以轻量级层增强Transformer实现文本生成；并通过双向训练机制（知识召回与能力细化两阶段）将生成知识迁移至理解任务。实验表明，该模型在视频生成与理解任务上均达到竞争性性能，验证了以生成为中心的架构路径可行性。

多模态视频论文/研究

02:30

AK@_akhaliq

Video-MME 基准测试发布 v2 版本，推动全面视频理解评估进入新阶段。论文已上传至 Hugging Face。

Hugging Face 多模态视频评测/基准

4月8日

20:37

公众号：可灵AI（快手·视频）

44

可灵AI × 清华大学 | 高校原力计划正式启幕

可灵AI与清华大学联合宣布“高校原力计划”正式启动。该计划旨在推动AI视频生成技术在高校的产学研合作，具体细节未在本次公告中披露。

行业动态视频

03:00

Artificial Analysis@ArtificialAnlys

Artificial Analysis 在 Text to Video 和 Image to Video Arenas 中引入匿名视频模型 HappyHorse-1.0。该模型在无音频视频生成榜单排名第一，有音频榜单排名第二，详细技术信息即将公布。

视频评测/基准

4月3日

14:14

公众号：通义实验室（千问）

29

Wan2.7-Video 为创作自由而来

产品更新视频

00:00

Google Blog：AI（RSS）

Google Vids 支持免费创建、编辑和分享视频

Google Vids 接入 Lyria 3 与 Veo 3.1 模型能力，新增免费 AI 视频生成功能，用户可无成本创建、编辑和分享高质量视频。

Google 产品更新视频

4月1日

12:14

公众号：可灵AI（快手·视频）

16

可灵AI清明短片引用户热议：评论区里人人都有"纸手机"

可灵AI生成清明主题视频，被评价为“最有人味的片子”。视频引发评论区大量用户分享自创的“纸手机”故事，展现AI与人文情感的碰撞。该作品由快手旗下可灵AI制作，突出AI在情感表达领域的突破。

多模态教程/实践视频

11:20

Deedy@deedydas

Gaussian splats：当今除AI外最激动人心的软件技术

Gaussian splats是新兴的实时3D渲染技术，可在iPhone上实现自由视角的沉浸式场景浏览。该技术用高斯分布编码场景结构与外观，相比NeRFs极大提升渲染速度。当前突破包括单图生成（Apple ML SHARP）、动态场景捕捉（4DV ai）及生成模型填补未拍摄区域。未来将成为Vision Pro等VR设备的核心娱乐格式，并与世界模型结合实现城市级漫游或游戏化交互，但仍需解决创建效率、存储传输及视觉真实感等挑战。

多模态现象/趋势视频

00:00

Google Blog：AI（RSS）

使用 Veo 3.1 Lite 构建：我们成本效益最高的视频生成模型

Veo 3.1 Lite 现已开放付费预览，作为 Google 成本效益最高的视频生成模型，支持通过 Gemini API 调用及 Google AI Studio 测试。

Google 模型发布视频

3月31日

19:03

公众号：昆仑万维（天工）

32

昆仑万维（天工）推出「天工短剧工作台」

昆仑万维（天工）正式推出「天工短剧工作台」，以AI智能体驱动短剧内容创作流程自动化。

智能体产品更新视频

00:00

Runway：News（网页）

推出 Runway Builders 计划

Runway 推出 Runway Builders 计划，为 Seed 至 Series C 初创企业提供最高50万免费 API 积分及 Characters 实时视频代理接口。该接口基于 GWM-1 模型，支持从单张图片零微调生成可控数字角色，适用于客服、销售助手等实时交互场景。

智能体产品更新视频

00:00

Runway：News（网页）

Runway 推出 Runway Fund 投资基金

Runway 正式成立 Runway Fund，专注投资 AI、媒体与世界模拟领域的早期初创公司。基金初始规模 1000 万美元，单笔投资最高 50 万美元，重点布局 AI 研究、新应用及新媒体内容三大方向，已投项目包括 Cartesia、LanceDB 等。

行业动态视频

3月28日

22:34

公众号：昆仑万维（天工）

19

昆仑万维携 SkyReels V4 与 Mureka V9 亮相2026中关村论坛，获高度赞誉

昆仑万维在2026中关村论坛上展示两大全球顶尖模型 SkyReels V4 和 Mureka V9，获得多方高度赞誉。

图像生成行业动态视频

3月26日

12:10

公众号：可灵AI（快手·视频）

23

周杰伦《太阳之子》AIMV创作挑战赛上线

可灵AI邀请创作者参与周杰伦新歌《太阳之子》AIMV创作挑战赛，用AI影像为旋律续写MV故事，具体参与方式及规则见活动页面。

图像生成行业动态视频

3月25日

21:36

Gary Marcus：The Road to AI We Can Trust（RSS）

战争与 AI、Sora 的消亡，以及今日现场观看的 3 种方式

这是一则简短预告，作者为仓促通知致歉，宣布将围绕战争与人工智能、Sora 的终结等话题发布几项公告，同时提供今日现场观看的三种途径，但正文未透露具体发布内容、技术细节或数据指标。

大佬观点视频

3月24日

15:34

公众号：通义实验室（千问）

51

PrismAudio：声画同频，音效随行

PrismAudio 由通义实验室（千问）开源发布，定位为“更会思考的AI音效师”，能够实现声画同频、音效随行的智能音效生成。

多模态模型发布视频

3月23日

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

安全使用 Sora 创作

Sora 2 与 Sora 应用将安全作为基础架构，采用具体保护措施应对前沿视频模型与社交创作平台带来的全新安全挑战。

OpenAI 产品更新视频

3月20日

13:32

公众号：生数科技（Vidu·视频）

24

生数科技：通用世界模型是连接数字世界与物理世界的桥梁

生数科技在公众号推文中指出，通用世界模型是连接数字世界与物理世界的桥梁。文章标题与正文均为此单一观点，未提供更多细节。

多模态现象/趋势视频

3月19日

01:18

Hao AI Lab@haoailab

哇！Vera Rubin 的演示看起来很棒，但实时编辑实际上已经可以在单张 B200 上实现了！

Runway: A breakthrough in real-time video generation. As a research preview developed with @NVIDIA and shared at @NVIDIAGTC this...

开源/仓库视频部署/工程

3月18日

05:19

Hao AI Lab@haoailab

精选

（1/N）我们正在推出 Dreamverse。大多数 AI 视频模型需要数分钟才能生成一段 5 秒 1080p 的片段。而在 4.5 秒内，我们就能在单张 GPU 上生成 30 秒 1080p 的片段。

模型发布视频部署/工程

推荐理由：AI视频生成速度突破实时阈值，单GPU秒级出片可直接上手体验

05:07

Hao AI Lab@haoailab

精选65

FastVideo推出Dreamverse原型，实现"氛围导演"式实时视频生成

FastVideo团队发布Dreamverse原型界面，引入创新的“氛围导演”工作流。该模式允许用户通过自然语言实时、迭代地引导视频生成，如更换背景或调整运镜，无需编写复杂的长提示词。其核心是全新的实时推理栈，能在单GPU上以约4.55秒生成5秒1080p视频，速度快于观看时间，从而将生成过程从被动等待转变为实时导演体验。团队认为，视频生成的未来在于让创作速度跟上想象速度，快速的反馈循环比单纯追求模型性能更能催生优质作品。

产品更新视频部署/工程

推荐理由：视频生成从「等一分钟看结果」变成「边看边改」，这个交互范式转变比模型本身更值得关注。做内容创作工具的产品人，这个 demo 值得花五分钟体验一下实时迭代的手感。

3月14日

03:19

Hao AI Lab@haoailab

（1/N）内容创作者被困在昂贵且缓慢的视频生成 API 中太久了。我们再也受不了了。😅😭

开源/仓库视频部署/工程

3月13日

18:07

公众号：生数科技（Vidu·视频）

37

万兴剧厂深度集成Vidu Q3，携手生数科技开启AI漫剧创作新时代

万兴科技携手生数科技，深度集成Vidu Q3模型，以“大模型+工具+场景”模式，开启“人人都是漫剧创作者”的智能新时代。

行业动态视频

3月12日

20:27

公众号：生数科技（Vidu·视频）

35

生数科技与无界动力达成全面战略合作，共创物理AI新范式

具身智能行业动态视频

00:00

Runway：News（网页）

负责任地构建交互式 AI 角色

Runway 发布 Characters 实时视频 API，支持从单张图片生成可对话虚拟角色。文章在介绍客服、教育等应用场景的同时，重点讨论了该技术在肖像权同意、实时深度伪造欺诈、情感操纵及社交依附等方面的潜在风险。Runway 已采取内容过滤（禁止儿童与公众人物形象）、限制专业领域建议及透明度标识等安全措施，但承认随着技术进步，相关治理挑战仍需持续应对。

智能体产品更新视频

3月11日

00:00

Runway：News（网页）

Runway 成立 Runway Labs 内部孵化器

Runway 推出内部孵化器 Runway Labs，探索生成式视频与通用世界模型的新应用。由联合创始人 Alejandro Matamala Ortiz 领导，团队将快速原型化前沿实验产品。目前正在招聘设计工程师、ML工程师、全栈工程师及前创业者。

行业动态视频

3月10日

14:51

公众号：生数科技（Vidu·视频）

22

Vidu 联合浦光星奕举办首届 AIGC 内容产业大会，聚焦 AI 短剧与视频大模型应用

3月13日，Vidu 联合浦光星奕举办「AI新视界漫剧新潮流——首届AIGC内容产业大会」，邀请AI技术、影视制作、短剧平台和内容机构等领域嘉宾，共同探讨下一代内容产业机会。议题覆盖AIGC内容生产、AI短剧/AI漫剧、视频大模型应用及内容产业新商业模式。

图像生成行业动态视频

3月9日

00:00

Runway：News（网页）

精选

Runway 推出 Characters：单图实时生成可对话虚拟角色 API

Runway 推出 Characters API，基于 GWM-1 世界模型，支持用单张图片零微调生成实时可对话虚拟角色。支持自定义外观风格、声音、性格及知识库，具备自然表情、眼神、口型同步和手势。面向客户支持、培训教育和品牌营销等企业场景，已获 BBC 等采用。开发者可通过 API 集成，消费者也可在网页端体验预设角色。

智能体产品更新多模态视频

推荐理由：Runway推出实时视频Agent，单图生成可对话数字人，拓展AI交互形态

1…24 252627 28