全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态一手 · 152 条

全部一手资讯 X 论文

标签「视频」清除

4月1日周三

12:14公众号：可灵AI（快手·视频）16可灵AI清明短片引用户热议：评论区里人人都有"纸手机"

00:00Google Blog：AI（RSS）使用 Veo 3.1 Lite 构建：我们成本效益最高的视频生成模型

3月31日周二

19:03公众号：昆仑万维（天工）32昆仑万维（天工）推出「天工短剧工作台」

00:00Runway：News（网页）推出 Runway Builders 计划

00:00Runway：News（网页）Runway 推出 Runway Fund 投资基金

3月28日周六

22:34公众号：昆仑万维（天工）19昆仑万维携 SkyReels V4 与 Mureka V9 亮相2026中关村论坛，获高度赞誉

3月26日周四

12:10公众号：可灵AI（快手·视频）23周杰伦《太阳之子》AIMV创作挑战赛上线

3月25日周三

21:36Gary Marcus：The Road to AI We Can Trust（RSS）战争与 AI、Sora 的消亡，以及今日现场观看的 3 种方式

3月24日周二

15:34公众号：通义实验室（千问）51PrismAudio：声画同频，音效随行

3月23日周一

08:00OpenAI：官网动态（RSS · 排除企业/客户案例）安全使用 Sora 创作

3月20日周五

13:32公众号：生数科技（Vidu·视频）24生数科技：通用世界模型是连接数字世界与物理世界的桥梁

3月13日周五

18:07公众号：生数科技（Vidu·视频）37万兴剧厂深度集成Vidu Q3，携手生数科技开启AI漫剧创作新时代

3月12日周四

20:27公众号：生数科技（Vidu·视频）35生数科技与无界动力达成全面战略合作，共创物理AI新范式

00:00Runway：News（网页）负责任地构建交互式 AI 角色

3月11日周三

00:00Runway：News（网页）Runway 成立 Runway Labs 内部孵化器

3月10日周二

14:51公众号：生数科技（Vidu·视频）22Vidu 联合浦光星奕举办首届 AIGC 内容产业大会，聚焦 AI 短剧与视频大模型应用

3月9日周一

00:00Runway：News（网页）精选Runway 推出 Characters：单图实时生成可对话虚拟角色 API

3月6日周五

11:34公众号：生数科技（Vidu·视频）22Vidu即将亮相香港国际影视展 FILMART 30th

2月16日周一

11:52公众号：豆包（字节）41我们和贾樟柯导演合作了一支Seedance 2.0 贺岁短片

00:00LMSYS：Blog（Chatbot Arena 团队）SGLang-Diffusion：面向生产级视频生成的高级优化

2月12日周四

12:18公众号：豆包（字节）41豆包视频生成模型Seedance 2.0上线

00:00字节 Seed：Research Feed（网页内嵌数据）精选Seedance 2.0 正式发布

2月10日周二

20:09公众号：小红书技术（dots.llm）54懂剪辑，更懂叙事：FireRed-OpenStoryline--首个开源具备导演思维的视频剪辑Agent

14:02公众号：可灵AI（快手·视频）26可灵春节特效限免及奖励活动

14:02公众号：可灵AI（快手·视频）16可灵AI春节贺岁片，让爱马力全开！

00:00Runway：News（网页）Runway 获 3.15 亿美元 E 轮融资，用于扩展 World Simulation

2月5日周四

20:00公众号：生数科技（Vidu·视频）52强强联合！万兴科技携手生数科技，共拓 AI漫剧产业新蓝图

1月31日周六

14:20公众号：生数科技（Vidu·视频）44Vidu 全球生态计划正式启航

1月20日周二

08:00Hugging Face：Blog（RSS）73精选Overworld发布实时交互式视频扩散模型Waypoint-1

1月16日周五

18:39Google DeepMind：Blog（RSS）D4RT：教AI看见四维世界

1月14日周三

01:00Google DeepMind：Blog（RSS）Veo 3.1 Ingredients to Video：更强的一致性、创造力和控制力

1月5日周一

00:00Runway：News（网页）Runway基于NVIDIA Rubin平台加速视频生成与世界模型

12月13日周六

17:03美团 LongCat：HuggingFace 新模型meituan-longcat/LongCat-Video-Avatar 视频化身项目

11月7日周五

00:00LMSYS：Blog（Chatbot Arena 团队）SGLang Diffusion：加速视频与图像生成

10月28日周二

00:00MiniMax：Blog（网页）精选MiniMax 发布 Hailuo 2.3 / 2.3 Fast 视频模型

10月26日周日

01:27Google DeepMind：Blog（RSS）《ANCESTRA》幕后：Veo 与真人实景拍摄相结合

10月25日周六

00:04美团 LongCat：HuggingFace 新模型美团 LongCat-Video 项目

10月24日周五

02:38Google DeepMind：Blog（RSS）推出 Veo 3.1 及高级创意功能

10月10日周五

10:20蚂蚁 inclusionAI：GitHub 新仓库66精选Ming-VideoMAR：基于连续令牌的自回归视频生成模型

10月4日周六

08:37Sam Altman：Blog（RSS）Sora 更新 #1

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

4月1日

12:14

公众号：可灵AI（快手·视频）

16

可灵AI清明短片引用户热议：评论区里人人都有"纸手机"

可灵AI生成清明主题视频，被评价为“最有人味的片子”。视频引发评论区大量用户分享自创的“纸手机”故事，展现AI与人文情感的碰撞。该作品由快手旗下可灵AI制作，突出AI在情感表达领域的突破。

多模态教程/实践视频

00:00

Google Blog：AI（RSS）

使用 Veo 3.1 Lite 构建：我们成本效益最高的视频生成模型

Veo 3.1 Lite 现已开放付费预览，作为 Google 成本效益最高的视频生成模型，支持通过 Gemini API 调用及 Google AI Studio 测试。

Google 模型发布视频

3月31日

19:03

公众号：昆仑万维（天工）

32

昆仑万维（天工）推出「天工短剧工作台」

昆仑万维（天工）正式推出「天工短剧工作台」，以AI智能体驱动短剧内容创作流程自动化。

智能体产品更新视频

00:00

Runway：News（网页）

推出 Runway Builders 计划

Runway 推出 Runway Builders 计划，为 Seed 至 Series C 初创企业提供最高50万免费 API 积分及 Characters 实时视频代理接口。该接口基于 GWM-1 模型，支持从单张图片零微调生成可控数字角色，适用于客服、销售助手等实时交互场景。

智能体产品更新视频

00:00

Runway：News（网页）

Runway 推出 Runway Fund 投资基金

Runway 正式成立 Runway Fund，专注投资 AI、媒体与世界模拟领域的早期初创公司。基金初始规模 1000 万美元，单笔投资最高 50 万美元，重点布局 AI 研究、新应用及新媒体内容三大方向，已投项目包括 Cartesia、LanceDB 等。

行业动态视频

3月28日

22:34

公众号：昆仑万维（天工）

19

昆仑万维携 SkyReels V4 与 Mureka V9 亮相2026中关村论坛，获高度赞誉

昆仑万维在2026中关村论坛上展示两大全球顶尖模型 SkyReels V4 和 Mureka V9，获得多方高度赞誉。

图像生成行业动态视频

3月26日

12:10

公众号：可灵AI（快手·视频）

23

周杰伦《太阳之子》AIMV创作挑战赛上线

可灵AI邀请创作者参与周杰伦新歌《太阳之子》AIMV创作挑战赛，用AI影像为旋律续写MV故事，具体参与方式及规则见活动页面。

图像生成行业动态视频

3月25日

21:36

Gary Marcus：The Road to AI We Can Trust（RSS）

战争与 AI、Sora 的消亡，以及今日现场观看的 3 种方式

这是一则简短预告，作者为仓促通知致歉，宣布将围绕战争与人工智能、Sora 的终结等话题发布几项公告，同时提供今日现场观看的三种途径，但正文未透露具体发布内容、技术细节或数据指标。

大佬观点视频

3月24日

15:34

公众号：通义实验室（千问）

51

PrismAudio：声画同频，音效随行

PrismAudio 由通义实验室（千问）开源发布，定位为“更会思考的AI音效师”，能够实现声画同频、音效随行的智能音效生成。

多模态模型发布视频

3月23日

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

安全使用 Sora 创作

Sora 2 与 Sora 应用将安全作为基础架构，采用具体保护措施应对前沿视频模型与社交创作平台带来的全新安全挑战。

OpenAI 产品更新视频

3月20日

13:32

公众号：生数科技（Vidu·视频）

24

生数科技：通用世界模型是连接数字世界与物理世界的桥梁

生数科技在公众号推文中指出，通用世界模型是连接数字世界与物理世界的桥梁。文章标题与正文均为此单一观点，未提供更多细节。

多模态现象/趋势视频

3月13日

18:07

公众号：生数科技（Vidu·视频）

37

万兴剧厂深度集成Vidu Q3，携手生数科技开启AI漫剧创作新时代

万兴科技携手生数科技，深度集成Vidu Q3模型，以“大模型+工具+场景”模式，开启“人人都是漫剧创作者”的智能新时代。

行业动态视频

3月12日

20:27

公众号：生数科技（Vidu·视频）

35

生数科技与无界动力达成全面战略合作，共创物理AI新范式

具身智能行业动态视频

00:00

Runway：News（网页）

负责任地构建交互式 AI 角色

Runway 发布 Characters 实时视频 API，支持从单张图片生成可对话虚拟角色。文章在介绍客服、教育等应用场景的同时，重点讨论了该技术在肖像权同意、实时深度伪造欺诈、情感操纵及社交依附等方面的潜在风险。Runway 已采取内容过滤（禁止儿童与公众人物形象）、限制专业领域建议及透明度标识等安全措施，但承认随着技术进步，相关治理挑战仍需持续应对。

智能体产品更新视频

3月11日

00:00

Runway：News（网页）

Runway 成立 Runway Labs 内部孵化器

Runway 推出内部孵化器 Runway Labs，探索生成式视频与通用世界模型的新应用。由联合创始人 Alejandro Matamala Ortiz 领导，团队将快速原型化前沿实验产品。目前正在招聘设计工程师、ML工程师、全栈工程师及前创业者。

行业动态视频

3月10日

14:51

公众号：生数科技（Vidu·视频）

22

Vidu 联合浦光星奕举办首届 AIGC 内容产业大会，聚焦 AI 短剧与视频大模型应用

3月13日，Vidu 联合浦光星奕举办「AI新视界漫剧新潮流——首届AIGC内容产业大会」，邀请AI技术、影视制作、短剧平台和内容机构等领域嘉宾，共同探讨下一代内容产业机会。议题覆盖AIGC内容生产、AI短剧/AI漫剧、视频大模型应用及内容产业新商业模式。

图像生成行业动态视频

3月9日

00:00

Runway：News（网页）

精选

Runway 推出 Characters：单图实时生成可对话虚拟角色 API

Runway 推出 Characters API，基于 GWM-1 世界模型，支持用单张图片零微调生成实时可对话虚拟角色。支持自定义外观风格、声音、性格及知识库，具备自然表情、眼神、口型同步和手势。面向客户支持、培训教育和品牌营销等企业场景，已获 BBC 等采用。开发者可通过 API 集成，消费者也可在网页端体验预设角色。

智能体产品更新多模态视频

推荐理由：Runway推出实时视频Agent，单图生成可对话数字人，拓展AI交互形态

3月6日

11:34

公众号：生数科技（Vidu·视频）

22

Vidu即将亮相香港国际影视展 FILMART 30th

生数科技 Vidu 将在 3 月 17 日至 20 日的香港国际影视展 FILMART 上设立 Vidu Q3「为剧而生」专区，展示专为漫剧、短剧、影视剧设计的 Vidu Q3 模型。该模型是全球首个支持 16 秒音视频直出的多模态模型，具备多镜头自由切换、多语言对话及多语种文字渲染能力，旨在为影视制作与内容工业带来全新生产方式。

多模态行业动态视频

2月16日

11:52

公众号：豆包（字节）

41

我们和贾樟柯导演合作了一支Seedance 2.0 贺岁短片

字节跳动旗下豆包的AI视频生成模型Seedance 2.0与导演贾樟柯合作，推出了一支贺岁短片。

行业动态视频

00:00

LMSYS：Blog（Chatbot Arena 团队）

SGLang-Diffusion：面向生产级视频生成的高级优化

SGLang-Diffusion发布六项生产级优化，包括Token级序列分片替代帧级方案，消除14.3%的padding开销并将通信量降至0.875倍；并行折叠技术解耦文本编码器与DiT的并行策略；并行VAE实现分布式编解码，消除高分辨率视频内存瓶颈。同时修复Cache-DiT多请求稳定性问题，优化视频保存I/O性能，并针对WanVideo融合LayerNorm内核。这些改进显著提升了视频生成框架的可扩展性、效率与稳定性。

开源/仓库视频部署/工程

2月12日

12:18

公众号：豆包（字节）

41

豆包视频生成模型Seedance 2.0上线

字节跳动旗下豆包推出视频生成模型Seedance 2.0，该模型已上线。

多模态模型发布视频

00:00

字节 Seed：Research Feed（网页内嵌数据）

精选

Seedance 2.0 正式发布

Seedance 2.0 视频生成模型正式发布，综合性能达业界 SOTA 水平。新版本支持多模态输入，可同时参考 9 张图片、3 段视频、3 段音频及文本指令，精准迁移构图、动作、运镜与音效。模型支持 15 秒高质量多镜头生成，集成双声道立体声技术，并新增视频延长与编辑功能，可定向修改片段、角色及剧情。目前已在即梦 AI、豆包及火山方舟平台上线，适用于影视、广告、电商等工业级内容创作场景。

多模态模型发布视频

关联讨论 1 条字节 Seed：Research Papers（网页内嵌数据）

推荐理由：字节Seedance 2.0发布，支持多模态输入与物理稳定生成，已上线豆包即梦

2月10日

20:09

公众号：小红书技术（dots.llm）

54

懂剪辑，更懂叙事：FireRed-OpenStoryline--首个开源具备导演思维的视频剪辑Agent

FireRed-OpenStoryline 今日正式开源，成为首个具备导演思维的视频剪辑Agent，将大模型能力从文本、图像拓展至视频剪辑领域。

智能体多模态开源/仓库视频

14:02

公众号：可灵AI（快手·视频）

26

可灵春节特效限免及奖励活动

可灵春节特效限免，邀请好友可获奖励，会员卡与灵感值免费领取，最高可领12000灵感值。

行业动态视频

14:02

公众号：可灵AI（快手·视频）

16

可灵AI春节贺岁片，让爱马力全开！

可灵AI发布2026贺岁短片，用AI生成暖心内容。用户参与评论区互动，有机会获得黑金会员奖励。

行业动态视频

00:00

Runway：News（网页）

Runway 获 3.15 亿美元 E 轮融资，用于扩展 World Simulation

Runway 宣布完成 3.15 亿美元 E 轮融资，由 General Atlantic 领投，NVIDIA、Adobe Ventures 等参投。本轮资金将用于预训练下一代 world models 并拓展至新产品和行业。公司正在招聘。

多模态行业动态视频

2月5日

20:00

公众号：生数科技（Vidu·视频）

52

强强联合！万兴科技携手生数科技，共拓 AI漫剧产业新蓝图

万兴科技加码AI漫剧，战略投资生数科技Vidu，双方将展开多方面合作。

行业动态视频

1月31日

14:20

公众号：生数科技（Vidu·视频）

44

Vidu 全球生态计划正式启航

Vidu 全球生态计划正式启航，以“创想共赢”为核心理念，面向全球开放生态合作。该计划由生数科技旗下 Vidu 发起，旨在携手全球伙伴共同推动视频创作生态发展。

行业动态视频

1月20日

08:00

Hugging Face：Blog（RSS）

精选73

Overworld发布实时交互式视频扩散模型Waypoint-1

Overworld推出实时交互式视频扩散模型Waypoint-1，用户可通过文本、鼠标和键盘实时控制生成可步入的虚拟世界。该模型基于帧因果校正流变换器架构，在1万小时游戏视频及对应控制数据上训练，从一开始就专注于交互体验，支持零延迟的自由操控。其配套的高性能推理库WorldEngine在消费级硬件上可实现流畅运行，例如Waypoint-1-Small在RTX 5090上能以30 FPS（4步去噪）或60 FPS（2步去噪）生成画面。模型采用扩散强制预训练和自我强制后训练来确保生成长序列的稳定性。

智能体 Hugging Face 模型发布视频

推荐理由：零延迟交互式视频生成，游戏和创意应用开发者的福音。

1月16日

18:39

Google DeepMind：Blog（RSS）

D4RT：教AI看见四维世界

D4RT 实现统一高效的4D重建与追踪，速度较先前方法提升最高达300倍，为四维计算机视觉领域提供高效解决方案。

DeepMind Google 多模态视频

1月14日

01:00

Google DeepMind：Blog（RSS）

Veo 3.1 Ingredients to Video：更强的一致性、创造力和控制力

Veo 3.1 版本新增竖屏视频生成功能，输出画面动态效果更自然生动，在一致性与创造力方面均有提升。

Google 产品更新视频

1月5日

00:00

Runway：News（网页）

Runway基于NVIDIA Rubin平台加速视频生成与世界模型

Runway率先在NVIDIA Rubin平台部署视频生成模型Gen-4.5与世界模型GWM-1。Gen-4.5在一天内从Hopper迁移至Vera Rubin NVL72，展现平台后向兼容性与生产就绪能力。Rubin单GPU提供50 PF推理算力，可加速实时长视频生成。GWM-1作为Runway首个通用世界模型家族，支持物理感知机器人训练、可探索虚拟世界及交互式化身，推动AI从文本理解向物理世界模拟演进。

产品更新具身智能视频

12月13日

17:03

美团 LongCat：HuggingFace 新模型

meituan-longcat/LongCat-Video-Avatar 视频化身项目

meituan-longcat 发布 LongCat-Video-Avatar 视频数字人项目，致力于通过开源与开放科学推进人工智能技术的普及与民主化。该项目旨在打破视频化身技术壁垒，将先进的 AI 能力开放给更广泛的开发者社区，推动前沿技术的平民化应用与生态发展。

Hugging Face 模型发布视频

11月7日

00:00

LMSYS：Blog（Chatbot Arena 团队）

SGLang Diffusion：加速视频与图像生成

SGLang 推出 Diffusion 推理引擎，将高性能 LLM 服务架构扩展至视频与图像生成领域。该系统支持 Wan、Hunyuan、Qwen-Image、Flux 等主流开源扩散模型，在 H100/H200 GPU 上实现 1.2-5.9 倍加速。通过 ComposedPipelineBase 架构抽象与统一序列并行技术，提供 OpenAI 兼容 API、CLI 及 Python 接口，并与 FastVideo 合作覆盖从训练到部署的全流程。

图像生成开源/仓库视频部署/工程

10月28日

00:00

MiniMax：Blog（网页）

精选

MiniMax 发布 Hailuo 2.3 / 2.3 Fast 视频模型

MiniMax 推出 Hailuo 2.3 视频生成模型，在物理动作流畅度、艺术风格化（支持动漫、水墨、游戏 CG）及角色微表情方面显著提升，维持 Hailuo 02 原价，Fast 版本批量创作成本降低 50%。Hailuo Video Agent 同步升级为 Media Agent，支持多模态一键视频生成与分步自定义创作，已全平台上线并开放免费试用。

智能体模型发布视频

关联讨论 1 条MiniMax：Blog（网页）

推荐理由：MiniMax 发布 Hailuo 2.3 视频模型及 Media Agent，支持多模态一键生成

10月26日

01:27

Google DeepMind：Blog（RSS）

《ANCESTRA》幕后：Veo 与真人实景拍摄相结合

与导演 Darren Aronofsky、Eliza McNitt 及超 200 人团队合作，采用 Veo AI 视频生成与真人实景拍摄结合的方式制作电影《ANCESTRA》。

DeepMind Google 产品更新多模态

10月25日

00:04

美团 LongCat：HuggingFace 新模型

美团 LongCat-Video 项目

美团 LongCat-Video 项目秉持开源与开放科学理念，致力于推进并普及人工智能技术。该项目通过开放源代码的方式，旨在降低 AI 技术应用门槛，打破技术壁垒，促进视频领域人工智能技术的广泛传播与创新发展，体现了推动 AI 技术民主化与开源生态建设的长期愿景。

Hugging Face 模型发布视频

10月24日

02:38

Google DeepMind：Blog（RSS）

推出 Veo 3.1 及高级创意功能

Veo 3.1 正式发布，带来重大功能更新。此次升级为用户提供更强大的高级创意控制能力，让创作过程更加灵活高效，满足多样化的创意需求。

Google 产品更新视频

10月10日

10:20

蚂蚁 inclusionAI：GitHub 新仓库

精选66

Ming-VideoMAR：基于连续令牌的自回归视频生成模型

Ming-VideoMAR 是一款仅解码器的自回归图像到视频生成模型，采用连续令牌统一视觉表征。它首次将时间因果性与空间双向性作为视频自回归核心原则，并提出了整合掩码生成的下一帧扩散损失。该模型首次实现了视频生成的零样本分辨率缩放，能灵活生成远超训练分辨率的视频。其在训练与推理效率上表现突出，参数量、训练数据量和GPU消耗仅为之前最佳模型Cosmos的极小比例（9.3%、0.5%和0.2%），同时在定量与定性评估中均实现超越。模型代码与检查点已开源，论文已被NeurIPS 2025接收。

开源/仓库数据/训练模型发布视频

推荐理由：蚂蚁把自回归视频生成的训练成本砍到 Cosmos 的 0.2% 还能赢，这个效率信号比分数本身更值得关注，做视频生成的团队该认真看看它的课程学习和渐进分辨率策略。

10月4日

08:37

Sam Altman：Blog（RSS）

Sora 将推出两项更新：一是为版权方提供更细粒度的角色生成控制，允许其指定角色使用方式（包括完全禁止）；二是启动视频生成商业化，计划与选择加入的版权方分享用户生成内容带来的收入。OpenAI 表示用户生成量远超预期，许多视频仅面向小众受众。公司特别提到日本创作者的内容产出表现突出，并承诺将像早期 ChatGPT 时代一样快速迭代，根据反馈及时调整策略。

OpenAI 产品更新视频