全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「视频」清除

5月15日周五

19:29PixVerse62Pixverse模板：让你成为全场焦点

18:54Berryxia.AI43Violin项目升级，支持音色克隆与多语言视频翻译

12:49HuggingFace Daily Papers（社区热门论文）67Causal Forcing++：用于实时交互式视频生成的可扩展少步自回归扩散蒸馏方法

11:49HuggingFace Daily Papers（社区热门论文）62SANA-WM：高效的分钟级世界模型，实现高清长视频生成与精准相机控制

11:28PixVerse49PixVerse模拟体育直播，真实感惊人

11:00公众号：可灵AI（快手·视频）52可灵AI即将亮相第79届戛纳国际电影节！

10:48HuggingFace Daily Papers（社区热门论文）67量化评估生成视频几何一致性的框架PDI-Bench

10:48HuggingFace Daily Papers（社区热门论文）68Warp-as-History：仅需一条训练视频即可泛化的相机控制视频生成

09:51Berryxia.AI11对对对！这个就是和JigSpace 的发动机的设计很接近的效果，磨具在细化一下就更好了。

09:51Berryxia.AI74开源视频翻译工具Violin发布，支持多语言与交互

09:48HuggingFace Daily Papers（社区热门论文）63RAVEN：基于一致性模型GRPO的实时自回归视频外推网络

09:41IT之家（RSS）54荣耀李健官宣：全球首款机器人手机 Robot Phone 三季度上市

08:10Runway：News（网页）67精选Runway正式进军日本市场，在东京设立总部并投入4000万美元

08:00HuggingFace Daily Papers（社区热门论文）26面向连续多无人机跟踪的拓扑感知时空切换框架

08:00HuggingFace Daily Papers（社区热门论文）62Echo-Forcing：面向交互式长视频生成的场景记忆框架

08:00HuggingFace Daily Papers（社区热门论文）56FashionChameleon：面向实时交互式人体-服装视频定制

08:00HuggingFace Daily Papers（社区热门论文）61Flash-GRPO：通过单步策略优化实现视频扩散模型的高效对齐

07:27Runway64Runway进军日本市场，投资4000万美元开设东京办公室

06:35Luma75精选Luma Agents高效生成电商素材全流程

03:05Luma43对比展示广告效果选择一目了然

02:31Chubby♨️63实测Higgsfield Supercomputer：用自然语言驱动多模型并行的AI生产力平台

5月14日周四

23:28PixVerse63一键生成F1进站时刻肖像特效

23:07Kling AI21镜头锁定你时，你才看见赛场

22:26Runway53Runway第四届AI电影节十大入围影片揭晓

21:33AK56AnyFlow模型实现任意步长视频生成

19:28PixVerse20最小观众全神贯注吃爆米花

16:06Kling AI12赛场抓拍瞬间遐想

14:58PixVerse52PixVerse V6 革新AI生成，模糊电影摄影边界

11:53CMU：Machine Learning Blog63精选教视觉-语言模型说"电影语言"

11:26向阳乔木49第三方AI客户端暂缺音视频解析功能与豆包全模态模型升级

10:45HuggingFace Daily Papers（社区热门论文）62AnyFlow：基于在线策略流图蒸馏的任意步数视频扩散模型

08:00HuggingFace Daily Papers（社区热门论文）44EverAnimate：通过潜在流修复实现分钟级人类动画

08:00HuggingFace Daily Papers（社区热门论文）48视频模型可通过可验证奖励进行推理

08:00HuggingFace Daily Papers（社区热门论文）54KVPO：基于KV语义探索的ODE原生自回归视频对齐GRPO方法

02:28PixVerse38创意视频传送门过渡获高度赞扬

00:25Runway65Runway Agent上线：对话生成完整视频

5月13日周三

23:27PixVerse57韩棒球热席卷Pixverse 模板创作正当时

23:05Kling AI60Kling AI将亮相2026戛纳探讨AI电影制作

21:01AK61长时第一人称视频理解推理基准发布

19:39阿绎 AYi24这个老哥把自己P进了《权游》，直接来了一波剧情魔改 hhh

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月15日

19:29

PixVerse@PixVerse_

62

Pixverse让你成为焦点~ 用Pixverse网页版的音乐会聚光灯模板制作吧！

产品更新视频

18:54

Berryxia.AI@berryxia

43

Violin项目升级，支持音色克隆与多语言视频翻译

Violin项目在保留核心的视频多语言翻译功能基础上，进行了多项迭代升级。新版本支持用户为目标语音选择多种角色和音色，并能在翻译成多国语言后克隆原始音色。同时，项目继续保持对多语言翻译后字幕导出的支持。这些改进旨在优化用户体验，使工具更适用于制作面向海外市场的视频播客内容。

教程/实践视频语音

12:49

HuggingFace Daily Papers（社区热门论文）

67

Causal Forcing++：用于实时交互式视频生成的可扩展少步自回归扩散蒸馏方法

本文提出Causal Forcing++，一种基于因果一致性蒸馏的少步自回归扩散蒸馏管道，旨在实现低延迟、流式的实时交互式视频生成。该方法针对帧级自回归和仅1-2采样步的激进设置，通过单步在线教师ODE监督来高效初始化学生模型，避免了预计算完整轨迹的开销。在帧级2步设置下，其性能超越现有最佳的4步块状方法，在多项评测指标上均有提升，同时将首帧延迟降低50%，并大幅减少训练成本。该管道还可扩展至动作条件世界模型生成。

视频论文/研究

11:49

HuggingFace Daily Papers（社区热门论文）

62

SANA-WM：高效的分钟级世界模型，实现高清长视频生成与精准相机控制

SANA-WM是一个26亿参数的高效开源世界模型，专为生成一分钟720p高清视频设计，具备精确的6自由度相机控制能力。其核心创新包括：混合线性注意力机制实现高效长上下文建模；双分支相机控制确保轨迹精准跟随；两阶段生成流程提升视频质量与一致性；以及从公开视频中提取精确位姿的鲁棒标注流程。该模型仅使用约21.3万个视频片段训练，在单GPU上即可生成60秒视频，其量化蒸馏版本在RTX 5090上仅需34秒完成去噪。在基准测试中，其动作跟随准确性优于先前开源基线，并在保持相当画质的同时，吞吐量提升36倍。

具身智能多模态视频论文/研究

11:28

PixVerse@PixVerse_

49

当PixVerse拿到媒体通行证时会发生什么这些病毒式传播的球场镜头最有趣之处在于，它们有种随机的标志性感觉。所以我用@PixVerse_重现了巴西对英格兰的SuperSport风格直播时刻，真实感简直离谱🔥 同一个世界，同一个目标。由PixVerse创作。⚽✨ #WEARE26 #PixVerseChallenge #FIFAWorldCup 📌查看下方提示👇🏾

Gilbert Odera | Your AI Plug🇰🇪: POV: The SuperSport cameraman finds the main character 😭⚽ The funniest part about these viral stadium cams is how RANDO...

图像生成教程/实践视频

11:00

公众号：可灵AI（快手·视频）

52

可灵AI即将亮相第79届戛纳国际电影节！

可灵AI将参与第79届戛纳电影节电影市场官方论坛，展示三部合作作品：李炜导演的动画电影《疍家风云》、Jon Erwin导演的电视剧集《House of David》、Eekjun Yang导演的院线电影《RAPHAEL》。论坛主题为“从创意构想到影视工业级落地：可灵AI赋能电影创作流程”，于5月18日15:30-17:30（戛纳当地时间）在戛纳影节宫主舞台举行。

行业动态视频

10:48

HuggingFace Daily Papers（社区热门论文）

67

量化评估生成视频几何一致性的框架PDI-Bench

针对生成视频模型作为隐式世界模型时几何一致性评估的挑战，研究团队提出了PDI-Bench定量评估框架。该框架通过分割与点追踪获取物体中心观测，利用单目重建将其提升至3D世界坐标，并通过计算投影几何残差来量化评估尺度-深度对齐、3D运动一致性与3D结构刚性三个关键维度。团队构建了PDI-Dataset以支持系统评测。测试表明，PDI能一致地揭示当前先进视频生成模型中未被常见感知指标捕获的几何缺陷，为推进物理基础视频生成提供了诊断工具。代码与数据集已开源。

arXiv 视频论文/研究评测/基准

10:48

HuggingFace Daily Papers（社区热门论文）

68

Warp-as-History：仅需一条训练视频即可泛化的相机控制视频生成

本文提出“Warp-as-History”方法，使冻结的视频生成模型无需训练即可零样本遵循指定相机轨迹。该方法将相机运动形变转化为具有目标帧位置对齐和可见令牌选择的伪历史序列，无需修改模型或进行测试时优化。此外，仅需在单条相机标注视频上进行轻量级离线LoRA微调，即可显著提升模型对相机轨迹的跟随能力、视觉质量和运动动态，并能泛化至未见过的视频。实验在多个数据集上验证了该方法的有效性。

图像生成视频论文/研究

09:51

Berryxia.AI@berryxia

11

对对对！这个就是和JigSpace 的发动机的设计很接近的效果，磨具在细化一下就更好了。

09:51

Berryxia.AI@berryxia

74

牛津大学博士后Kevin Lin开源了视频翻译工具Violin，可将视频自动进行语音识别、LLM翻译和语音合成，打破语言壁垒。工具支持个性化翻译风格，并能基于视频内容进行问答交互。它提供Web应用、CLI命令行及Agent Skill（如Claude Code skill）多种使用方式，默认利用Together AI的免费额度，也支持OpenAI等API。该项目旨在推动高质量视频内容的全球化传播。

Berryxia.AI: 兄弟们,这个可以啊!赶紧装起来! Kevin Lin,牛津大学博士后,前Meta和Microsoft研究员,刚刚把Violin这个开源视频翻译Skill放了出来。视频已经是互联网绝对主流的内容形式。可绝大多数高质量讲座、演讲、播客却被单...

多模态开源生态教程/实践视频

09:48

HuggingFace Daily Papers（社区热门论文）

63

RAVEN：基于一致性模型GRPO的实时自回归视频外推网络

本文提出实时自回归视频外推网络RAVEN，通过将自生成内容重组为干净历史端点与噪声状态的交织序列，对齐训练与推理时的历史分布，从而提升长序列生成质量。同时，提出一致性模型组相对策略优化方法，将一致性采样步骤重构为条件高斯转移，并直接对其应用在线强化学习，避免了先前方法中的辅助过程。实验表明，RAVEN在多项评估指标上超越近期因果视频蒸馏基线，结合CM-GRPO可进一步获得性能提升。

arXiv 视频论文/研究

09:41

IT之家（RSS）

54

荣耀李健官宣：全球首款机器人手机 Robot Phone 三季度上市

荣耀CEO李健官宣全球首款机器人手机Robot Phone将于今年第三季度上市。该手机最显著的特点是配备了一颗硕大的电动翻转三轴云台摄像头，内置2亿像素传感器，并支持向前/向后翻转。它融合了荣耀的移动影像技术与电影摄影机厂商ARRI的技术，具备AI物体追踪、AI视频剪辑与智能拍摄功能，号称是新形态的具身智能AI终端。该机外观为银灰色，背面有“α”Logo，曾在MWC 2026展会上亮相。

产品更新端侧视频

08:10

Runway：News（网页）

精选67

Runway正式进军日本市场，在东京设立总部并投入4000万美元

生成式AI公司Runway宣布在日本东京设立总部，正式进军日本市场，并计划投入4000万美元初始资金拓展业务。日本已成为Runway增长最快的市场之一，是其全球企业及自助客户的第三大市场。过去一年，日本企业客户数量增长300%，贡献了Runway亚洲总销售额的三分之一。软银、雅马哈等企业已在营销与创意流程中使用其服务。公司此次扩张旨在贴近日本领先的创意、机器人及制造行业客户，并已开始招募日本市场负责人以组建本地团队。

行业动态视频

推荐理由：Runway 在日本已有 300% 企业增长，这次砸 4000 万美元设东京办公室，对关注亚洲市场的人来说是个信号，AI 视频工具的全球化布局正在加速。

08:00

HuggingFace Daily Papers（社区热门论文）

26

面向连续多无人机跟踪的拓扑感知时空切换框架

该研究针对多无人机交通监控中因视野重叠导致车辆身份丢失、轨迹断裂的问题，提出一种实时多摄像头多车辆跟踪系统。为解决俯视图下基于外观的重识别方法存在的歧义性与计算成本问题，系统引入了轻量级的拓扑感知时空切换机制。其核心是基于队列的确定性匹配算法，利用几何重叠与虚拟车道离散化来管理身份移交。系统采用基于YOLO11与ByteTrack的高吞吐量并行管道处理并发的4K视频流。实验在复杂城市场景下验证，该系统在连续车流中实现了99.8%的切换成功率，显著优于74.1%的基于外观的重识别基线方法。

视频论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

62

Echo-Forcing：面向交互式长视频生成的场景记忆框架

现有无训练长视频生成方法因历史KV状态功能纠缠，在处理提示切换、场景遗忘与召回等交互式场景时存在瓶颈。为此，本文提出Echo-Forcing框架，包含三个核心机制：分层时间记忆、场景回放帧与差异感知记忆衰减，分别用于解耦和管理历史信息、压缩长期场景、以及自适应遗忘冲突内容。该框架能在有限缓存预算下，支持视频的平滑过渡、硬切与长程召回。在VBench-Long上的评估表明，Echo-Forcing在长视频与交互式视频生成任务中均取得了最佳整体性能。

arXiv GitHub 视频论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

56

FashionChameleon：面向实时交互式人体-服装视频定制

本文提出FashionChameleon，一个用于自回归视频生成的实时交互式人体-服装定制框架。它仅需单服装视频数据训练，通过三项核心技术实现：采用上下文学习的教师模型，在参考与服装图像不匹配时隐式保持运动连贯性；通过流式蒸馏与上下文学习提升生成一致性与效率；引入无需训练的KV缓存重调度机制，支持生成中多服装交互切换。该系统在单GPU上实现23.8 FPS的实时生成，速度比现有基线快30-180倍，并支持交互式定制与长视频一致性外推。

arXiv 视频论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

61

Flash-GRPO：通过单步策略优化实现视频扩散模型的高效对齐

Flash-GRPO是一种用于视频扩散模型与人类偏好对齐的单步训练框架，解决了现有方法计算成本高和训练不稳定的问题。该方法通过等时分组确保提示词层面的时间一致性，并利用时间梯度校正平衡不同时间步的梯度规模，从而优化策略性能。实验在1.3B至14B参数规模的模型上进行验证，结果显示Flash-GRPO在低计算预算下不仅实现了显著的训练加速，其对齐质量甚至优于全轨迹训练，同时保持了稳定的训练过程和业界领先的对齐性能。

安全/对齐视频论文/研究

07:27

Runway@runwayml

64

Runway进军日本市场，投资4000万美元开设东京办公室

Runway宣布扩张至日本，在东京设立办公室并初始投资4000万美元。日本已成为Runway最大且增长最快的市场之一，过去12个月企业客户基础增长三倍，跃升为全球第三大市场。Yamaha、NHN和SoftBank等公司正采用Runway于营销、广告和创意内容领域。此次扩张使Runway更接近日本在游戏、媒体和机器人行业的领先企业，以进一步拓展业务。

行业动态视频

06:35

Luma@LumaLabsAI

精选75

更多产品。更多市场。更多格式。再无瓶颈。定义需求。设定风格。Luma Agents 从此处理所有电商活动素材。立即扩展 → http://lumalabs.ai/app

智能体产品更新图像生成视频

推荐理由：Luma把AI生成能力打包成电商专用的Agent，直接省掉多格式物料制作的环节，做电商内容的同行可以看看实际效果是不是真有宣传的那么丝滑。

03:05

Luma@LumaLabsAI

43

并排展示。高下立判。定义比较标准。设定方向。 Luma Agents制作的每支广告，都能让选择从此变得显而易见。让选择显而易见 → http://lumalabs.ai/app

智能体产品更新视频

02:31

Chubby♨️@kimmonismus

63

实测Higgsfield Supercomputer：用自然语言驱动多模型并行的AI生产力平台

Higgsfield的Supercomputer平台允许用户以自然语言描述任务，系统从61种生产技能中自动选取，并将子任务路由至GPT-4o、Claude Opus、Gemini及多种图像视频模型并行处理。它能生成长达60分钟的视频，原生集成Obsidian构建持久化知识库，并通过27个平台连接器连接各类工具。平台运行于云端GPU基础设施，支持品牌标识锁定和后台任务调度。其技能在使用中通过版本追踪和评估测试不断自我改进，用户可通过浏览器或Telegram直接访问，无需本地设置。

Higgsfield AI 🧩: How Supercomputer works: 1. Access via browser or Telegram. No local setup 2. Describe your task 3. Orchestrates LLMs an...

智能体多模态视频评测/基准

5月14日

23:28

PixVerse@PixVerse_

63

不容错过PitCrewMoment潮流。一键将任何肖像转化为F1直播电视进站时刻。立即在PixVerse网页端尝试！

产品更新图像生成视频

23:07

Kling AI@Kling_ai

21

当镜头找到你时，你才看见赛场。🤫

22:26

Runway@runwayml

53

公布Runway第四届年度国际AI电影节十大影片入围名单。 6月11日纽约场或6月18日洛杉矶场，欢迎加入我们观看影片、聆听行业领袖分享等。门票可通过下方链接购买。

行业动态视频

21:33

AK@_akhaliq

56

AnyFlow 采用同策略流图蒸馏的任意步长视频扩散模型

数据/训练视频论文/研究

19:28

PixVerse@PixVerse_

20

看台上最小的粉丝，全神贯注地盯着爆米花。

16:06

Kling AI@Kling_ai

12

想象一下相机在比赛中捕捉到你的瞬间。

14:58

PixVerse@PixVerse_

52

PixVerse V6 的发布旨在让AI生成视频中的动态、音效、镜头行为与物理冲击感高度统一，使其如同存在于同一个真实的物理世界。该版本引入了原生音频、定向电影摄影技术和逼真的物理模拟，显著提升了动作、冲击、镜头行为与环境反应的拟真度与沉浸感。这一进展正开始模糊AI生成内容与真实电影摄影之间的界限，将AI动作场景的生成质量推向了全新的层级。

Gilbert Odera | Your AI Plug🇰🇪: PixVerse V6 is starting to blur the line between AI generation and real cinematography. Native Audio. Directional Cinema...

产品更新多模态视频

11:53

CMU：Machine Learning Blog

精选63

教视觉-语言模型说"电影语言"

研究团队与百余名专业创作者历时一年，构建了一个视频描述生成流程，其核心在于扩展精细化的人类-AI协同监督，而非单纯扩大模型规模。该研究（入选CVPR 2026亮点论文）指出，当前主流视频生成模型在理解和生成具有电影感的专业运镜（如希区柯克式滑动变焦、精确的焦点转移或荷兰角镜头）时存在明显不足，常产出通用或焦点错误的画面。这项工作揭示了一条通过提升监督质量来增强模型“电影语言”表达能力的新路径。

多模态视频论文/研究

推荐理由：这篇CVPR 2026 Highlight的博客版很有意思，它用100多个专业电影人来标注视频，教VLM学会推拉摇移的镜头语言，不是又多一个数据集，而是提醒我们：高质量的人工标注可能比堆模型更重要。

11:26

向阳乔木@vista8

49

用户认为某模型表现不错，但指出当前多数第三方AI Chat客户端（如CherryStuido、Chatwise）尚不支持音视频上传解析功能。同时，豆包大模型的Doubao-Seed-2.0-lite 0428版本已完成重要升级，新增音频理解能力，成为其家族首款支持图片、视频、音频、文本四种输入的全模态理解模型，且Agent、Coding和GUI能力据称也有显著提升。

向阳乔木: 前段时间参与了 Doubao-Seed-2.0-lite 0428 内测。这个版本升级,增加了音频理解,能同时支持图片、视频、音频、文本四种输入,成为豆包大模型家族首款全模态理解模型。除了全模态理解,据说 Agent、Coding、GU...

多模态视频评测/基准语音

10:45

HuggingFace Daily Papers（社区热门论文）

62

AnyFlow：基于在线策略流图蒸馏的任意步数视频扩散模型

针对一致性蒸馏模型在测试时增加采样步数性能下降的问题，研究团队提出首个基于流图的任意步数视频扩散蒸馏框架AnyFlow。该框架将蒸馏目标从端点一致性映射转向任意时间间隔的流图转换学习，从而优化整个ODE采样轨迹。其核心创新“流图反向模拟”技术，通过将完整的欧拉展开分解为捷径流图转换，实现了高效的在线策略蒸馏，有效减少了测试时的离散化误差和因果生成中的曝光偏差。实验表明，在13亿至140亿参数规模的双向与因果架构上，AnyFlow在少步采样中性能匹配或超越基于一致性的模型，并能随采样步数增加持续提升效果。

多模态视频论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

44

EverAnimate：通过潜在流修复实现分钟级人类动画

EverAnimate是一种高效的后训练方法，用于解决长动画视频生成中因分块处理导致的背景质量下降与角色身份不一致问题。该方法通过引入持久的潜在上下文记忆来恢复漂移的流轨迹，包含两个核心机制：持久潜在传播在跨片段间传播身份与动作以减轻时间遗忘；恢复式流匹配在采样时引入隐式修复目标，通过速度调整提升片段内保真度。该方法仅通过轻量级LoRA微调，在短时和长时动画设置下均超越现有最优方案，在10秒和90秒动画上均取得了显著的指标提升。

arXiv 图像生成视频论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

48

视频模型可通过可验证奖励进行推理

研究人员提出VideoRLVR方法，利用基于规则的反馈优化视频扩散模型，使其具备可验证的推理能力。该方法将视频推理建模为生成可验证的视觉轨迹，核心包括SDE-GRPO优化骨干、密集分解奖励以及Early-Step Focus策略。其中，Early-Step Focus策略通过将优化集中在早期去噪阶段，减少约40%训练延迟并保持性能。在Maze、FlowFree和Sokoban三个程序化生成任务中，VideoRLVR显著优于监督微调基线，尤其在成功率较低时效果突出。该模型在可验证推理基准和域外测试中也优于多个商用及开源模型，表明可验证强化学习能推动视频模型实现更可靠的规则一致视觉推理。

推理视频论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

54

KVPO：基于KV语义探索的ODE原生自回归视频对齐GRPO方法

针对流式自回归视频生成器与人类偏好对齐的挑战，现有方法依赖噪声探索和SDE策略，与蒸馏模型的ODE动态不匹配。本文提出KVPO框架，引入因果语义探索范式，将变异源从随机噪声转移至历史键值缓存，构建语义多样的生成分支；同时提出基于轨迹速度能量的速度场代理策略，在流匹配速度空间量化分支可能性，形成与ODE一致的奖励加权对比目标。实验表明KVPO在视觉质量、运动质量和文本-视频对齐方面均有提升。

arXiv 视频论文/研究

02:28

PixVerse@PixVerse_

38

你碾压了那个传送门过渡 👀

Amy G: ✨ From runway to reality... or was it just a dream? Went from posing in the studio straight into bed with a magical port...

产品更新视频

00:25

Runway@runwayml

65

认识Runway Agent。您的新AI创意伙伴，帮助您构思并制作完整的、经过音效设计和剪辑的视频。一切只需简单的对话。从广告到短片再到社交媒体内容，Runway Agent让您轻松制作更多所需内容。点击下方链接在网页版开始体验。

智能体产品更新多模态视频

5月13日

23:27

PixVerse@PixVerse_

57

棒球比赛吃热狗被4K镜头捕捉韩国棒球热潮现已登陆Pixverse网页端使用Pixverse的K-Baseball Sprint模板，立即创作你的作品吧！

产品更新图像生成视频

23:05

Kling AI@Kling_ai

60

Kling AI将亮相2026戛纳探讨AI电影制作

Kling AI将于2026年5月18日在戛纳电影节电影市场会议中举办专场活动，主题为“从创意可能到制作现实：Kling AI在电影工作流中的应用”。活动旨在探讨AI辅助电影制作的现状与未来演进。Kling AI通过支持《House of David》、《Born of the Tide》及《RAPHAEL》等项目，展示了AI在好莱坞级制作、全AI生成动画及剧情长片等实际影视生产中的多元化应用。

行业动态视频

21:01

AK@_akhaliq

61

EgoMemReason 一个用于长时第一人称视频理解的记忆驱动推理基准

推理视频论文/研究

19:39

阿绎 AYi@AYi_AInotes

24

这个老哥把自己P进了《权游》，直接来了一波剧情魔改 hhh

1…17 181920 21…28