全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「视频」清除

4月28日周二

19:35公众号：生数科技（Vidu·视频）24降本50%，效率提升10倍，Vidu发布一键生成AI解说剧产品，重塑解说剧生产链路

17:35阿绎 AYi56AI生成"刀马舞"视频及零门槛副业路径分享

17:26PixVerse40欢乐马匹上线PixVerse 限时五折优惠

16:06Kling AI544K捕捉雨中光影展现城市雨景细节

12:34HuggingFace Daily Papers（社区热门论文）61World-R1：通过强化学习为文本到视频生成强化3D约束

12:34HuggingFace Daily Papers（社区热门论文）39OmniShotCut：基于镜头查询Transformer的整体关系式镜头边界检测

12:00Alibaba Cloud30阿里云新加坡AI视频挑战赛启动，工作坊反响热烈

11:45PixVerse27创意伙伴践行AI向善，共赴日内瓦电影节

09:32Alibaba Cloud26HappyHorse登陆GMI平台

01:18Runway45Runway线上API黑客松启动奖金2.5万美元

00:49AK49构建人类与AI协同监督的精准视频语言模型

00:44凡人小北35整合多款AI与地图API自动生成路线引导视频

00:34AK48语义进展函数实现视频分析与生成

4月27日周一

21:25阿绎 AYi60AI技术赋能普通人创作赛博朋克版《权游》，降低影视制作门槛并开辟副业新路径

20:30公众号：可灵AI（快手·视频）25可灵AI创作者计划3.0正式升级！

08:00HuggingFace Daily Papers（社区热门论文）47X2SAM：面向图像与视频的统一分割多模态大语言模型

08:00HuggingFace Daily Papers（社区热门论文）56Co-Director：一种智能生成视频叙事的分层多智能体框架

01:18阿绎 AYi51Seedance 2.0提示词一键生成电影级视频，AI副业红利期来临

4月26日周日

23:18阿绎 AYi54好莱坞的终结？AI重塑影视创作门槛

21:22Rohan Paul41Medeo AI整合GPT Image 2.0与Seedance 2.0，统一创意工作流

20:52Rohan Paul39Medeo AI整合GPT Image 2.0与Seedance 2.0，统一创意工作流

16:23Kling AI39Kling 4K展现发丝级细节

15:21阿绎 AYi44AI视频生成颠覆创作，Seedance 2.0让历史大片触手可及

11:30公众号：可灵AI（快手·视频）42可灵AI 4K实战评测：一杯奶茶钱做4K时尚大片

11:21阿绎 AYi47AI视频副业：零门槛生成美女跳舞视频快速变现

08:00HuggingFace Daily Papers（社区热门论文）44Talker-T2AV：基于自回归扩散建模的联合语音-视频生成

00:58阿绎 AYi40AI工具颠覆游戏预告制作，个人可快速生成AAA级演示视频

4月25日周六

23:58阿绎 AYi37Seedance 2.0与Rita平台复刻经典AI视频，创作重心转向创意

21:20阿绎 AYi32苹果手工广告反AI宣言，推荐Rita视频制作工具

20:00Kling AI43Kling4K驱动图像海报变4K动态

17:40阿绎 AYi42Rita平台直连原版Seedance 2.0，性价比之选

16:00Kling AI434K画质纤毫毕现光线轨迹清晰可辨

4月24日周五

15:55公众号：可灵AI（快手·视频）33可灵AI原生4K直出功能上线

11:19AK44视频时序流学习新研究

11:17HuggingFace Daily Papers（社区热门论文）56快慢之间：学习视频中的时间流

08:00HuggingFace Daily Papers（社区热门论文）59通过语义进度函数进行视频分析与生成

08:00HuggingFace Daily Papers（社区热门论文）52FlowAnchor：稳定免反演视频编辑中的编辑信号

4月23日周四

23:05公众号：可灵AI（快手·视频）49可灵AI 4K影像创作大赛今日开启！

23:05公众号：可灵AI（快手·视频）53可灵AI实现4K画质与团队会员跨空间管理双重升级

4月22日周三

22:44Rohan PaulHeyGen Instant Highlights V2：提示词搜索自动剪辑长视频

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

4月28日

19:35

公众号：生数科技（Vidu·视频）

24

降本50%，效率提升10倍，Vidu发布一键生成AI解说剧产品，重塑解说剧生产链路

Vidu发布一键生成AI解说剧产品，实现降本50%、效率提升10倍，重新塑造解说剧生产链路。该产品无需人工剪辑与配音，可自动完成解说剧的全部生成流程，推动内容创作进入全AI化阶段。

产品更新图像生成视频

17:35

阿绎 AYi@AYi_AInotes

56

AI生成"刀马舞"视频及零门槛副业路径分享

推文展示了一段以假乱真的AI生成“刀马舞”手势舞视频，并分享了利用此技术快速创收的副业方法。该方法门槛极低，仅需电脑，无需囤货、开店或露脸。核心是使用Rita平台的Seedance2.0和GPT-image-2模型，批量生成高质量美女跳舞视频，发布到小红书、抖音、支付宝视频号等平台获取流量分成。粉丝增长后可接品牌商单，成本远低于真人网红。推文强调该赛道尚处红利期，并附上了详细的视频分镜提示词和负面提示词以确保生成质量。

阿绎 AYi: 很多人总说AI没用,我觉得那是因为你光刷不用,真正能赚钱的人早就闷声发大财了。分享一个用 AI 做副业的路子, 有点野,基本上算零门槛,见钱快(`・ω・ ́)💰 为啥说零门槛: 首先不用囤货不用开店不用露脸,一台电脑就能干,成本低到可以...

图像生成教程/实践视频

17:26

PixVerse@PixVerse_

40

Happy Horse 已正式驰骋进入 PixVerse。从一个提示开始，或放入第一帧并让它自由发挥。限时优惠 - 额外 50% 折扣截止时间：5月6日 · 07：00 UTC / 00：00 PDT 备好马鞍。立即在 PixVerse 上尝试 Happy Horse。转发+关注+回复 = 300积分（仅限48小时）

产品更新图像生成视频

16:06

Kling AI@Kling_ai

54

720p 看到了雨城，但 4K 看见了雨中每一缕光。🌧️ 在 Kling 4K 中查看更多。

产品更新图像生成视频

12:34

HuggingFace Daily Papers（社区热门论文）

61

World-R1：通过强化学习为文本到视频生成强化3D约束

针对现有视频基础模型常出现几何不一致的问题，研究团队提出World-R1框架。该框架无需修改底层模型架构，而是通过强化学习，利用预训练的3D基础模型和视觉语言模型的反馈进行优化，从而将视频生成与3D约束对齐。团队构建了专用的世界模拟纯文本数据集，并采用周期性解耦训练策略来平衡几何一致性与场景动态流畅性。评估表明，该方法在保持基础模型原有视觉质量的同时，显著提升了3D一致性，有效弥合了视频生成与可扩展世界模拟之间的差距。

数据/训练视频论文/研究

12:34

HuggingFace Daily Papers（社区热门论文）

39

OmniShotCut：基于镜头查询Transformer的整体关系式镜头边界检测

针对现有镜头边界检测方法存在边界不可解释、遗漏细微间断、依赖噪声标注与过时基准等问题，本研究提出OmniShotCut方法。该方法将镜头边界检测构建为结构化关系预测任务，通过基于镜头查询的密集视频Transformer，联合估计镜头范围及其内外关系。为规避人工标注不精确，采用全合成过渡合成流程自动生成带精确边界及参数化变体的主要过渡类型。同时，发布了支持整体与诊断评估的现代宽领域基准OmniShotCutBench。

多模态视频论文/研究

12:00

Alibaba Cloud@alibaba_cloud

30

阿里云新加坡AI视频挑战赛启动，工作坊反响热烈

阿里云在新加坡举办的“SG WANders AI视频挑战赛”已拉开序幕，首场AI工作坊吸引了近200名参与者，反响热烈。注册即将截止，主办方鼓励参与者把握最后机会报名，并有机会赢取奖品。第二场工作坊定于5月4日举行，旨在帮助参与者利用阿里云的WAN模型学习、创作和完善其AI视频作品。本次活动由阿里云与FizzDragon联合组织，并得到了新加坡工艺教育学院等多家机构的协作支持。

图像生成行业动态视频

11:45

PixVerse@PixVerse_

27

很好的公益广告！看到我们的创意合作伙伴实践 AI for Good，真受鼓舞。加入与 PixVerse 的 AI for Good 电影节 - 让我们一起前往日内瓦！详情 >> https://app.pixverse.ai/challenge/brand/398802048463808

Ashraf Ghori: Mental Health Matters. SuperBowl Commercial #PixVerseSpotlightChallenge #PixVerseV6 #AnthumAI Made by PixVerse V6 @PixVe...

行业动态视频

09:32

Alibaba Cloud@alibaba_cloud

26

HappyHorse现已登陆GMI 【引用 @gmi_cloud】：Happy Horse is on GMI @HappyHorseATH 又一个将我们推向电影级制作的视频模型👇

GMI Cloud: Happy Horse is on GMI @HappyHorseATH another video model that pushes us closer to cinematic production 👇

行业动态视频

01:18

Runway@runwayml

45

我们的首次线上Runway API黑客马拉松将于下周开始。一个周末。免费API额度。25，000美元奖金池。构建实时视频智能体、智能媒体流水线或任何你能想象的项目。无需经验。通过下方链接了解更多信息并注册。

智能体行业动态视频

00:49

AK@_akhaliq

49

构建一个由人类与AI监督的精确视频语言 paper： https://huggingface.co/papers/2604.21718

多模态视频论文/研究

00:44

凡人小北@frxiaobei

35

开发者通过整合Google Maps的街景与3D视图功能，利用OPENAI进行路线优化与关键地点提取，并结合预设的角色卡，调用Seedance的API，实现了从起点到终点的引导视频自动生成。该系统能自动选取路线中的标志性地标，并将虚拟角色融入场景进行引导。生成的视频片段经手动合成编辑后，最终形成完整的导航视频，展现了AI技术对生活方式的革新。

梁: 重新优化了一天, 调用googlemap的街景功能和3D视图功能, 用OPENAI进行优化与关键地点提取, 结合设计好的角色卡, 调用Seedance的API, 自动生成一个从起点到终点的案内视频。自动挑选路线中的几个标志性地点, 然后让...

多模态教程/实践视频

00:34

AK@_akhaliq

48

通过语义进展函数进行视频分析与生成 paper： https://huggingface.co/papers/2604.22554

多模态视频论文/研究

4月27日

21:25

阿绎 AYi@AYi_AInotes

60

AI技术赋能普通人创作赛博朋克版《权游》，降低影视制作门槛并开辟副业新路径

网友利用GPT-image-2和Seedance 2.0等AI工具，创作出赛博朋克风格的《权力的游戏：2048》概念短片，将维斯特洛大陆重构为反乌托邦世界，其电影级质感可媲美HBO原作。这标志着AI技术正将曾属于好莱坞的顶级创作权下放给普通人，大幅降低了史诗级内容的制作门槛。同时，AI也成为有效的创收工具，例如通过特定平台批量生成“AI美女跳舞”类短视频，可凭借流量分成和商单实现低门槛副业盈利，目前该赛道仍处红利期。

阿绎 AYi: 很多人总说AI没用,我觉得那是因为你光刷不用,真正能赚钱的人早就闷声发大财了。分享一个用 AI 做副业的路子, 有点野,基本上算零门槛,见钱快(`・ω・ ́)💰 为啥说零门槛: 首先不用囤货不用开店不用露脸,一台电脑就能干,成本低到可以...

OpenAI 图像生成教程/实践视频

20:30

公众号：可灵AI（快手·视频）

25

可灵AI创作者计划3.0正式升级！

产品更新视频

08:00

HuggingFace Daily Papers（社区热门论文）

47

X2SAM：面向图像与视频的统一分割多模态大语言模型

X2SAM是一个统一的分割多模态大语言模型，它将图像中的任意分割能力扩展至视频。该模型结合大语言模型与存储引导视觉特征的掩码记忆模块，能依据对话指令和视觉提示生成时间一致的视频掩码，并支持图像与视频输入下的通用、开放词汇、指代、推理及交互式分割。研究团队提出了视频视觉基础分割基准V-VGD，用于评估模型根据交互式视觉提示分割视频物体轨迹的能力。通过跨异构数据集的统一联合训练，X2SAM在视频分割上表现优异，在图像分割基准上保持竞争力，同时保留了通用的图像与视频对话能力。

多模态视频论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

56

Co-Director：一种智能生成视频叙事的分层多智能体框架

针对当前智能体视频生成流程存在的语义漂移与级联失败问题，研究团队提出了Co-Director。该框架将视频叙事构建为全局优化问题，其核心是分层参数化设计：全局层采用多臂老虎机探索有潜力的创意方向，局部层通过多模态自优化循环来缓解身份漂移并确保序列一致性，从而平衡叙事策略探索与创意配置利用。为进行评估，团队构建了包含400个场景的个性化广告数据集GenAD-Bench。实验表明，Co-Director在生成连贯性上显著优于现有先进基线，并能无缝泛化至更广泛的电影叙事场景。

智能体视频论文/研究

01:18

阿绎 AYi@AYi_AInotes

51

Seedance 2.0提示词一键生成电影级视频，AI副业红利期来临

作者分享Seedance 2.0的提示词，可一次性生成高质量视频，无需返工，实现低成本电影级别制作。引用推文指出，利用Rita平台的Seedance2.0和GPT-image-2批量生成AI美女跳舞视频，在小红书、抖音和支付宝视频号等平台通过流量分成和商单盈利，适合零门槛副业。当前赛道处于红利期，提示词到位即可高效产出内容，大幅降低传统拍摄成本。

阿绎 AYi: 很多人总说AI没用,我觉得那是因为你光刷不用,真正能赚钱的人早就闷声发大财了。分享一个用 AI 做副业的路子, 有点野,基本上算零门槛,见钱快(`・ω・ ́)💰 为啥说零门槛: 首先不用囤货不用开店不用露脸,一台电脑就能干,成本低到可以...

图像生成教程/实践视频

4月26日

23:18

阿绎 AYi@AYi_AInotes

54

好莱坞的终结？AI重塑影视创作门槛

用户利用Seedance 2.0等AI工具，仅用几分钟便生成了质感精良的《水浒传》明星选角概念视频，成本极低。视频中，莱昂纳多、锤哥、范·迪塞尔等演员被精准“分配”给宋江、李逵、鲁智深等角色，效果逼真。这凸显了AI技术正将影视行业中最依赖经验与资本的选角、视觉制作门槛急剧降低，使得个人能够轻松地将创意构想转化为高质量视觉内容，预示着创作权力格局的深刻变化。

阿绎 AYi: 很多人总说AI没用,我觉得那是因为你光刷不用,真正能赚钱的人早就闷声发大财了。分享一个用 AI 做副业的路子, 有点野,基本上算零门槛,见钱快(`・ω・ ́)💰 为啥说零门槛: 首先不用囤货不用开店不用露脸,一台电脑就能干,成本低到可以...

图像生成教程/实践视频

21:22

Rohan Paul@rohanpaul_ai

41

Medeo AI推出集成式创意工具，将GPT Image 2.0的高质量图像生成与Seedance 2.0的电影级视频生成结合在同一工作流中。该方案允许用户无需切换工具即可完成从静态图像到动态视频的创作，并支持提示词复用，实现资产无缝衔接。目前正限时免费提供GPT Image 2.0的访问权限，旨在通过整合多款顶尖AI模型提升全流程创作效率。

Medeo_AI: Everyone's talking about GPT Image 2.0💥 Looking for perfect quality photos? GPT Image 2.0 does exactly this What about ...

产品更新图像生成视频

20:52

Rohan Paul@rohanpaul_ai

39

Medeo AI推出整合性创意工具，将GPT Image 2.0的高质量图像生成与Seedance 2.0的电影感视频生成结合在单一工作流中。该方案允许用户在同一管道内完成图像生成、视频生成及提示词复用，实现静态帧到动态画面的无缝转换，无需手动切换工具或重复导出。目前正限时免费提供GPT Image 2.0的访问权限。

Medeo_AI: Everyone's talking about GPT Image 2.0💥 Looking for perfect quality photos? GPT Image 2.0 does exactly this What about ...

产品更新图像生成视频

16:23

Kling AI@Kling_ai

39

720p 看到了轮廓，但 4K 能看到每一根在阳光下闪耀的发丝。✨ 在 Kling 4K 中查看更多。

产品更新图像生成视频

15:21

阿绎 AYi@AYi_AInotes

44

AI视频生成颠覆创作，Seedance 2.0让历史大片触手可及

用户通过Rita平台使用原版Seedance 2.0模型，仅用几分钟便生成出描绘“刘邦白登之围”历史场景的高质量视频。该体验凸显AI视频生成的核心价值并非单纯提升画质与流畅度，而是将导演门槛降至极低，使个人能快速将创意视觉化。此前创作受限于资金、技术等瓶颈，如今工具便捷性解放了想象力，让创意成为唯一核心。引用推文补充指出，Rita平台直接接入未降配的Seedance 2.0，提供高并发、分钟级出片且成本较低的服务，进一步降低了工具使用门槛。

阿绎 AYi: 兄弟们,挖到一个好东西,必须分享出来,直接说结论: 目前能跑原版Seedance 2.0、不排队、不降智、还能传真人照片生成真人视频的平台, 性价比最高的就是Rita, 总之强烈推荐,冲就完了! 有好多兄弟私信问我,怎么好久没发AIGC内...

图像生成教程/实践视频

11:30

公众号：可灵AI（快手·视频）

42

可灵AI 4K实战评测：一杯奶茶钱做4K时尚大片

可灵AI推出4K实战评测，展示以“一杯奶茶钱”的低成本制作4K分辨率时尚大片的流程与效果，验证AI视频工具在影视级创作中的性价比与可行性。

教程/实践视频

11:21

阿绎 AYi@AYi_AInotes

47

AI视频副业：零门槛生成美女跳舞视频快速变现

AI可用于低门槛副业赚钱，通过Rita平台直接接入原版Seedance2.0，结合GPT-image-2批量生成AI美女跳舞视频。该平台不排队、不降智且性价比高，适合快速出片。视频可发布到小红书、抖音和支付宝视频号，利用平台创作者扶持获取流量分成，覆盖成本并盈利。粉丝增长后能吸引内衣美妆品牌商单，因报价远低于真人网红。当前赛道仍处红利期，强调执行力是关键。

阿绎 AYi: 兄弟们,挖到一个好东西,必须分享出来,直接说结论: 目前能跑原版Seedance 2.0、不排队、不降智、还能传真人照片生成真人视频的平台, 性价比最高的就是Rita, 总之强烈推荐,冲就完了! 有好多兄弟私信问我,怎么好久没发AIGC内...

图像生成教程/实践视频

08:00

HuggingFace Daily Papers（社区热门论文）

44

Talker-T2AV：基于自回归扩散建模的联合语音-视频生成

Talker-T2AV提出了一种自回归扩散框架，用于联合生成语音和视频。其核心设计是将高级语义建模与低级细节渲染解耦：一个共享的自回归语言模型在统一的块级标记空间中对音视频进行联合推理，而两个轻量级的扩散Transformer头则分别解码出帧级的音频和视频潜在表示。该方法避免了现有模型在去噪过程中全程强制跨模态纠缠的弊端，更符合语音驱动面部合成任务的特点。在语音肖像基准测试中，该模型在唇部同步准确性、视频质量和音频质量上均优于双分支基线，实现了比级联方法更强的跨模态一致性。

多模态视频论文/研究

00:58

阿绎 AYi@AYi_AInotes

40

AI工具颠覆游戏预告制作，个人可快速生成AAA级演示视频

一段由GPT Image 2和Seedance 2生成的21秒“AAA游戏实机演示”视频引发热议。该视频呈现了从角色定制到赛博朋克街头游玩的完整流程，视觉效果堪比《赛博朋克2077》，但实为纯AI生成的概念视频。这凸显了AI工具对游戏行业预制作和营销环节的冲击：以往需庞大团队、高昂成本和数月时间的预渲染演示，现在个人用一台电脑、少量费用和极短时间即可完成，大幅降低了精美预告片的制作门槛，可能改变行业的投资与宣传模式。

阿绎 AYi: 兄弟们,挖到一个好东西,必须分享出来,直接说结论: 目前能跑原版Seedance 2.0、不排队、不降智、还能传真人照片生成真人视频的平台, 性价比最高的就是Rita, 总之强烈推荐,冲就完了! 有好多兄弟私信问我,怎么好久没发AIGC内...

图像生成现象/趋势视频

4月25日

23:58

阿绎 AYi@AYi_AInotes

37

Seedance 2.0与Rita平台复刻经典AI视频，创作重心转向创意

用户通过Seedance 2.0和Rita平台制作AI视频，复刻了潘金莲与西门庆等经典场景，并分享提示词技巧。Rita平台直接接入原版Seedance 2.0，模型无降智，支持高并发分钟级出片，月费11.99美元可跑30条4秒视频。工具门槛降低后，创作瓶颈从工具操作转向创意打磨，更多时间用于优化prompt和画面分镜。推荐提示词已放在评论区供取用。

阿绎 AYi: 兄弟们,挖到一个好东西,必须分享出来,直接说结论: 目前能跑原版Seedance 2.0、不排队、不降智、还能传真人照片生成真人视频的平台, 性价比最高的就是Rita, 总之强烈推荐,冲就完了! 有好多兄弟私信问我,怎么好久没发AIGC内...

MCP/工具教程/实践视频

21:20

阿绎 AYi@AYi_AInotes

32

苹果手工广告反AI宣言，推荐Rita视频制作工具

苹果MacBook Neo广告采用纯手工实拍定格动画制作，强调“no AI used”，以人类劳动价值对抗AI生成内容的泛滥，形成对AI时代的反思。同时，推文推荐AI视频制作工具Rita，它直接接入原版Seedance 2.0官方接口，支持上传真人照片生成视频，具有不排队、不降智和高性价比的优势。工具门槛降低后，创作瓶颈从技术转向创意，凸显了AI辅助下创意表达的新可能。

阿绎 AYi: 兄弟们,挖到一个好东西,必须分享出来,直接说结论: 目前能跑原版Seedance 2.0、不排队、不降智、还能传真人照片生成真人视频的平台, 性价比最高的就是Rita, 总之强烈推荐,冲就完了! 有好多兄弟私信问我,怎么好久没发AIGC内...

20:00

Kling AI@Kling_ai

43

看 Image 2 海报在 Kling4K 驱动下，转变为惊艳的 4K 动态效果。

产品更新图像生成视频

17:40

阿绎 AYi@AYi_AInotes

42

Rita平台直连原版Seedance 2.0，性价比之选

博主推荐Rita作为目前性价比最高的AI视频生成平台。该平台是GamsGo旗下产品，与字节官方合作，直接接入未经降配的原版Seedance 2.0模型，无需排队且生成速度快。其Mega套餐月费为11.99美元，可生成30条4秒视频，新用户注册赠送积分。博主通过生成“潘金莲与西门庆重逢”等视频测试，确认其画面细节与官方效果一致，认为该平台降低了工具门槛，使创作者能将更多精力集中于创意与提示词打磨。

MCP/工具教程/实践视频

16:00

Kling AI@Kling_ai

43

720p 看到了光束，但 4K 能看到每一道穿透尘埃的光线。✨ 在 Kling 4K 中查看更多。

产品更新图像生成视频

4月24日

15:55

公众号：可灵AI（快手·视频）

33

可灵AI原生4K直出功能上线

可灵AI昨日上线原生4K直出功能，面向创作者提供商业级4K视频生成能力，实现卡号不抖动、LOGO不歪斜的画面质量，满足真实商业应用需求。

教程/实践视频

11:19

AK@_akhaliq

44

看见快与慢学习视频中的时间流论文： https://huggingface.co/papers/2604.21931

多模态视频论文/研究

11:17

HuggingFace Daily Papers（社区热门论文）

56

快慢之间：学习视频中的时间流

本研究将时间作为可学习的视觉概念，开发了用于推理与操控视频时序的模型。通过自监督学习，模型能利用视频的多模态线索检测速度变化并估计播放速率。基于此，我们从真实世界视频中构建了最大的慢动作数据集。利用该数据，我们进一步开发了具备时序控制能力的模型，包括按指定速度生成运动的“速度条件视频生成”，以及将低帧率模糊视频转换为高帧率清晰序列的“时间超分辨率”。这项研究将时间确立为视频学习中一个可操控的感知维度，为时序可控的视频生成、时间取证检测及理解事件演变的世界模型开辟了新途径。

多模态视频论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

59

通过语义进度函数进行视频分析与生成

研究团队提出了一种“语义进度函数”，用于分析和校正图像与视频生成模型中常见的非线性语义演变问题。该方法通过计算序列中每帧语义嵌入的距离，并拟合一条反映累积语义变化的平滑曲线，来揭示语义节奏的不均匀性。基于此，团队进一步提出了一种语义线性化程序，能够对序列进行重新参数化，使语义变化以恒定速率展开，从而产生更平滑、连贯的过渡。该框架是模型无关的，可用于识别时间不规则性、比较不同生成器的语义节奏，并能引导生成视频或真实视频序列朝向任意目标节奏发展。

图像生成视频论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

52

FlowAnchor：稳定免反演视频编辑中的编辑信号

研究团队提出FlowAnchor，一个无需训练、基于光流的免反演视频编辑框架。现有免反演方法在视频编辑中面临挑战，多物体或长视频场景下易失败，其根源在于高维潜在空间中编辑信号不稳定，存在空间定位不准和强度衰减问题。FlowAnchor通过空间感知注意力优化确保文本引导与空间区域精确对齐，并采用自适应强度调制维持足够编辑强度，从而稳定编辑信号，引导光流向目标分布演化。实验表明，该方法在多物体和快速运动场景中能实现更忠实、时序一致且高效的视频编辑。

多模态视频论文/研究

4月23日

23:05

公众号：可灵AI（快手·视频）

49

可灵AI 4K影像创作大赛今日开启！

图像生成行业动态视频

23:05

公众号：可灵AI（快手·视频）

53

可灵AI实现4K画质与团队会员跨空间管理双重升级

快手旗下可灵AI近日完成双重升级：视频生成支持4K画质输出，并新增团队会员跨空间管理功能。

产品更新图像生成视频

4月22日

22:44

Rohan Paul@rohanpaul_ai

HeyGen Instant Highlights V2：提示词搜索自动剪辑长视频

长视频内容挖掘通常需要人工观看、标记和剪辑。HeyGen Instant Highlights V2通过提示词搜索自动解决这一痛点，可检测相关时刻、跨镜头追踪人脸、处理多说话人场景并生成字幕。其优势在于无缝下游工作流：剪辑完成后可直接进行翻译（支持175+语言）、唇同步和4K画质升级，无需导出或借助第三方工具。

HeyGen: Your 90-min video has 15 clips hiding in it Instant Highlights V2 finds them Prompt-based search, face tracking, multi-s...

产品更新视频

1…22 232425 26…28