AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态一手 · 152 条
全部一手资讯X论文
标签「视频」清除
5月22日周五
15:02公众号:月之暗面(Kimi)37Kimi 原生视频理解能力已登陆 TRAE 中国版,分享体验得 Labubu!
14:02公众号:龙猫LongCat(美团)54从高拟真到真可用,LongCat-Video-Avatar 1.5 正式开源
02:45Runway:News(网页)74同事件精选Runway发布Aleph 2.0视频编辑模型及Edit Studio应用同一事件,精选展示《Aleph 2.0 与 Edit Studio》
5月21日周四
13:43公众号:京东JoyAI49京东数字人核心能力升级
11:05公众号:火山引擎42火山剧创1.0上线:重塑短剧工业化流程,制作周期缩短80%
5月20日周三
19:09公众号:火山引擎24在戛纳,和电影大师们聊了聊Seedance
01:48Google DeepMind:Blog(RSS)83同事件精选推出Gemini Omni多模态AI模型同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
5月19日周二
14:28公众号:可灵AI(快手·视频)24可灵AI与候鸟300发起"候鸟记忆复活计划"
00:52Hugging Face:Blog(RSS)67精选NVIDIA Cosmos Predict 2.5 微调:使用 LoRA/DoRA 生成机器人视频
5月18日周一
16:07公众号:可灵AI(快手·视频)56可灵AI上线全球首个原生4K视频模型
5月17日周日
11:00公众号:可灵AI(快手·视频)35戛纳倒计时|可灵AI戛纳论坛议程抢先看
5月15日周五
11:00公众号:可灵AI(快手·视频)52可灵AI即将亮相第79届戛纳国际电影节!
08:10Runway:News(网页)67精选Runway正式进军日本市场,在东京设立总部并投入4000万美元
5月14日周四
11:53CMU:Machine Learning Blog63精选教视觉-语言模型说"电影语言"
5月11日周一
08:00Thinking Machines Lab:官方博客(RSS)59精选Thinking Machines Lab发布Interaction Models研究预览
5月6日周三
19:00公众号:可灵AI(快手·视频)39可灵AI:8所高校AI创作工坊开课,优秀作品直通釜山电影节
5月5日周二
17:32Runway:News(网页)80精选从单张图像构建实时视频智能体:Runway Characters技术解析
4月30日周四
13:03公众号:生数科技(Vidu·视频)55生数科技与星尘智能达成战略合作,共同推进具身世界模型落地
11:00公众号:可灵AI(快手·视频)33可灵AI灵感工坊·4K零距片场(北京电影主题专场)活动回顾
10:00公众号:火山引擎35巨日禄AI×火山引擎:Seedance2.0让量产"精品"成为可能
08:00OpenRouter:Announcements(RSS)52OpenRouter 四月发布亮点:视频生成、工作区、Agent SDK、重排序模型与前沿模型
08:00OpenRouter:Announcements(RSS)52OpenRouter 四月更新:视频生成、工作区、Agent SDK、Reranker 模型及前沿模型发布
4月28日周二
20:46公众号:可灵AI(快手·视频)41可灵AI超创亮相北京国际电影节,多部作品入围AIGC单元斩获大奖
19:35公众号:生数科技(Vidu·视频)24降本50%,效率提升10倍,Vidu发布一键生成AI解说剧产品,重塑解说剧生产链路
4月27日周一
20:30公众号:可灵AI(快手·视频)25可灵AI创作者计划3.0正式升级!
4月26日周日
11:30公众号:可灵AI(快手·视频)42可灵AI 4K实战评测:一杯奶茶钱做4K时尚大片
4月24日周五
15:55公众号:可灵AI(快手·视频)33可灵AI原生4K直出功能上线
4月23日周四
23:05公众号:可灵AI(快手·视频)49可灵AI 4K影像创作大赛今日开启!
23:05公众号:可灵AI(快手·视频)53可灵AI实现4K画质与团队会员跨空间管理双重升级
4月17日周五
18:00公众号:可灵AI(快手·视频)28可灵AI×艾菲 AIGC广告创作大赛征稿进行中!
4月16日周四
18:00公众号:生数科技(Vidu·视频)35红果爆款《教书五年》布局背后:Vidu&酱油动漫联手合围真人剧
4月15日周三
18:00公众号:生数科技(Vidu·视频)30生数科技Vidu发布《AI漫剧视频模型行业白皮书V1.0》
16:01公众号:可灵AI(快手·视频)36可灵AI高校创作工坊,解锁AI创作新可能
08:00OpenRouter:Announcements(RSS)57精选宣布推出视频生成功能
4月10日周五
12:00公众号:生数科技(Vidu·视频)51生数科技完成近20亿元B轮融资,以通用世界模型定义下一代数字与物理世界生产力底座
00:00Runway:News(网页)Runway 扩大与 NYU Tisch 艺术学院合作
4月9日周四
19:11公众号:生数科技(Vidu·视频)51生数科技Vidu正式上线阿里云百炼
4月8日周三
20:37公众号:可灵AI(快手·视频)44可灵AI × 清华大学 | 高校原力计划正式启幕
4月3日周五
14:14公众号:通义实验室(千问)29Wan2.7-Video 为创作自由而来
00:00Google Blog:AI(RSS)Google Vids 支持免费创建、编辑和分享视频
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月22日
15:02
公众号:月之暗面(Kimi)
37
Kimi 原生视频理解能力已登陆 TRAE 中国版,分享体验得 Labubu!
产品更新多模态视频
14:02
公众号:龙猫LongCat(美团)
54
从高拟真到真可用,LongCat-Video-Avatar 1.5 正式开源

美团技术团队正式开源 LongCat-Video-Avatar 1.5,该版本从高拟真走向真可用,将视频头像生成从室内彩排演练推向千人千面的真实应用场景。

图像生成模型发布视频
02:45
Runway:News(网页)
同事件精选74
Runway发布Aleph 2.0视频编辑模型及Edit Studio应用

Runway于2026年5月21日发布了视频编辑模型Aleph 2.0及其新产品Edit Studio。Aleph 2.0支持编辑最长30秒的1080p视频,具备精准局部编辑能力,可只改变指定内容而完全保留原视频其余部分。该模型引入了基于单帧图像的精确控制,并支持一次性跨多个镜头应用编辑。Edit Studio是基于这些新能力构建的应用,旨在帮助用户高效地将现有视频素材转化为所需版本,例如更换产品、调整背景或修复拍摄瑕疵。该功能现已向所有付费Runway桌面网页端用户开放,使用优惠码可享受套餐折扣。

产品更新视频
同一事件,精选展示《Aleph 2.0 与 Edit Studio》
推荐理由:精准局部编辑是过去一年 AI 视频工具最大的短板,Aleph 2.0 把这事做对了,预览控制加多镜头编辑让商业视频迭代成本大幅下降。
5月21日
13:43
公众号:京东JoyAI
49
京东数字人核心能力升级

京东数字人近日完成核心能力升级,从“会播、会答”的数字主播进化为面向直播经营全链路的智能增长中枢,帮助商家以更低成本打造接近真人头部达播效果的直播间。已累计服务超7万商家,2026年一季度开播量同比激增10倍。该产品为京东自研AI,曾获2024年吴文俊奖,实现长时长、自由态、高频互动,推出采销东哥、总裁、明星及IP数字人。

产品更新视频语音
11:05
公众号:火山引擎
42
火山剧创1.0上线:重塑短剧工业化流程,制作周期缩短80%

火山剧创1.0正式发布,旨在重塑短剧工业化生产流程。该产品将短剧制作周期缩短80%,通过标准化、自动化工具链提升效率,降低门槛。火山引擎依托自身技术积累,为短剧行业提供从创意到成片的一站式解决方案。

产品更新视频
5月20日
19:09
公众号:火山引擎
24
在戛纳,和电影大师们聊了聊Seedance

火山引擎的Seedance在戛纳电影节上与多位电影大师进行了交流。

其他视频
01:48
Google DeepMind:Blog(RSS)
同事件精选83
推出Gemini Omni多模态AI模型

谷歌推出原生多模态AI模型Gemini Omni,能够整合视频、图像、音频和文本等多种输入,生成高质量视频内容。其核心能力是通过自然语言对话进行视频编辑,并能保持角色一致性、物理规律与场景连贯性。首个模型Gemini Omni Flash已上线,未来将支持图像和音频输出。Gemini Omni结合了对物理世界的直觉理解与丰富的知识库,支持从写实到叙事的创意生成,并可通过多轮对话持续编辑视频,而不丢失原始场景上下文。

DeepMindGoogle多模态模型发布
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
推荐理由:Gemini Omni 把视频生成从画面堆砌推到了物理世界叙事,多轮自然语言编辑和世界知识融合是真正的代际升级,做视频内容的该重新理解工具的定义了。
5月19日
14:28
公众号:可灵AI(快手·视频)
24
可灵AI与候鸟300发起"候鸟记忆复活计划"

可灵AI与候鸟300合作推出#候鸟记忆复活计划,邀请曾参与候鸟300的艺术家用旧照片、影像、手稿或故事作为素材,通过可灵AI续写创作。活动即日起至5月31日,带话题发布视频并填写问卷即视为参与。将综合创意独特性和技术表现力筛选10支优秀作品,各奖励12,000灵感值。

图像生成行业动态视频
00:52
Hugging Face:Blog(RSS)
精选67
NVIDIA Cosmos Predict 2.5 微调:使用 LoRA/DoRA 生成机器人视频

NVIDIA Cosmos Predict 2.5 是一个 2B 参数的世界模型,可根据文本、图像或视频片段生成物理合理的视频。通过 LoRA 或 DoRA 在 DiT 的注意力层(to_q, to_k, to_v, to_out.0)和前馈层注入可训练适配器,冻结全部基座权重,在单个 80GB GPU 上即可完成参数高效微调,避免了全量微调的高成本与灾难性遗忘。该流程使用 diffusers 和 accelerate 库,利用 92 个机器人操作视频训练集与 50 个 (prompt, image) 测试对进行微调,并展示如何用微调模型生成合成机器人轨迹以支持下游机器人学习任务。支持单 GPU 与多 GPU 训练,切换不同领域适配器无需重训。

具身智能教程/实践数据/训练视频

推荐理由:这篇教程把微调Cosmos Predict 2.5的方法从头到尾讲清楚了,做机器人合成数据的同行可以直接抄作业,LoRA/DoRA切换也很方便,值得收藏。
5月18日
16:07
公众号:可灵AI(快手·视频)
56
可灵AI上线全球首个原生4K视频模型

可灵AI推出全球首个原生4K视频模型,旨在利用原生4K技术重塑创作流程,加速AI赋能影视工业级内容创作。

产品更新多模态视频
5月17日
11:00
公众号:可灵AI(快手·视频)
35
戛纳倒计时|可灵AI戛纳论坛议程抢先看
行业动态视频
5月15日
11:00
公众号:可灵AI(快手·视频)
52
可灵AI即将亮相第79届戛纳国际电影节!

可灵AI将参与第79届戛纳电影节电影市场官方论坛,展示三部合作作品:李炜导演的动画电影《疍家风云》、Jon Erwin导演的电视剧集《House of David》、Eekjun Yang导演的院线电影《RAPHAEL》。论坛主题为“从创意构想到影视工业级落地:可灵AI赋能电影创作流程”,于5月18日15:30-17:30(戛纳当地时间)在戛纳影节宫主舞台举行。

行业动态视频
08:10
Runway:News(网页)
精选67
Runway正式进军日本市场,在东京设立总部并投入4000万美元

生成式AI公司Runway宣布在日本东京设立总部,正式进军日本市场,并计划投入4000万美元初始资金拓展业务。日本已成为Runway增长最快的市场之一,是其全球企业及自助客户的第三大市场。过去一年,日本企业客户数量增长300%,贡献了Runway亚洲总销售额的三分之一。软银、雅马哈等企业已在营销与创意流程中使用其服务。公司此次扩张旨在贴近日本领先的创意、机器人及制造行业客户,并已开始招募日本市场负责人以组建本地团队。

行业动态视频

推荐理由:Runway 在日本已有 300% 企业增长,这次砸 4000 万美元设东京办公室,对关注亚洲市场的人来说是个信号,AI 视频工具的全球化布局正在加速。
5月14日
11:53
CMU:Machine Learning Blog
精选63
教视觉-语言模型说"电影语言"

研究团队与百余名专业创作者历时一年,构建了一个视频描述生成流程,其核心在于扩展精细化的人类-AI协同监督,而非单纯扩大模型规模。该研究(入选CVPR 2026亮点论文)指出,当前主流视频生成模型在理解和生成具有电影感的专业运镜(如希区柯克式滑动变焦、精确的焦点转移或荷兰角镜头)时存在明显不足,常产出通用或焦点错误的画面。这项工作揭示了一条通过提升监督质量来增强模型“电影语言”表达能力的新路径。

多模态视频论文/研究

推荐理由:这篇CVPR 2026 Highlight的博客版很有意思,它用100多个专业电影人来标注视频,教VLM学会推拉摇移的镜头语言,不是又多一个数据集,而是提醒我们:高质量的人工标注可能比堆模型更重要。
5月11日
08:00
Thinking Machines Lab:官方博客(RSS)
精选59
Thinking Machines Lab发布Interaction Models研究预览

Thinking Machines Lab发布interaction models研究预览。该模型从零训练,原生处理音频、视频和文本,采用多流微回合设计实现实时响应,无需外部脚手架。研究预览展示了全新的交互能力,并在智能性与响应性上取得综合SOTA表现。

智能体多模态模型发布视频

推荐理由:Thinking Machines 把实时交互训进了模型本身,不再是外挂脚手架,微轮次架构和 benchmark 数据很硬,做语音/视频助手的可以认真看看,虽然还是研究预览,但方向值得盯着。
5月6日
19:00
公众号:可灵AI(快手·视频)
39
可灵AI:8所高校AI创作工坊开课,优秀作品直通釜山电影节

可灵AI联合8所高校启动AI创作工坊,课程已正式开课。工坊中的优秀作品将获得直通釜山电影节的参展机会。

行业动态视频
5月5日
17:32
Runway:News(网页)
精选80
从单张图像构建实时视频智能体:Runway Characters技术解析

Runway公司推出“Characters”实时视频智能体,它能将任意单张参考图像(如真人、卡通或幻想生物照片)实时转化为具有自然对话表现力的视频角色。该技术基于其通用世界模型GWM-1,无需微调即可生成每秒24帧的高清视频,并同步口型、表情和头部运动。其核心突破在于通过自回归逐帧生成、流程优化与并行化,实现了每帧仅37毫秒的模型处理时间,以及从用户停止说话到角色开始响应仅1.75秒的服务器端延迟,从而满足了实时交互对话的严苛要求。

智能体产品更新视频

推荐理由:把单张图变成实时对话角色这件事,Runway 做到了 24fps 且 1.75 秒响应。不是预录,是真实时,还带了知识库和工具调用,做虚拟角色产品的可以直接拿来集成。
4月30日
13:03
公众号:生数科技(Vidu·视频)
55
生数科技与星尘智能达成战略合作,共同推进具身世界模型落地

生数科技与星尘智能正式宣布达成战略合作,双方将共同推进具身世界模型落地。

具身智能行业动态视频
11:00
公众号:可灵AI(快手·视频)
33
可灵AI灵感工坊·4K零距片场(北京电影主题专场)活动回顾

可灵AI在北京举办灵感工坊·4K零距片场电影主题专场活动,现场展示4K级视频创作体验。活动详情与精彩瞬间已在官方渠道发布。

行业动态视频
10:00
公众号:火山引擎
35
巨日禄AI×火山引擎:Seedance2.0让量产"精品"成为可能

巨日禄AI与火山引擎合作推出Seedance2.0,旨在实现“精品”内容的规模化生产。

产品更新视频
08:00
OpenRouter:Announcements(RSS)
52
OpenRouter 四月发布亮点:视频生成、工作区、Agent SDK、重排序模型与前沿模型

OpenRouter 四月发布涵盖视频生成、工作区(workspaces)、Agent SDK、重排序模型(reranker models)以及一批前沿模型(frontier model)的推出。

智能体产品更新视频
08:00
OpenRouter:Announcements(RSS)
52
OpenRouter 四月更新:视频生成、工作区、Agent SDK、Reranker 模型及前沿模型发布

OpenRouter 在四月推出多项更新,涵盖视频生成、工作区功能、Agent SDK、Reranker 模型以及一批前沿模型。

智能体产品更新视频
4月28日
20:46
公众号:可灵AI(快手·视频)
41
可灵AI超创亮相北京国际电影节,多部作品入围AIGC单元斩获大奖

可灵AI超创亮相北京国际电影节,多部作品入围AIGC单元并斩获大奖。

多模态行业动态视频
19:35
公众号:生数科技(Vidu·视频)
24
降本50%,效率提升10倍,Vidu发布一键生成AI解说剧产品,重塑解说剧生产链路

Vidu发布一键生成AI解说剧产品,实现降本50%、效率提升10倍,重新塑造解说剧生产链路。该产品无需人工剪辑与配音,可自动完成解说剧的全部生成流程,推动内容创作进入全AI化阶段。

产品更新图像生成视频
4月27日
20:30
公众号:可灵AI(快手·视频)
25
可灵AI创作者计划3.0正式升级!
产品更新视频
4月26日
11:30
公众号:可灵AI(快手·视频)
42
可灵AI 4K实战评测:一杯奶茶钱做4K时尚大片

可灵AI推出4K实战评测,展示以“一杯奶茶钱”的低成本制作4K分辨率时尚大片的流程与效果,验证AI视频工具在影视级创作中的性价比与可行性。

教程/实践视频
4月24日
15:55
公众号:可灵AI(快手·视频)
33
可灵AI原生4K直出功能上线

可灵AI昨日上线原生4K直出功能,面向创作者提供商业级4K视频生成能力,实现卡号不抖动、LOGO不歪斜的画面质量,满足真实商业应用需求。

教程/实践视频
4月23日
23:05
公众号:可灵AI(快手·视频)
49
可灵AI 4K影像创作大赛今日开启!
图像生成行业动态视频
23:05
公众号:可灵AI(快手·视频)
53
可灵AI实现4K画质与团队会员跨空间管理双重升级

快手旗下可灵AI近日完成双重升级:视频生成支持4K画质输出,并新增团队会员跨空间管理功能。

产品更新图像生成视频
4月17日
18:00
公众号:可灵AI(快手·视频)
28
可灵AI×艾菲 AIGC广告创作大赛征稿进行中!

可灵AI与艾菲奖联合发起AIGC广告创作大赛,设置潮宏基珠宝、云南白药、华帝、999澳诺四大品牌赛道。奖项包括艾菲奖杯/证书、万元品牌实物奖励及50万灵感值,每个赛道独立评奖。投稿周期即日起至5月25日。早鸟福利:可灵AI联合艾菲评选50件优秀作品,入选作品报名费用全额支持。

行业动态视频
4月16日
18:00
公众号:生数科技(Vidu·视频)
35
红果爆款《教书五年》布局背后:Vidu&酱油动漫联手合围真人剧

Vidu与酱油动漫合作,助力仙侠真人剧《教书五年,我教出满门妖神》热映。该剧是红果平台爆款,背后整合了AI视频生成与动漫制作资源,试图以AI赋能真人剧内容生产。

行业动态视频
4月15日
18:00
公众号:生数科技(Vidu·视频)
30
生数科技Vidu发布《AI漫剧视频模型行业白皮书V1.0》

生数科技Vidu正式发布《AI漫剧视频模型行业白皮书V1.0》,该白皮书已上市。

图像生成行业动态视频
16:01
公众号:可灵AI(快手·视频)
36
可灵AI高校创作工坊,解锁AI创作新可能

可灵AI推出高校创作工坊,面向大学生开放AI创作体验,鼓励探索AI在内容生成中的应用,解锁创作新可能。

行业动态视频
08:00
OpenRouter:Announcements(RSS)
精选57
宣布推出视频生成功能

OpenRouter平台现已上线视频生成服务。用户可通过单一API接口,直接调用顶级的视频生成模型。这一集成简化了开发流程,使开发者无需分别对接不同厂商,即可便捷地访问和使用当前领先的视频AI模型能力。

产品更新视频部署/工程

推荐理由:OpenRouter 把视频生成塞进统一 API,对已经在用它做多模型路由的开发者来说是零成本扩展,但对大多数人只是又一个聚合入口,不算必须关注的节点。
4月10日
12:00
公众号:生数科技(Vidu·视频)
51
生数科技完成近20亿元B轮融资,以通用世界模型定义下一代数字与物理世界生产力底座

生数科技完成近20亿元B轮融资,声称将以通用世界模型定义下一代数字与物理世界的生产力底座。

行业动态视频
00:00
Runway:News(网页)
Runway 扩大与 NYU Tisch 艺术学院合作

Runway 扩大与 NYU Tisch 艺术学院合作,向 ITP、IMA 及 Hyper Cinema Lab 学生开放全套 AI 工具,支持课程作业与个人创作。Runway 创始团队曾就读于 ITP,此次合作旨在让新一代创作者掌握 AI 时代的电影与艺术工作流。

行业动态视频
4月9日
19:11
公众号:生数科技(Vidu·视频)
51
生数科技Vidu正式上线阿里云百炼

生数科技旗下视频生成模型Vidu已正式上线阿里云百炼平台,标志着从“模型领先”向“生态领先”的转变。双方将联合加速行业发展。

产品更新视频部署/工程
4月8日
20:37
公众号:可灵AI(快手·视频)
44
可灵AI × 清华大学 | 高校原力计划正式启幕

可灵AI与清华大学联合宣布“高校原力计划”正式启动。该计划旨在推动AI视频生成技术在高校的产学研合作,具体细节未在本次公告中披露。

行业动态视频
4月3日
14:14
公众号:通义实验室(千问)
29
Wan2.7-Video 为创作自由而来
产品更新视频
00:00
Google Blog:AI(RSS)
Google Vids 支持免费创建、编辑和分享视频

Google Vids 接入 Lyria 3 与 Veo 3.1 模型能力,新增免费 AI 视频生成功能,用户可无成本创建、编辑和分享高质量视频。

Google产品更新视频
‹ 上一页
1234
下一页 ›