AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「视频」清除
5月13日周三
17:57PixVerse38PixVerse推出自制运动镜头趋势功能
17:57PixVerse18猫咪全神贯注观赛瞬间
17:35Kling AI10用Kling AI制作广播趋势
12:30Alibaba Cloud24HappyHorse 1.0大师班:实现AI视频像素级一致与高效工作流
10:44HuggingFace Daily Papers(社区热门论文)66CausalCine:用于多镜头视频叙事的实时自回归生成框架
03:24PixVerse26滑板爱好者惊艳表演引关注
01:31AI Notkilleveryoneism Memes ⏸️52AI冲击好莱坞:Tyler Perry因Sora叫停8亿美元扩建,呼吁行业联合应对
5月12日周二
23:24PixVerse23MOBA角色定位趣味升级
22:52Runway62首届虚构节目提案大赛揭晓二十强
21:49Berryxia.AI67Seedacne 2.0与GPT-image-2实现高还原度视频生成
21:33Kling AI45AI助力韩国棒球趋势参与指南
12:44HuggingFace Daily Papers(社区热门论文)70精选WorldReasonBench:面向未来世界状态预测的视频生成器人类对齐压力测试
10:49歸藏(guizang.ai)50谷歌或即将发布新一代视频模型Veo 4,功能全面升级
08:00HuggingFace Daily Papers(社区热门论文)62TrackCraft3R:将视频扩散Transformer改造为前馈式密集3D跟踪器
08:00HuggingFace Daily Papers(社区热门论文)61PresentAgent-2:迈向通用多模态演示智能体
07:29Luma26Luma Agents定义奢华视觉新标准
06:35swyx 🌉64实时AI定义被颠覆,全能模型梦想复兴
04:59Luma73Luma Agents:从情绪板到完整广告的自动化创作
02:59Luma59Luma Agents新增Kling Omni模型支持
01:23PixVerse57低清梗图变身4K杰作
5月11日周一
23:50小互43网传字节跳动收缩AI项目被指谣言,作者驳斥其多处硬伤
23:35IT之家(RSS)61快手可灵被传将以 200 亿美元估值融资,谋求"单飞"上市
23:33🚨 AI News | TestingCatalog55谷歌Gemini Omni视频模型将具备高级编辑能力
22:31Kling AI15用Kling AI打造棒球赛氛围
22:23Chubby♨️64谷歌发布革命性视频生成模型
22:20向阳乔木56MACE模型登顶Huggingface:MoE架构驱动音乐生成舞蹈视频
20:52PixVerse38Seedance让墨迹飞动 体验Pixverse新作
17:57AK58MACE-Dance:音乐驱动舞蹈视频生成新模型
16:55Alibaba Cloud43摩纳哥AI电影节举办24小时电影黑客松
16:53Chubby♨️40谷歌全新Omni模型即将发布
16:22PixVerse67高效AI工作流:结合ChatGPT与PixVerse精准生成品牌香水广告
14:32🚨 AI News | TestingCatalog61Google I/O曝光Gemini Omni视频模型新证据
10:21PixVerse33PixVerse母亲节特效上线eachlabs平台
09:25Alibaba Cloud72HappyHorse AI视频引擎登陆阿里云
08:00Thinking Machines Lab:官方博客(RSS)59精选Thinking Machines Lab发布Interaction Models研究预览
01:34阿绎 AYi24中国导演AI创作母亲节短片
01:34阿绎 AYi62AI预测视频爆款:脑科学模型革新内容创作流程
5月10日周日
23:51PixVerse32母亲节AIGC粘土定格动画短片发布
23:29Kling AI17成长即告别:从相伴到分离
07:59Orange AI68字节收缩AI战线,砍项目保豆包与硬件
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月13日
17:57
PixVerse@PixVerse_
38
这个趋势真有趣!现在你可以在PixVerse制作自己的运动镜头趋势了

きゅにお@AI動画を楽しむ行けたら行くで来る率高い小学5年生は人造人間108号📦🚀⛑️: ちなみに、 トレンドになってる観戦動画テンプレ⚾️⚽️ PixVerseにもあるからね? 好きな方でやってみて🙌 @PixVerse_ #PixVerse

产品更新视频
17:57
PixVerse@PixVerse_
18
Meow 一秒都没有错过比赛

Mr Das: Bro paid for the best seat in the stadium Created on @PixVerse_

其他视频
17:35
Kling AI@Kling_ai
10
用Kling AI制作的广播趋势,现在去创造你的吧。🔥

TRND: ترند " مقطع متداول " متداول: مشجعة مدريدية تلقى إعجابًا واسعًا بسبب جمالها 🤍🔥!

其他视频
12:30
Alibaba Cloud@alibaba_cloud
24
HappyHorse 1.0大师班:实现AI视频像素级一致与高效工作流

针对AI视频常出现的闪烁、崩溃等问题,HappyHorse 1.0 Masterclass旨在帮助参与者提升AI工作流水平,实现像素级完美一致性和企业级效率。该线下大师班将于2026年5月15日在香港铜锣湾时代广场举行,核心目标是让创作者掌握专业工作流,推动创意与AI视频制作的创新。

行业动态视频
10:44
HuggingFace Daily Papers(社区热门论文)
66
CausalCine:用于多镜头视频叙事的实时自回归生成框架

研究团队提出CausalCine,一个将多镜头视频生成转化为在线导演过程的交互式自回归框架。该框架能跨越镜头边界进行因果生成、实时响应动态提示,并复用历史上下文。其核心是内容感知记忆路由(CAMR)机制,该机制依据注意力相关性动态检索历史关键信息,而非依赖时间邻近性,从而在有限内存下保持跨镜头连贯性。团队首先训练因果基础模型学习复杂镜头转换,再将其蒸馏为少步生成器以实现实时交互。实验表明,CausalCine显著优于自回归基线,并接近双向模型能力,同时解锁了流式交互性。

arXiv多模态视频论文/研究
03:24
PixVerse@PixVerse_
26
@Kawaiizice 这些滑板者太强了👀

Kawaiizice: Nossa raposinha skatista levou a Clover pra dar um passeio de skate! 🦊🛹🍀 "Rumo aos céus!" (aos céus? sim!) (ꏿ ω ꏿ) ps...

产品更新图像生成视频
01:31
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
52
电影制作人Tyler Perry在目睹OpenAI的Sora视频生成模型演示后,宣布暂停其价值8亿美元的工作室扩建计划。他指出AI能以极低成本完成原本耗资数千万美元的试播集制作,企业必将选择低成本路径,因此对近未来大规模失业深感忧虑。Perry呼吁好莱坞各工会乃至国会采取统一行动,建立监管框架保护从业人员,强调行业必须联合而非各自为战。此前梦工厂创始人Katzenberg预测AI将在三年内削减90%动画岗位,此事印证了该趋势正在加速。

AI Notkilleveryoneism Memes ⏸️: 4 months ago, Dreamworks founder Katzenberg said AI will cut animated movie jobs by 90% in 3 years It's already happenin...

图像生成现象/趋势视频
5月12日
23:24
PixVerse@PixVerse_
23
MOBA游戏格局迎来良性升级。 森林守护者、废料工程师、迷因辅助已锁定。
产品更新视频
22:52
Runway@runwayml
62
祝贺首届"尚未存在的节目"提案大赛的二十位获奖者。 观看下方前五名提案展示。
行业动态视频
21:49
Berryxia.AI@berryxia
67
Seedacne 2.0+ GPT-image-2 就可以完成如下视频,还原度不错,Prompt见评论区!
教程/实践视频
21:33
Kling AI@Kling_ai
45
想跟上韩国棒球潮流并被镜头捕捉吗?⚾ 这里有一个快速教程,用Kling AI一键搞定! 体育场转播挑战赛已在KlingAI应用和网页端上线,快来参与,看看你能否打出制胜一击。
产品更新视频
12:44
HuggingFace Daily Papers(社区热门论文)
精选70
WorldReasonBench:面向未来世界状态预测的视频生成器人类对齐压力测试

研究团队发布WorldReasonBench基准,旨在直接评估视频生成模型作为“世界模拟器”的推理能力。该基准包含436个测试案例,涵盖物理、社会、逻辑和信息四大维度及22个子类,要求模型根据初始状态与动作生成状态演化一致的未来视频。评估采用人类对齐的双部分方法:过程感知推理验证通过结构化问答检测时序与因果错误;多维质量评估则对推理质量、时序一致性和视觉美学进行评分。测试发现,当前先进模型在视觉合理性与世界推理能力间存在显著差距,生成的视频可能看似逼真却违反动态、因果或信息守恒规律。相关资源已开源。

多模态视频论文/研究

推荐理由:视频生成越来越像真的,但逻辑和因果一塌糊涂,这个基准把问题量化了,想做世界模拟器的团队可以拿来测测自己的模型到底懂不懂世界。
10:49
歸藏(guizang.ai)@op7418
50
谷歌或即将发布新一代视频模型Veo 4,功能全面升级

谷歌可能即将推出新一代视频生成模型,暂称Veo 4或类似名称。该模型被描述为类似Sora 2.0的全能参考模型,支持对现有视频进行修改参考和内容替换等操作。在文字生成质量上,它被认为比Sora 2.0略有优势,清晰度和细节可能也稍有提升。据透露,这款即将到来的Gemini Omni视频模型在视频编辑功能上将更为先进,能够完成去除水印、替换视频内物体等复杂任务。谷歌预计会发布该模型的两个版本,包括一个性能更强的Pro变体,而目前展示的样本可能并非Pro版本。

🚨 AI News | TestingCatalog: GOOGLE 🔥: An upcoming Gemini Omni video model from Google is expected to be much more advanced in video editing, capabl...

Google模型发布视频
08:00
HuggingFace Daily Papers(社区热门论文)
62
TrackCraft3R:将视频扩散Transformer改造为前馈式密集3D跟踪器

TrackCraft3R首次将预训练的视频扩散Transformer改造为前馈式密集3D跟踪器。该方法通过双潜在表征(几何潜在与跟踪潜在)和时序RoPE对齐两项核心设计,将视频DiT的逐帧生成范式转换为以参考帧为锚点的跟踪范式,仅需LoRA微调。给定单目视频及其逐帧重建点云图,模型能单次前向传播预测出以首帧为锚点的跟踪点云图及其可见性。该方法在标准3D跟踪基准上实现了最优性能,同时以1.3倍的速度和仅需1/4.6的峰值内存运行,并对大幅运动和长视频保持鲁棒性。

arXiv多模态视频论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
61
PresentAgent-2:迈向通用多模态演示智能体

PresentAgent-2 是一个从用户查询生成端到端演示视频的智能体框架。它首先将开放式查询总结为聚焦主题,并从演示友好型来源进行深度研究,收集文本、图像、GIF和视频等多模态资源。随后构建演示幻灯片,生成特定模式的脚本,并将幻灯片、音频和动态媒体合成为完整视频。该框架统一支持三种独立演示模式:单人演示(单解说员)、讨论式演示(多演讲者结构化角色)和交互式演示(基于生成内容回答观众问题)。研究团队构建了涵盖三种场景的多模态演示基准,并制定了内容质量、媒体相关性、动态媒体使用等评估标准,从而将演示生成从文档依赖的幻灯片创建扩展到查询驱动、研究基础的多模态视频生成。

智能体arXiv多模态视频
07:29
Luma@LumaLabsAI
26
最卓越的营销不只展示产品,更让你向往其存在的世界。 设定愿景。定义美学。Luma Agents由此构建所有奢华营销视觉。 树立标准 → http://lumalabs.ai/app
产品更新图像生成视频
06:35
swyx 🌉@swyx
64
我相信年轻人会这样形容:"@thinkymachines 刚刚残酷碾压了gdm和oai"。 基本上所有人的"实时"定义都得到了巨大升级。

swyx 🌉: lowkey the funniest videos of the batch. thinky has some comedians!! congrats to @thinkymachines on reviving the omnimod...

多模态模型发布视频语音
04:59
Luma@LumaLabsAI
73
情绪板曾是最精彩的部分。如今它只是起点。 上传你的参考素材。设定方向。Luma Agents 会将其从情绪板转化为完整的广告。 生成广告 → http://lumalabs.ai/app
智能体产品更新图像生成视频
02:59
Luma@LumaLabsAI
59
Luma Agents现已支持通过Kling Omni生成内容。 更多模型。更广范围。相同工作流程。 立即体验 → https://lumalabs.ai/app
产品更新图像生成视频
01:23
PixVerse@PixVerse_
57
PixVerse将我古老的144p梗图变成4K杰作。 我的梗图存档刚刚完成华丽升级。🔥
产品更新图像生成视频
5月11日
23:50
小互@xiaohu
43
网传字节跳动收缩AI项目被指谣言,作者驳斥其多处硬伤

针对网传“字节跳动关停30%AI项目、面临现金流危机”的信息,推文作者指出其存在多处硬伤并予以驳斥。作者认为,所谓“80亿推理成本导致现金流危机”的说法与字节庞大的营收、现金储备及高达千亿级别的AI投入计划严重不符。同时,指出“产品线收缩”与Dreamina等重点产品全球推广的事实相悖,且原文有明显AI生成痕迹。经向字节内部人士求证,该信息被认定为虚假。

现象/趋势视频
23:35
IT之家(RSS)
61
快手可灵被传将以 200 亿美元估值融资,谋求"单飞"上市

快手科技计划分拆旗下AI视频业务可灵,寻求以200亿美元估值进行Pre-IPO融资,目标明年独立上市。可灵是快手自主研发的视频生成大模型,2024年6月上线,2025年1月推出升级版3.0系列。财务数据显示,2025年第四季度可灵营业收入达3.4亿元,12月单月收入突破2000万美元,年化收入运行率已超过3亿美元。公司对可灵在2026年实现收入同比翻倍增长保持较强信心。

行业动态视频
23:33
🚨 AI News | TestingCatalog@testingcatalog
55
谷歌即将推出的Gemini Omni视频模型在视频编辑方面预计将显著进步,能够完成去除水印、替换视频中物体等复杂任务。该模型可能发布两个版本,包括一个Pro变体。引用推文展示了该模型的实际编辑效果,对比了原始视频与编辑后的视频,并证实其在去除水印方面表现优异。

Just a dragon: 🫨Google is creating a new Omni model with good video editing. Veo4? The original is on the left. Edited right. The new ...

Google多模态模型发布视频
22:31
Kling AI@Kling_ai
15
棒球赛氛围已锁定。⚾ 看看我们如何在Kling AI中创作它。
其他图像生成视频
22:23
Chubby♨️@kimmonismus
64
天哪,谷歌正在放大招! 新的视频模型/Gemini Omni 简直好得离谱且精准。 YouTube 和 TikTok 将涌现大量新的 AI 生成视频。

Chetaslua: Holllllyyyyyyyy @GeminiApp cooked 😳😳 🚨 Gemini Omni: New video model Here is the first output and see the text coheren...

Google模型发布视频
22:20
向阳乔木@vista8
56
MACE模型登顶Huggingface:MoE架构驱动音乐生成舞蹈视频

本周Huggingface排行榜上,MACE论文暂时位列第一。该研究采用混合专家(MoE)架构,实现了根据音乐生成舞蹈视频的任务。这一技术进展被认为将显著提升类似抖音平台上AI舞蹈视频的真实感与表现力。

Hugging Face多模态视频论文/研究
20:52
PixVerse@PixVerse_
38
墨迹在飞舞?Seedance让它成为现实。快来Pixverse试试吧 👀 【引用 @MrDasOnX】:Ink shouldn't be able to fly, but this one finds a way! Seedance 2.0 1080p on PixVerse | @PixVerse_ 提示词如下 👇

Mr Das: Ink shouldn't be able to fly, but this one finds a way! Seedance 2.0 1080p on PixVerse | @PixVerse_ Prompt below 👇

教程/实践视频
17:57
AK@_akhaliq
58
MACE-Dance 用于音乐驱动舞蹈视频生成的运动-外观级联专家模型
多模态视频论文/研究
16:55
Alibaba Cloud@alibaba_cloud
43
摩纳哥AI电影节举办24小时电影黑客松

作为摩纳哥AI电影节的一部分,官方将在One Monte Carlo举办一场24小时AI电影黑客松。活动面向电影制作人、创作者和创新者,挑战是在一天内创作出一部1-3分钟的AI生成电影。活动由阿里云提供技术支持,参与者将获得专属工具并接受现场任务简报。获胜作品将在颁奖典礼的主舞台上进行现场展映。活动时间为2026年6月9日至10日,地点在摩纳哥的One Monte Carlo。

行业动态视频
16:53
Chubby♨️@kimmonismus
40
全新谷歌Omni模型即将到来!可能将在i/o大会上发布(下周现场见 :)) 可能是Veo 3.1的更新版本(甚至可能是下一代迭代) 感谢reddit上的Zachary
Google行业动态视频
16:22
PixVerse@PixVerse_
67
用户分享了一个高效AI视频创作流程。他首先利用ChatGPT,基于预设镜头描述,生成了一个结构严谨、支持多镜头序列的详细视频提示词。该提示词严格指定了品牌元素(如瓶身、包装、Logo及阿拉伯文/英文文本)需通过参考附件精确还原,并描述了超奢华、电影感的视觉风格。随后,他将此提示词输入PixVerse平台,借助其高速生成优势,快速产出了1080p分辨率的视频。此工作流有效结合了GPT的精准指令生成能力与PixVerse的快速视频渲染能力,实现了对品牌视觉的严格把控和高效率内容产出。

AZIZ | AI 🇸🇦: 5️⃣ عجبتني النتيجة وقلت ليه ماستخدم سي دانس ٢ ، ورحت على منصة @PixVerse_ لان احب ان السرعة عندهم عالية جدا لتوليد الفيدي...

图像生成教程/实践视频
14:32
🚨 AI News | TestingCatalog@testingcatalog
61
Google I/O曝光Gemini Omni视频模型新证据

在Google I/O期间,Gemini移动应用中发现了即将推出的Gemini Omni视频模型的新证据。该模型被描述为“我们的新视频模型”,功能包括混剪视频、在聊天中直接编辑以及使用模板等。分析指出,这可能是基于Gemini的真正“Omni”模型,而非Veo。早期测试显示,该模型会快速消耗使用额度,且网络和移动端应用都将新增一个“使用情况”标签页来追踪用量。

Google多模态模型发布视频
10:21
PixVerse@PixVerse_
33
太喜欢@eachlabs这些惊艳的特效了!万分感谢。🔥 【引用 @eachlabs】:💐 母亲节快乐! 全新@PixVerse_母亲节特效现已在eachlabs平台上线✨ 从情感肖像到电影级庆祝时刻,新系列等你探索🌸 探索下方全新特效👇🏻

each::labs: 💐 Happy Mother's Day! New @PixVerse_ Mother's Day effects are now live on eachlabs ✨ From emotional portraits to cinema...

产品更新视频
09:25
Alibaba Cloud@alibaba_cloud
72
资产审核:通过。物理逻辑:无缝衔接。🐎 HappyHorse是面向生产就绪内容的排名第一的AI视频引擎。从复杂的物理交互到原生1080p唇形同步,我们不仅生成--更精准执行。 现已上线阿里云Model Studio。 https://int.alibabacloud.com/m/1000412167/
产品更新视频
08:00
Thinking Machines Lab:官方博客(RSS)
精选59
Thinking Machines Lab发布Interaction Models研究预览

Thinking Machines Lab发布interaction models研究预览。该模型从零训练,原生处理音频、视频和文本,采用多流微回合设计实现实时响应,无需外部脚手架。研究预览展示了全新的交互能力,并在智能性与响应性上取得综合SOTA表现。

智能体多模态模型发布视频

推荐理由:Thinking Machines 把实时交互训进了模型本身,不再是外挂脚手架,微轮次架构和 benchmark 数据很硬,做语音/视频助手的可以认真看看,虽然还是研究预览,但方向值得盯着。
01:34
阿绎 AYi@AYi_AInotes
24
母亲节快乐, 这是一位中国导演用AI创作的母亲节短片,基于他的个人经历。 苦难终将愈合, 因为一切都会改变。风暴会过去,艰难会过去,痛苦会过去…一切都会过去。 【引用 @X】:告诉你妈妈我祝她母亲节快乐

X: tell your mom i said happy mother's day

其他视频
01:34
阿绎 AYi@AYi_AInotes
62
AI预测视频爆款:脑科学模型革新内容创作流程

Higgsfield发布Virality Predictor工具,利用基于700多人fMRI数据训练的AI模型,直接预测视频引发的人脑神经反应。它能分析15秒视频的整体病毒潜力、前3秒钩子得分及注意力曲线,并生成脑区激活热图。该工具可与Claude等AI结合,实现批量生成视频变体并自动筛选高分版本,使内容测试成本从高昂广告费降至极低token费。这标志着爆款创作从依赖灵感和人工测试,转向依靠系统化预测与高效淘汰机制,核心竞争力变为利用AI快速筛除非爆款的能力。

Higgsfield AI 🧩: Higgsfield releases Virality Predictor What does it mean: > Upload any clip up to 15s > Get viral potential, hook score ...

MCP/工具产品更新视频
5月10日
23:51
PixVerse@PixVerse_
32
母亲节之际,@DYJ_Science 与 @PixVerse_ 呈现AIGC粘土定格动画短片《母亲的另一面》。
行业动态视频
23:29
Kling AI@Kling_ai
17
我们长大了。 然后我们分道扬镳。 成长是一场漫长的告别。👋
行业动态视频
07:59
Orange AI@oran_ge
68
字节跳动在内部战略复盘后,已关停约30%的AI应用项目,包括猫箱、星绘及Dreamina的部分业务线。核心原因在于豆包之外的产品均未达千万DAU预期,且面临高昂的AI推理成本与海外政策风险。公司未来将聚焦三大方向:全力发展豆包以争夺国内通用AI领先地位,押注PICO和AI眼镜等硬件,并收缩纯应用层面的无差别投入。此举标志着字节从广泛试水转向重点押注,可能引发中国AI应用层的行业洗牌。

Mr. 小川: 字节跳动悄悄关掉了 30% 的 AI 项目--豆包之外的产品全在收缩 行业内消息:字节 4 月内部 AI 战略复盘会,直接砍掉了 30% 的 AI 应用项目,包括"猫箱"、"星绘"、海外 AI 视频工具 Dreamina 的部分线。表面上字...

行业动态视频
‹ 上一页
1…1819202122…28
下一页 ›