AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「视频」清除
5月6日周三
04:01Luma35室内设计工作室。时尚工具。珠宝配置器。故事板生成器。 所有这些都正在使用Uni-1.1 API构建。 无论你在构建什么,智能层已就位。→ http://lumalabs.ai/api
02:27AI Notkilleveryoneism Memes ⏸️59AI颠覆就业:从动画电影到各行各业,90%成本削减预示劳动力巨变
5月5日周二
23:56Luma70Uni-1.1 API上线,内置提示增强与多模态能力
17:32Runway:News(网页)80精选从单张图像构建实时视频智能体:Runway Characters技术解析
15:46Alibaba Cloud39Happy Horse 1.0发布,AI视频制作告别闪烁与失真
13:14阿绎 AYi64起步成本90美元,30秒一条视频:AI换脸工具带来的低门槛高杠杆生意
11:26Kling AI25Kling AI创作者四月灵感启航
10:14阿绎 AYi74精选分享一个免费下载任何 YouTube 视频的GitHub开源项目,非常实用🔥
09:14IT之家(RSS)30128 年校庆,北大发布首部 AI 宣传片
08:00HuggingFace Daily Papers(社区热门论文)59Audio-Visual Intelligence in Large Foundation Models
08:00HuggingFace Daily Papers(社区热门论文)56参数高效的多视角技能熟练度估计:从判别式分类到生成式反馈
08:00HuggingFace Daily Papers(社区热门论文)59Stream-R1:面向流式视频生成的可靠性-困惑度感知奖励蒸馏框架
06:55Luma66Luma Agents助您构建完整广告系统
05:49AK68UniVidX:基于扩散先验的统一多模态视频生成框架
03:48PixVerse17萌宠照镜子可爱瞬间分享
02:48PixVerse30水豚足球赛萌翻网络
01:58Runway69精选实时视频对话代理诞生
5月4日周一
23:48Chubby♨️62初创公司Video Rebirth文生视频模型Bach-1.0跻身全球前六
22:16Rohan Paul64初创公司Video Rebirth闯入AI视频生成榜单前六,打破巨头垄断
21:24小互56传谷歌I/O将发布Omni模型,Gemini或升级为全模态生产力入口
17:48Artificial Analysis56Bach-1.0预览版登顶文生视频榜单
16:14阿绎 AYi77精选Claude通过第三方平台补足视频分析能力,开启AI应用新生态
11:19Kling AI42经典电影海报动起来 克林4K技术呈现
08:00HuggingFace Daily Papers(社区热门论文)63基于预测性隐变量的视频生成
04:47PixVerse26怪物派对热舞引爆Seedance 2.0
03:47PixVerse11精致动画获赞,大炮特效震撼
5月3日周日
20:15Chubby♨️42谷歌新模型传闻:Gemini更新与视觉模型猜测
16:45Chubby♨️45谷歌或于I/O大会推出全新Omni模型,Gemini视频生成能力有望升级
14:12IT之家(RSS)59国内首部院线 AI 原生动画电影将至,《三星堆:未来往事》获颁"龙标"
11:18Kling AI24老电影4K焕新,经典永流传
11:12IT之家(RSS)669.8 万余个自媒体账号被处置,网信部门严管"自媒体"未规范标注信息来源行为
08:00HuggingFace Daily Papers(社区热门论文)64面向高效自回归视频生成的运动感知缓存框架
06:50TestingCatalog News 🗞58谷歌I/O动态:Gemini测试用于视频生成的新Omni模型
05:16PixVerse15疲惫时刷新,周末 PixVerse Seedance 创作乐
5月2日周六
17:11Rohan Paul31机器人遭情感重创惩罚
12:11IT之家(RSS)54AI 短剧《霍去病》导演澄清:3000 元仅是算力成本,80 集、5 亿播放实属夸大
08:11IT之家(RSS)56奥斯卡明确规定:AI 演员和剧本没资格获奖
08:00HuggingFace Daily Papers(社区热门论文)51TT4D:基于单目视频的乒乓球4D重建流程与数据集
06:18Hao AI Lab37ICML 2026收录多项AI前沿研究
05:16PixVerse63玻璃骏马展现超现实艺术境界
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月6日
04:01
Luma@LumaLabsAI
35
室内设计工作室。时尚工具。珠宝配置器。故事板生成器。 所有这些都正在使用Uni-1.1 API构建。 无论你在构建什么,智能层已就位。→ http://lumalabs.ai/api
产品更新多模态视频
02:27
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
59
梦工厂联合创始人杰弗里·卡森伯格预测,AI将在三年内使动画电影制作成本降低90%,所需人力减少至原先的10%。这不仅将彻底颠覆娱乐产业,更将迅速波及所有行业。好莱坞艺术家的反抗凸显了危机感--AI已在艺术创作领域实现从低水平到超人类能力的飞跃。若其在操纵、编程、生物工程等领域取得类似突破,将引发大规模失业潮,可能促使有组织劳工运动复兴。尽管可能带来更多电影产出,但各行各业的游戏规则已被永久改变。

AI Notkilleveryoneism Memes ⏸️: AGI is the Great Flipper of All The Gameboards Dreamworks co-founder Jeff Katzenberg says AI will cut animated movie cos...

现象/趋势视频
5月5日
23:56
Luma@LumaLabsAI
70
Uni-1.1 API 今日上线。在 API 层面内置提示增强、研究和参考资料收集功能。 与好莱坞电影摄影师、视觉特效艺术家以及跨文化形式的世界级艺术家合作训练。 价格和延迟仅为同类模型的一半以下。 专为在生产环境中部署产品的开发者设计--在 Image Arena 的文本到图像和图像编辑类别中排名前三。 开始构建 → https://lumalabs.ai/api
产品更新图像生成视频
17:32
Runway:News(网页)
精选80
从单张图像构建实时视频智能体:Runway Characters技术解析

Runway公司推出“Characters”实时视频智能体,它能将任意单张参考图像(如真人、卡通或幻想生物照片)实时转化为具有自然对话表现力的视频角色。该技术基于其通用世界模型GWM-1,无需微调即可生成每秒24帧的高清视频,并同步口型、表情和头部运动。其核心突破在于通过自回归逐帧生成、流程优化与并行化,实现了每帧仅37毫秒的模型处理时间,以及从用户停止说话到角色开始响应仅1.75秒的服务器端延迟,从而满足了实时交互对话的严苛要求。

智能体产品更新视频

推荐理由:把单张图变成实时对话角色这件事,Runway 做到了 24fps 且 1.75 秒响应。不是预录,是真实时,还带了知识库和工具调用,做虚拟角色产品的可以直接拿来集成。
15:46
Alibaba Cloud@alibaba_cloud
39
Happy Horse 1.0发布,AI视频制作告别闪烁与失真

Happy Horse 1.0是一款面向创意工作者的生产级AI视频引擎,旨在解决现有AI视频工具的核心痛点。它主打“像素级一致性”,确保角色和资产在视频中保持稳定,不再出现变形或闪烁。同时,引擎具备企业级效率,在质量、速度和成本上进行了优化。官方将于2026年5月15日在香港举办大师班,演示如何将AI视频工作流程从“实验性”提升至“专业级”。

产品更新视频
13:14
阿绎 AYi@AYi_AInotes
64
起步成本90美元,30秒一条视频:AI换脸工具带来的低门槛高杠杆生意

文章介绍一款年费89.99美元的在线AI换脸工具Swaptok,用户可通过四步流程在30秒内将TikTok或Reels公开视频中的人脸替换为AI生成的高清人脸,单条成本极低。作者提出四条变现路径:运营AI网红矩阵账号、承接品牌广告外包、为自有产品制作素材以及出售课程或服务。同时指出需进行二次创作避免限流、注意版权风险及把握红利期等关键建议,视其为技术发展催生的新内容生产方式。

图像生成教程/实践视频
11:26
Kling AI@Kling_ai
25
愿景随Kling AI而动。 每一帧,都是心跳。每一个故事,都栩栩如生。 欢迎来到Kling AI创作者的四月光影灵感集!🎬
其他视频
10:14
阿绎 AYi@AYi_AInotes
精选74
分享一个免费下载任何 YouTube 视频的GitHub开源项目,非常实用🔥

开源项目Voice-Pro将多语言视频创作流程大幅简化。用户输入YouTube链接后,该工具可在本地自动完成视频下载、人声分离、语音转文字、翻译、声线克隆及配音合成,全程不到两分钟。它将原本需要多个付费工具协作的复杂流程,整合为一个免费、本地化的高效解决方案,显著提升了创作者的工作效率。

GitHub开源/仓库视频语音

推荐理由:一个开源工具把 yt-dlp + Whisper + 翻译 + 声线克隆六步压缩成一条本地流水线,之前每月烧几百刀订阅费的事现在免费跑在自己机器上,做多语言视频的人可以直接换掉整套工具链。
09:14
IT之家(RSS)
30
128 年校庆,北大发布首部 AI 宣传片

北京大学在建校128周年之际,发布了首部AI生成的校庆宣传片《举火》。该片回顾了学校自1898年创办以来的重要历史事件、知名校友及科研成果,例如在23位“两弹一星”元勋中,有12位是北大校友。视频以“举火”为主题,展现了从历史传承到当代青年接续奋斗的脉络,标志着北大在利用人工智能技术进行形象传播方面迈出新的一步。

行业动态视频
08:00
HuggingFace Daily Papers(社区热门论文)
59
Audio-Visual Intelligence in Large Foundation Models

音频-视觉智能已成为人工智能的核心前沿领域,旨在让机器能够感知、生成并交互于多模态现实世界。在大模型时代,音频与视觉的联合建模愈发关键,不仅用于理解,更支持对动态时序信号的可控生成与推理。Meta MovieGen、Google Veo-3等最新进展凸显了业界与学界对统一音视频架构的关注。然而,该领域研究仍较为分散,任务多样、分类不一致、评估方法各异,阻碍了系统化比较与知识整合。本综述首次从大模型视角全面回顾音频-视觉智能,建立了统一的任务分类体系,涵盖理解、生成与交互三大方向,并综合了模态标记化、跨模态融合、自回归与扩散生成、大规模预训练等核心方法。同时,研究梳理了代表性数据集、基准与评估指标,指出同步性、空间推理、可控性与安全性等开放挑战。

多模态视频论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
56
参数高效的多视角技能熟练度估计:从判别式分类到生成式反馈

评估人的动作完成质量(熟练度)对教学、康复等领域至关重要,但其挑战在于细微的时空差异分布于多视角视频中。本文针对Ego-Exo4D数据集提出三种创新方法:SkillFormer采用参数高效的判别式架构实现选择性多视角融合;PATS通过保留基础动作的局部密集片段来改进时序采样;ProfVLM则将任务重构为条件语言生成,通过门控跨视角投影器和紧凑语言模型,同时输出熟练度标签与专家风格反馈。这些方法仅需比视频Transformer基线少20倍的可训练参数和少3倍的训练周期,即达到最优准确率,推动了该任务从封闭集分类向可解释反馈生成的范式转变。

具身智能多模态视频论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
59
Stream-R1:面向流式视频生成的可靠性-困惑度感知奖励蒸馏框架

针对流式视频扩散模型的分布匹配蒸馏方法普遍均等对待所有输出,限制了质量提升。Stream-R1框架提出统一的奖励引导机制,从两个层面自适应重加权蒸馏目标:在序列间,依据预训练奖励分数对损失进行重缩放,让高可靠性序列主导优化;在序列内,利用同一奖励模型的反向传播生成像素级时空权重,将优化集中于预期增益最大的区域和帧。该方法在标准基准测试中,于视觉质量、运动质量和文本对齐方面均持续优于基线,且无需改变架构或增加推理开销。

多模态视频论文/研究
06:55
Luma@LumaLabsAI
66
定义概念。设定方向。 让Luma Agents将你的想法转化为完整的广告系统。 查看概念 → http://lumalabs.ai/app
智能体产品更新视频
05:49
AK@_akhaliq
68
UniVidX 一个通过扩散先验实现多功能视频生成的统一多模态框架 paper: https://huggingface.co/papers/2605.00658
Hugging Face多模态视频论文/研究
03:48
PixVerse@PixVerse_
17
可爱的猫娘对镜瞬间 @Kawaiizice!分享你家宠物面对镜子的搞笑反应--一起传播这份可爱吧!🐱🪞

Kawaiizice: Gatinha e espelho! 😺🪞 Não é curioso? (=^・ω・^=) Quem tem bichinho, tem reações engraçadas com espelhos pra compartilhar...

其他视频
02:48
PixVerse@PixVerse_
30
水豚足球巨星!😍太有趣了,@FotachuARGUY 继续保持!

Fotachu - AR GUY: MY SUBMISSION TO THE @PixVerse_ "Seedance 1080p on PixVerse" CHALLENGE! CABYBARA SOCCER BALL - EPISODE 1 #SEEDANCE

行业动态视频
01:58
Runway@runwayml
精选69
实时视频智能体已到来。 今天,我们将分享如何构建Runway Characters,让你能将一张图片转化为一个完全富有表现力、可对话的视频智能体,以每秒24帧的高清画质流畅播放。端到端延迟仅需1.75秒。 了解更多信息请见下文。
产品更新多模态视频

推荐理由:Runway 把 AI 视频从生成拉入实时对话时代,1.75 秒的延迟让视频代理第一次有了「对话感」,做交互设计的同学可以认真看一眼。
5月4日
23:48
Chubby♨️@kimmonismus
62
初创公司Video Rebirth的文本生成视频模型Bach-1.0 Preview在Artificial Analysis的全球AI视频排行榜上首次亮相即位列第六。其性能与Vidu Q3 Pro、Kling 3.0 Omni 1080p (Pro)及grok-imagine-video等知名模型相当。该模型计划于五月下旬广泛发布。

Artificial Analysis: Bach-1.0 Preview from Video Rebirth debuts at #6 on the Artificial Analysis Text to Video Leaderboard (No Audio)! Bach-1...

模型发布视频评测/基准
22:16
Rohan Paul@rohanpaul_ai
64
初创公司Video Rebirth凭借其模型Bach-1.0 Preview,在Artificial Analysis的文本转视频榜单中首次进入前六名,打破了该榜单长期由阿里巴巴、字节跳动、xAI等万亿美元级巨头主导的局面。其模型性能与Vidu Q3 Pro、Kling 3.0 Omni 1080p (Pro)及grok-imagine-video等顶尖模型相当,并计划于五月下旬广泛发布。这一突破标志着初创企业在高质量AI视频生成领域取得了显著进展,为该领域的竞争格局带来了新的变数。

Artificial Analysis: Bach-1.0 Preview from Video Rebirth debuts at #6 on the Artificial Analysis Text to Video Leaderboard (No Audio)! Bach-1...

模型发布视频
21:24
小互@xiaohu
56
传谷歌I/O将发布Omni模型,Gemini或升级为全模态生产力入口

据传谷歌将在I/O大会发布名为“Omni”的新模型,旨在将Gemini从聊天助手升级为集成写作、图片、视频、长上下文记忆与复杂任务流的全模态生产力平台。该模型可能原生支持视频生成与输出,超越现有的Veo 3.1。同时,Gemini 3.2/3.5版本或专注于提升推理速度与效率,而Ultra版本则向长上下文、重记忆及多步骤工作流方向深化。若消息属实,Gemini将成为首个具备视频输出能力的顶级Omni模型。

TestingCatalog News 🗞: GOOGLE I/O 🚨: A NEW OMNI MODEL IS BEING TESTED ON GEMINI FOR VIDEO GENERATION! > "Start with an idea or try a template....

Google多模态模型发布视频
17:48
Artificial Analysis@ArtificialAnlys
56
Bach-1.0 Preview from Video Rebirth 在 Artificial Analysis 文本转视频排行榜(无音频)中首次亮相,位列第6! Bach-1.0 Preview 是来自 @video_rebirth 的最新文本转视频模型,其性能与 Vidu Q3 Pro、Kling 3.0 Omni 1080p (Pro) 和 grok-imagine-video 相近。 Bach-1.0 Preview 计划于五月下旬广泛发布。 在下方 Artificial Analysis 视频竞技场中查看 Bach-1.0 Preview 的生成示例 🧵
模型发布视频
16:14
阿绎 AYi@AYi_AInotes
精选77
Claude通过第三方平台补足视频分析能力,开启AI应用新生态

借助Algrow的MCP平台,Claude现已能直接分析YouTube等平台的视频内容,自动生成包含数据表格、爆款拆解与留存曲线的深度报告。这标志着大模型竞争重点转向生态建设,第三方开发者通过工具链迅速弥补了Claude的原生视频短板。该功能为内容创作者提供了高效分析竞品、提炼爆款公式的生产力工具,并预示视频研究Agent时代的开启。目前处于免费试用阶段,未来订阅定价亲民。

AnthropicMCP/工具产品更新视频

推荐理由:第三方MCP插件让Claude终于能分析视频,做视频的一键生成爆款拆解和帧级留存分析,比手动刷三天视频强多了。
11:19
Kling AI@Kling_ai
42
经典电影。标志性时刻。 现以惊艳的Kling 4K动态呈现。 海报不再只是悬挂着了。 它们在播放。🎬
产品更新图像生成多模态视频
08:00
HuggingFace Daily Papers(社区热门论文)
63
基于预测性隐变量的视频生成

视频变分自编码器(VAE)通过隐空间建模提升生成效率,但重建优化未必改善生成性能。为此,本研究受预测性世界建模启发,提出预测性视频VAE(PV-VAE),引入统一的预测性重建目标。该方法在训练时随机丢弃未来帧,仅编码部分过去观测,并让解码器同时重建已观测帧与预测未来帧,从而使隐空间编码更具时间预测性的结构,增强对视频动态的连贯理解。在UCF101数据集上,PV-VAE相比Wan2.2 VAE收敛速度提升52%,FVD指标改善34.42。分析表明,该模型具有良好的可扩展性,其隐空间能有效捕捉时间连贯性与运动先验,在下游视频理解任务中也带来一致性能提升。

多模态视频论文/研究
04:47
PixVerse@PixVerse_
26
那场怪物派对的能量简直不可思议 🧛♀️🤘 感谢 @StevieMac03 带来这首史诗级的 Seedance 2.0 热曲!

Stevie Mac: It was quite the weekend at the Monster bash! Created with Seedance 2.0 1080p with native audio via @PixVerse_ Which is ...

教程/实践视频
03:47
PixVerse@PixVerse_
11
🔥这些炮火效果太震撼了!@UminekoStudio 将如此精细的艺术作品生动呈现,做得太棒了🥰

UMINEKO STUDIO: PixVerse経由のSeedance2.0の1080pサンプルです。 緻密なイラストをアニメーションさせてみました いかがでしょうか @PixVerse_

产品更新视频
5月3日
20:15
Chubby♨️@kimmonismus
42
目前的传闻: - Google Gemini Flash 3.2/3.5(已在测试中) - 新的Omni模型,甚至可能推出更新的Veo来与Seedance竞争 - "spark Robin"--新的视觉模型?
Google多模态行业动态视频
16:45
Chubby♨️@kimmonismus
45
据泄露信息显示,谷歌可能正在为其Gemini平台测试一款全新的Omni模型,专注于视频生成功能,其界面标语为"由Omni驱动"。该模型的内部代号接近当前基于Veo的视频工具"Toucan"。分析指出,若谷歌正式发布名为Gemini Omni的视频生成模型,其性能很可能超越现有的Veo 3.1版本。此举若成真,Gemini将成为首个具备视频输出能力的顶级Omni模型,相关进展或于即将到来的Google I/O大会上正式公布。

TestingCatalog News 🗞: GOOGLE I/O 🚨: A NEW OMNI MODEL IS BEING TESTED ON GEMINI FOR VIDEO GENERATION! > "Start with an idea or try a template....

Google多模态模型发布视频
14:12
IT之家(RSS)
59
国内首部院线 AI 原生动画电影将至,《三星堆:未来往事》获颁"龙标"

国内首部AI原生动画院线电影《三星堆:未来往事》已获得公映许可证,即将登陆全国影院。该片深度结合三星堆古蜀文明与AI技术,以AI呈现文物,构建连接过去与未来的科幻世界。其概念预告片已在香港国际影视展亮相,创作脉络可追溯至2024年上线的同系列AI科幻短剧《三星堆·未来启示录》第一季,该短剧全网播放量已达1.6亿次。

多模态行业动态视频
11:18
Kling AI@Kling_ai
24
老电影呈现出4K画质。 黑白影像看起来宛如昨日拍摄。 经典电影永不褪色。 它们只是等待被再次观看。🎞️
产品更新视频
11:12
IT之家(RSS)
66
9.8 万余个自媒体账号被处置,网信部门严管"自媒体"未规范标注信息来源行为

近期,网信部门针对“自媒体”未规范标注信息来源的行为展开严管,处置违规账号9.8万余个。主要问题包括发布国内外时事、公共政策等信息时不标注来源,使用AI生成内容不添加标识,以及虚构演绎内容不标注标签,这些行为误导公众、破坏网络生态。典型案例涉及抖音、快手、哔哩哔哩等多个平台账号,内容涵盖国际时事、公共政策、AI生成视频和虚构剧情。网信部门将指导平台把规范标注设为短视频发布的必经环节,并要求创作者主动规范标注,确保信息真实完整。

政策/监管视频
08:00
HuggingFace Daily Papers(社区热门论文)
64
面向高效自回归视频生成的运动感知缓存框架

自回归视频生成因顺序去噪计算负担重而面临部署挑战。现有缓存重用方法采用粗粒度的块级跳过,无法捕捉细粒度像素动态。为此,研究提出MotionCache运动感知缓存框架,其核心是利用帧间差异作为像素级运动特征的轻量级代理。该方法采用从粗到细的策略:初始预热阶段建立语义连贯性,随后根据运动权重动态调整每个令牌的缓存更新频率。在SkyReels-V2和MAGI-1等先进模型上的实验表明,MotionCache分别实现了6.28倍和1.64倍的显著加速,同时有效保持了生成质量(VBench指标下降分别仅为1%和0.01%)。该框架代码已开源。

GitHub视频论文/研究
06:50
TestingCatalog News 🗞@testingcatalog
58
谷歌I/O动态:Gemini测试用于视频生成的新Omni模型

谷歌正在其Gemini平台测试一款名为“Omni”的新模型,专注于视频生成功能。泄露信息显示,该模型的界面提示用户“从一个想法开始或尝试一个模板”,并注明“由Omni驱动”。这一模型可能与内部代号“Toucan”的视频生成工具密切相关,后者目前由Veo驱动。如果谷歌计划正式发布用于视频生成的Gemini Omni,其性能很可能超越当前的Veo 3.1版本。若消息属实,Gemini将成为首个具备视频输出能力的顶级Omni模型,这标志着谷歌在视频生成领域的重大技术进展,并可能为未来的Google I/O 2026活动预热。此举显示了谷歌在人工智能视频生成方面的持续创新和竞争态势。

Google多模态模型发布视频
05:16
PixVerse@PixVerse_
15
疲惫的时候,就用@Kawaiizice 的酷炫作品来refresh一下吧✨ 要想度过最棒的周末,就在PixVerse上用高画质Seedance享受创作的乐趣!😺🚀

Kawaiizice: Sem energia? Recarregue!! 😺⚡️ Quais seus planos para o fim de semana?'-' :: Seedance 1080p on PixVerse! @PixVerse_

其他视频
5月2日
17:11
Rohan Paul@rohanpaul_ai
31
这对机器人来说是多么严厉的惩罚啊。👀 这纯粹是情感上的伤害。
其他视频
12:11
IT之家(RSS)
54
AI 短剧《霍去病》导演澄清:3000 元仅是算力成本,80 集、5 亿播放实属夸大

AI短剧《霍去病》导演杨涵涵澄清,此前引发关注的“3000元成本、48小时制作、80集、5亿播放”等说法存在夸大。3000元仅为算力成本,不包含人力;48小时指纯工作时间;实际作品只有4分钟MV和6分钟正片两个版本,5亿播放量源于未经核实数据。团队3人属实,项目于2026年1月底启动,每天工作约12小时,4天完成。导演的B站账号曾使用夸大标题,被质疑自我炒作。

行业动态视频
08:11
IT之家(RSS)
56
奥斯卡明确规定:AI 演员和剧本没资格获奖

奥斯卡奖发布新规,明确禁止人工智能生成的表演和剧本获奖。美国电影艺术与科学学院规定,从2027年3月举行的下一届颁奖典礼开始生效。规则指出,电影制作中虽可使用AI工具,但“合成”表演者不能获得任何奖项,获奖剧本必须是“人类创作的”。学院可要求提交作品提供更多信息,以验证人类创作身份。这一变化旨在维护奖项对人类创意的认可,回应行业对AI替代演员的担忧。

行业动态视频
08:00
HuggingFace Daily Papers(社区热门论文)
51
TT4D:基于单目视频的乒乓球4D重建流程与数据集

TT4D是一个大规模高保真乒乓球数据集,包含超过140小时从单目转播视频重建的单打与双打比赛数据,提供高质量相机标定、精确3D球位、球旋转、时间分割以及随时间变化的3D人体网格等多模态标注。该数据集通过新颖的重建流程实现规模与精度的结合:传统方法依赖2D球轨进行时间分割,易受遮挡和多视角影响;TT4D则首先通过学习的提升网络将未分割的2D球轨全程提升至3D,再基于3D轨迹可靠分割时间,并能推断球旋转、处理漏检,在高遮挡情况下成功重建轨迹。该流程是目前唯一能从通用视角单目转播视频重建乒乓球比赛的方法。数据集已应用于球拍击球姿态速度估计、竞技对抗回合生成模型训练等下游任务。

数据/训练视频论文/研究
06:18
Hao AI Lab@haoailab
37
很高兴分享我们最近被ICML 2026接收的工作!这些项目涵盖高效因果并行解码器、扩散大语言模型、视频稀疏注意力、视频量化感知训练、在线推测解码以及智能文档推理。 衷心感谢所有合作者和共同作者在这些工作中的付出。期待今年夏天在首尔与大家相见!🇰🇷
智能体视频论文/研究部署/工程
05:16
PixVerse@PixVerse_
63
哇,这匹玻璃马简直达到了不同层次的超现实感 🐴🤯 顺便特别感谢 @MrDasOnX 在 PixVerse 上用 HappyHorse 完美创作了这件马主题作品!☺️

Mr Das: Fragments of glass collide and transform into a powerful cinematic horse, racing through light and shadow in a surreal v...

图像生成教程/实践视频
‹ 上一页
1…2021222324…28
下一页 ›