AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「视频」清除
6月25日周四
08:00HuggingFace Daily Papers(社区热门论文)51LiveEdit:面向实时扩散的流式视频编辑
08:00HuggingFace Daily Papers(社区热门论文)48LISA:基于似然分数对齐的视觉条件可控生成正则化方法
07:11Luma31Luma AI 逐帧重建《但丁的地狱》
06:41Luma31Luma制作粘土动画短片Zozo
05:49Orange AI50AI 行业商业化的本质可能是 2boss
02:54ViggleAI60Viggle Survivor 新生存游戏已上线
6月24日周三
23:08Kling AI18可灵AI:众人追问她的发光皮肤
22:14PixVerse24PixVerse Originals S1《Change》发布
21:58IT之家(RSS)47今年圣诞节前,伦敦警方拟将实时面部识别技术推广至市中心
21:08Kling AI24可灵AI推出"You Vs You"挑战活动
19:44PixVerse23PixVerse AI视频用于游戏过场动画
14:42IT之家(RSS)67国家广播电视总局:使用 AI 技术生成的微短剧应在每集明显位置添加提示标识
13:52小互56字节跳动Seedance 2.5发布:一次生成30秒4K短片
11:43PixVerse18PixVerse 梅西 AI 生成引发意外反响
08:00HuggingFace Daily Papers(社区热门论文)48Physics Question Scene Graph:文本到视频生成物理合理性细粒度评估方法
07:07Hacker News 热门(buzzing.cc 中文翻译)48Lift4D:协调单视图3D估计与4D重建的真实场景框架
06:14Orange AI54即梦 Seedance 2.0 4K 视频定价引 ROI 定律思考
05:45Runway72精选Runway推出Seedance 4K等三款新模型
03:21Hao AI Lab73精选FastWan-QAD:单卡5090上1.8秒生成5秒视频
03:16Rohan Paul66MaineCoon发布22B实时音视频生成模型
02:12AYi28holy shit😭 AI视频脸崩镜头乱的死穴被这个玩法直接干没了, 角色全程不崩,运镜精准到帧, 独立创作者直接能拍院线级镜头!
01:06Kling AI27可灵AI 1000积分赠送活动
00:03HuggingFace Daily Papers(社区热门论文)44Vera:用于内容保留视频编辑的分层扩散模型
6月23日周二
23:00公众号:昆仑万维(天工)49DramaWave张薇:AI拍剧代替的是流程,不是故事 | 上海电视节白玉兰论坛
22:36Luma26Luma AI 打造《Wolf of Arcadia》世界
21:36Kling AI14可灵AI:你的下一个对手是自己
20:41PixVerse26PixVerse Seedance 2.0 打造 AI 世界杯故事
20:24The Decoder:AI News(RSS)67字节跳动Seedance 2.5将AI视频生成延长至30秒
20:16Berryxia.AI14Seedance 这一波属于断档式的领先了。 短期内,别的模型难以追赶了。
20:11PixVerse36PixVerse Originals 新作《Drifters》预告
19:11PixVerse60PixVerse Magic Extend 扩展画面保留主体
17:16Alibaba Cloud27阿里云KaryaWAN AI挑战赛获胜者揭晓
17:15Emad38Emad Mostaque:中国实验室视频近乎完美
17:15Emad33Seedance 2.5 即将发布:多资产输入与更长输出
15:55X.PIN57字节跳动发布多款新模型
15:26Chubby♨️25Seedance 2.5 发布,表现惊艳
15:14Berryxia.AI44Seedance 2.5 发布:原生 4K/30 秒视频,7 月初上线
15:07IT之家(RSS)54KTV频现AI魔改MV:画面与歌曲毫不相干,消费者可投诉
14:37🚨 AI News | TestingCatalog65字节跳动发布Seedance 2.5及2.0升级版
13:11歸藏(guizang.ai)65Seedance 2.0 4K 视频上线即梦,15 秒 1200 积分
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月25日
08:00
HuggingFace Daily Papers(社区热门论文)
51
LiveEdit:面向实时扩散的流式视频编辑

流式视频编辑面临背景保持与低延迟两大瓶颈。LiveEdit提出因果逐帧编辑框架,通过三阶段蒸馏将双向基础模型的编辑能力迁移至单向流式编辑器,实现稳定长时编辑。引入面向AR的掩码缓存跨帧复用区域计算,将推理速度提升至12.66 FPS,在流式基线中取得最优视觉质量,适用于交互式与增强现实场景。

多模态视频论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
48
LISA:基于似然分数对齐的视觉条件可控生成正则化方法

LISA是一种针对视觉条件可控生成的训练正则化方法。它将双分支范式(预训练主网络+侧网络)重新解释为基于分数的生成建模:主网络提供无条件先验分数,侧网络隐式贡献似然分数。LISA通过轻量解码器将侧网络指定层中间特征投影到分数隐空间,与构造的近似似然分数目标计算距离作为正则化损失,并与标准扩散损失联合优化。实验表明,LISA能一致加速训练收敛并提升合成质量,使侧网络特征更解耦,且几乎不增加训练成本、零额外推理成本。

arXiv图像生成视频论文/研究
07:11
Luma@LumaLabsAI
31
一段指引。一次坠落。 我们最古老的故事之一,逐帧重建。 《但丁的地狱》由 @NinaSabinaAI 创作。使用 Luma 制作。
其他视频
06:41
Luma@LumaLabsAI
31
卫生纸没了。浴室空了。孩子太安静了。Zozo,一部由Eran May-Raz创作的粘土动画短片。使用Luma制作。
其他视频
05:49
Orange AI@oran_ge
50
AI 行业商业化的本质可能是 2boss

AI 行业商业化的核心是“2boss”——付费方不是使用者(程序员、抽卡员),而是他们的老板。以 Claude/Codex 和 Seedance 为例,老板愿为提升效率的工具付费。中国 2B 市场进入“2boss”时刻,老板买单意愿强烈;独立开发者等自费者也扮演自己的老板。

大佬观点编码视频
02:54
ViggleAI@ViggleAI
60
新游戏提示: 🎮 VIGGLE SURVIVOR 现已上线 🎮 上传你的角色 → 堆叠升级 → 迎战无尽波次 → 尽可能久地存活。 任何角色。任何搭配。一个任务:生存。 现在尝试:https://viggle.ai/games/app/
产品更新视频
6月24日
23:08
Kling AI@Kling_ai
18
大家都在问她的发光皮肤……
其他视频
22:14
PixVerse@PixVerse_
24
"万事皆变--除了我们真正想改变的东西。" Change - PixVerse Originals S1. Caroline Kiessling 完全在 PixVerse 上构建了这部静谧的视觉诗,不断打磨每一帧,直到情绪到位。 转发+关注+评论 = 150 Creds & 全片私信送达(仅限48小时)
图像生成行业动态视频
21:58
IT之家(RSS)
47
今年圣诞节前,伦敦警方拟将实时面部识别技术推广至市中心

伦敦警察厅计划扩大实时面部识别(LFR)的使用范围,圣诞节前率先在市中心西区部署固定摄像头,明年再扩展至另外六个地区。系统扫描路过人脸,与通缉嫌疑人观察名单比对。警方称克罗伊登六个月试点期间,摄像头扫描47万张人脸,促成173人被捕,仅1人被错误识别且未实施逮捕。警方已降低算法敏感度,称偏差“几乎已消除”,约80%伦敦居民支持该技术。每次启用前会提前通知,无匹配数据“几乎”立即删除。

政策/监管视频
21:08
Kling AI@Kling_ai
24
可灵AI(Kling AI)发起"You Vs You"挑战,概念为"你的下一个对手就是你自己"。参与者需发布带可灵水印的AI生成视频,添加话题#youvsyou并@Kling_ai,同时私信提供UID。投稿期2026年6月23日至6月30日(UTC-8),点赞统计截止7月5日,奖励7月6日至10日发放。按跨平台总点赞数排名:第1名获16,000 Credits(1人),第2名11,000 Credits(2人),第3名7,500 Credits(3人)。

Kling AI: Your next opponent is you.

行业动态视频
19:44
PixVerse@PixVerse_
23
使用AI为你的游戏制作过渡过场动画?太棒了。整个场景充满夏日清新感。期待新项目完成 @patata1216

美咲: ぜんざいのアトリエ開発迷走中😅 海エリアはやっぱり釣りでしょう、とかなんとか言うことで、釣りミニゲームを組み込み。 AI開発らしく、Pixverseで作ったAI動画を差し込んで作ってみたよ。 やってみると、こういうバリエーション動画を作る...

图像生成教程/实践视频
14:42
IT之家(RSS)
67
国家广播电视总局:使用 AI 技术生成的微短剧应在每集明显位置添加提示标识

国家广播电视总局就《微短剧发展管理办法(征求意见稿)》公开征求意见。征求意见稿提出,微短剧按投资额度、题材分为一类、二类、三类,分类实行备案公示和发行许可制度。使用人工智能技术生成、制作的微短剧,制作机构和播出单位应在每集明显位置添加提示标识。此外,征求意见稿还支持外向型微短剧创作,为境外主创人员参与提供便利,鼓励优秀微短剧境内外同步播出。

政策/监管视频
13:52
小互@xiaohu
56
字节跳动发布Seedance 2.0升级版和Seedance 2.5视频模型。新版支持一次生成30秒短片,原生4K分辨率,可输入50个全模台参考素材,并支持3D白模。同时推出AI版权商业化平台,允许用户使用官方授权的IP电影版权进行创作和分成。

小互: 字节跳动发布全新视频模型Seedance2.0升级版和 Seedance 2.5 一次生成30秒短片 原生支持4K分辨率 支持50个全模台参考素材输入 支持3D白模 同时发布AI版权商业化平台,可以使用官方授权的各种IP电影版权进行创作,分...

模型发布视频
11:43
PixVerse@PixVerse_
18
这还真是出乎意料 【引用 @qc35_】:山羊遇上山羊 使用 @PixVerse_ 创作 #messi #argentina #pixverse

Kilauai_: Goat meet goat Create with @PixVerse_ #messi #argentina #pixverse

其他视频
08:00
HuggingFace Daily Papers(社区热门论文)
48
Physics Question Scene Graph:文本到视频生成物理合理性细粒度评估方法

论文提出 Physics Question Scene Graph (PQSG),一种层级问题图评估方法,利用 VLM 生成带逻辑依赖的问题图,从对象、动作和物理定律三个维度细粒度检查生成视频。为验证方法,构建了 FinePhyEval 数据集,包含来自 Sora 2、Veo 3 和 Wan 2.1 的生成视频及人工标注。PQSG 的细粒度评分与人类判断相关性优于以往方法,且闭源模型物理真实性排名高于 Wan 2.1。此外,FinePhyEval 标注可用于子任务评估:两个强 VLM 能生成类人问题,但回答准确率仍不及人类。

视频论文/研究评测/基准
07:07
Hacker News 热门(buzzing.cc 中文翻译)
48
Lift4D:协调单视图3D估计与4D重建的真实场景框架

Lift4D是一个测试时优化框架,从单目视频重建动态物体的完整几何、外观和变形,包括相机从未观察到的区域。它通过因果潜在条件化使单视图3D重建模型(图像到3D DiT)生成时间一致的逐帧预测,作为可变形3D高斯泼溅表示的初始化;随后结合遮挡感知优化与视图条件扩散先验,恢复可见表面细节并补全被遮挡及未观测部分。在合成和真实场景中,Lift4D在严重遮挡与非刚性运动下显著优于先前4D重建方法。

图像生成视频论文/研究
06:14
Orange AI@oran_ge
54
即梦 Seedance 2.0 4K 视频定价引 ROI 定律思考

字节跳动视频生成模型 Seedance 2.0 收费:4K 15 秒需 1200 积分,折合超会约 88 元/条;一分钟广告片成本约 350 元,抽卡翻倍约 700 元。主推文指出,大模型训练和使用遵循 ROI 定律——算力、精力有限时 RL 优先选择价值最高的场景(如 coding 和短剧),模型定价高导致只有 ROI 算得过的人才用;当前 AI 仍处“替代阶段”,尚未进入“发现新价值”阶段。

小宇Chengzi: Seedance 2.0 4K 15 秒要 1200 积分。 按超会来算, 一条 15 秒 4K 视频差不多 88 元, 一条 1 分钟左右的广告片, 成本大概 350 元上下。就算抽卡翻个倍700元 如果能跑出可用的 4K 商业画面, 你...

大佬观点视频
05:45
Runway@runwayml
精选72
Seedance 4K。Seedance Mini。Kling 3.0 Turbo。现已推出。 全球最佳模型,汇聚一处。 使用优惠码 30RUNWAY,前三个月可享七折优惠。 通过下方链接开始使用。
产品更新视频

推荐理由:Runway 一次性推出 Seedance 4K 等多个模型,视频生成画质再升级,对 Sora 等的追赶信号明显,做视频的可以直接上手试试。
03:21
Hao AI Lab@haoailab
精选73
FastWan-QAD:单卡5090上1.8秒生成5秒视频

Sky Computing Lab 发布 FastWan-QAD 视频生成模型系列,基于 FastVideo 的量化感知蒸馏(QAD)方案训练。在单张 NVIDIA GeForce RTX 5090 上,端到端生成一段 5 秒 480P 视频仅需 1.8 秒。模型、代码及博客已开源。

GitHubHugging Face模型发布端侧

推荐理由:单张 RTX 5090 上 1.8 秒生成 5 秒视频,把消费级延迟压到了‘即时生成’的临界点,做短视频和互动应用的开发者可以认真把这个模型放进技术栈。
03:16
Rohan Paul@rohanpaul_ai
66
MaineCoon发布22B实时音视频生成模型

MaineCoon是一款22B参数的实时文本到音频-视频模型,专为实时AI角色设计。单H100 GPU可达47.5 FPS,成本低于0.001美元/秒;单RTX Pro 6000实现实时30 FPS。采用多阶段无强制流式训练(自采样、跨模态对齐、域偏好优化、强化在线策略蒸馏)及智能体流式推理框架,支持千秒级连续生成。双流扩散Transformer(视频+音频交叉注意力)保持表情、口型与声音同步,历史KV缓存和attention sink确保片段连贯。首帧小于1秒,生成与播放同步,不先制作完整视频再配音。

多模态推理模型发布视频
02:12
AYi@AYi_AInotes
28
holy shit😭 AI视频脸崩镜头乱的死穴被这个玩法直接干没了, 角色全程不崩,运镜精准到帧, 独立创作者直接能拍院线级镜头!
现象/趋势视频
01:06
Kling AI@Kling_ai
27
🎁 1000 Credits 赠送活动 参与方式: ✓ 关注 @KlingAI ✓ 转发此推文 ✓ 回复你为 Football Jungle 创作的动物及其招牌动作 时长:48 小时 前 15 名最佳回复将各获得 1000 Credits。

Kling AI: WILD - The Full MV is OUT NOW! Welcome to Football Jungle ⚽️

行业动态视频
00:03
HuggingFace Daily Papers(社区热门论文)
44
Vera:用于内容保留视频编辑的分层扩散模型

Vera 是一种分层扩散模型,专为内容保留视频编辑设计。它生成编辑层及 alpha 遮罩,与源视频合成,从而分离创意编辑与内容保留。架构采用混合 Transformer(MoT),各层独立 DiT 通过联合自注意力交互。训练使用高质量分层数据集,含精确 alpha 遮罩和多样场景。定量基准和人类偏好显示,Vera 在内容保留上优于开源模型,编辑质量有竞争力,仅使用 486K 帧分层训练数据。

视频论文/研究
6月23日
23:00
公众号:昆仑万维(天工)
49
DramaWave张薇:AI拍剧代替的是流程,不是故事 | 上海电视节白玉兰论坛

昆仑万维旗下短剧业务DramaWave内容负责人张薇在6月22日上海电视节白玉兰论坛上分享海外微短剧市场洞察。DramaWave采取付费和免费双轨运营,海外月活用户超亿,年度经常性收入达6亿美金。AI技术极大提升了内容产能——男频玄幻类AI短剧填补了真人拍摄成本高、难度大的空白,平台目前一个月可上线200余部AI剧。张薇指出,AI作为工具代替的是制作环节而非故事内核,99%的观众只关心故事是否好看。合作模式包括成品剧上传、合拍等,平台持续欢迎好剧本。

现象/趋势视频
22:36
Luma@LumaLabsAI
26
文明并非天然。它是被建造的。而它所埋葬的,永远不会真的消亡。 Wolf of Arcadia,一个由@MazuranDomagoj 创造的世界。 使用 Luma 制作。
行业动态视频
21:36
Kling AI@Kling_ai
14
你的下一个对手是你自己。
产品更新视频
20:41
PixVerse@PixVerse_
26
用 GPT image 2 制作故事板,再通过 PixVerse 的 Seedance 2.0 转为电影级短片--一位教练的最后礼物,一段世界杯决赛的 AI 故事。主推文称赞道:用 Pixverse 把这个故事呈现得很棒。

M: COACH'S LAST GIFT ⚽ An old pair of boots, a quiet tunnel, and a coach holding a faded photo from the stands What happens...

其他视频
20:24
The Decoder:AI News(RSS)
67
字节跳动Seedance 2.5将AI视频生成延长至30秒

字节跳动在火山引擎FORCE大会上发布五款新AI模型。核心产品Seedance 2.5可生成单次30秒视频片段(无需后期拼接),支持场景变化与节奏切换,并同时处理多达50个额外输入(参考图、音频等),后期编辑可保持原有视觉风格。Seedance 2.0升级原生4K与10bit色深。其他模型包括Doubao 2.1 Pro语言模型、Seedream 5.0 Pro图像模型和Seed-Audio 1.0音频模型。据称Doubao 2.1 Pro价格比Claude Opus 4.6低约80%。Seedance 2.5将于7月初上线。

多模态模型发布视频
20:16
Berryxia.AI@berryxia
14
Seedance 这一波属于断档式的领先了。 短期内,别的模型难以追赶了。
大佬观点视频
20:11
PixVerse@PixVerse_
36
一个迷失的人类。一只老虎战士。一只犀牛守护者。一只长颈鹿学者。一只沙漠青蛙。 《Drifters》是一部来自 PixVerse Originals 的奇特而温馨的寻家冒险故事。 @ruangideai 独自在 PixVerse 上构建了它,将不可能的世界变成了一段温暖的归家之旅。 转发+关注+回复"Drifters"= 150 Credits 及完整影片私信(仅限48小时)
产品更新视频
19:11
PixVerse@PixVerse_
60
画面被裁掉一半。再次裁剪不是解决办法。 PixVerse Web 上的 Magic Extend 可以补全缺失的空间--主体保持不变,背景被填充。 转推+关注+回复=300Creds 私信(仅 72 小时)
产品更新图像生成视频
17:16
Alibaba Cloud@alibaba_cloud
27
恭喜,我们宣布KaryaWAN AI挑战赛的获胜者诞生了!创作者们借助阿里云的WAN 2.7重新定义了故事讲述,从电影般的愿景到现实世界的影响力。马来西亚已准备好引领AI驱动的故事讲述。 观看入围选手的视频👇 🔗 https://int.alibabacloud.com/m/1000414756/ #AlibabaCloud #KaryaWANAIChallenge #AIStoryTelling
行业动态视频
17:15
Emad@EMostaque
38
当我几年前离开 Stability AI 时,我预测我们现在会看到中国实验室产出近乎完美的视频。 但看到输出质量达到这样的水平,几乎可以创造任何你能想象的东西,仍然令人惊叹。
大佬观点视频
17:15
Emad@EMostaque
33
Emad Mostaque 称即将推出的 Seedance 2.5 模型视觉效果惊人,支持多资产输入和更长输出。他预期 Grok Imagine 将在明年底跟上并实现实时生成同等质量。引用其两年前离开 Stability AI 时的预测:中国实验室大约现在会产出近乎完美的视频。如今看到输出质量已达到可创造任何想象内容的水平,每个像素都将被生成,这蕴含深远影响。

Emad: When I left Stability AI a couple of years ago I predicted we would see almost perfect video from Chinese labs around no...

xAI大佬观点视频
15:55
X.PIN@thexpin
57
字节跳动刚刚推出了一波新模型: 1️⃣ Doubao 2.1 Pro 面向编程。 2️⃣ Seedance 2.5:4K 视频,每段最长 30 秒。将于 7 月上线,同时推出新的 AI 版权商业化平台。 3️⃣ Seedream 5.0 Pro:图像模型,能处理图像中的文本,支持多层编辑,并输出可编辑的分层设计文件。 4️⃣ Seed-Audio 1.0:零样本多模态音频:一次生成多角色对话、背景音乐和音效。
图像生成多模态模型发布视频
15:26
Chubby♨️@kimmonismus
25
Seedance 2.5 发布。看起来太疯狂了!仍在试图弄清楚 Veo 4 在哪里,以及为什么没有其他产品能接近 Seedance。
多模态大佬观点视频
15:14
Berryxia.AI@berryxia
44
字节跳动发布视频模型 Seedance 2.0 升级版及 Seedance 2.5。Seedance 2.5 一次生成 30 秒短片,原生支持 4K 分辨率,支持 50 个全模态参考素材输入和 3D 白模。同时推出 AI 版权商业化平台,允许使用官方授权 IP 进行创作并分成。主推文指出该版本 CG 感大幅减轻,但当前仅限 Demo 展示,正式上线预计在 7 月初。

小互: 字节跳动发布全新视频模型Seedance2.0升级版和 Seedance 2.5 一次生成30秒短片 原生支持4K分辨率 支持50个全模台参考素材输入 支持3D白模 同时发布AI版权商业化平台,可以使用官方授权的各种IP电影版权进行创作,分...

图像生成模型发布行业动态视频
15:07
IT之家(RSS)
54
KTV频现AI魔改MV:画面与歌曲毫不相干,消费者可投诉

中央广播电视总台中国之声报道,近期多地消费者反映KTV中原版MV被AI生成视频替换,画面与歌曲意境完全不符,例如温婉情歌高潮处出现大猩猩持枪扫射。KTV工作人员称,多数因MV无版权或歌曲本身无MV,曲库服务方打包设备时替换为AI生成内容,商家无法控制。律师指出,该做法不能规避MV版权费,反可能侵犯放映权及保护作品完整权,额外收取版权费也不合规。消费者可向消费者权益保护单位及KTV运营主管部门投诉。

现象/趋势视频
14:37
🚨 AI News | TestingCatalog@testingcatalog
65
BYTEDANCE 🔥: Seedance 2.5 已正式发布,同时还有更新的 Seedance 2.0。 - Seedance 2.0 现支持 4k 输出 - Seedance 2.5 将能够一次性生成 30 秒视频 - 字节跳动还宣布了一个新的 AI 版权商业化平台 这个视频广告太惊艳了 👀

小互: 字节跳动发布全新视频模型Seedance2.0升级版和 Seedance 2.5 一次生成30秒短片 原生支持4K分辨率 支持50个全模台参考素材输入 支持3D白模 同时发布AI版权商业化平台,可以使用官方授权的各种IP电影版权进行创作,分...

多模态模型发布视频
13:11
歸藏(guizang.ai)@op7418
65
Seedance 2.0 4K 视频上线即梦,15 秒 1200 积分

Seedance 2.0 的 4K 分辨率功能已在即梦上线。用户需选择 Seedance VIP 版本,15 秒视频消耗 1200 积分。4K 分辨率视频码率为 50M,主要面向商业片和商业短剧制作公司。

模型发布视频
‹ 上一页
123456…28
下一页 ›