AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「视频」清除
7月1日周三
00:50fofr73Google 发布 gemini-skills,基于 Omni API 快速搭建 AI 智能体
00:50fofr32Omni Flash 图像编辑能力惊艳登场
00:35elvis45谷歌推出 Nano Banana 2 Lite 与 Gemini Omni Flash 生成媒体模型
00:30Logan Kilpatrick78Gemini发布Nano Banana 2 Lite与Omni Flash
00:27🚨 AI News | TestingCatalog62Google 推出 Nano Banana 2 Lite 与 Gemini Omni Flash Preview 两款新生成式媒体模型
00:26Google DeepMind66Google DeepMind 发布 Gemini 图像与视频模型
00:25Google AI74Google AI 发布 Nano Banana 2 Lite 与 Gemini Omni Flash 两大模型更新
00:25NotebookLM60NotebookLM 上线短视频概览功能
00:20fofr70Gemini Omni Flash 与 Nano Banana 2 Lite 上架 API
6月30日周二
23:28TechCrunch:AI(RSS)44Riverside 推出新闻通讯功能,支持 AI 转换播客视频为内容
23:23Kling AI15可灵Kling AI致敬六月创作者
21:57PixVerse28PixVerse Seedance 2.0 原生4K恐怖生成
20:38The Decoder:AI News(RSS)58美国竞选全面融入AI,欧洲以AI Act反向监管
20:24歸藏(guizang.ai)45Seedance 2.0 加速 AI 视频短片生态发展
19:26🚨 AI News | TestingCatalog33谷歌将推Nano Banana 2 Lite及Gemini Omni Flash
18:26PixVerse24Seedance 2.0 4K 将提示词变恐怖电影
16:20公众号:可灵AI(快手·视频)50戛纳国际创意节首设AI Craft子赛道,可灵AI参与作品获奖
12:26HuggingFace Daily Papers(社区热门论文)37NeuWorld:通过神经隐式场景实现交互式世界探索
12:26HuggingFace Daily Papers(社区热门论文)46DreamForge-World 0.1 Preview:低算力实时可控世界模型预览版
11:22Kling AI35可灵Kling AI在2026戛纳狮子节斩获三座狮子奖
11:02IT之家(RSS)4562 岁香港演员吴启华卖肖像权拍 AI 电影,"重回"20 岁样貌
10:55PixVerse11PixVerse:武士道是美与决心
08:21Kling AI19可灵AI:你正处于生命哪个时刻?
04:27ViggleAI54Viggle V4.5发布:一张头像生成全身
6月29日周一
22:24Berryxia.AI45开发者跑通AI视频讲解Skills,可自动生成内容
22:23PixVerse40PixVerse:手机视频秒变科幻电影场景
21:49fofr54Omni中文本逐句显示效果
19:52PixVerse48Seedance 2.0原生4K登场PixVerse
19:01IT之家(RSS)55创作者自制 AI 动画被搬运至优酷收费观看,相关剧集已下架
18:24Berryxia.AI62开源视频制作项目OpenMontage单日获3000 Star
17:51公众号:豆包(字节)29豆包携手人教社发起「经典课文名师AI共创计划」,用 Seedance 视频模型还原课文场景
17:01IT之家(RSS)62做视频不花钱、一句话搞定大纲分镜,Agnes AI推全新免费视频创作平台Pavo
15:27Rohan Paul72AI推动动画制作成本暴跌90%
08:00HuggingFace Daily Papers(社区热门论文)44AVTok:面向整体音频-视频生成的一维统一分词器
06:27宝玉20这种AI视频也挺有意思的😂
6月28日周日
22:21PixVerse58Seedance 2.0 用3D通道锁定运动与相机
18:21PixVerse6PixVerse企鹅康复后奇异事件频发
08:00HuggingFace Daily Papers(社区热门论文)55基于通用关键帧提取连接视频问答与视频引导智能体任务
02:22Berryxia.AI61LLM讲解通俗易懂引热议
6月27日周六
22:28Deedy34字节跳动7月初发布Seedance 2.5视频生成模型,生成长度翻倍至30秒
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月1日
00:50
fofr@fofrAI
73
Google 通过 Gemini Omni API 发布 gemini-skills 技能包,支持视频编辑、文生视频、图片参考视频生成、首帧生成视频,并提供预处理输入视频为 10 秒 720p、音频剥离、视频检查等辅助工具。同作者展示 Omni Flash 模型编辑能力:输入"将桌子改成浅水池",模型输出湿手、水波、折射、阴影及音效。该 API 已开放,可用于构建视频编辑流水线。

fofr: Omni Flash is a smart model. The way the hand is wet, the water ripples, the refraction, the shadows, the sound effects ...

智能体Google教程/实践视频
00:50
fofr@fofrAI
32
Omni Flash 模型具有出色的图像编辑能力,能够将桌子变为浅水池,并逼真呈现手部湿润、水波、折射、阴影和音效。该模型现已通过 API 提供,其编辑能力非常适合实现炫酷的流水线。

fofr: Omni Flash is a smart model. The way the hand is wet, the water ripples, the refraction, the shadows, the sound effects ...

Google图像生成视频评测/基准
00:35
elvis@omarsar0
45
Elvis Saravia 称赞谷歌持续降低模型使用成本。谷歌在 Gemini API 和 AI Studio 中推出两款新模型:Nano Banana 2 Lite 图像生成速度低于 4 秒,价格仅 $0.034/千张;Gemini Omni Flash 在视频编辑上达到 SOTA,价格为 $0.10/秒,与 Veo 3.1 Fast 一致。Saravia 透露 DAIR.AI 正使用 Nano Banana 和 Gemini 构建教育研究项目,并已开始测试 Nano Banana 2 Lite。

Logan Kilpatrick: Introducing Nano Banana 2 Lite 🍌 and Gemini Omni Flash 🔮, our new generative media models in the Gemini API and AI Stu...

Google图像生成模型发布视频
00:30
Logan Kilpatrick@OfficialLoganK
78
推出 Nano Banana 2 Lite 🍌 和 Gemini Omni Flash 🔮,我们在 Gemini API 和 AI Studio 中新的生成媒体模型! Nano Banana 2 Lite 极快(图像 <4 秒)且便宜($0.034 / 1K 图像)。 Omni Flash 在视频编辑上达到 SOTA,$0.10 / 秒,与 Veo 3.1 Fast 相同!
Google多模态模型发布视频
关联讨论 1 条Google DeepMind:Blog(RSS)
00:27
🚨 AI News | TestingCatalog@testingcatalog
62
Google 在 Gemini API 和 AI Studio 推出两款新生成式媒体模型:Nano Banana 2 Lite 图像生成极快(<4秒/张),价格仅 $0.034/千张;Gemini Omni Flash Preview 在视频编辑上达到 SOTA,定价 $0.10/秒,与 Veo 3.1 Fast 相同。Omni Flash 现已提供 API 预览。

Logan Kilpatrick: Introducing Nano Banana 2 Lite 🍌 and Gemini Omni Flash 🔮, our new generative media models in the Gemini API and AI Stu...

Google图像生成模型发布视频
00:26
Google DeepMind@GoogleDeepMind
66
我们正在推出两个主要版本: 🔘 Nano Banana 2 Lite:我们最快、最便宜的 Gemini 图像模型 🔘 Gemini Omni Flash:现可通过 Gemini API 和 @GoogleAIStudio 使用,帮助开发者生成和编辑高质量视频。
Google图像生成模型发布视频
关联讨论 1 条Google DeepMind:Blog(RSS)
00:25
Google AI@GoogleAI
74
Google AI 发布 Nano Banana 2 Lite 与 Gemini Omni Flash 两大模型更新

Google AI 推出两大模型更新:1)Nano Banana 2 Lite——最快、最经济的 Gemini 图像模型,文本生成图像不到 4 秒,已上线 Gemini API 和 AI Studio,即将登陆 NotebookLM、Google 搜索、Google Photos 等;2)Gemini Omni Flash 进入公开预览——原生多模态模型,支持低成本视频生成与对话式编辑,可通过 Gemini API、AI Studio 及 Gemini Enterprise Agent Platform 集成。两模型结合可快速实现空间设计重绘:上传照片、滑动选择设计方案,Omni 将细节以电影级动画呈现。演示应用已在 AI Studio 上架。

Google产品更新图像生成视频
关联讨论 1 条Google DeepMind:Blog(RSS)
00:25
NotebookLM@NotebookLM
60
Doom scrolling but make it educational 🤓 介绍 NotebookLM 中的短视频概览功能!将你最复杂的信息源转化为60秒的竖屏视频,深入探讨任何概念。 现已面向移动端和网页端的 Google AI Ultra 和 Pro 订阅用户推出(免费用户即将支持!)
Google产品更新视频
00:20
fofr@fofrAI
70
Gemini Omni Flash 和 Nano Banana 2 Lite 现已在 API 中可用 🔥 Nano Banana 2 Lite 是最快的 banana,图像约 4 秒生成,每张 $0.034(`gemini-3.1-flash-lite-image`) Omni API 文档: https://ai.google.dev/gemini-api/docs/omni

Google DeepMind: We're shipping 2 major releases: 🔘 Nano Banana 2 Lite: our fastest and cheapest Gemini Image model 🔘 Gemini Omni Flash...

Google图像生成模型发布视频
6月30日
23:28
TechCrunch:AI(RSS)
44
Riverside 推出新闻通讯功能,支持 AI 转换播客视频为内容

视频与播客录制工具 Riverside 新增新闻通讯发布功能,用户可通过 AI 助手将已有视频和播客内容自动转换为新闻通讯,也可在应用内从头创建并直接发送。Riverside 同时更新录制套件,支持多机位录制和远程嘉宾添加。新版 AI 功能还包括自动生成录制初稿、为社交媒体创建钩子与内容,以及基于对话视频播客训练的 AI 视频增强功能,可改善光线、深度和锐度。Riverside 已累计融资超 6000 万美元。

产品更新多模态视频
23:23
Kling AI@Kling_ai
15
像金鱼在水中闪烁一样,每个想法都留下一丝色彩。✨ 那些为我们的六月染上色彩的创作者们。
行业动态视频
21:57
PixVerse@PixVerse_
28
这条医院走廊刚给我来了个我没点的跳吓。我的手柄现在不见了。 Seedance 2.0 上线 PixVerse。原生 4K 恐怖内容,直接通过提示词生成。
产品更新多模态视频
20:38
The Decoder:AI News(RSS)
58
美国竞选全面融入AI,欧洲以AI Act反向监管

《纽约时报》报道,美国两党竞选团队已将AI融入候选人审查、选民微定向等环节,87%策略师每日使用AI。民主党团体Swing Left用AI分析选民对话,American Bridge 21st Century用AI审查约250名共和党候选人。共和党更依赖私营公司,民主党偏向非营利模式且选民对AI更怀疑。欧洲则不同:2025年10月起欧盟政治广告须明确标注出资方等信息,禁止使用敏感数据画像;AI Act于2026年8月2日生效,要求对涉及公共利益的深度伪造和AI内容显著标注。德国2025年联邦选举中,多数党签署公平协议承诺标注AI内容,但AfD和BSW未签署。

政策/监管视频
20:24
歸藏(guizang.ai)@op7418
45
Seedance 2.0 加速 AI 视频短片生态发展

Seedance 2.0 的推出推动了 AI 视频短片生态的快速发展。近日,制作《神秘复苏》AI 视频的三位博主被该作品动画官方举报,导致视频被删除。这些博主的 AI 视频质量高且粉丝不少。作为回应,小说粉丝将动画官方的 PV 举报下架。

现象/趋势视频
19:26
🚨 AI News | TestingCatalog@testingcatalog
33
GOOGLE 🔥:一款新的 Nano Banana 2 Lite 图像生成模型即将到来! > "推出 Nano Banana 2 Lite,用于超快、高性价比的图像生成,以及 Gemini Omni Flash,用于通过对话式、逐步编辑进行强大的视频创作"

Logan Kilpatrick: ⚡️🍌🔮

Google图像生成模型发布视频
18:26
PixVerse@PixVerse_
24
当你以为已经摆脱了烦恼……结果发现是一只暴龙。💀🦖 Seedance 2.0 4K - 你的提示词变成了电影级恐怖。
产品更新图像生成视频
16:20
公众号:可灵AI(快手·视频)
50
戛纳国际创意节首设AI Craft子赛道,可灵AI参与作品获奖

本届戛纳国际创意节首次设立“AI Craft”子赛道。可灵AI参与制作的两部广告获奖:《L’Ultimo Uomo Reale》获Classic单元Film银奖及Craft单元Film Craft铜奖;《Lorem Ipsum》获Classic单元Film铜奖。这标志着AI创作正式进入全球最高级别广告创意奖评审体系。

行业动态视频
12:26
HuggingFace Daily Papers(社区热门论文)
37
NeuWorld:通过神经隐式场景实现交互式世界探索

NeuWorld提出场景中心范式Walking in the Implicit,将交互式视频生成的滚动变量从帧级潜变量替换为固定长度的可渲染隐式状态NIS。模型利用Transformer VAE从稀疏有姿态帧学习局部锚定的NIS,并通过扩散Transformer根据未来相机轨迹和几何感知历史演化NIS。通过复用VAE编码器作为统一条件器,将相机、参考图像和历史线索映射到同一NIS模态,避免外部异构编码器。模型在公开姿态视图数据上从头训练,未使用预训练视频骨干或3D重建器,实现了强长程一致性和有利推理效率。

arXiv视频论文/研究
12:26
HuggingFace Daily Papers(社区热门论文)
46
DreamForge-World 0.1 Preview:低算力实时可控世界模型预览版

DreamForge-World 0.1 Preview 是一款低算力实时交互世界模型预览版,基于 LongLive 1 自回归视频栈(源自 Wan2.1-T2V-1.3B)和 Matrix-Game 系列的残差动作路径。支持实时键盘鼠标控制、多模态初始化、中流重提示及双视角操作。在单张 RTX 4090 上以原生 480p 分辨率达到 14-15 FPS,内存占用低,展示了在消费级 GPU 上实现实时可控世界模型预览的低算力路线。

开源生态视频论文/研究
11:22
Kling AI@Kling_ai
35
可灵Kling AI在2026戛纳狮子节斩获三座狮子奖

可灵Kling AI在2026年戛纳狮子国际创意节上拿下三座狮子奖:电影类(消费品)银狮、电影类(B2B)铜狮,以及新设的AI工艺类铜狮。推文指出,这些奖项标志着AI作为真正工艺工具的地位——Kling旨在为创作者提供对可信物理、真实情感、角色面部微表情及镜头间一致性的控制。获奖作品来自Lipstick Film、Purga Films等团队。

行业动态视频
11:02
IT之家(RSS)
45
62 岁香港演员吴启华卖肖像权拍 AI 电影,"重回"20 岁样貌

62 岁香港演员吴启华近日卖出肖像权拍摄 AI 电影,制片方用其 20 岁样貌制作影片,本人无需出演。他看过成品后满意,认为 AI 不会冲击演员工作,反而开辟新路线,并透露酬劳不错。多位同行持相反观点:马修·麦康纳警告 AI 取代人类从业者,尼古拉斯·凯奇抨击 AI 改变表演是“死胡同”,演员王劲松感叹 AI 生成视频真假难辨。此外,伦敦“AI 女演员”Tilly Norwood 引发争议,美国演员工会 SAG-AFTRA 明确反对合成演员。

现象/趋势视频
10:55
PixVerse@PixVerse_
11
武士道是美与决心,凝聚在这一击之中!

楽園: 武士道とは!? #pixversecpp @PixVerse_

其他视频
08:21
Kling AI@Kling_ai
19
你正处于生命的哪个时刻?⏰
其他视频
04:27
ViggleAI@ViggleAI
54
只需一张头像。介绍我们的新模型 Viggle V4.5。 - 从一张头像出发,全身结果更清晰、细节更完整、每个角度都表现到位 - 纹理更精细,与参考图更一致 - 动作更稳定 🎁 关注 + 转发 + 评论,赢取 10 个免费会员资格!
模型发布视频
6月29日
22:24
Berryxia.AI@berryxia
45
开发者跑通AI视频讲解Skills,可自动生成内容

Berry Xia 宣布成功完成了一套“视频讲解的Skills”开发与测试。用户只需提供网站、内容、视频地址等信息,该技能就能自动生成基础的讲解视频。作者询问社区兴趣度,表示如果需求多可能会进一步分享。目前未披露具体使用的模型或平台名称。

智能体教程/实践视频
22:23
PixVerse@PixVerse_
40
过去,打造一个完整的黑暗科幻世界需要摄影棚布景、复杂的合成技术以及大量视效预算。 有了 PixVerse,一段简单的后院手机拍摄视频也能转化为电影级场景,同时完全保留原表演的完整性。
产品更新视频
21:49
fofr@fofrAI
54
这是一个提示词,展示了文本在Omni中的良好效果。 该提示词的精确文本逐字显示在此环境视频中。 文本逐句出现,如同电影的开头。 背景是飞过蓝天。
多模态教程/实践视频
19:52
PixVerse@PixVerse_
48
这是 PixVerse 上的 Seedance 2.0 原生 4K--从文本生成电影级角色动作和城市动作的最佳 AI 视频模型。
模型发布视频
19:01
IT之家(RSS)
55
创作者自制 AI 动画被搬运至优酷收费观看,相关剧集已下架

据《正在新闻》报道,舒先生制作的 AI 动画被搬运至优酷平台,剧集《小企鹅咕嘎冒险记》更新至29集,最新一集来自舒先生5月1日发布的作品。前4集免费,后续需VIP。舒先生称动画由AI生成并剪辑,未在任何平台备案,也不清楚备案号来源。优酷客服表示该剧是站内官方少儿节目,非私人上传,但无法查询备案号,侵权问题需通过知识产权投诉平台处理。目前该剧集已无法在优酷搜索到,从搜索引擎进入会提示“版权受限暂无可播源”。

多模态行业动态视频
18:24
Berryxia.AI@berryxia
62
开源项目OpenMontage单日获3000 Star,将视频生产拆为12条pipeline,内置52工具和500+ agent skills。用户用自然语言描述需求,agent完成从调研到剪辑全流程,支持AI与真实素材混合工作流,具备预合成验证、后渲染自检等质量把控,渲染引擎Remotion+HyperFrames,普通人对话可产出专业级视频。

Berryxia.AI: 这个开源视频制作工作流真爽啊! 单日斩获3000 Star,真的牛~ 又一个把AI coding agent直接变成视频制作工作室的项目开源了,叫OpenMontage。 它把整个视频生产流程拆成12条结构化pipeline(动画解说、纪录...

智能体GitHub开源/仓库视频
17:51
公众号:豆包(字节)
29
豆包携手人教社发起「经典课文名师AI共创计划」,用 Seedance 视频模型还原课文场景

近日,豆包与人民教育出版社合作发起「经典课文名师AI共创计划」,邀请康震、蒙曼、骆玉明、梁永安、苏德超五位名师讲解,使用 Seedance 视频模型还原经典文本中的场景、人物与情境。同时,豆包旗下教育产品豆包爱学上线“豆包课堂”专区,同样基于 Seedance 视频模型呈现经典古诗文。该计划旨在以AI视频生成技术让经典课文“活”起来。

产品更新视频
17:01
IT之家(RSS)
62
做视频不花钱、一句话搞定大纲分镜,Agnes AI推全新免费视频创作平台Pavo

新加坡公司Sapiens AI旗下Agnes AI推出免费视频创作平台Pavo。用户提供一句话初始需求,平台自动生成需求、大纲、角色场景道具设计、分镜、关键帧及分镜视频,用户逐环节微调确认即可成片。Pavo免费使用Agnes自研模型,包括文本模型Agnes-2.0-Flash、图片模型Agnes-Image-2.1-Flash、视频模型Agnes-Video-2.0。即将上线的Agnes-Video-2.5-Preview在动作、角色、相机移动和场景连贯性上接近Veo 3。

产品更新多模态视频
15:27
Rohan Paul@rohanpaul_ai
72
彭博社:AI正在推动动画行业走向成本崩塌,好莱坞电影制片人称长片制作成本可能下降90%,因为制片厂、员工和工会准备面对更少的人类工作岗位。 好莱坞就业已经受到罢工、减产、并购和AI驱动的重组的压力。 --- bloomberg .com/news/newsletters/2026-06-28/animation-s-ai-reckoning-filmmakers-say-they-can-make-movies-for-90-less
现象/趋势视频
08:00
HuggingFace Daily Papers(社区热门论文)
44
AVTok:面向整体音频-视频生成的一维统一分词器

AVTok 是一种新颖的统一分词器,专为整体音频-视频生成设计。它采用双流 Transformer 架构,包含共享编码器-解码器和模态特定的可学习查询,将音频-视频对高效编码为紧凑的一维潜在表示并共享同一码本。为应对异质信息不平衡,研究者设计了分层训练策略,逐步重建各模态。实验表明,AVTok 在音频-视频重建及下游任务(音频到视频、视频到音频、类别条件联合生成)中均表现优异,为构建统一音视频大语言模型提供了潜在方向。

多模态视频论文/研究
06:27
宝玉@dotey
20
这种AI视频也挺有意思的😂
其他视频
6月28日
22:21
PixVerse@PixVerse_
58
从基本的灰色3D座舱模型到全速电影级圈速。 Seedance 2.0 使用3D通道锁定运动和相机移动,无需依赖文本提示即可提供精确、一致的结果。
产品更新多模态视频
18:21
PixVerse@PixVerse_
6
小企鹅从疾病中康复,本该回归日常,但梦境、星星、微光、旧箱子……奇怪的事情逐渐增多,不过它依然我行我素🐧📷

楽園: 病気から回復したぺんぎんちゃん。 いつもの日常に戻ったはずなのに、 夢、星、小さな光、古い箱...... 少しずつ不思議なことが増えてきました。 でも本人は相変わらずマイペースです🐧📷 #pixversecpp @PixVerse_

其他视频
08:00
HuggingFace Daily Papers(社区热门论文)
55
基于通用关键帧提取连接视频问答与视频引导智能体任务

论文提出VG-GUIBench基准,用于评估多模态大语言模型(MLLM)的GUI智能体能否跟随视频教程完成交互任务。现有VideoQA基准侧重浅层视觉线索,而VG-GUIBench考察模型从视频中学习深层知识并泛化到长时智能体任务。同时提出TASKER关键帧提取算法,联合考虑任务相关性与场景动态筛选信息帧。实验显示,TASKER在EgoSchema全集上超出最优基线2.0%,在NExT-QA数据集上超出1.8%,展示了通用关键帧提取方法在视频理解任务中的潜力。代码与数据已公开。

智能体多模态视频论文/研究
02:22
Berryxia.AI@berryxia
61
一位老师以通俗易懂的方式讲解大语言模型(LLM),引发网友共鸣,并邀请大家分享看法。原文信息有限,未提及具体模型名称或课程细节。

Berryxia.AI: 这个开源视频制作工作流真爽啊! 单日斩获3000 Star,真的牛~ 又一个把AI coding agent直接变成视频制作工作室的项目开源了,叫OpenMontage。 它把整个视频生产流程拆成12条结构化pipeline(动画解说、纪录...

智能体GitHub开源/仓库视频
6月27日
22:28
Deedy@deedydas
34
字节跳动7月初发布Seedance 2.5视频生成模型,生成长度翻倍至30秒

字节跳动将于7月初发布视频生成模型Seedance 2.5,将生成长度从15秒翻倍至30秒,支持音频+4K视频;参考图片/音频/视频数量提升至50个以上;支持局部编辑(特定角色、闭合、细节),附带版权过滤。其前代Seedance 2已是视频生成模型第一名,ARR达20亿美元,定价$2.5/15秒,累计生成超330万小时视频。对比时间线:Veo 3(2025年5月)首降音视频生成15秒,Kling 3(2026年1月)15秒,Seedance 2(2026年2月)15秒,Seedance 2.5(2026年7月)30秒。中国视频模型持续扩大对美国的领先优势。

多模态模型发布视频
‹ 上一页
1234…28
下一页 ›