AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「视频」清除
今天7月3日 周五
04:03Odyssey20Odyssey 表示可能多留一会儿
04:02Runway60Runway 推出 Agent Skills 功能
01:08Apple Machine Learning Research(RSS)56精选VideoFlexTok:可变长度粗到细视频分词
00:33Berryxia.AI15换助理了!!! 新助理说每个人都需要一个数字人? 那么,还要她干嘛呢? 你说呢?兄弟们~ 【引用 @berryxia】:开始让美女助教卖课了😂 丝滑~
00:06IT之家(RSS)71精选快手可灵AI获初始投资者20.28亿美元注资,投后估值180亿美元
7月2日周四
22:00公众号:可灵AI(快手·视频)49可灵AI广告斩获戛纳金狮:两部作品获1银2铜
21:37Rohan Paul52Arcads 将 Slack 变为 AI 广告工作室,支持 Claude 协作与多视频工具
20:45The Decoder:AI News(RSS)42Google 为 NotebookLM 引入 TikTok 风格短视频
20:03PixVerse25PixVerse Seedance 2.0 单灰模转电影级4K丧尸场景
19:39meng shao79精选browser-use 发布开源 AI 视频剪辑 Skill「video-use」
19:29fofr60Omni 图像参考一镜到底示例
19:01Kling AI31可灵AI广告片获戛纳狮子奖铜奖
16:39小互66豆包复刻真人+2D贴纸搞笑短视频
14:32PixVerse37PixVerse 支持日本大学 AI 服装设计工作坊
13:37Alibaba Cloud35阿里云Happy Horse短片《The Glow of First Love》获摩纳哥AI电影节黑客松第三名
11:02PixVerse52Seedance 2.0 动作参考转 4K 风格化战士
10:03IT之家(RSS)68消息称快手可灵 AI 将完成 30 亿美元融资:投后估值 180 亿美元,腾讯参投
08:21AYi73Seedance 2.0 生成逼真韩国社区生活视频
03:02PixVerse59PixVerse APP 推出 Lip-Sync 功能
01:21AYi47AI零成本副业:儿童动画月入$5000+,营销Agent Lev8找客户三项Benchmark领先
00:25Kling AI26可灵推出互动故事系列《Choose Your Journey》
00:25Kling AI26可灵 AI 推出 1000 积分抽奖活动
7月1日周三
23:57Luma29Luma AI绿幕与海洋同动作转换
23:54Runway36Runway 推出"不存在产品"广告大赛 奖金10万美元
23:31Berryxia.AI29Omini的场景很适合做换装视频,包括家居装修类的这类前后对比的场景。
23:31Berryxia.AI15Omini 1.0 视频编辑能力提升,新版本即将发布
20:54Kling AI53可灵 Kling AI 在 2026 戛纳狮子奖斩获银狮铜狮
16:22fofr15智能体脚本配合Lyria 3生成音乐作品
11:28HuggingFace Daily Papers(社区热门论文)38MemLearner:为视频世界模型学习查询上下文记忆
10:30Berryxia.AI26Omini 1.0 修改视频也还可以,看着演示空间、透视这些都应该提升不少啊。 应该很快就发布新版本可以使用了,但是因为属于编辑强,所以热度好像没有很高。
05:27Luma20Luma AI 短片《AOI》发布
03:57Luma54Luma 上线 Seedance 2.0 Mini
03:55NotebookLM68精选NotebookLM Short Video Overviews 全量上线 Web 英文版
03:53Runway49Runway 推出 Gemini Omni Flash 视频生成编辑
03:27Luma31Luma AI打造恐龙与智能体的温馨小世界
03:20AYi62卧槽,Google这回不拉胯了, 这才是短视频真正该有的打开方式啊, NotebookLM可以把复杂资料直接做成六十秒竖屏概览, 刷信息流的功夫就能啃完一个硬核概念了🤯
02:28Artificial Analysis68阿里巴巴 HappyHorse 1.1 登顶 Artificial Analysis 视频排行榜第二
01:38The Decoder:AI News(RSS)59Google 发布 Nano Banana 2 Lite 图像模型与 Gemini Omni Flash 视频模型
01:31Rohan Paul72Google发布Nano Banana 2 Lite与Gemini Omni Flash
00:50fofr52Omni Flash模型编辑能力令人惊叹
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月3日
04:03
Odyssey@odysseyml
20
可能多待一会儿。
行业动态视频
04:02
Runway@runwayml
60
推出 Agent Skills。通过简单命令即可构建广告活动、创建商业广告、本地化广告等。输入 /,选择一项 Skill,Agent 便开始工作。规模化你的营销。一键执行。 请通过下方链接开始使用。
智能体产品更新视频
01:08
Apple Machine Learning Research(RSS)
精选56
VideoFlexTok:可变长度粗到细视频分词

VideoFlexTok提出一种可变长度token序列的视频表示方法,采用粗到细结构——首个token捕捉语义和运动等抽象信息,后续token添加精细细节,生成流解码器支持任意token数量的视频重建。相比传统3D网格分词,该结构允许根据下游需求调整token数,在相同预算下编码更长视频。在类别和文本到视频生成任务中,VideoFlexTok以1.1B参数(5.2B的1/5)达到可比生成质量(gFVD和ViCLIP Score)。训练一个处理10秒81帧视频的文本到视频模型仅需672个token,比同等3D网格分词器少8倍。

数据/训练视频论文/研究

推荐理由:把视频 tokenization 从固定网格改成变长 coarse-to-fine,训练效率提升明显,还能做更长的视频。研究角度挺漂亮,但离产品落地还有距离,做视频生成的可以追一下。
00:33
Berryxia.AI@berryxia
15
换助理了!!! 新助理说每个人都需要一个数字人? 那么,还要她干嘛呢? 你说呢?兄弟们~ 【引用 @berryxia】:开始让美女助教卖课了😂 丝滑~

Berryxia.AI: 开始让美女助教卖课了😂 丝滑~

其他视频
00:06
IT之家(RSS)
精选71
快手可灵AI获初始投资者20.28亿美元注资,投后估值180亿美元

快手在港交所公告,21名初始投资者同意以138.24亿元人民币(20.28亿美元)现金注资北京可灵,后者将持有可灵AI相关资产。同日15名额外投资者追加出资52.235亿元人民币(7.6639亿美元),认购总上限为204.471亿元(30亿美元),对应北京可灵扩大后注册资本的16.67%。投后估值180亿美元。快手预计未来12个月内启动可灵AI赴港上市,募资用于扩充算力、建设数据中心及人才引进。

行业动态视频

推荐理由:可灵AI这轮180亿美元估值融资,是AI视频赛道迄今最重量级的资本动作之一,也是中国AI公司分拆上市的标杆事件,值得关注后续上市进程。
7月2日
22:00
公众号:可灵AI(快手·视频)
49
可灵AI广告斩获戛纳金狮:两部作品获1银2铜

戛纳国际创意节今年首设AI Craft子赛道,两部使用可灵AI生成的广告获奖:《L'Ultimo Uomo Reale》获Classic单元Film银奖及Craft单元Film铜奖,《Lorem Ipsum》获Classic单元Film铜奖。前者为二手奢侈品平台The RealReal的愚人节广告,几乎全由AI生成,仅手提包为实拍,展现人物一致性和复杂视觉奇观;后者由Purga Films制作,全片角色用拉丁文假文对话,风格迥异但情绪推进精准。两部作品标志可灵已产出商业交付级广告,获全球最高级别广告创意殿堂认可。

多模态行业动态视频
21:37
Rohan Paul@rohanpaul_ai
52
Arcads 将 Slack 转化为 AI 广告工作室,用户可直接在 Slack 内创建广告、研究竞争对手并生成创意。支持 Claude Tag(@Claude 跨频道跨工具委派任务)和 MCP(让 Claude 从 Slack 安全调用 Arcads 技能)。同一界面可调用 Veo 3.1、Kling Motion Control、Nano Banana、Sora 2 Pro 等视频生成工具。官方宣布 Claude x Arcads in Slack 即日上线,用户可在 Slack DM 中获取病毒式广告。

arcads AI: Introducing Claude x Arcads in Slack: Get viral ads in your Slack DMs Available today for all Arcads users

AnthropicMCP/工具产品更新视频
20:45
The Decoder:AI News(RSS)
42
Google 为 NotebookLM 引入 TikTok 风格短视频

Google 为 NotebookLM 新增视频概览功能,可将上传的源文件转换为 60 秒竖屏短视频,分解特定主题。该功能目前正在移动端和网页端向 Google AI Ultra 和 Pro 订阅者推出,免费用户即将获得访问权限。NotebookLM 是 Google 的 AI 笔记工具,能分析多源内容并以不同格式重新打包。

Google产品更新视频
20:03
PixVerse@PixVerse_
25
从单个灰模动作片段到电影级4K丧尸场景。 角色外观来自一张参考图像,动作来自3D参考,环境在每个镜头中保持一致。 使用 PixVerse 上的 Seedance 2.0 创建。
产品更新视频
19:39
meng shao@shao__meng
精选79
browser-use 发布开源 AI 视频剪辑 Skill「video-use」

browser-use 团队推出面向 Codex、Claude Code 等 AI 编码智能体的开源 Skill「video-use」,让 LLM 通过 ElevenLabs Scribe 将音频转写为约 12KB 文本(含逐词时间戳、说话人分离、事件标记),仅在决策点调用 timeline_view.py 生成 PNG 帧图。技术流水线包括转写、打包、生成 JSON 格式 EDL、ffmpeg 渲染及最多 3 轮自评估。渲染关键细节:分段提取 + -c copy 拼接、30ms 音频淡入淡出、PTS 时移、字幕最后叠加、HDR 自动映射、竖屏缩放、两-pass loudnorm。动画支持 HyperFrames、Remotion、Manim 等引擎。项目附带 12 条硬规则确保生产正确性。

智能体GitHub开源/仓库视频

推荐理由:browser-use 团队把 AI 视频剪辑从「看视频帧」变成「读转写文本」,12KB 文本代替 4500 万 token 噪声的思路很聪明,一套可落地的 ffmpeg 脚本集,做 AI agent 视频处理的可以直接抄。
19:29
fofr@fofrAI
60
这些与 Omni 配合得很好: > 这个奇怪生物的一个连续不间断场景<IMG_REF_0>,没有对话,摄像机从远处颤抖地拉近又拉远,对焦前有点模糊,正在下雨。将图像用作参考而非第一帧。一个由业余爱好者拍摄的长场景。

fofr: You can replace the animal and the object with anything in the quoted prompt, and NB2L let's you cycle through ideas qui...

教程/实践视频
19:01
Kling AI@Kling_ai
31
可灵AI广告片获戛纳狮子奖铜奖

可灵Kling AI官方宣布,由其生成的广告片《Lorem Ipsum》荣获戛纳狮子奖(Cannes Lions)电影类B2B铜奖。该片由阿根廷工作室Purga Films制作,片中所有角色均使用无意义的占位词“Lorem Ipsum”对话,但情感表达依然强烈。全片通过Kling AI生成,涵盖多种风格和世界,展现了可灵在表演一致性、情感深度和电影级控制上的能力。

图像生成行业动态视频
16:39
小互@xiaohu
66
用户使用豆包,根据详细prompt复刻了一部真人实拍与2D动漫贴纸合成的搞笑短视频。视频为第一人称厨房做饭视角,包含4个镜头:贴纸角色倒盐捣乱、被锅铲敲头、被喂盐咸菜、齁到倒地。prompt指定了风格(8K超清竖屏)、时长10秒、场景(真实厨房)、角色(金色长发水手服Q版贴纸人物)及各镜头的动作与音效。

John: 简简单单使用豆包复刻一下📺 prompt 👇 [风格]真人实拍+2D动漫贴纸合成搞笑短视频(Live-Action + Flat 2D Sticker Composite),第一人称做饭视角(POV Cooking Vlog),写实厨房...

多模态教程/实践视频
14:32
PixVerse@PixVerse_
37
日本大阪成蹊大学服装设计系使用 PixVerse 平台开设 AI 服装设计工作坊,学生在两个小时内完成从图像到视频的高质量闭环交付。PixVerse 官方感谢分享,并表示支持更多创意教育。

汗青 HQ: 日本的艺术大学已经开始重视AI技术的价值。这是我在大阪成蹊大学的服装设计系,开设的AI服装设计的工作坊,感谢PixVerse的大力支持,同学们使用PixVerse平台在两个小时内完成了从图像到视频的高质量闭环交付,一站式平台全部搞定。

行业动态视频
13:37
Alibaba Cloud@alibaba_cloud
35
阿里云Happy Horse短片《The Glow of First Love》获摩纳哥AI电影节黑客松第三名

阿里云Happy Horse平台创作的短片《The Glow of First Love》在摩纳哥AI电影节黑客松中获得第三名。该一分钟作品讲述一名女子在2003年丈夫车祸去世后独自抚养女儿,53年间被无形光之守护者陪伴,直至临终重逢。短片利用Happy Horse平台将情感转化为诗意视觉,展示了festival-grade AI工具在叙事中的潜力。

行业动态视频
11:02
PixVerse@PixVerse_
52
视口输入 → 4K 输出 左:原始动作装备阻挡姿势 右:Seedance 2.0 将该动作转化为风格化 4K 战士 披风飘动、落地重量、出拳跟进--全部直接来自参考。 输入清晰的运动。模型处理其余部分。
产品更新视频
10:03
IT之家(RSS)
68
消息称快手可灵 AI 将完成 30 亿美元融资:投后估值 180 亿美元,腾讯参投

快手旗下可灵 AI 即将完成 30 亿美元融资,投后估值 180 亿美元,腾讯参投。快手今年 4 月首次计划分拆时估值目标 200 亿美元,后下调至 180 亿。公司预计未来 12 个月内启动赴港上市,资金用于扩充算力、建设数据中心、引进人才。可灵 AI 今年 3 月年化收入运行率达 5 亿美元,一季度收入 6.5 亿元同比增长 300%,全球用户突破 1 亿,约四分之三收入来自海外。今年 2 月发布的 3.0 系列模型增强了视频生成中的叙事控制力和一致性。

行业动态视频
08:21
AYi@AYi_AInotes
73
Seedance 2.0 生成逼真韩国社区生活视频

Seedance 2.0 通过详细 prompt 生成一段超真实视频,以 2000 年代初 DV 摄像机美学展示韩国女性日常:手持抖动、自动对焦搜索、曝光波动、运动模糊等不完美感,配合环境自然音(鸟鸣、风声、社区闲聊),实现家庭录像般的独特说服力。

图像生成教程/实践视频
03:02
PixVerse@PixVerse_
59
多数内容无法发布的首要原因? 就是需要自己出镜拍摄。 试试 PixVerse APP 上的 Lip-Sync。 添加图片或视频,输入脚本(或上传音频),即可生成。 使用内置声音、克隆自己的声音,或用任何音频文件驱动。 转推 + 关注 + 回复 = 150 积分私信发放(仅限 72 小时)
产品更新视频
01:21
AYi@AYi_AInotes
47
AI零成本副业:儿童动画月入$5000+,营销Agent Lev8找客户三项Benchmark领先

主推文介绍零成本AI副业:用AI做YouTube儿童早教动画。五步:搜童谣对标、AI改写脚本、Wan2.7或Pika生成动画、AI配儿童音色+背景音乐、标题标签SEO。日更1-2条,首月见收益,月入$5000-$10000。注意纯原创、专业儿童音色、遵守COPPA关闭个性化广告。另引用营销Agent Lev8,找海外客户场景:有效结果90个(Exa 58.2,Codex 20),匹配精度83.3%(Exa 76.5,Codex 71.8),单条成本$0.052(Exa $0.061)。Lev8聚合50+数据源和10亿+职场人脉,支持5个渠道发送定制破冰消息。

AYi: 真的有点兴奋,终于等来营销圈的 Codex 了,不管你是独立开发还是OPC一人公司,找客户扒联系方式写破冰信这些破事,直接给你干得明明白白! 甚至你用来做副业搞钱都是一个超级神器! 我们都知道,AI现在已经把写代码的门槛拉平了,Codex能...

智能体多模态教程/实践视频
00:25
Kling AI@Kling_ai
26
视频结束,游戏开始。 欢迎来到《Choose Your Journey》,我们全新的互动故事系列。 找到你的出路。 三扇门,一个选择。 明智抉择。
产品更新视频
00:25
Kling AI@Kling_ai
26
🎁1000 Credits 抽奖活动 参与方式: ✓ 关注 @Kling_ai ✓ 转发此推文 ✓ 回复你的选择并写下接下来会发生的事。 排名前 10 的最佳回复将各赢取 1,000 Credits。 慎重选择。 下一章节可能就跟随你的评论。 活动时长:72 小时

Kling AI: End of video. Start of game. Welcome to Choose Your Journey, our new interactive story series. Find your way out. Three ...

行业动态视频
7月1日
23:57
Luma@LumaLabsAI
29
观看拍摄变成世界。一边是绿幕,另一边是开阔海洋,相同的动作连接两者。由@heydin_ai制作。使用Luma创作。
产品更新多模态视频
23:54
Runway@runwayml
36
推出另一场大型广告竞赛,为不存在的产品。你的机会:制作你能想象到的任何广告,赢取高达10万美元的现金奖励。没有客户意见。没有制片人说"不"。只需从7个新创意简报中选择,用4周时间让你最疯狂的概念变为现实。大创意赢大钱。 了解更多并开始,请点击下方链接。
行业动态视频
23:31
Berryxia.AI@berryxia
29
Omini的场景很适合做换装视频,包括家居装修类的这类前后对比的场景。
图像生成大佬观点视频
23:31
Berryxia.AI@berryxia
15
Omini 1.0 在视频修改方面表现不错,演示空间和透视处理有显著提升。新版本很快将可使用,但由于其属于强编辑型工具,目前热度不高。

Berryxia.AI: Omini 1.0 修改视频也还可以,看着演示空间、透视这些都应该提升不少啊。 应该很快就发布新版本可以使用了,但是因为属于编辑强,所以热度好像没有很高。

视频评测/基准
20:54
Kling AI@Kling_ai
53
可灵 Kling AI 在 2026 戛纳狮子奖斩获银狮铜狮

可灵 Kling AI 宣布,由 Lipstick 制作、Sebastian Strasser 执导的短片《L'Ultimo Uomo Reale》(最后的真人)在 2026 年戛纳狮子奖上获奖:电影 – 消费品类银狮奖和新增的电影工艺 – AI 工艺类铜狮奖。片中大部分镜头由可灵 Kling AI 生成,展示出行业领先的角色一致性、电影级视觉效果和动作质量,成为导演创意的完美伙伴。

行业动态视频
16:22
fofr@fofrAI
15
最近用智能体编写脚本真是太棒了。 我给一个子智能体赋予了Hyperframes技能、一些Omni输出和提示词,它就生成了这个。 音乐由Lyria 3生成。
智能体其他视频
11:28
HuggingFace Daily Papers(社区热门论文)
38
MemLearner:为视频世界模型学习查询上下文记忆

视频世界模型在长时段生成中缺乏记忆,导致场景不一致。MemLearner 提出基于学习的自适应上下文查询方法,利用 query tokens 桥接上下文与预测 token,并借助视频生成模型自身的预训练视觉先验进行上下文查询,无需从头训练额外模块。团队收集了带场景遮挡和动态物体的长视频数据集,辅以相机位姿标注,并采用多数据集训练策略同时利用标注渲染视频和无标注真实视频。实验表明,MemLearner 在场景一致性和记忆方面显著优于以往视频世界模型,尤其在遮挡和动态场景下。

arXiv视频论文/研究
10:30
Berryxia.AI@berryxia
26
Omini 1.0 修改视频也还可以,看着演示空间、透视这些都应该提升不少啊。 应该很快就发布新版本可以使用了,但是因为属于编辑强,所以热度好像没有很高。
产品更新视频
05:27
Luma@LumaLabsAI
20
有些门只有当你走得足够远时才会打开。 AOI,Paola Rocchetti 创作的短片。由 Luma 制作。
产品更新视频
03:57
Luma@LumaLabsAI
54
Seedance 2.0 Mini 现已登陆 Luma。 带上你最疯狂的想法,看它动起来。快速生成,在同一画布中优化,让你的概念从火花到成片,无需离开你的工作流。 立即创建 → http://lumalabs.ai/app
模型发布视频
03:55
NotebookLM@NotebookLM
精选68
NotebookLM 正式向 Web 英文用户全量推出 Short Video Overviews(短视频概览)功能。该功能可将复杂资料自动转化为 60 秒竖屏视频,深入讲解任意概念。此前,这一功能已面向 Google AI Ultra 和 Pro 订阅者(移动端及 Web)推出,免费用户即将可用。

NotebookLM: Doom scrolling but make it educational 🤓 Introducing Short Video Overviews in NotebookLM! Turn your most complex source...

Google产品更新视频

推荐理由:NotebookLM 把资料源变成 60 秒竖屏视频,想法不新但落地很实用,学生和内容创作者可能会高频用上,只是颠覆性谈不上。
03:53
Runway@runwayml
49
使用 Gemini Omni Flash 生成和编辑视频,现在已在 Runway 中上线。从提示词、图片或视频开始,创建你能想象到的任何内容。点击下方链接开始使用,或让 Agent 调用 Omni。
Google产品更新视频
03:27
Luma@LumaLabsAI
31
一只孤独的恐龙。 一份共享的冰淇淋。 一段友谊。 整个温柔的小世界,与一个AI智能体一同构建,由Anurag Tiwari创作。 使用Luma制作。
其他多模态视频
03:20
AYi@AYi_AInotes
62
卧槽,Google这回不拉胯了, 这才是短视频真正该有的打开方式啊, NotebookLM可以把复杂资料直接做成六十秒竖屏概览, 刷信息流的功夫就能啃完一个硬核概念了🤯
Google产品更新视频
02:28
Artificial Analysis@ArtificialAnlys
68
阿里巴巴 HappyHorse 1.1 登顶 Artificial Analysis 视频排行榜第二

阿里巴巴 HappyHorse 1.1 在 Artificial Analysis 文生视频和图生视频排行榜位列第二,仅次于字节跳动 Seedance 2.0。该模型基于统一 Transformer 架构,是 1.0 的改进版,重点提升音画同步,支持七种语言的原生音频与唇形同步对话,并在运动、角色和场景一致性上增强。支持最多 9 张参考图像,生成 720p 和 1080p。图生视频带音频模态从第 5 名升至第 2 名。定价 $9.90/分钟(1080p),已在阿里云 Model Studio、Qwen Cloud 和 fal 上线。

多模态模型发布视频
01:38
The Decoder:AI News(RSS)
59
Google 发布 Nano Banana 2 Lite 图像模型与 Gemini Omni Flash 视频模型

Google 推出两款新生成式 AI 模型。Nano Banana 2 Lite 可在 4 秒内生成图像,每张成本 0.034 美元(1K 分辨率),API 名称为 gemini-3.1-flash-lite-image。Gemini Omni Flash 允许开发者通过文本提示在 API 中生成和编辑最长 10 秒的视频,每秒输出价格 0.10 美元。Google 推荐将两个模型链式使用:先用 Nano Banana 2 Lite 生成图像,再传递给 Gemini Omni Flash 转化为视频。两者均使用 SynthID 水印,已通过 Google AI Studio、Gemini API 和 Gemini Enterprise Agent Platform 提供。

Google图像生成多模态模型发布
01:31
Rohan Paul@rohanpaul_ai
72
Google发布Nano Banana 2 Lite与Gemini Omni Flash

Google推出快速图像模型Nano Banana 2 Lite(4秒生成,$0.034/1K分辨率图像)以及视频编辑模型Gemini Omni Flash(输出10秒片段,$0.10/秒,支持文本/图像/视频输入和对话式剪辑)。两者可链式使用:Nano生成参考图,Omni将其动画化,逐步替代gemini-2.5-flash-image。当前Omni Flash API不支持音频参考,视频参考最多3秒但未正确生效;Interactions API保留会话上下文,支持连续3次编辑。

Logan Kilpatrick: Introducing Nano Banana 2 Lite 🍌 and Gemini Omni Flash 🔮, our new generative media models in the Gemini API and AI Stu...

Google图像生成多模态模型发布
00:50
fofr@fofrAI
52
Omni Flash 是个聪明的模型。看那湿润的手、水波、折射、阴影、音效 🤯 我很期待看到大家用它做什么,现在它已在 API 中可用。这个模型的编辑能力是为酷炫的流程而生的。
图像生成大佬观点视频
‹ 上一页
123…28
下一页 ›