6月2日

01:26

Google Blog：AI（RSS）

谷歌员工如何使用 Gemini 制作 Google I/O 2026

本文介绍了谷歌员工使用 Gemini 模型来制作 2026 年的 Google I/O 开发者大会。

Google 图像生成多模态教程/实践

00:43

Berryxia.AI@berryxia

Gemini Omni推出数字头像创建功能

Gemini Omni现已上线数字头像（Avatar）创建功能。用户可通过Gemini App或网页，按三步流程（拍照、录语音、系统自动生成）创建外观和声音都像自己的数字分身。该功能可直接应用于视频创作，显著降低了制作个人视频内容的门槛。所有由Gemini Omni生成的视频均自动嵌入SynthID数字水印，可用于验证视频是否为AI生成及出处，以技术手段防范深假风险。

Google Gemini: Easily add yourself to your video creations in Gemini. Here's how to create your own digital avatar that looks and sound...

Google 教程/实践视频

00:28

swyx@swyx

Ethan He论视频生成未来

前xAI世界模型负责人Ethan He在播客中分享了对Grok Imagine及视频生成未来的看法。他指出，视频模型的智能主要来自LLM，而非单纯扩大视频数据规模，因此正从视频生成转向LLM领域。他认为，视频生成的下一个前沿是训练用于编排视频模型的视频Agent模型。AI视频的发展将类似编程Agent路径，当前文本到视频仅是“自动补全”阶段。未来，世界模型将变得实时交互，语言模型或成为视频的控制层。

Latent.Space: 🆕Grok Imagine's Video Agent Moment: Cosmos, xAI, World Models, Generative UI, & the Codex Phase for Video! https://www....

智能体 xAI 大佬观点视频

00:26

Google Gemini@GeminiApp

精选71

轻松将自己添加到Gemini的视频创作中。以下是如何使用Gemini Omni创建一个外观和声音都像你的数字分身。🧵

Google 图像生成教程/实践视频

推荐理由：官方给了个傻瓜教程，看一遍就能在视频里塞进自己的数字分身，做短视频和教学的可以省掉真人出镜的麻烦。

6月1日

23:13

Kling AI@Kling_ai

如果你能把云装进袋子里会怎样？☁️ 这是我们用可灵AI实现的方式。

图像生成教程/实践视频

20:22

公众号：卡尔的AI沃茨

LibTV推出3D导演台：用3D构图节点精确控制AI图片/视频中的人物空间关系

针对AI图片和视频中多人场景空间关系控制难的问题，LibTV推出3D导演台功能，在画布中嵌入轻量级3D构图节点。用户可添加人体素模、基础几何体、群众阵列，自由移动、旋转、缩放并调整人物关节姿势。支持在同一3D场景中放置多个机位，预设或手动调整视角，截图作为参考图发送到画布，关联人物并编写提示语，即可生成符合构图的图片或视频。还可利用宫格切分工具拆分九宫格分镜，配合视频合成功能连续成短片。该功能避免了用长提示语描述位置关系，提升创作可控性。

图像生成教程/实践视频

19:04

Alibaba Cloud@alibaba_cloud

准备好与24小时时钟赛跑了吗？🎬 加入2026摩纳哥AI电影节（6月9-10日）的24H AI Film Hackathon，由阿里云支持。现场创作你的AI短片，赢取积分（3000美元）和主舞台展映机会。立即报名 👇https://int.alibabacloud.com/m/1000413821/

行业动态视频

18:42

Berryxia.AI@berryxia

KwaiKeye开源多模态大模型Keye VL 2.0-30B-A3B

KwaiKeye开源了多模态大模型Keye VL 2.0-30B-A3B，采用Apache 2.0许可。该模型总参数为30B，但仅激活3B参数。其核心亮点是通过DeepSeek稀疏注意力技术实现了256K的上下文长度。该模型的视频理解能力表现出一个反直觉的特性：喂入的帧数越多，其准确率反而持续上升。在基准测试中，其表现已与Qwen3 VL、Gemini 3 Flash等模型相当。

Adina Yakup: Keye VL 2.0-30B-A3B 🔥 New multimodal model from @KwaiKeye ✨ 30B/3B active - Apache 2.0 ✨ 256K context via DeepSeek Spar...

多模态开源生态推理模型发布

18:24

Runway：News（网页）

精选61

Runway 在伦敦设立欧洲总部及世界模型研究中心

Runway 宣布在伦敦建立新的欧洲总部和专注于通用世界模型的研究中心。公司计划在未来18个月向英国AI生态投资$100M，到2028年投资额将翻倍以上。过去12个月，其在欧洲的订阅销量增长了50%，企业客户占比超20%。新总部将扩大其在欧洲的研究与商业布局，公司正招聘欧洲负责人以组建跨研究、产品、工程和销售的团队，并深化与BBC、Fremantle、WPP等企业的合作。世界模型是其研究的核心，旨在将生成式AI的应用扩展至机器人、科学研究与工业模拟等领域。

行业动态视频

关联讨论 1 条

推荐理由：Runway 把世界模型研发带到伦敦并承诺 1 亿美元投资，不是新品但战略意义清晰，欧洲的视频创作者和工业仿真团队离顶尖工具更近了，做影视、游戏和机器人的可以关注后续落地。