# Gemini Omni实现多模态编辑与场景生成

- 来源：Demis Hassabis (@demishassabis)
- 发布时间：2026-05-20 04:16
- AIHOT 分数：79
- AIHOT 链接：https://aihot.virxact.com/items/cmpd3inq600mkslk1dw2dbyga
- 原文链接：https://x.com/demishassabis/status/2056831486251380783

## AI 摘要

Gemini Omni在世界理解与多模态编辑方面实现了重大飞跃！它能处理照片、视频和音频，并构建全新的场景。随着时间的推移，它将能够处理任何输入和任何输出——从视频开始。

你甚至可以提供自己的视频，并在此基础上迭代你的想法：

## 正文

Gemini Omni is a major leap in world understanding &amp； multimodal editing！ It can take photos， video &amp； audio and build entirely new scenes. Over time it'll be able to handle any input &amp； any output - starting w/ video

You can even give it your own videos &amp； iterate on your ideas：