# Google DeepMind 发布 Nano Banana 2 Lite 和 Gemini Omni Flash

- 来源：Google DeepMind：Blog（RSS）
- 发布时间：2026-07-01 00:02
- AIHOT 分数：70
- AIHOT 标记：精选
- AIHOT 链接：https://aihot.virxact.com/items/cmr0ucc880030slatw1gfkq2h
- 原文链接：https://deepmind.google/blog/start-building-with-nano-banana-2-lite-and-gemini-omni-flash

## 精选理由

Nano Banana 2 Lite 把图像生成拉到 4 秒延迟和 0.034 美元单价，很适合高频草稿流，Omni Flash 首次对开发者开放视频生成和对话编辑，两个模型串起来的快速迭代工作流是这次最实用的更新。

## AI 摘要

Google DeepMind 推出 Nano Banana 2 Lite（gemini-3.1-flash-lite-image），为 Nano Banana 系列速度最快、成本最低的图像模型，文本到图像输出仅需 4 秒，每 1K 分辨率图像成本 $0.034，已上线 Google AI Studio、Gemini API 及消费者产品（AI Mode in Search、Gemini app 等）。同时推出 Gemini Omni Flash（gemini-omni-flash-preview），支持高画质视频生成与对话式编辑，视频输出定价 $0.10/秒，面向开发者开放 API。

## 正文

开始使用 Nano Banana 2 Lite 和 Gemini Omni Flash 进行构建

2026 年 6 月 30 日

· 10 分钟阅读

x.comFacebookLinkedInMail

我们正通过 Nano Banana 2 Lite（我们最快、最具成本效益的 Gemini 图像模型）和 Gemini Omni Flash（用于高质量视频生成与对话式编辑）让您更轻松地实验和扩展创意。

Alisa Fortin

产品经理，Google DeepMind

Anish Nangia

产品经理，Google DeepMind

x.comFacebookLinkedInMail

今天，我们通过两大主要发布，让实验、优化和扩展创意变得更快、更轻松：

推出 Nano Banana 2 Lite：这是 Nano Banana 系列中迄今最快、最具成本效益的图像模型，专为高吞吐量、速度和规模而构建。Nano Banana 2 Lite 即日起在 Google AI Studio、Gemini API 和 Gemini Enterprise Agent Platform 中可用。它也在今天开始向 Google 消费端产品（包括搜索中的 AI 模式、Gemini 应用及众多其他产品）推送。

向开发者提供 Gemini Omni Flash：这是我们用于视频生成和对话式编辑的高质量、高性价比模型，首次在 Google AI Studio、Gemini API 和 Gemini Enterprise Agent Platform 中可用。Omni Flash 也已在 Gemini 应用和 Google Flow 中可用。

使用生成式媒体进行构建往往离不开创意迭代。借助这两款模型，开发者可以构建全面的端到端多媒体体验，将快速图像生成与视频创建和编辑无缝衔接。无论您的工作流需要生成数千张图像还是编辑多轮视频序列，您现在拥有两款新模型来加速构建、无缝迭代，并将创意愿景变为现实。

Nano Banana 2 Lite：我们最快、最具成本效益的 Gemini 图像模型

观看 Nano Banana 2 Lite 与 Nano Banana 2 在图像生成速度和质量上的并排对比（使用简单提示词）。

Nano Banana 2 Lite（gemini-3.1-flash-lite-image）专为快速构思和对速度及成本为主要制约因素的高效开发者流水线而设计。对于当前使用我们第一版 Nano Banana（gemini-2.5-flash-image）的开发者，这是我们推荐的替代方案——您可以立即替换，即可在关键性能维度上获得直接收益。

Nano Banana 2 和 2 Lite 与竞品 AI 图像模型的性能基准对比，评估了生成/编辑质量（Elo 分数）、处理延迟以及每张 1K 分辨率图像的成本之间的权衡。

Nano Banana 2 Lite 在以下方面表现突出：

延迟：文本到图像的输出仅需 4 秒。这使其成为交互式原型设计和快速视觉草稿的理想选择。

成本效益（每张 1K 图像 0.034 美元）：对于专注于草稿、构思、管理运营预算或低带宽用量的开发者而言，这是一个经济实惠的选择。

尽管优先考虑速度，Nano Banana 2 Lite 仍保持了可靠的提示词遵循度、出色的人物一致性以及可读的图像内文字渲染。

了解 Nano Banana 系列

Nano Banana 2 Lite（Gemini 3.1 Flash Lite Image）：为速度而生。针对超低延迟至关重要的近实时、高吞吐量工作流进行了优化。

Nano Banana 2（Gemini 3.1 Flash Image）：通用型主力。在较低延迟下提供高质量，实现了性能和成本的最佳平衡。

Nano Banana Pro（Gemini 3 Pro Image）：针对复杂的专业用例进行了优化。为准确性比速度更重要的任务提供最强大的控制和高级推理能力。

Nano Banana（Gemini 2.5 Flash Image）：我们上一代模型。我们建议升级到 Nano Banana 2 Lite，以获得更好的质量、更快的速度和更低的成本。

如需查看完整的模型能力列表和集成方法，请参阅开发者文档。

在开发者平台发布的同时，Nano Banana 2 Lite 也将登陆 Google 消费端产品，包括搜索中的 AI 模式、Gemini 应用、NotebookLM、Google 相册、Stitch、Google Flow 和 Google Ads。

通过 Gemini Omni Flash 体验高质量、高性价比的视频编辑与生成。

观看某人使用 Gemini Omni 表演四种数字魔术，比如从手机里拉出一个 3D 气球文字，以及把屏幕里的水倒进玻璃杯。角落里有一段小小的“原始”视频，揭示了她在 Omni 生成的特效添加之前实际拍摄这些魔术的过程。

在 Google I/O 上，我们推出了 Gemini Omni Flash，这是一款将 Gemini 的多模态推理与视频生成和编辑相结合的大模型。今天，Gemini Omni Flash（gemini-omni-flash-preview）通过 Gemini API 和 Google AI Studio 向开发者开放，原生支持基于文本、图像和视频输入组合的高质量视频生成和对话式编辑。该模型定价具有竞争力，每秒钟视频输出 0.10 美元，与 Veo 3.1 Fast 相同。

Omni Flash 在以下方面表现出色：

对话式视频编辑：使用自然语言优化和编辑视频。

多模态引用：结合图像、文本和视频等输入，保持对场景的控制和一致性。

现实世界知识：Omni 借助 Gemini 的知识，如历史、生物学和叙事逻辑，构建引人入胜的视频。

文本与动作同步：通过简单的提示词，将文本和图形直接连接到视频动作。

如需全面的基准测试信息，请访问 Google DeepMind 的 Gemini Omni 网页。

局限：

Omni 目前仅支持生成 10 秒视频，更长时长的支持即将推出。

该模型在 Gemini API 中暂不支持上传音频参考和场景扩展。

API schema 接受时长不超过 3 秒的视频参考，但目前模型无法正确处理这些输入。

场景切换或平移运动时角色一致性存在一定局限，但我们正在努力改进。

Gemini Omni 即日起在 Google AI Studio 和 Gemini API 中公开发布预览版。请查阅开发者文档了解完整的模型能力列表和区域特定限制。

立即使用两款模型进行构建。

当您将这些模型串联使用时，真正的魔法才会显现。使用 Nano Banana 2 Lite 作为高速图像生成模型，然后将该图像作为参考传递给 Gemini Omni Flash，将其生成为高质量视频。此外，通过使用 Interactions API 处理这些多轮交互体验，可以保留会话历史和上下文，使用户能够叠加最多三个连续的编辑操作。

为了帮助您快速上手，我们创建了几个可供您二次创作的演示应用，让您体验如何将 Nano Banana 2 Lite 和 Gemini Omni Flash 配对到同一个工作流程中。

Anywhere 是一款旨在展示两款模型强大能力的演示应用。拍摄自拍照或上传照片，应用即使用 Nano Banana 2 Lite 瞬间将您“传送”到数十个地标景点。然后，点击某个图像，Omni Flash 会将生成的图像转化为该地点的动画短片。

Space Lift 是一款由 Nano Banana 2 Lite 和 Gemini Omni 驱动的室内设计演示应用，您只需上传一张照片即可立即重新构想任何房间。应用会自动跨多种设计风格生成完整的概念方案。找到您喜欢的外观后，点击视频按钮，即可观看 Omni 以电影级效果将设计变为动态画面，让您在将其变为现实之前，先体验新空间在动态中的效果。

Omni 产品工作室是一款演示应用，可将 Nano Banana 2 Lite 生成的静态图像转换为由 Gemini Omni 生成的电影级电商视频。该演示展示了如何通过快速交互图像到视频的输出来融合多模态输入，从而构建交互式媒体。

跳转到位置 1 跳转到位置 2 跳转到位置 3 跳转到位置 4 跳转到位置 5 跳转到位置 6 跳转到位置 7 跳转到位置 8

以安全透明的方式构建

基于 Google 的安全基础设施构建，Gemini Omni 和 Nano Banana 2 Lite 使用了 SynthID 水印技术。您可以通过 Gemini 应用、Chrome 中的 Gemini 或 Google 搜索来验证 AI 内容。进一步了解我们如何扩展验证工具，帮助您了解内容在整个网络上的创建和编辑方式。

立即开启您的项目

Nano Banana 2 Lite 资源：

前往 Google AI Studio，在 Playground 中体验该模型。

深入了解我们的 Gemini API 文档。

查阅我们的 Nano Banana 提示词指南，其中包含最佳实践和示例提示词。

Gemini Omni Flash 资源：

前往 Google AI Studio，在 Playground 中体验该模型。

深入了解我们的 Gemini API 文档。

查阅我们的 Gemini Omni Flash 提示词指南，其中包含最佳实践和示例提示词。

发布在：
