Google AI@GoogleAI

精选75

2026-05-27 05:08·37天前

精选理由

Google 官方放出的视频提示技巧，没有废话全是可复制的 prompt，想玩 Gemini Omni 的创作者可以直接抄作业。

AI 摘要

Google 发布了其多模态模型 Gemini Omni 的视频生成功能使用指南。该模型可通过 Gemini 应用、Google Flow 等平台体验。指南包含五项提示词技巧：利用模型已有的现实世界知识进行简洁描述；精确控制文本在视频中的渲染与排版；使用专业镜头指令（如推拉摇移）像电影摄影师一样调度画面；通过迭代编辑高效修改视频；以及在生成中直接调整角色的动作节奏或情绪。其核心在于通过精准的提示词引导模型生成复杂且可控的视频内容。

AI 翻译 · 中文

来源：X：Google AI (@GoogleAI)

http://x.com/i/article/2059377716965888000

掌握 Gemini Omni：终极视频提示词指南

上周，我们推出了 Gemini Omni——我们最新的模型，旨在从任何输入生成任何内容，首先从视频开始。

今天，您可以在 @geminiapp、@GoogleFlow、@GoogleFlowMusic 以及 @YouTube Shorts 和 Create 上体验 Gemini Omni Flash 的速度和创意。

为了帮助您突破可能性的边界，以下是充分利用 Gemini Omni 先进视频生成能力的五个技巧。

利用现实世界知识

您无需向 Gemini Omni 过度解释这个世界。它基于 Gemini 对历史、科学和文化的深刻理解而构建，因此能够可靠地生成视觉、感觉和运动都逼真的输出。跳过细致的描述。直接在提示词中使用文化标志、历史时期或科学术语。

示例提示词：

[视频展示字母表中的物品。每个字母开头的一个不寻常的物品被放置在桌子上（例如 C 是水豚，D 是迪斯科球，L 是熔岩灯）。所有 26 个字母必须由 26 个物品表示，并配有显示该字母的匹配字幕条。每次只显示一个物品和一个字幕条。每个字幕条必须看起来像用黑色马克笔写在左下角的一张纸条上。快速切换，大约每个物品 9 帧，24FPS。最后一帧是一张写着“THE END”的纸条。整个视频配有平静流畅的音乐]

[宇航员在火星上的第一人称视角]

[一颗弹珠在连锁反应式轨道上快速滚动，连续流畅的镜头]

掌控文本渲染

Gemini Omni 不仅拥有先进的文本渲染能力，还能让您将文本无缝集成到视觉效果中。您可以指定排版、空间位置、动画风格以及复杂的视觉效果（如双重曝光），所有内容都与视频中的动作完美同步。

示例提示词：

[逐词显示，每次屏幕上一个单词：did, you, know, that, this, model, can, do, pretty, good, text!? 每个单词以不同的动画风格出现，节奏完美契合，精彩片段集锦]

[将跟随动作的、极简风格的文字注释叠加到视频的物理环境中。这段文字代表[对象]面无表情、即时的内心独白——善于观察、略带荒诞，且带有对生活的思考。可以理解为“侵入性想法”。使用干净、白色、小写无衬线字体（如 Helvetica 或 Inter）。文字悬浮在 3D 空间中，通过极细、清晰、白色的引导线与被评论的对象相连]

像专业人士一样运镜

像电影摄影师一样思考。Gemini Omni 对精确的摄像指导、摄像机类型和构图指令反应极佳。尝试在下一个提示词中整合这些术语：

示例提示词：

镜头与角度：“一个连续镜头”、“一镜到底”、“固定机位”、“锁帧”或“固定角度”。

摄像机运动：“推进镜头”、“急推镜头”、“向左平移”或“推拉变焦”。

摄像机风格：“自然的智能手机变焦”、“复古胶片摄像机”或“颗粒感网络摄像头风格”。

迭代式编辑（并保留有效的部分）

每一部好视频都是在剪辑中诞生的。使用 Gemini Omni，你不需要为了修正单个错误而从头重写整个提示词。你可以提出具体、有针对性的修改要求，比如更换背景或替换字幕。Omni 会在多次修改中保留视频的核心结构，让你只专注于需要调整的部分。

示例提示词：

[将小提琴转移到新的环境中]

[让小提琴变得隐形]

[改变摄像机角度，使其从小提琴演奏者肩膀上方拍摄]

即时改变动作

想要在场景中间改变角色的节奏或情绪？你可以直接提示 Gemini Omni 修改对象的移动方式或与环境的互动方式，而不会破坏角色模型的连续性。

示例提示词：

[让角色踮着脚尖走路]

[加快节奏]

[让他们跃入空中]

开始创作吧

导演椅属于你了。尝试使用这些提示技巧，搭配 Gemini Omni Flash，并标记 @GoogleAI 向我们展示你的作品！

Google AI@GoogleAI · X

精选75导出 Markdown

2026-05-27 05:08·37天前

在 X 看原推· x.com

精选理由

Google 官方放出的视频提示技巧，没有废话全是可复制的 prompt，想玩 Gemini Omni 的创作者可以直接抄作业。

AI 摘要

AI 翻译 · 中文

来源：X：Google AI (@GoogleAI)

http://x.com/i/article/2059377716965888000

掌握 Gemini Omni：终极视频提示词指南

上周，我们推出了 Gemini Omni——我们最新的模型，旨在从任何输入生成任何内容，首先从视频开始。

今天，您可以在 @geminiapp、@GoogleFlow、@GoogleFlowMusic 以及 @YouTube Shorts 和 Create 上体验 Gemini Omni Flash 的速度和创意。

为了帮助您突破可能性的边界，以下是充分利用 Gemini Omni 先进视频生成能力的五个技巧。

利用现实世界知识

示例提示词：

[视频展示字母表中的物品。每个字母开头的一个不寻常的物品被放置在桌子上（例如 C 是水豚，D 是迪斯科球，L 是熔岩灯）。所有 26 个字母必须由 26 个物品表示，并配有显示该字母的匹配字幕条。每次只显示一个物品和一个字幕条。每个字幕条必须看起来像用黑色马克笔写在左下角的一张纸条上。快速切换，大约每个物品 9 帧，24FPS。最后一帧是一张写着“THE END”的纸条。整个视频配有平静流畅的音乐]

[宇航员在火星上的第一人称视角]

[一颗弹珠在连锁反应式轨道上快速滚动，连续流畅的镜头]

掌控文本渲染

示例提示词：

[逐词显示，每次屏幕上一个单词：did, you, know, that, this, model, can, do, pretty, good, text!? 每个单词以不同的动画风格出现，节奏完美契合，精彩片段集锦]

[将跟随动作的、极简风格的文字注释叠加到视频的物理环境中。这段文字代表[对象]面无表情、即时的内心独白——善于观察、略带荒诞，且带有对生活的思考。可以理解为“侵入性想法”。使用干净、白色、小写无衬线字体（如 Helvetica 或 Inter）。文字悬浮在 3D 空间中，通过极细、清晰、白色的引导线与被评论的对象相连]

像专业人士一样运镜

像电影摄影师一样思考。Gemini Omni 对精确的摄像指导、摄像机类型和构图指令反应极佳。尝试在下一个提示词中整合这些术语：

示例提示词：

镜头与角度：“一个连续镜头”、“一镜到底”、“固定机位”、“锁帧”或“固定角度”。

摄像机运动：“推进镜头”、“急推镜头”、“向左平移”或“推拉变焦”。

摄像机风格：“自然的智能手机变焦”、“复古胶片摄像机”或“颗粒感网络摄像头风格”。

迭代式编辑（并保留有效的部分）

示例提示词：

[将小提琴转移到新的环境中]

[让小提琴变得隐形]

[改变摄像机角度，使其从小提琴演奏者肩膀上方拍摄]

即时改变动作

想要在场景中间改变角色的节奏或情绪？你可以直接提示 Gemini Omni 修改对象的移动方式或与环境的互动方式，而不会破坏角色模型的连续性。

示例提示词：

[让角色踮着脚尖走路]

[加快节奏]

[让他们跃入空中]

开始创作吧

导演椅属于你了。尝试使用这些提示技巧，搭配 Gemini Omni Flash，并标记 @GoogleAI 向我们展示你的作品！