Google 官方放出的视频提示技巧,没有废话全是可复制的 prompt,想玩 Gemini Omni 的创作者可以直接抄作业。
Google 发布了其多模态模型 Gemini Omni 的视频生成功能使用指南。该模型可通过 Gemini 应用、Google Flow 等平台体验。指南包含五项提示词技巧:利用模型已有的现实世界知识进行简洁描述;精确控制文本在视频中的渲染与排版;使用专业镜头指令(如推拉摇移)像电影摄影师一样调度画面;通过迭代编辑高效修改视频;以及在生成中直接调整角色的动作节奏或情绪。其核心在于通过精准的提示词引导模型生成复杂且可控的视频内容。
来源:X:Google AI (@GoogleAI)
http://x.com/i/article/2059377716965888000
掌握 Gemini Omni:终极视频提示词指南
上周,我们推出了 Gemini Omni——我们最新的模型,旨在从任何输入生成任何内容,首先从视频开始。
今天,您可以在 @geminiapp、@GoogleFlow、@GoogleFlowMusic 以及 @YouTube Shorts 和 Create 上体验 Gemini Omni Flash 的速度和创意。
为了帮助您突破可能性的边界,以下是充分利用 Gemini Omni 先进视频生成能力的五个技巧。
- 利用现实世界知识
您无需向 Gemini Omni 过度解释这个世界。它基于 Gemini 对历史、科学和文化的深刻理解而构建,因此能够可靠地生成视觉、感觉和运动都逼真的输出。跳过细致的描述。直接在提示词中使用文化标志、历史时期或科学术语。
示例提示词:
- [视频展示字母表中的物品。每个字母开头的一个不寻常的物品被放置在桌子上(例如 C 是水豚,D 是迪斯科球,L 是熔岩灯)。所有 26 个字母必须由 26 个物品表示,并配有显示该字母的匹配字幕条。每次只显示一个物品和一个字幕条。每个字幕条必须看起来像用黑色马克笔写在左下角的一张纸条上。快速切换,大约每个物品 9 帧,24FPS。最后一帧是一张写着“THE END”的纸条。整个视频配有平静流畅的音乐]
- [宇航员在火星上的第一人称视角]
- [一颗弹珠在连锁反应式轨道上快速滚动,连续流畅的镜头]
- 掌控文本渲染
Gemini Omni 不仅拥有先进的文本渲染能力,还能让您将文本无缝集成到视觉效果中。您可以指定排版、空间位置、动画风格以及复杂的视觉效果(如双重曝光),所有内容都与视频中的动作完美同步。
示例提示词:
- [逐词显示,每次屏幕上一个单词:did, you, know, that, this, model, can, do, pretty, good, text!? 每个单词以不同的动画风格出现,节奏完美契合,精彩片段集锦]
- [将跟随动作的、极简风格的文字注释叠加到视频的物理环境中。这段文字代表[对象]面无表情、即时的内心独白——善于观察、略带荒诞,且带有对生活的思考。可以理解为“侵入性想法”。使用干净、白色、小写无衬线字体(如 Helvetica 或 Inter)。文字悬浮在 3D 空间中,通过极细、清晰、白色的引导线与被评论的对象相连]
- 像专业人士一样运镜
像电影摄影师一样思考。Gemini Omni 对精确的摄像指导、摄像机类型和构图指令反应极佳。尝试在下一个提示词中整合这些术语:
示例提示词:
- 镜头与角度:“一个连续镜头”、“一镜到底”、“固定机位”、“锁帧”或“固定角度”。
- 摄像机运动:“推进镜头”、“急推镜头”、“向左平移”或“推拉变焦”。
- 摄像机风格:“自然的智能手机变焦”、“复古胶片摄像机”或“颗粒感网络摄像头风格”。
- 迭代式编辑(并保留有效的部分)
每一部好视频都是在剪辑中诞生的。使用 Gemini Omni,你不需要为了修正单个错误而从头重写整个提示词。你可以提出具体、有针对性的修改要求,比如更换背景或替换字幕。Omni 会在多次修改中保留视频的核心结构,让你只专注于需要调整的部分。
示例提示词:
- [将小提琴转移到新的环境中]
- [让小提琴变得隐形]
- [改变摄像机角度,使其从小提琴演奏者肩膀上方拍摄]
- 即时改变动作
想要在场景中间改变角色的节奏或情绪?你可以直接提示 Gemini Omni 修改对象的移动方式或与环境的互动方式,而不会破坏角色模型的连续性。
示例提示词:
- [让角色踮着脚尖走路]
- [加快节奏]
- [让他们跃入空中]
开始创作吧
导演椅属于你了。尝试使用这些提示技巧,搭配 Gemini Omni Flash,并标记 @GoogleAI 向我们展示你的作品!