AI 摘要
Google AI推出的Gemini 3.1 TTS模型新增音频标签功能,开发者可通过方括号内的标签直观控制语音风格、语速和表达。关键使用技巧包括:标签需用方括号包裹并置于期望转换点,避免直接相邻;使用[slow]、[fast]控制语速,[short pause]制造戏剧停顿;还能通过[cackles]、[whispers]等标签精细操控发声。这些提示词技巧适用于构建语言学习工具、互动播客应用或自适应客服等多种场景,赋能开发者高效利用模型进行音频创作。
玩转 Gemini 3.1 TTS:音频标签与提示词技巧指南
Last week, we launched Gemini 3.1 TTS, our latest and best text-to-speech model. This new model introduces [awe] audio tags, an intuitive way to guide vocal sty...