ChatGPT 语音最大规模升级:OpenAI 正筹备推出 GPT-Bidi-1 模型
OpenAI 正筹备推出 GPT-Bidi-1 模型,采用双向(BiDi)架构,能同时听和说,吸收用户打断并在对话中实时调整。相比已进化至 GPT-5.5 的文本模型,ChatGPT 的语音能力仍基于较旧音频技术栈,GPT-Bidi-1 旨在弥合这一差距。上线后用户可切换双向模式与现有高级语音模式,并支持 High、Medium 及 Instant 智能等级,按任务调整速度和深度。
IT之家 6 月 17 日消息,科技媒体 testingcatalog 今天(6 月 17 日)发布博文,报道称 OpenAI 公司正在筹备推出 GPT-Bidi-1 模型,将成为 ChatGPT 语音模式最大规模升级。
IT之家曾于今年 3 月报道,OpenAI 于 2026 年年初开始研发“双向”(BiDi)架构,能够同时听和说,可以吸收用户的打断,并在对话中途实时调整。

报道指出 OpenAI 的文本模型已快速进化至 GPT-5.5,而语音功能仍停留在较旧的音频技术栈上,导致口语对话能力落后文字表现,而 GPT-Bidi-1 模型有望弥合这一差距。
该模型上线后,ChatGPT 用户可以根据需求切换双向模式和现有的高级语音模式,并支持 High、 Medium 以及 Instant 智能等级,方便用户根据任务调整速度和深度。
