ChatGPT 语音最大规模升级：OpenAI 正筹备推出 GPT-Bidi-1 模型

2026-06-17 14:59·3天前

AI 摘要

OpenAI 正筹备推出 GPT-Bidi-1 模型，采用双向（BiDi）架构，能同时听和说，吸收用户打断并在对话中实时调整。相比已进化至 GPT-5.5 的文本模型，ChatGPT 的语音能力仍基于较旧音频技术栈，GPT-Bidi-1 旨在弥合这一差距。上线后用户可切换双向模式与现有高级语音模式，并支持 High、Medium 及 Instant 智能等级，按任务调整速度和深度。

原文

IT之家 6 月 17 日消息，科技媒体 testingcatalog 今天（6 月 17 日）发布博文，报道称 OpenAI 公司正在筹备推出 GPT-Bidi-1 模型，将成为 ChatGPT 语音模式最大规模升级。

IT之家曾于今年 3 月报道，OpenAI 于 2026 年年初开始研发“双向”（BiDi）架构，能够同时听和说，可以吸收用户的打断，并在对话中途实时调整。

报道指出 OpenAI 的文本模型已快速进化至 GPT-5.5，而语音功能仍停留在较旧的音频技术栈上，导致口语对话能力落后文字表现，而 GPT-Bidi-1 模型有望弥合这一差距。

该模型上线后，ChatGPT 用户可以根据需求切换双向模式和现有的高级语音模式，并支持 High、 Medium 以及 Instant 智能等级，方便用户根据任务调整速度和深度。

OpenAI模型发布语音

IT之家（RSS）

ChatGPT 语音最大规模升级：OpenAI 正筹备推出 GPT-Bidi-1 模型

2026-06-17 14:59·3天前

AI 摘要

原文

IT之家曾于今年 3 月报道，OpenAI 于 2026 年年初开始研发“双向”（BiDi）架构，能够同时听和说，可以吸收用户的打断，并在对话中途实时调整。

OpenAI模型发布语音

阅读原文ithome.com