# OpenAI音频模型超越Google，AI竞争格局瞬息万变

- 来源：Berryxia.AI (@berryxia)
- 发布时间：2026-05-08 07:36
- AIHOT 分数：63
- AIHOT 链接：https://aihot.virxact.com/items/cmow664ff0358slcxk2kcwu65
- 原文链接：https://x.com/berryxia/status/2052532980300853313

## AI 摘要

在ScaleAILabs的音频多挑战榜单中，OpenAI新发布的GPT-Realtime-2超越Google的gemini-3.1-flash-live，位居榜首。其指令保持能力较前代大幅提升，从36.7%增至70.8% APR，并在实时语音编辑方面表现突出，这对语音代理应用至关重要。尽管Google此前在图像模型和Gemini 3.1等产品上有过亮眼表现，但评论认为其在当前激烈的AI竞争中尚未展现出决定性的“杀手锏”。市场格局变化迅速，没有永远的赢家，期待Google能尽快推出突破性产品。

## 正文

最近Google真的是被谁都逮着按在地上摩擦了啊！

刚刚GPT-Realtime-2 live 音频模型位居第一，将前阵子发布不久的Google gemini-3.1-flash-live 超越，并且领先不少。

真是感慨，后半年的时候Google的香蕉🍌图像模型一战封神，Gemini 3.1 前段设计拉到一个新的高度，Veo3 也是爆火了一阵子。

但是，2026 年来看。

至少目前，还没有看到他们的杀手锏的东西出来，AI这个反馈的搏杀的战场，真的没有永远的赢家啊！

太残忍了。
期待Google 赶紧搞掂东西出啦啊。

### 引用推文

> Scale Labs：Congrats to @OpenAI for taking the top spot on our Audio MultiChallenge S2S leaderboard with the release of GPT-Realtime-2 🥇 GPT-Realtime-2 more than doubles G...
