OpenAI 联合 Broadcom 与 Celestica 从零设计首款自研推理芯片 Jalapeño,9 个月完成流片,专为 LLM 推理优化,能效优于当前 SOTA。计划 2026 年底起以吉瓦级规模部署,用于 ChatGPT、Codex、API 及未来智能体产品。OpenAI 称这是“全栈优势”关键环节,通过自研芯片构建飞轮:更好基础设施→更高算力效率→更好训练与推理→更强模型→更好产品→更多使用与收入→再投入。推理芯片直接改善成本、速度与可靠性,是 AI 触达用户的环节。
OpenAI 发布首款自研推理芯片 Jalapeño
OpenAI 联合 Broadcom(和 Celestica)从零设计了一款专为 LLM 推理优化的加速器 Jalapeño,9 个月完成流片,宣称能效显著优于当前 SOTA,计划 2026 年底起以吉瓦级规模部署--这是 OpenAI 把"全栈"延伸到芯片层的标志性一步。
为什么 OpenAI 要造芯片? 官方用了 "full-stack advantage"(全栈优势) 和一个飞轮模型来论证: 更好的基础设施 → 更高算力效率 → 更好的训练与推理 → 更强模型 → 更好产品 → 更多使用与收入 → 再投入下一代基础设施。
逻辑上是把芯片作为飞轮的最底层杠杆:只有自己掌握芯片架构,才能让内核、内存、网络、调度、产品体验围绕同一目标协同优化。这与 Google(TPU)、Amazon(Trainium/Inferentia)、Meta(MTIA)走的是同一条垂直整合路径--前沿 AI 公司自研推理芯片已成行业共识。
对 OpenAI 而言,还有一个直接的商业落点:推理是 AI 触达用户的环节。每一点成本、速度、可靠性的改善,都会直接转化为更快的 ChatGPT 回答、能多走几步的 Codex 任务、更便宜的 API、以及高峰期更稳的访问。