meng shao@shao__meng

2026-06-24 21:37·8天前

AI 摘要

OpenAI 联合 Broadcom 与 Celestica 从零设计首款自研推理芯片 Jalapeño，9 个月完成流片，专为 LLM 推理优化，能效优于当前 SOTA。计划 2026 年底起以吉瓦级规模部署，用于 ChatGPT、Codex、API 及未来智能体产品。OpenAI 称这是“全栈优势”关键环节，通过自研芯片构建飞轮：更好基础设施→更高算力效率→更好训练与推理→更强模型→更好产品→更多使用与收入→再投入。推理芯片直接改善成本、速度与可靠性，是 AI 触达用户的环节。

OpenAI 发布首款自研推理芯片 Jalapeño

OpenAI 联合 Broadcom（和 Celestica）从零设计了一款专为 LLM 推理优化的加速器 Jalapeño，9 个月完成流片，宣称能效显著优于当前 SOTA，计划 2026 年底起以吉瓦级规模部署--这是 OpenAI 把"全栈"延伸到芯片层的标志性一步。

为什么 OpenAI 要造芯片？官方用了 "full-stack advantage"（全栈优势）和一个飞轮模型来论证：更好的基础设施 → 更高算力效率 → 更好的训练与推理 → 更强模型 → 更好产品 → 更多使用与收入 → 再投入下一代基础设施。

逻辑上是把芯片作为飞轮的最底层杠杆：只有自己掌握芯片架构，才能让内核、内存、网络、调度、产品体验围绕同一目标协同优化。这与 Google（TPU）、Amazon（Trainium/Inferentia）、Meta（MTIA）走的是同一条垂直整合路径--前沿 AI 公司自研推理芯片已成行业共识。

对 OpenAI 而言，还有一个直接的商业落点：推理是 AI 触达用户的环节。每一点成本、速度、可靠性的改善，都会直接转化为更快的 ChatGPT 回答、能多走几步的 Codex 任务、更便宜的 API、以及高峰期更稳的访问。

OpenAIWe've designed and built our first AI chip: Jalapeño. Designed from the ground up by OpenAI and brought to production with @Broadcom, Jalapeño is purpose-built ...

OpenAI 产品更新推理部署/工程

在 X 查看原推

meng shao@shao__meng · X

66导出 Markdown

2026-06-24 21:37·8天前

在 X 看原推· x.com

AI 摘要

OpenAI 发布首款自研推理芯片 Jalapeño