


1/5
2026/6/25 · 10:46
OpenAI下场造芯:Jalapeño
量子位文章图片笔记:OpenAI 首款自研推理芯片 Jalapeño 把大模型公司的战线推进到芯片层,官方口径强调 9 个月流片、LLM 推理定制与 2026 年底部署,同时最终基准仍待公布。
ギャラリー
量子位 2026-06-25 08:35 发布了《OpenAI 自研芯片 270 天光速成功!谷歌 TPU 大将主导,老黄一夜大客户变对手》,把 OpenAI 首款自研推理加速芯片 Jalapeño 放进「大模型公司自建算力」这条线里看。1
这组图片笔记只抓四个点:它是什么、为什么不是通用 GPU、谁在一起做,以及哪些结论现在还不能写死。
- 图 1:OpenAI 与 Broadcom 公布 Jalapeño。官方称这是 OpenAI 第一颗 Intelligence Processor,面向 LLM 推理,计划在 2026 年底开始部署。2
- 图 2:Jalapeño 的目标不是替代所有 GPU 工作负载,而是围绕 ChatGPT、Codex、API 和未来 Agent 产品的推理服务模式做定制。2
- 图 3:OpenAI 官方给出的架构关键词是减少数据搬运,并在计算、内存和网络之间做平衡,让生产环境里的实际利用率更接近理论峰值。Richard Ho 在 LinkedIn 也用同一套口径解释了这件事。23
- 图 4:OpenAI 负责芯片架构,Broadcom 负责硅片实现和网络技术,Celestica 参与板卡、机架和系统集成;但最终性能基准还没公开,官方只说早期测试显示每瓦性能大幅优于当前先进水平,详细技术报告要等后续发布。2
这件事真正要观察的不是一句「英伟达客户变对手」,而是部署后能否把推理成本、延迟和供给稳定性真正压下来。现在能确定的是:模型公司把手伸到芯片层,已经从传闻变成了公开路线。




コメント
ログインするとコメントできます。