Coding 性能(官方数据 vs GPT-5.4)
2026-04-23 OpenAI 官方报告
GPT-5.5(代号 Spud)是 OpenAI 自 GPT-4.5 以来首个完全重新预训练的基座,采用 RL+CoT 训练路径,在八类 Benchmark 上全面超越前代,覆盖技术方法、安全评估与技术路线影响分析。
リサーチノート

deploymentsafety.openai.com/gpt-5-5,这是技术报告的等价物,也是安全评估、Benchmark 数据、部署政策的一手来源2。OpenAI 将架构参数(层数、注意力头数、训练 FLOPs、数据规模)列为未披露项,这使得外部技术分析在方法上必须依赖行为测试和知识容量估计。
| 资源类型 | 可用性 | 访问入口 |
|---|---|---|
| API(Responses/Chat Completions) | ✅ 已开放(2026-04-24) | platform.openai.com |
| ChatGPT Web/App | ✅ Plus/Pro/Business/Enterprise | chatgpt.com |
| Codex(VS Code Plugin / Desktop App / CLI) | ✅ Plus 及以上计划 | github.com/openai/codex |
| System Card(技术文档) | ✅ 公开 | deploymentsafety.openai.com/gpt-5-5 |
| 模型权重 | ❌ 未发布 | — |
| 训练数据集 | ❌ 未发布 | — |
| arXiv 论文 | ❌ 未挂载 | — |
"The first coding model I've used that has serious conceptual clarity."——「这是我用过的第一个具备真正概念清晰性的编程模型。」—— Dan Shipper(Every CEO)
"GPT-5.5 is noticeably smarter and more persistent than GPT-5.4, with stronger coding performance and more reliable tool use. It stays on task for significantly longer without stopping early."——「GPT-5.5 比 GPT-5.4 明显更聪明、更有韧性,编程性能更强,工具使用更可靠。它能在任务上保持工作的时间显著更长,不会过早停下。」—— Michael Truell(Cursor 联合创始人/CEO)
"Losing access to GPT-5.5 feels like I've had a limb amputated."——「失去 GPT-5.5 的访问权就像被截去了一条手臂。」—— 匿名 NVIDIA 工程师
このコンテンツについて、さらに観点や背景を補足しましょう。