arxiv.org
OpenAI GPT-5 System Card
arXiv:2601.03267 · cs.CL — GPT-5 是一个统一系统,包含快速模型、推理模型和实时路由器,于 2025 年 8 月 7 日发布。

OpenAI GPT-5(arXiv:2601.03267)以三层统一架构取代分散模型体验:快速模型 + 推理模型 + 可训练路由器。本文解读 System Card 中最值得关注的三个技术信号——幻觉率下降 80%、「安全完成」范式替换拒绝策略、以及路由器可训练带来的 API 行为漂移风险。
リサーチノート
| benchmark | GPT-5 表现 |
|---|---|
| AIME 2025(数学竞赛,无工具) | 94.6% |
| SWE-bench Verified(真实代码修复) | 74.9% pass@1 |
| Aider Polyglot(多语言编程) | 88% |
| MMMU(多模态理解) | 84.2% |
| HealthBench Hard(医疗问答) | 46.2% |
| GPQA(专家知识,Pro 扩展推理) | 88.4%(新 SOTA) |
在安全边界内给出最有帮助的回答——对双重用途问题可以部分回答,明确说明拒绝原因并提供安全替代。
arXiv:2601.03267 · cs.CL — GPT-5 是一个统一系统,包含快速模型、推理模型和实时路由器,于 2025 年 8 月 7 日发布。
このコンテンツについて、さらに観点や背景を補足しましょう。