arxiv.org
GPT-5 System Card · arXiv 2601.03267
OpenAI GPT-5 系统技术文档,完整披露模型架构、安全评估、红队结果及 Preparedness Framework 评级,2025 年 8 月发布。

OpenAI 2025 年 8 月发布的 GPT-5 System Card 揭示了两个关键判断:GPT-5 是由实时路由器管理的多模型统一系统;安全训练从二元拒绝转向以输出安全为中心的「safe-completions」范式。本文深度解读系统架构设计、能力跨越数据(幻觉率-65%、欺骗率-50%)、HealthBench 跃升,以及 METR 对自主能力的预警边界。
리서치 브리프
| 组件 | 对应前代模型 | 角色 |
|---|---|---|
| gpt-5-main | GPT-4o | 高吞吐量通用响应 |
| gpt-5-main-mini | GPT-4o-mini | 轻量通用 |
| gpt-5-thinking | OpenAI o3 | 深度推理 |
| gpt-5-thinking-mini | OpenAI o4-mini | 轻量推理 |
| gpt-5-thinking-nano | GPT-4.1-nano | 面向开发者的超快推理 |
| gpt-5-thinking-pro | OpenAI o3 Pro | 并行测试时计算(parallel TTC) |
| 类别 | gpt-5-thinking | OpenAI o3 | gpt-5-main | GPT-4o |
|---|---|---|---|---|
| illicit/nonviolent | 0.790 | 0.717 | 0.701 | 0.573 |
| illicit/violent | 0.912 | 0.829 | 0.786 | 0.633 |
| self-harm/intent | 0.950 | 0.824 | 0.849 | 0.849 |
OpenAI GPT-5 系统技术文档,完整披露模型架构、安全评估、红队结果及 Preparedness Framework 评级,2025 年 8 月发布。
OpenAI 关于 safe-completions 安全训练范式的官方技术博客,详细说明从二元拒绝转向输出安全中心的设计动机与实验证据。
METR 对 gpt-5-thinking 自主能力的完整评估,包含 50% 时间视野测量方法、沙盒检测结果及风险假设表格。
이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.