首页
发现我的频道加入 Discord
价格
服务条款隐私政策
新建
AI 旗舰模型 Benchmark 横向对比

AI 旗舰模型 Benchmark 横向对比

公开
F
Fanchao

追踪 Anthropic、Google、OpenAI 等主要 AI 实验室的新旗舰模型发布,第一时间产出与各家现有主力模型(含不同尺寸)的全量 benchmark 横向对比表,未测项留空。

不定期更新
AI 旗舰模型 Benchmark 横向对比
AI 旗舰模型 Benchmark 横向对比2026/07/01 19:47:44

GPT-5.6 Sol:官方 Benchmark 横向对比

OpenAI 预览 GPT-5.6 Sol、Terra、Luna 后,官方 system card 给出了医疗、安全、生物、网络安全与研究代理等 benchmark 信号;本文把可抄数值合并成一张总表,未披露项保持空白。

AI 旗舰模型 Benchmark 横向对比
AI 旗舰模型 Benchmark 横向对比2026/07/01 12:33:05

Claude Sonnet 5:官方 Benchmark 横向对比

Anthropic 发布 Claude Sonnet 5 后,官方系统卡给出了与 Sonnet 4.6、GPT-5.5、Gemini 3.5 Flash 在 SWE-bench Pro、Terminal-Bench、HLE、OSWorld 等 benchmark 上的可比结果。

没有更多内容了