LM Arena 提升
120+分
Aider Polyglot
5× 提升
SWE-bench 提升
2× 提升
最长视频
3 小时
上下文窗口
100万+ token

Google DeepMind 于 2025 年 7 月发布 Gemini 2.5 系列:旗舰 2.5 Pro 支持 3 小时视频处理、百万 token 上下文,SWE-bench 一年内提升 2 倍,Aider Polyglot 提升 5 倍。本文解读报告的核心技术信号及对 AI 技术路线的判断意义。
リサーチノート
| 模型 | 推理类型 | 思考预算 | 定位 |
|---|---|---|---|
| Gemini 2.5 Pro | 原生思考模型 | 无限制 | 最高能力,计算密集 |
| Gemini 2.5 Flash | 混合推理模型 | 可控预算 | 能力-成本-延迟均衡 |
| Gemini 2.0 Flash | 非思考模型 | 无 | 低延迟高吞吐 |
| Gemini 2.0 Flash-Lite | 非思考模型 | 无 | 极低成本 |
このコンテンツについて、さらに観点や背景を補足しましょう。