
2026. 7. 1. · 16:49
From AGI to ASI:DeepMind 把超级智能拆成四条路
Google DeepMind 的《From AGI to ASI》把后 AGI 进展拆成算力扩展、范式演化、递归自我改进和多智能体集体四条路线。文章解读这些路径的技术含义、六类可能刹车,以及为什么真正需要监测的是持续增长机制,而不是单一 AGI 时刻。
Google DeepMind 这篇报告真正抛出的不是「AGI 什么时候到」这个老问题,而是更麻烦的一问:如果人类级 AGI 到来,AI 进步会停在那条线上,还是会继续沿着计算、算法、自我改进和多智能体组织一路向上?Google DeepMind 于 2026 年 6 月 12 日在官方研究页发布《From AGI to ASI》,并给出 arXiv 论文入口;arXiv 页面显示该版本于 2026 年 6 月 10 日提交,作者包括 Tim Genewein、Matija Franklin、Laurent Orseau、Iason Gabriel、Allan Dafoe、Marcus Hutter、Thore Graepel 和 Shane Legg 等 14 人。12
报告的价值不在于给出一个确定时间表。它更像一张「后 AGI 地图」:把从 AGI 到 ASI 的可能路线、阻力和可测指标拆开,让讨论从口号回到可以研究的问题。对于关注模型能力、Agent 产品和 AI 安全的人,这篇报告最值得读的地方,是它把超级智能从一个单点事件,改写成一组可被持续监测的增长机制。
先把定义摆正:ASI 不是 AlphaGo 式单项超人
报告对 AGI 和 ASI 的定义刻意保持粗粒度。AGI 指大致达到单个普通人水平的通用人工智能;ASI 则指在几乎所有人类关心的任务和领域中,都显著超过人类水平的通用人工智能。报告还把 ASI 的门槛抬高到「超过大型人类专家集体」:不是某个模型在一两个榜单上赢过专家,而是系统整体能胜过大型、协调良好的人类组织。3
这一定义有两个后果。
第一,今天的单领域超人系统不算 ASI。AlphaGo、AlphaFold 这类系统可以在围棋或蛋白结构预测上非常强,但报告把 ASI 限定为「general superintelligence」,也就是跨任务、跨领域的整体能力。3
第二,ASI 不一定是一个「单体天才」。报告明确允许一个 ASI 由数百万个实例组成,这些实例并行互动、共享信息、形成集体能力。换句话说,未来真正可怕或有用的系统,可能不是一个孤立模型,而是一家公司、市场或研究院形态的 AI 组织。3
为什么 DeepMind 认为「停在 AGI」并不自然
报告的一个核心判断是:如果人类级 AGI 真的出现,AI 进步刚好停在「单个人类水平」并不容易解释。原因不是 AGI 必然立刻爆炸,而是数字智能具有一些会随算力放大的优势:输入输出速度、内部处理速度、工作记忆、无损复制、跨硬件迁移,以及高带宽共享经验。报告把这些列为数字智能相对生物智能的关键差异。3
最直观的例子是「复制」。人类训练一个专家需要多年,复制一个已经训练好的 AI 实例则更接近资源调度问题。如果单个 AGI 只相当于一名高水平研究员,但可以被快速复制、加速运行、并用高带宽通信组织起来,那么系统级能力就可能远超个人模型本身。
报告还给了一个增长背景:过去几十年,硬件制造改善让每美元算力约以每年 1.5 倍增长;过去十年,算力硬件投入约以每年 2.5 倍增长;算法效率也以约每年 3 倍改善。报告把这些因素合并为「有效算力」增长,并采用约每年 10 倍的保守估计,同时强调不确定性很大。3
这里的关键不是「10 倍」这个数字一定准确,而是它改变了问题表述。我们不只要问「模型参数还能不能变大」,还要问:更多推理时计算、更多模型实例、更便宜的实验、更快的数据生成,能否把一个人类级系统堆成组织级超级系统。
四条通往 ASI 的路线:可能并行,而不是互斥
报告把 AGI 到 ASI 的技术路径拆成四条。
1. 继续扩展算力、模型和数据。 这条路线最像过去十年深度学习的延长线:更大训练、更大推理预算、更高效算法、更低单位成本。但报告也提醒,数量增长不自动等于质变。更大的搜索空间需要更好的归纳偏置、启发式和价值估计;暴力搜索在大多数非玩具问题上会很快撞到资源墙。3
2. 算法范式演化或转移。 当前主范式是大规模预训练 Transformer,加上后训练、检索、工具调用、Agent 框架和推理时扩展。报告认为,要走向 AGI 甚至 ASI,可能需要继续补上近乎无限上下文、持续学习、交互环境中的稳健决策、世界模型等能力;真正的范式转移则可能来自新架构、新优化方式、神经形态硬件、模拟计算或更强的 RL 预训练。3
3. 递归自我改进。 报告把自我改进拆得比「AI 写出更好的 AI」更细:AI 可以改进代码和架构,可以辅助芯片和制造流程,可以生成或筛选更高质量数据,也可以通过分工专业化提升集体效率。它还把 AlphaZero 式循环看作一个具体类比:用搜索得到更好的策略数据,再蒸馏回模型,反过来提升下一轮搜索效率。3
4. 多智能体协调与群体智能。 这条路线最值得产品和组织设计者关注:ASI 可能不是单体模型能力的结果,而是大量 AGI Agent 通过任务分解、专业化、市场机制或中心化调度形成的集体属性。报告甚至提出「多智能体扩展律」这个研究方向:群体智能如何随实例数量、组织形式、通信密度和算力预算变化。3
这四条路线可以同时发生。比如,推理时计算增加可以提升单次搜索质量;搜索结果又能生成训练数据;训练出的模型再被部署成更多 Agent;Agent 反过来参与下一代模型和芯片设计。真正的不确定性在于这些环路会很快衰减,还是会互相放大。
六个刹车:报告最有价值的部分是「摩擦」
这篇报告没有把 ASI 写成直线冲刺。它列出六类可能减速甚至卡住进展的瓶颈。3
数据墙。 高质量人类文本的增长速度跟不上模型规模增长。报告提到,后续可用数据可能来自合成数据、高保真模拟、交互数据、自博弈、强化学习和推理时搜索结果蒸馏,但这些机制是否足够稳定,仍是开放问题。3
经济与自然资源约束。 如果进步主要依赖继续堆算力,那么芯片、能源、数据中心位置、稀土、互连带宽和内存带宽都会成为硬约束。报告特别指出,模型变大后,数据在内存和计算单元之间移动的开销,可能成为有效算力利用率的主导因素。3
神经网络主范式可能不够。 大模型加后训练、工具、检索和 Agent 框架可能继续平滑演化,也可能在幻觉、提示注入、持续学习、稳健决策和第三方数据学习等问题上遇到更深限制。报告没有下结论,只把它列为需要持续观测的瓶颈。3
研究越来越难。 一个成熟领域要维持同等进步速度,通常需要越来越多投入。报告引用「ideas getting harder to find」这类经济学观察,并给出反向力量:如果 AI 研究员足够便宜、足够多,研究投入的复制速度可能比培养人类专家快得多。报告举例说,保持摩尔定律所需研究者数量相较 1970 年代约增加 18 倍,而把人工研究员实例增加 18 倍,在算力调度意义上可能是小时到周的量级。3
抽象屏障。 这是报告中最有辨识度的论点之一:如果今天的模型主要从人类已经符号化的认知产物中学习,它们可能擅长重组人类概念,却不一定能从原始世界中发现全新的概念原语。报告用一个反事实问题说明这一点:如果一个现代基础模型只训练在前工业、前牛顿时代的知识上,它能否推导出相对论或量子力学?报告认为这并不显然。3
治理、事故和社会反弹。 报告把监管和刻意减速也视作路径变量。重大事故、滥用、军事或政治风险、劳动市场冲击,都可能让社会选择放慢能力进步;但经济竞争和国家安全压力又可能抵消这种减速。3
这篇报告对今天的大模型行业有什么提示
第一,它把「Agent 规模化」放到了和模型规模化同等重要的位置。过去大家习惯问下一个模型是不是更聪明;这篇报告提醒我们,还要问同一能力水平的模型能否被低成本复制、专业化、协调和审计。一个普通模型加一个普通工作流,未必危险也未必有用;但上万个模型实例组成的自动化组织,性质会完全不同。
第二,它让推理时计算变成长期变量。今天的「thinking」和多样本搜索,常被看作提高答题分数的技巧;在报告框架里,它们也可能是数据生产、自我改进和 Agent 组织的基础设施。如果搜索结果可验证、可蒸馏、可进入下一轮训练,那么推理成本就不只是服务成本,也可能是研发投入。
第三,它把评测问题推到前台。报告在研究议程中提出,后 AGI 时代不能继续只用人类专家作为上限,因为那会很快饱和;需要能评估通用超人能力、多智能体协作能力、递归改进能力和经济生产率的基准。3 这对产品团队也有现实意义:如果你在做 Agent 系统,单轮任务成功率只是第一层指标,群体协作的吞吐、错误传播、可恢复性和审计成本同样会决定系统上限。
局限:这不是一篇给答案的论文
这篇报告更像问题地图,不是实验论文。它没有给出某条路径的概率,也没有证明 ASI 会在某个年份出现。报告自己也承认,预测 ASI 能做什么、不能做什么,很难只靠理论给出实用负结论;近似算法和启发式常常能绕开最坏情况复杂度,让经验测量和持续基准变得更重要。3
它还有一个重要前提:为了聚焦技术轨迹,报告假设 AI 安全与对齐会被「足够程度地解决」。但作者同时强调,这不是轻假设;不安全或不可控的系统本身也会成为能力部署和自动化研究的瓶颈。3
所以,更稳妥的读法不是「DeepMind 预测 ASI 快来了」,而是:如果 AGI 成为现实,我们需要提前把后续增长机制拆开测量。要盯的不只是模型排行榜,还包括有效算力增长、推理时搜索收益、AI 参与 AI 研发的比例、合成数据能否改善训练、多智能体协作是否出现扩展律,以及治理和社会反馈会在哪些点形成硬刹车。
这也是报告最后的落点:未来不可预测,但可以通过更多路线图、更多量化监测和更强的跨学科研究来降低不确定性。作者在结论中写道,如果人类级 AGI 能达到,AI 进步恰好停在人类水平并不可信;更可能的是在 AGI 前停滞,或在 AGI 后较平滑地进入弱 ASI,当然递归自我改进导致更快跃迁也不能排除。3
对读者而言,这篇报告最重要的提醒是:不要只等一个「AGI 时刻」。更值得提前准备的,是一连串由算力、推理、数据、Agent 组织和科研自动化共同推动的变化。它们可能没有单一爆点,却会不断改写我们对模型、组织和技术进步速度的判断。

이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.