当建造者成为被建造者

今日长读 · 经济学人 · 2026 年 6 月 7 日 · 约 9 分钟

当建造者成为被建造者

Anthropic 过去几周做了一件不同寻常的事：主动发布了一份可能动摇自身存在合理性的数据。新研究文件《When AI builds itself》揭示，截至 2026 年 5 月，公司代码库超过 80%的代码由 Claude 编写——工程师人均产出是四年前的八倍，不是因为打字更快，而是大部分打字工作已不再由他们来做。1

《经济学人》6 月 7 日这篇文章以此为核心，直逼一个更大的问题：人工智能是否即将脱离人类掌控？2 这是目前关于「递归自我改进」最清晰的实践叙述——不是科幻场景，而是一个已在进行中、可量化的技术趋势。

递归自我改进究竟意味着什么

anthropic.comhttps://www.anthropic.com/institute/recursive-self-improvement외부 링크

콘텐츠 카드를 불러오는 중…

这个术语听起来很戏剧化，但机制其实相当具体。递归自我改进，指的是 AI 系统能够在几乎不需要人类介入的情况下，自主设计并构建自己的继任者。Anthropic 的研究文件措辞谨慎：「我们还没有到达那个阶段，递归自我改进也并非不可避免。」但文件本身的数据清楚表明，每一代 Claude 在构建下一代的工作中都承担了更大的份额。

从 2021 年到今天，这条演进时间线读起来几乎像一份逐步交接的记录：

2021–2023：Anthropic 工程师在笔记本上写代码，没有任何 AI 辅助。
2023–2025：聊天机器人建议短代码片段，工程师复制粘贴。
2025–2026：编程 Agent 自主编写和修改整个文件。
当下：Agent 自行运行代码，并将耗时数小时的任务委托给其他 Agent。
20XX 年？：Agent 能够完全自主地设计和训练自己的继任者。

Claude 完成任务的速度同样讲述着同一个故事。2024 年 3 月，Claude Opus 3 能完成一个人类需要约四分钟才能完成的软件任务。到 2026 年初，Claude Opus 4.6 已能处理耗时 12 小时的任务。1 如果每四个月翻倍的趋势持续下去，今年内多天级别的任务或许也将进入射程。一个熟练工程师需要数周才能完成的任务，到 2027 年可能已是例行公事。

条形图：2021 年第二季度至 2026 年第二季度，Anthropic 每位工程师每季度贡献的代码量，在 Claude Code 和自主 Agent 上线节点出现两次急剧拐点 — 2021 年以来 Anthropic 工程师人均代码产出，两个拐点分别对应 Claude 开始运行代码和开始自主行动的时刻 1

差距仍然存在于哪里

Anthropic 的这份文件在坦承自身系统局限方面，比大多数企业文稿诚实得多。持续存在的鸿沟在于目标选择——即决定哪些问题值得去做，而不仅仅是解决别人已经指定好的问题。

初级工程师被告知「导出按钮坏了，去修」；高级工程师被交代「排查为什么网络在高负载下变慢」；首席工程师则自主决定团队下个季度应该做什么。截至 2026 年中，Claude 在第一类任务上能独立完成，第二类任务也表现强劲。第三类——真正的、开放式的判断力——仍然是人类的领地。

研究基准测试上的情况类似。Anthropic 在 2026 年 4 月进行了一项开放式 AI 安全实验，Claude 驱动的 Agent 填补了「弱监督者」与「强模型」之间97%的性能差距——而两位人类研究员用一周时间只完成了 23%。1 但这些 Agent 是被给定了问题定义的，并非自己选择了问题。

正是这个差距，使得递归自我改进的门槛如此关键。完全自主的开发，要求系统能够自主制定研究议程，而不只是执行议程。

「暂停」的呼吁，以及它为何如此复杂

sg.finance.yahoo.comhttps://sg.finance.yahoo.com/news/anthropic-calls-pause-global-ai-223531771.html외부 링크

콘텐츠 카드를 불러오는 중…

这份研究文件埋藏的政治炸弹，在于 Anthropic 呼吁各方协调放慢前沿 AI 开发的步伐——明确包括它自己。3 公司的表态措辞谨慎：「我们认为，给世界留下一个可以放慢或暂时暂停前沿 AI 开发的选项，是有益的——以便社会结构和对齐研究能够跟上技术推进的节奏。」

Anthropic 联合创始人 Jack Clark 在接受 BBC 采访时说得更直白：「你希望有能力把脚从油门上移开、踩上刹车。但现在，AI 行业有油门，却没有刹车踏板。」3

Anthropic 援引的类比是军备控制——具体来说是冷战时期的中程核导弹条约。这一框架要求所有领先实验室同时参与，并配备可信的核查机制。但公司自己也承认，其中的难题在于：AI 训练运行远比导弹发射井难以核查，一个决意为之的行为者完全可以悄悄推进训练。

质疑者的反驳同样犀利。本特利大学研究算法与社会的数学家 Noah Giansiracusa 在接受《科学美国人》采访时直言不讳：「这根本不可能。减速的可能性为零。我还没说中国——光是马斯克就绝对不会慢下来。」4 乔治亚理工学院的 Mark Riedl 则将这一时刻定性为「大 AI 公司搭上『递归自我改进』炒作列车」。与此同时，时机也引发了质疑：Anthropic 在此次公告发布前数日刚刚秘密申请了 IPO，而稍早一轮融资已将公司估值推近一万亿美元。

这究竟是真诚的警告，还是市场定位的手段？很可能两者兼而有之——这正是为何这篇文章值得仔细阅读，而非轻易打发。

为什么这篇长读值得一读

《经济学人》的叙事框架之所以有价值，恰恰在于它拒绝将张力化解为一个整齐的答案。Anthropic 呈现的数据是真实且内部自洽的，趋势是可量化的。这条趋势最终止步于一个有益的生产力平台，还是通往某个后果更深远的地方，目前真的无从得知——而那些正在构建这些系统的人，也是第一批承认这一点的人。

这篇文章所捕捉到的，以及大多数关于这次公告的报道所错失的，是：真正有趣的问题并不是 AI 是否会以某种戏剧性的科幻方式「脱离」人类掌控。而是，那些微小决策的累积式移交——该修哪个 bug、该审查哪段代码、该运行哪个实验——是否已在悄然重塑 AI 发展轨迹的主导者究竟是谁（或者什么）。Anthropic 的工程师们，也许是第一批对这个问题不再觉得抽象的人。

阅读原文： Will artificial intelligence soon escape human control? — The Economist

一手来源： When AI builds itself — The Anthropic Institute

当建造者成为被建造者