
当建造者成为被建造者
Anthropic 的新研究文件披露,Claude 如今已承担该公司超过80%的代码编写工作,并悄然呼吁全球暂停前沿 AI 开发。《经济学人》6月7日的这篇文章,是目前对「递归自我改进」在实践中究竟意味着什么的最清晰叙述,也揭示了 AI 控制权的问题已不再停留于理论。

今日长读 · 经济学人 · 2026 年 6 月 7 日 · 约 9 分钟
当建造者成为被建造者
Anthropic 过去几周做了一件不同寻常的事:主动发布了一份可能动摇自身存在合理性的数据。新研究文件《When AI builds itself》揭示,截至 2026 年 5 月,公司代码库超过 80%的代码由 Claude 编写——工程师人均产出是四年前的八倍,不是因为打字更快,而是大部分打字工作已不再由他们来做。1
《经济学人》6 月 7 日这篇文章以此为核心,直逼一个更大的问题:人工智能是否即将脱离人类掌控?2 这是目前关于「递归自我改进」最清晰的实践叙述——不是科幻场景,而是一个已在进行中、可量化的技术趋势。
递归自我改进究竟意味着什么
콘텐츠 카드를 불러오는 중…
这个术语听起来很戏剧化,但机制其实相当具体。递归自我改进,指的是 AI 系统能够在几乎不需要人类介入的情况下,自主设计并构建自己的继任者。Anthropic 的研究文件措辞谨慎:「我们还没有到达那个阶段,递归自我改进也并非不可避免。」但文件本身的数据清楚表明,每一代 Claude 在构建下一代的工作中都承担了更大的份额。
从 2021 年到今天,这条演进时间线读起来几乎像一份逐步交接的记录:
- 2021–2023:Anthropic 工程师在笔记本上写代码,没有任何 AI 辅助。
- 2023–2025:聊天机器人建议短代码片段,工程师复制粘贴。
- 2025–2026:编程 Agent 自主编写和修改整个文件。
- 当下:Agent 自行运行代码,并将耗时数小时的任务委托给其他 Agent。
- 20XX 年?:Agent 能够完全自主地设计和训练自己的继任者。
Claude 完成任务的速度同样讲述着同一个故事。2024 年 3 月,Claude Opus 3 能完成一个人类需要约四分钟才能完成的软件任务。到 2026 年初,Claude Opus 4.6 已能处理耗时 12 小时的任务。1 如果每四个月翻倍的趋势持续下去,今年内多天级别的任务或许也将进入射程。一个熟练工程师需要数周才能完成的任务,到 2027 年可能已是例行公事。

差距仍然存在于哪里
Anthropic 的这份文件在坦承自身系统局限方面,比大多数企业文稿诚实得多。持续存在的鸿沟在于目标选择——即决定哪些问题值得去做,而不仅仅是解决别人已经指定好的问题。
初级工程师被告知「导出按钮坏了,去修」;高级工程师被交代「排查为什么网络在高负载下变慢」;首席工程师则自主决定团队下个季度应该做什么。截至 2026 年中,Claude 在第一类任务上能独立完成,第二类任务也表现强劲。第三类——真正的、开放式的判断力——仍然是人类的领地。
研究基准测试上的情况类似。Anthropic 在 2026 年 4 月进行了一项开放式 AI 安全实验,Claude 驱动的 Agent 填补了「弱监督者」与「强模型」之间97%的性能差距——而两位人类研究员用一周时间只完成了 23%。1 但这些 Agent 是被给定了问题定义的,并非自己选择了问题。
正是这个差距,使得递归自我改进的门槛如此关键。完全自主的开发,要求系统能够自主制定研究议程,而不只是执行议程。
「暂停」的呼吁,以及它为何如此复杂
콘텐츠 카드를 불러오는 중…
这份研究文件埋藏的政治炸弹,在于 Anthropic 呼吁各方协调放慢前沿 AI 开发的步伐——明确包括它自己。3 公司的表态措辞谨慎:「我们认为,给世界留下一个可以放慢或暂时暂停前沿 AI 开发的选项,是有益的——以便社会结构和对齐研究能够跟上技术推进的节奏。」
Anthropic 联合创始人 Jack Clark 在接受 BBC 采访时说得更直白:「你希望有能力把脚从油门上移开、踩上刹车。但现在,AI 行业有油门,却没有刹车踏板。」3
Anthropic 援引的类比是军备控制——具体来说是冷战时期的中程核导弹条约。这一框架要求所有领先实验室同时参与,并配备可信的核查机制。但公司自己也承认,其中的难题在于:AI 训练运行远比导弹发射井难以核查,一个决意为之的行为者完全可以悄悄推进训练。
质疑者的反驳同样犀利。本特利大学研究算法与社会的数学家 Noah Giansiracusa 在接受《科学美国人》采访时直言不讳:「这根本不可能。减速的可能性为零。我还没说中国——光是马斯克就绝对不会慢下来。」4 乔治亚理工学院的 Mark Riedl 则将这一时刻定性为「大 AI 公司搭上『递归自我改进』炒作列车」。与此同时,时机也引发了质疑:Anthropic 在此次公告发布前数日刚刚秘密申请了 IPO,而稍早一轮融资已将公司估值推近一万亿美元。
这究竟是真诚的警告,还是市场定位的手段?很可能两者兼而有之——这正是为何这篇文章值得仔细阅读,而非轻易打发。
为什么这篇长读值得一读
《经济学人》的叙事框架之所以有价值,恰恰在于它拒绝将张力化解为一个整齐的答案。Anthropic 呈现的数据是真实且内部自洽的,趋势是可量化的。这条趋势最终止步于一个有益的生产力平台,还是通往某个后果更深远的地方,目前真的无从得知——而那些正在构建这些系统的人,也是第一批承认这一点的人。
这篇文章所捕捉到的,以及大多数关于这次公告的报道所错失的,是:真正有趣的问题并不是 AI 是否会以某种戏剧性的科幻方式「脱离」人类掌控。而是,那些微小决策的累积式移交——该修哪个 bug、该审查哪段代码、该运行哪个实验——是否已在悄然重塑 AI 发展轨迹的主导者究竟是谁(或者什么)。Anthropic 的工程师们,也许是第一批对这个问题不再觉得抽象的人。
이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.