代码量在涨,生产力在哪?Chollet 和 Mollick 同一天点破 AI 产能幻觉

代码量在涨,生产力在哪?Chollet 和 Mollick 同一天点破 AI 产能幻觉

6 月 6 日,Chollet 发出一张 app 发布量暴涨、使用率却不动的图表,一句「代码量不等于生产力」击中要害;Mollick 转发 Anthropic 的 Agent 架构对比表并指出:AI 已经开始自己决定用哪种执行模式,架构师设计的图已经和模型实际跑的路径不一样了。两条线在同一个地方汇合——当 AI 代劳了执行,判断力才是真正没被自动化掉的东西。

X·AI 大佬今日观点
2026. 6. 7. · 08:05
구독 1개 · 콘텐츠 5개
今天(北京时间 6 月 6 日)白名单的核心人物里,Karpathy、LeCun、Demis、Jim Fan 仍无窗口内原创推文,Marcus 的新一轮 IPO 炮火集中在深夜之后(超出本期窗口)。活跃的是 Chollet 和 Mollick——两人隔着几个小时,各自从不同角度击中了同一个问题:在 Agent 把代码量推高 10 倍、把工作流变得越来越复杂的今天,我们到底该怎么量产出?

Chollet:代码量不等于生产力

UTC 15:56,Chollet 发了一句话,附了一张 app store 数据图:
Code volume does not represent productivity.
콘텐츠 카드를 불러오는 중…
这条推文 509 个点赞、39K 次展示,回复里大量工程师和产品人在附和。图表本身说的是:过去一年,应用发布量上涨了约 80%,但有实质下载量/评分的应用数量几乎没动,使用率曲线也是平的。
意思很明确:AI 辅助编码让「写代码」这件事的成本接近零,但代码写出来 ≠ 有人用、有人付费、有人留存。开发侧的产出爆炸,和用户侧的使用增量之间,出现了一个正在拉大的剪刀差。
Chollet 随后在另一条推文里给出了更底层的框架判断(虽然发布时间超出本轮窗口,但逻辑上是同一天思路的延伸):「规模化知识给你静态能力。智能给你适应性。」——他一直以来的核心立场:当前 LLM 靠扩大知识覆盖(scaling)来提升表现,本质是「把更多东西记住了」,但应对真实新问题的适应力——才是他认为智能最核心的部分——并没有随着代码量或模型参数同步增长。
换成工程视角就是:Agent 帮你把代码量放大了 10 倍,不等于你的产品解决了 10 倍的真实用户问题。生产力的瓶颈已经从「写代码」转移到「判断要做什么」「能否真正解决用户痛点」。
这并不是反 AI 的论点。Chollet 在当日另一处也强调:「开发者生产力很难衡量。」他的意思是:用代码量当 KPI 是个错误的代理指标,行业整体在用一个错误的尺子量正确的目标1

Mollick:Agent 团队的架构图能看,但 AI 自己会绕过它

几乎同一天,Mollick 转发了 Anthropic 关于 Agent 架构模式的官方图表,并加了一个关键补充:
콘텐츠 카드를 불러오는 중…
他的原话是:
This chart from Anthropic is useful, since Agent Teams and Workflows are both very new and very powerful (and token hungry). On the other hand, maybe it doesn't matter as a lot of the decisions about which approach to use is from the AI itself & it often uses them in combination.
Anthropic 的图表把 Agent 系统分成三类:Workflows(工作流,由代码控制执行路径)、Subagents(子 Agent,独立执行但受主 Agent 调度)、Agent Teams(多 Agent 并行,任务在多个 Agent 之间动态分配)2。三者的核心差别在于:谁决定下一步做什么——是预定义的代码逻辑、是主控 Agent,还是 Agent 群体自己商量。
Mollick 的洞察在于「也许这个区分不重要了」。他的理由是:AI 自己越来越多地决定用哪种模式。工程师设计了一个 Workflow,模型跑着跑着觉得该召唤一个子 Agent 了,然后就召唤了。你的架构图是 Workflow,模型的实际执行路径是 Agent Team——这种情况在实际工程中正在变得普遍。
回复区里出现了一些能印证他判断的第一手反馈:
  • 「我搭了个 Agent 管道,确认了,模型根本不管你的架构图。两轮之内它就自己路由到了一个你没计划到的 Team 模式。」
  • 「谁决定下一步这一行才是关键。Subagents 在同一个上下文里悄悄失败,Teams 和 Workflows 在跨 handoff 时失败——跨上下文的状态保持不住。」
  • 「表格跳过了失败成本。Workflows 失败了重跑这一步。Agent Teams 失败了要重放整个 trace。」3
把 Mollick 的观察和 Chollet 的数据放在一起,有一条暗线会浮现出来:
工具的自主性在提高,但「产出是什么」「怎么算好」这两个问题,工具本身还没学会替你回答。
Agent Teams 的 token 消耗是 Workflow 的 10-100 倍,但它生成的代码量也是 10 倍——然而 Chollet 的图表告诉你,代码量的 10 倍增长和用户真实使用的增长,几乎没有关系。

两条线的汇合点

Chollet 和 Mollick 平时站位不同:Chollet 对 scaling 路线持长期怀疑,Mollick 是 AI 实用主义的有力推手。但今天他们两人的观察收束在同一个地方:
当 AI 代劳了「执行」这件事,人类的判断权重反而在上升。
Chollet 说:开发者的瓶颈从写代码变成了判断——你做的东西有没有人真的用?Mollick 说:架构师的瓶颈从设计系统变成了理解 AI 实际在做什么——当 AI 自己选择执行路径,你还能读懂失败在哪里吗?
两个维度本质上是一件事的两面:AI 把执行自动化了,剩下没有自动化的,是「你要做什么、你有没有做到」。这个判断,目前没有任何 Agent 架构能替代。

本期时间窗口内原创推文较少(北京时间 6 月 6 日,两条有效内容),Marcus 的新一批推文(涉及 SpaceX IPO、OpenAI 人才外流)集中在深夜之后,纳入下一期。

이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.

  • 로그인하면 댓글을 작성할 수 있습니다.