代码量在涨，生产力在哪？Chollet 和 Mollick 同一天点破 AI 产能幻觉

今天（北京时间 6 月 6 日）白名单的核心人物里，Karpathy、LeCun、Demis、Jim Fan 仍无窗口内原创推文，Marcus 的新一轮 IPO 炮火集中在深夜之后（超出本期窗口）。活跃的是 Chollet 和 Mollick——两人隔着几个小时，各自从不同角度击中了同一个问题：在 Agent 把代码量推高 10 倍、把工作流变得越来越复杂的今天，我们到底该怎么量产出？

Chollet：代码量不等于生产力

UTC 15:56，Chollet 发了一句话，附了一张 app store 数据图：

Code volume does not represent productivity.

콘텐츠 카드를 불러오는 중…

这条推文 509 个点赞、39K 次展示，回复里大量工程师和产品人在附和。图表本身说的是：过去一年，应用发布量上涨了约 80%，但有实质下载量/评分的应用数量几乎没动，使用率曲线也是平的。

意思很明确：AI 辅助编码让「写代码」这件事的成本接近零，但代码写出来 ≠ 有人用、有人付费、有人留存。开发侧的产出爆炸，和用户侧的使用增量之间，出现了一个正在拉大的剪刀差。

Chollet 随后在另一条推文里给出了更底层的框架判断（虽然发布时间超出本轮窗口，但逻辑上是同一天思路的延伸）：「规模化知识给你静态能力。智能给你适应性。」——他一直以来的核心立场：当前 LLM 靠扩大知识覆盖（scaling）来提升表现，本质是「把更多东西记住了」，但应对真实新问题的适应力——才是他认为智能最核心的部分——并没有随着代码量或模型参数同步增长。

换成工程视角就是：Agent 帮你把代码量放大了 10 倍，不等于你的产品解决了 10 倍的真实用户问题。生产力的瓶颈已经从「写代码」转移到「判断要做什么」「能否真正解决用户痛点」。

这并不是反 AI 的论点。Chollet 在当日另一处也强调：「开发者生产力很难衡量。」他的意思是：用代码量当 KPI 是个错误的代理指标，行业整体在用一个错误的尺子量正确的目标1。

Mollick：Agent 团队的架构图能看，但 AI 自己会绕过它

几乎同一天，Mollick 转发了 Anthropic 关于 Agent 架构模式的官方图表，并加了一个关键补充：

콘텐츠 카드를 불러오는 중…

他的原话是：

This chart from Anthropic is useful, since Agent Teams and Workflows are both very new and very powerful (and token hungry). On the other hand, maybe it doesn't matter as a lot of the decisions about which approach to use is from the AI itself & it often uses them in combination.

Anthropic 的图表把 Agent 系统分成三类：Workflows（工作流，由代码控制执行路径）、Subagents（子 Agent，独立执行但受主 Agent 调度）、Agent Teams（多 Agent 并行，任务在多个 Agent 之间动态分配）2。三者的核心差别在于：谁决定下一步做什么——是预定义的代码逻辑、是主控 Agent，还是 Agent 群体自己商量。

Mollick 的洞察在于「也许这个区分不重要了」。他的理由是：AI 自己越来越多地决定用哪种模式。工程师设计了一个 Workflow，模型跑着跑着觉得该召唤一个子 Agent 了，然后就召唤了。你的架构图是 Workflow，模型的实际执行路径是 Agent Team——这种情况在实际工程中正在变得普遍。

回复区里出现了一些能印证他判断的第一手反馈：

「我搭了个 Agent 管道，确认了，模型根本不管你的架构图。两轮之内它就自己路由到了一个你没计划到的 Team 模式。」
「谁决定下一步这一行才是关键。Subagents 在同一个上下文里悄悄失败，Teams 和 Workflows 在跨 handoff 时失败——跨上下文的状态保持不住。」
「表格跳过了失败成本。Workflows 失败了重跑这一步。Agent Teams 失败了要重放整个 trace。」3

把 Mollick 的观察和 Chollet 的数据放在一起，有一条暗线会浮现出来：

工具的自主性在提高，但「产出是什么」「怎么算好」这两个问题，工具本身还没学会替你回答。

Agent Teams 的 token 消耗是 Workflow 的 10-100 倍，但它生成的代码量也是 10 倍——然而 Chollet 的图表告诉你，代码量的 10 倍增长和用户真实使用的增长，几乎没有关系。

两条线的汇合点

Chollet 和 Mollick 平时站位不同：Chollet 对 scaling 路线持长期怀疑，Mollick 是 AI 实用主义的有力推手。但今天他们两人的观察收束在同一个地方：

当 AI 代劳了「执行」这件事，人类的判断权重反而在上升。

Chollet 说：开发者的瓶颈从写代码变成了判断——你做的东西有没有人真的用？Mollick 说：架构师的瓶颈从设计系统变成了理解 AI 实际在做什么——当 AI 自己选择执行路径，你还能读懂失败在哪里吗？

两个维度本质上是一件事的两面：AI 把执行自动化了，剩下没有自动化的，是「你要做什么、你有没有做到」。这个判断，目前没有任何 Agent 架构能替代。

本期时间窗口内原创推文较少（北京时间 6 月 6 日，两条有效内容），Marcus 的新一批推文（涉及 SpaceX IPO、OpenAI 人才外流）集中在深夜之后，纳入下一期。

代码量在涨，生产力在哪？Chollet 和 Mollick 同一天点破 AI 产能幻觉

Chollet：代码量不等于生产力

Mollick：Agent 团队的架构图能看，但 AI 自己会绕过它

两条线的汇合点

참고 출처