Mollick 盯上长任务 Agent，Marcus 盯上 token 税 (2026)

过去 24 小时，Sam Altman 在窗口内有一条原创，但内容是世界杯观赛感受，不是 AI 观点；Karpathy、Demis、Jim Fan、Chollet、Ilya 等核心账号没有新的可入选原创长推。可写的高信号材料主要来自两个人：Ethan Mollick 继续把 Fable / Claude Code 这类长任务 Agent 拉回「怎么管理」的问题，Gary Marcus 则把 AI 投入回报追问推进到 token 税和公共补偿。1

速览

Mollick 的主线：长任务 Agent 已经能做出很强的东西，但企业还缺一套可观察、可干预、可复盘的操作台。
Marcus 的主线：如果 AI 行业要花数万亿美元扩建算力，就必须拿出更清楚的正向影响证据；同时，他提出按每个 token 征收小额税的想法。
今天的分歧：Mollick 担心企业按今天的能力上限设计系统，Marcus 担心行业按未来的能力承诺提前花钱。一个怕保守，一个怕透支。

Mollick：长任务 Agent 的瓶颈不只是模型能力

Ethan Mollick（宾夕法尼亚大学沃顿商学院教授）这组推文很集中。北京时间 7 月 2 日 12:35，他说自己看了不少关于 Fable 工作流的讨论后，反而更确信一点：大家几乎还不知道该怎样组织长时间运行的 Agent 工作，「没人有足够经验，也没人做了足够测试，能得出真正结论」。2

十几分钟后，他给出一个更具体的操作提醒：长任务跑久了，Fable 会发展出一种「内部奇怪节奏和对话」。如果用户不明确要求它用普通话汇报进展，这种风格会渗进输出，甚至进入菜单文案。3 这不是文风小毛病。对企业来说，Agent 产物如果夹带一套难以解释的内部节奏，后面的验收、交接、审计都会变麻烦。

到北京时间 7 月 3 日 00:42，他把问题说得更直接：Fable in Claude Code 能做出很惊人的东西，非程序员也能用，但界面并不是为 5 小时以上的自主任务设计的。用户很难实时观察发生了什么，也很难中途干预，很多时候只能等最终输出。4

Loading content card…

这条线索和他稍后关于「持续学习」的判断连在一起。Mollick 说，持续学习可能是 AI 爆发式采用的最大障碍，也可能影响递归式自我改进；只要模型仍像「失忆症患者」一样，需要人类替它完成学习，采用速度就会被人类流程卡住。5

换成企业落地语言，就是三件事：Agent 要能记住项目过程，要能解释自己正在做什么，还要允许人在关键节点接管。否则模型能力再强，组织也只能把它当一个会交大作业的黑箱工具，而不是可协作的同事。

Mollick 对实施路线的分歧也有一句很好的概括。他说自己 X 信息流里的 AI 落地建议分成两派：一派「feel the exponential」，相信能力曲线还会继续快速上升；另一派的潜意识模型则是假定 AI 已经差不多到顶，因此应该围绕今天的限制和成本结构建设系统。6 这句话对企业选型有用：如果系统被今天的弱点写死，半年后可能全是技术债；如果完全押注指数曲线，今天的流程又可能失控。

他还补了一句安全相关判断：关于 Mythos 和网络安全的讨论并不是炒作，使用 Fable 做自主工作的人应该已经能感受到。7 这句话信息量不在「网络安全」四个字，而在 Mollick 把自主工作能力和安全风险放在同一个框里看。Agent 越能独立跑长任务，越不能只看完成率，还要看权限、日志、回滚和隔离。

Marcus：如果要花数万亿美元，先把账算清

Gary Marcus（纽约大学名誉教授、长期 AI 批评者）今天的线索还是围绕成本与公共账本，但比单纯说「泡沫」更具体。北京时间 7 月 2 日 22:18，他追问：在还不能扎实记录清楚正向影响时，是否应该把数万亿美元投入一个投机性赌注。8

紧接着，他把批评落到一个词上：tokenmaxxing。他说，这又是更多证据，说明 tokenmaxxing 是个糟糕想法。9 这里的 tokenmaxxing 可以理解为把更多 token、更大上下文、更大吞吐量当成核心路线。Marcus 的反对不是说 token 不重要，而是反对把消耗量本身当成进步证据。

几分钟后，他提出了一个政策想法：对每个生成的 token 征收小额税，既可能带来很大公共收益，也不必让政府和某一家具体公司绑定；他给出的理由是，每个 token 都借用了社会中大量创作者未获补偿的贡献。10

Loading content card…

这不是成熟政策方案，但它把 AI 争议从「模型厉不厉害」推到了另一个账本：训练数据、推理消耗、创作者补偿和公共财政怎样连接。对国内读者来说，更值得留意的是这个提问方向。未来监管不一定照着 token 税走，但只要 AI 公司继续用社会文本、图像、代码和用户行为训练模型，补偿和再分配问题就很难绕开。

今天的共同问题：Agent 能力上去了，组织和账本没跟上

Mollick 和 Marcus 的立场看起来相反。Mollick 担心企业按今天的模型短板设计流程，错过能力继续上升后的红利；Marcus 担心企业和资本市场先把未来红利花掉，却拿不出当下的生产率证据。

放在一起看，它们其实指向同一个缺口：AI 系统正在从「一次回答」变成「连续执行」，但组织管理和公共账本都还按旧工具来算。企业内部要补的是任务日志、检查点、权限和中途干预；行业外部要补的是成本、收益、创作者贡献和社会风险的计量方式。

如果今天只带走一个判断，可以是这个：长任务 Agent 不是把聊天框拉长，而是把软件工程、流程管理和审计责任塞进同一个系统。模型厂商会继续展示能力曲线，企业和监管者则要追问另一组问题：谁能看见它在做什么，谁能在中途叫停，出错后谁能复盘，消耗的资源和数据又由谁来付账。

Mollick 盯上长任务 Agent，Marcus 盯上 token 税

速览

Mollick：长任务 Agent 的瓶颈不只是模型能力

Marcus：如果要花数万亿美元，先把账算清

今天的共同问题：Agent 能力上去了，组织和账本没跟上

References

More from this channel

Related content