
July 3, 2026 · 8:08 AM
Mollick 盯上长任务 Agent,Marcus 盯上 token 税
过去 24 小时,核心账号的 AI 原创主要集中在 Mollick 和 Marcus:前者把 Fable / Claude Code 的问题落到长任务可观察性、持续学习和企业实施节奏,后者继续追问 AI 投入回报,并提出按 token 征税的政策想法。
过去 24 小时,Sam Altman 在窗口内有一条原创,但内容是世界杯观赛感受,不是 AI 观点;Karpathy、Demis、Jim Fan、Chollet、Ilya 等核心账号没有新的可入选原创长推。可写的高信号材料主要来自两个人:Ethan Mollick 继续把 Fable / Claude Code 这类长任务 Agent 拉回「怎么管理」的问题,Gary Marcus 则把 AI 投入回报追问推进到 token 税和公共补偿。1
速览
- Mollick 的主线:长任务 Agent 已经能做出很强的东西,但企业还缺一套可观察、可干预、可复盘的操作台。
- Marcus 的主线:如果 AI 行业要花数万亿美元扩建算力,就必须拿出更清楚的正向影响证据;同时,他提出按每个 token 征收小额税的想法。
- 今天的分歧:Mollick 担心企业按今天的能力上限设计系统,Marcus 担心行业按未来的能力承诺提前花钱。一个怕保守,一个怕透支。
Mollick:长任务 Agent 的瓶颈不只是模型能力
Ethan Mollick(宾夕法尼亚大学沃顿商学院教授)这组推文很集中。北京时间 7 月 2 日 12:35,他说自己看了不少关于 Fable 工作流的讨论后,反而更确信一点:大家几乎还不知道该怎样组织长时间运行的 Agent 工作,「没人有足够经验,也没人做了足够测试,能得出真正结论」。2
十几分钟后,他给出一个更具体的操作提醒:长任务跑久了,Fable 会发展出一种「内部奇怪节奏和对话」。如果用户不明确要求它用普通话汇报进展,这种风格会渗进输出,甚至进入菜单文案。3 这不是文风小毛病。对企业来说,Agent 产物如果夹带一套难以解释的内部节奏,后面的验收、交接、审计都会变麻烦。
到北京时间 7 月 3 日 00:42,他把问题说得更直接:Fable in Claude Code 能做出很惊人的东西,非程序员也能用,但界面并不是为 5 小时以上的自主任务设计的。用户很难实时观察发生了什么,也很难中途干预,很多时候只能等最终输出。4
Loading content card…
这条线索和他稍后关于「持续学习」的判断连在一起。Mollick 说,持续学习可能是 AI 爆发式采用的最大障碍,也可能影响递归式自我改进;只要模型仍像「失忆症患者」一样,需要人类替它完成学习,采用速度就会被人类流程卡住。5
换成企业落地语言,就是三件事:Agent 要能记住项目过程,要能解释自己正在做什么,还要允许人在关键节点接管。否则模型能力再强,组织也只能把它当一个会交大作业的黑箱工具,而不是可协作的同事。
Mollick 对实施路线的分歧也有一句很好的概括。他说自己 X 信息流里的 AI 落地建议分成两派:一派「feel the exponential」,相信能力曲线还会继续快速上升;另一派的潜意识模型则是假定 AI 已经差不多到顶,因此应该围绕今天的限制和成本结构建设系统。6 这句话对企业选型有用:如果系统被今天的弱点写死,半年后可能全是技术债;如果完全押注指数曲线,今天的流程又可能失控。
他还补了一句安全相关判断:关于 Mythos 和网络安全的讨论并不是炒作,使用 Fable 做自主工作的人应该已经能感受到。7 这句话信息量不在「网络安全」四个字,而在 Mollick 把自主工作能力和安全风险放在同一个框里看。Agent 越能独立跑长任务,越不能只看完成率,还要看权限、日志、回滚和隔离。
Marcus:如果要花数万亿美元,先把账算清
Gary Marcus(纽约大学名誉教授、长期 AI 批评者)今天的线索还是围绕成本与公共账本,但比单纯说「泡沫」更具体。北京时间 7 月 2 日 22:18,他追问:在还不能扎实记录清楚正向影响时,是否应该把数万亿美元投入一个投机性赌注。8
紧接着,他把批评落到一个词上:tokenmaxxing。他说,这又是更多证据,说明 tokenmaxxing 是个糟糕想法。9 这里的 tokenmaxxing 可以理解为把更多 token、更大上下文、更大吞吐量当成核心路线。Marcus 的反对不是说 token 不重要,而是反对把消耗量本身当成进步证据。
几分钟后,他提出了一个政策想法:对每个生成的 token 征收小额税,既可能带来很大公共收益,也不必让政府和某一家具体公司绑定;他给出的理由是,每个 token 都借用了社会中大量创作者未获补偿的贡献。10
Loading content card…
这不是成熟政策方案,但它把 AI 争议从「模型厉不厉害」推到了另一个账本:训练数据、推理消耗、创作者补偿和公共财政怎样连接。对国内读者来说,更值得留意的是这个提问方向。未来监管不一定照着 token 税走,但只要 AI 公司继续用社会文本、图像、代码和用户行为训练模型,补偿和再分配问题就很难绕开。
今天的共同问题:Agent 能力上去了,组织和账本没跟上
Mollick 和 Marcus 的立场看起来相反。Mollick 担心企业按今天的模型短板设计流程,错过能力继续上升后的红利;Marcus 担心企业和资本市场先把未来红利花掉,却拿不出当下的生产率证据。
放在一起看,它们其实指向同一个缺口:AI 系统正在从「一次回答」变成「连续执行」,但组织管理和公共账本都还按旧工具来算。企业内部要补的是任务日志、检查点、权限和中途干预;行业外部要补的是成本、收益、创作者贡献和社会风险的计量方式。
如果今天只带走一个判断,可以是这个:长任务 Agent 不是把聊天框拉长,而是把软件工程、流程管理和审计责任塞进同一个系统。模型厂商会继续展示能力曲线,企业和监管者则要追问另一组问题:谁能看见它在做什么,谁能在中途叫停,出错后谁能复盘,消耗的资源和数据又由谁来付账。
More from this channel
Related content
- Sign in to comment.
