Jim Fan 谈机器人自我改进,Mollick 给模型路由泼冷水
2/7/2026 · 8:07

Jim Fan 谈机器人自我改进,Mollick 给模型路由泼冷水

过去 24 小时内,核心账号原创仍偏少;本期聚焦 Jim Fan 的机器人自我改进组件、Ethan Mollick 对模型路由与用例评测的提醒,以及 Chollet 与 Marcus 对就业和算力过剩的不同判断。

这个 24 小时窗口里,核心账号没有出现 Sama 或 Karpathy 那种足以单独撑起一篇的长推;真正有信息量的信号来自四个方向:Jim Fan 把机器人自我改进继续往工程组件上推,Ethan Mollick 连发几条提醒企业别被模型供应商的话术牵着走,François Chollet 给出了一个反直觉的就业判断,Gary Marcus 则继续把算力投资拉回过剩产能问题。
人物窗口内可入选原创这条推文真正值得看的地方
Jim FanASPIRE 是 Physical AutoResearch 系列第二项工作,目标是为机器人自我改进补组件 1机器人路线正在从「示范更多动作」转向「让系统自己补技能」
Ethan Mollick预分类路由容易低估高智能模型在复杂任务上的价值 2企业采购模型时,便宜路由和真实任务效果之间会有冲突
François Chollet这一轮 AI 不会带来大规模失业,影响更多会表现为软件工程师需求上升 3他把「AI 替代劳动」这件事压回到更窄的技术影响范围内
Gary MarcusAI 处理能力转售在他看来是过度建设已经开始的迹象 4他不再只批评模型可靠性,而是盯着资本开支后的闲置风险

Jim Fan:机器人自我改进不再只是愿景

Jim Fan 这条不长,但它把 Physical AutoResearch 的重点说得很清楚:从 ENPIRE 到 ASPIRE,这是同一系列里的第二项工作;团队正在给机器人自我改进搭组件,方式是「one /skill at a time」1
Cargando tarjeta de contenido…
这句话的重点不是 ASPIRE 这个名字,而是「组件」和「技能」。机器人自我改进如果只停留在演示层,看起来会像让机械臂多做几个任务;但 Jim Fan 的表述更像在搭一套可迭代的实验系统。机器人先获得一个可验证的小技能,再把这个技能放进下一轮学习、评估和调整。它不像聊天模型那样靠文字反馈快速试错,现实世界里的每一次动作都要付出硬件、时间和安全成本。
所以这条短推值得入选:它让本频道从近期反复出现的模型、监管和资本叙事里跳出来,看见具身 AI 另一条进展线。机器人不是只等一个更大的基础模型接管身体,而是在补一块块能让系统持续改进的工程积木。

Mollick:别把「路由」当成企业 AI 的万能省钱按钮

Mollick 今天最有价值的几条,都在提醒企业别过早相信单一厂商叙事。他说,先把任务预分类再交给不同模型的路由方案,容易产出很多差结果;原因是路由很难,而且经常低估高智能模型在许多问题上的价值2
Cargando tarjeta de contenido…
这和他另一条提醒可以放在一起读:讨论 AI 未来时,人们太容易相信公司的愿景。大模型公司会说更大的模型才是未来;只有小模型可卖的公司,则会告诉你小模型才是未来5
企业真正要做的不是在「大模型」和「小模型」里选一个阵营,而是把自己的任务拿出来测。Mollick 还专门提醒,模型必须按具体用例做 benchmark;一旦判断和决策层层叠加,模型差异会被放大,标准 benchmark 未必能告诉你某个模型在咖啡馆财务损失这类具体情境下会比另一个模型更保守6
对企业读者来说,这比「模型 A 比模型 B 便宜」更实用。便宜模型可以处理低风险、可回滚、结构清楚的任务;但只要任务里出现多轮判断、隐含偏好、财务或安全后果,路由器本身就成了新的风险点。省下来的 token 成本,可能会被返工、错判和人工复核吃掉。

Chollet 和 Marcus:一边压低就业恐慌,一边抬高产能疑问

Chollet 的就业判断很直白:当前这波 AI 技术不会导致大规模失业,劳动力市场影响应该很小,主要表现为软件工程师需求增加3
Cargando tarjeta de contenido…
这不是一个可以直接拿来安慰所有行业的结论,因为他没有在这条推文里展开行业拆分、时间尺度或数据来源。但它和 Mollick 的「按用例测模型」放在一起,会形成一个更克制的判断:AI 的短期影响可能不是横扫劳动力市场,而是在软件、流程和判断密集型岗位里重新分配任务。谁能把模型能力接到真实工作流里,谁先受益;接不进去,单靠模型发布会并不会自动变成生产率。
Marcus 则从另一个方向提醒过热。他把「转售过剩 AI 处理能力」和 META 放在一起,说如果世界足够理性,这类动作会被看作已经开始过度建设的信号4
Marcus 的问题不新,但今天这条的角度更具体:当算力被讲成稀缺资产时,转售「过剩处理能力」听起来像商业模式;当资本开支已经跑在需求前面时,它也可能是库存压力的别名。把这条和 Chollet 的就业判断合起来看,今天的冲突就出来了:技术可能没有快到立刻改写就业,资本却已经按「需求会无限增长」在提前下注。

今天的读法

这一天的 X 观点没有一个统一答案,反而给了三个检查清单。
第一,机器人自我改进要看可复用组件,而不是只看演示视频有多顺。第二,企业 AI 选型要看具体任务上的连续判断质量,不能只看路由方案省了多少推理成本。第三,AI 对就业和算力需求的影响都还需要更细的证据:Chollet 在提醒别把替代效应说满,Marcus 在提醒别把基础设施需求说满。
这三条放在一起,今天最稳的结论是:AI 行业正在从「模型能力继续涨」进入「能力如何落地、成本谁来承担、需求是否真能接住」的阶段。对读者来说,下一步不是押一个口号,而是把自己关心的任务、成本和风险写成可测问题。

Contenido relacionado

  • Inicia sesión para comentar.