
2026. 6. 25. · 08:10
Mollick 讲组织,Chollet 讲原语,Marcus 讲泡沫
过去 24 小时内,高信号原创主要集中在 Mollick、Chollet 和 Marcus:企业 AI 使用已经从工具采购变成组织设计问题,ARC-AGI-2 的开源进展仍要和失败模式一起读,AI 泡沫批评则继续转向资本账本。
过去 24 小时,能撑起观点密度的原创,主要集中在 Ethan Mollick、François Chollet 和 Gary Marcus。今天的共同主题不是「又一个模型发布」,而是三个更现实的问题:公司到底该怎么把 AI 放进组织里,ARC-AGI-2 这类测试该怎么读,以及资本市场是否已经把 AI 故事讲过了头。
| 线索 | 原话里的关键信号 | 对读者的含义 |
|---|---|---|
| Mollick:AI 使用从 IT 问题变成组织问题 | Mollick 说,组织如何使用 AI,越来越是组织设计和战略选择,而不是 IT 选择:哪些智能外包给 agent、公司边界如何变化、人的角色如何重定 1。 | 企业内部推 AI,难点不在「买哪个工具」,而在工作流、权限、评价和岗位边界。 |
| Chollet:分数之外,看原语和失败模式 | Chollet 判断,一项开源模型在 ARC-AGI-2 上拿到迄今最强开源成绩 2;他同日还强调,理解复杂系统要看边缘案例和失败模式 3。 | Benchmark 有用,但它更像入口。真正要问的是模型在哪些边界上崩、哪些结构能泛化。 |
| Marcus:泡沫叙事继续升温 | Marcus 引用 Paul Gambles 经 Bloomberg 的说法,称 AI bubble 在规模、杠杆和估值兴奋度上都异常大 4。 | 资本端的质疑正在从「模型能不能做」转向「这些投入能不能回本」。 |
콘텐츠 카드를 불러오는 중…
Mollick:员工不是不用 AI,而是不想被看见
Mollick 今天最有用的一条,不是某个工具技巧,而是那句「AI 决策正在变成组织设计问题」。这句话放在企业里很具体:当 agent 能接手研究、写代码、做流程、查资料时,公司要决定什么叫外包给机器、什么仍然算人的职责、谁来承担错误,绩效又怎么记。
他随后转发的论文线索给这件事补了一层实验依据。David Almog 的预印本《Barriers to AI Adoption: Image Concerns at Work》做了一个 450 名美国远程工作者参与的现场实验:当 workers 知道 HR 评估者能看见他们依赖 AI 的程度时,他们把初始答案改成 AI 推荐的比例从约 30.5% 降到 26.2%,任务准确率也从 79.1% 降到 76.4% 5。论文还写到,AI 使用可见后,worker 更倾向于强调「对自己判断的信心」这个形象信号 5。
Mollick 用一句话概括得更直白:很多声称自己从不用 AI 的人,其实在秘密使用 AI 6。这对企业落地的提醒很硬:如果组织把「用了 AI」默认为偷懒、能力不足或不够专业,员工就会把 AI 使用藏起来。结果不是少用 AI,而是管理层拿不到真实流程,安全、合规、效率评估全都失真。
同一天,他还把个人体验落到小处:Codex 和 Code 帮他解决 Windows 机器上的问题,省掉了很多「烦人的时间消耗」,这类小胜利是 AI 工具价值最容易被低估的部分 7。大公司讨论 agent 战略时,最好别只盯着替代岗位。很多价值先出现在没人愿意花时间碰的小问题上。
Chollet 和 Mollick:ARC-AGI-2 的分数,要和「锯齿感」一起读
콘텐츠 카드를 불러오는 중…
Chollet 今天最像主线的一条,是他对 ARC-AGI-2 开源模型成绩的评价。他没有展开长文,只说这是迄今开源模型在 ARC-AGI-2 上最强的表现 2。如果只看这一句,很容易把它读成「开源追上来了」。但 Mollick 同一天给了更谨慎的参照:Gemini 3 Pro 在 2025 年 11 月率先达到 ARC-AGI-2 至少 23%,实际得分 31%;他据此判断,闭源模型和开源权重模型之间 8-12 个月的差距仍然存在,只是开源模型的能力更「锯齿」,有些任务更好,有些任务更差 8。
这两条放在一起,比单看分数有用。Chollet 关心的是推理能力能否跨题型泛化,Mollick 关心的是领先能力扩散到开源生态的时间差。对开发者和企业来说,结论不是简单地「等开源」或「买闭源」,而是要按任务边界做选择:如果任务验证清楚、失败成本低,开源模型的性价比会更快出现;如果任务处在模型最锯齿的区域,领先闭源模型也可能突然掉链子。
Chollet 同日的两条短句把他的技术立场说得更清楚。他说,理解复杂系统的最好方式是看边缘案例和失败模式,因为它们定义了系统轮廓 3;他还说,复杂现象来自简单规则的可扩展重组,如果找到合适的 primitive building blocks,复杂性会自己出现 9。这不是一句哲学口号。它对应的是评测方法:别只问模型会不会做一道题,要看它怎样失败、失败是否有结构、有没有可能通过更好的原语组合减少这种失败。
Marcus:泡沫批评从能力质疑转向资本账本
콘텐츠 카드를 불러오는 중…
Marcus 的主线仍然是怀疑,但今天的怀疑更偏市场语言。他引用 Paul Gambles 的说法,把 AI bubble 称作人类见过的最大股市泡沫之一,理由包括规模、杠杆和估值兴奋度 4。这类说法容易听起来夸张,但它和最近几周的讨论方向一致:大家不再只争模型是不是「聪明」,也开始追问数据中心、算力租赁、云厂商资本开支和软件收入之间的账能不能对上。
他另两条短推也在同一条线上。一条写「Welcome to the GenerativeAI Fizzle™」,把生成式 AI 的叙事从爆发改写成失速 10;另一条则用「建立在 IP theft 上的公司反过来抱怨自己的 IP 被盗」来讽刺 AI 公司围绕知识产权的双重标准 11。这两条都很短,不能替他补出完整论证,但它们显示 Marcus 今天关心的是 AI 商业叙事的合法性:钱从哪里来,训练材料如何取得,最后谁为过度承诺买单。
今天这三组观点的交叉点很清楚:AI 已经足够有用,所以员工会偷偷用;AI 仍然足够不稳定,所以 benchmark 分数必须和失败模式一起看;AI 又足够贵,所以资本市场迟早会问成本和收入是否相称。最值得跟踪的,不是明天谁又发一个更大的模型,而是这三条线哪一条先撑不住。
참고 출처
- 1Ethan Mollick 关于组织使用 AI 的推文
- 2François Chollet 关于 ARC-AGI-2 开源模型成绩的推文
- 3François Chollet 关于失败模式的推文
- 4Gary Marcus 关于 AI bubble 的推文
- 5Barriers to AI Adoption: Image Concerns at Work
- 6Ethan Mollick 关于秘密使用 AI 的推文
- 7Ethan Mollick 关于 Codex/Code 解决 Windows 问题的推文
- 8Ethan Mollick 关于 ARC-AGI-2 与开闭源差距的推文
- 9François Chollet 关于简单规则与复杂性的推文
- 10Gary Marcus 关于 GenerativeAI Fizzle 的推文
- 11Gary Marcus 关于 IP 的推文




이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.