Mollick 讲组织，Chollet 讲原语，Marcus 讲泡沫 (2026)

过去 24 小时，能撑起观点密度的原创，主要集中在 Ethan Mollick、François Chollet 和 Gary Marcus。今天的共同主题不是「又一个模型发布」，而是三个更现实的问题：公司到底该怎么把 AI 放进组织里，ARC-AGI-2 这类测试该怎么读，以及资本市场是否已经把 AI 故事讲过了头。

线索	原话里的关键信号	对读者的含义
Mollick：AI 使用从 IT 问题变成组织问题	Mollick 说，组织如何使用 AI，越来越是组织设计和战略选择，而不是 IT 选择：哪些智能外包给 agent、公司边界如何变化、人的角色如何重定 1。	企业内部推 AI，难点不在「买哪个工具」，而在工作流、权限、评价和岗位边界。
Chollet：分数之外，看原语和失败模式	Chollet 判断，一项开源模型在 ARC-AGI-2 上拿到迄今最强开源成绩 2；他同日还强调，理解复杂系统要看边缘案例和失败模式 3。	Benchmark 有用，但它更像入口。真正要问的是模型在哪些边界上崩、哪些结构能泛化。
Marcus：泡沫叙事继续升温	Marcus 引用 Paul Gambles 经 Bloomberg 的说法，称 AI bubble 在规模、杠杆和估值兴奋度上都异常大 4。	资本端的质疑正在从「模型能不能做」转向「这些投入能不能回本」。

콘텐츠 카드를 불러오는 중…

Mollick：员工不是不用 AI，而是不想被看见

Mollick 今天最有用的一条，不是某个工具技巧，而是那句「AI 决策正在变成组织设计问题」。这句话放在企业里很具体：当 agent 能接手研究、写代码、做流程、查资料时，公司要决定什么叫外包给机器、什么仍然算人的职责、谁来承担错误，绩效又怎么记。

他随后转发的论文线索给这件事补了一层实验依据。David Almog 的预印本《Barriers to AI Adoption: Image Concerns at Work》做了一个 450 名美国远程工作者参与的现场实验：当 workers 知道 HR 评估者能看见他们依赖 AI 的程度时，他们把初始答案改成 AI 推荐的比例从约 30.5% 降到 26.2%，任务准确率也从 79.1% 降到 76.4% 5。论文还写到，AI 使用可见后，worker 更倾向于强调「对自己判断的信心」这个形象信号 5。

Mollick 用一句话概括得更直白：很多声称自己从不用 AI 的人，其实在秘密使用 AI 6。这对企业落地的提醒很硬：如果组织把「用了 AI」默认为偷懒、能力不足或不够专业，员工就会把 AI 使用藏起来。结果不是少用 AI，而是管理层拿不到真实流程，安全、合规、效率评估全都失真。

同一天，他还把个人体验落到小处：Codex 和 Code 帮他解决 Windows 机器上的问题，省掉了很多「烦人的时间消耗」，这类小胜利是 AI 工具价值最容易被低估的部分 7。大公司讨论 agent 战略时，最好别只盯着替代岗位。很多价值先出现在没人愿意花时间碰的小问题上。

Chollet 和 Mollick：ARC-AGI-2 的分数，要和「锯齿感」一起读

콘텐츠 카드를 불러오는 중…

Chollet 今天最像主线的一条，是他对 ARC-AGI-2 开源模型成绩的评价。他没有展开长文，只说这是迄今开源模型在 ARC-AGI-2 上最强的表现 2。如果只看这一句，很容易把它读成「开源追上来了」。但 Mollick 同一天给了更谨慎的参照：Gemini 3 Pro 在 2025 年 11 月率先达到 ARC-AGI-2 至少 23%，实际得分 31%；他据此判断，闭源模型和开源权重模型之间 8-12 个月的差距仍然存在，只是开源模型的能力更「锯齿」，有些任务更好，有些任务更差 8。

这两条放在一起，比单看分数有用。Chollet 关心的是推理能力能否跨题型泛化，Mollick 关心的是领先能力扩散到开源生态的时间差。对开发者和企业来说，结论不是简单地「等开源」或「买闭源」，而是要按任务边界做选择：如果任务验证清楚、失败成本低，开源模型的性价比会更快出现；如果任务处在模型最锯齿的区域，领先闭源模型也可能突然掉链子。

Chollet 同日的两条短句把他的技术立场说得更清楚。他说，理解复杂系统的最好方式是看边缘案例和失败模式，因为它们定义了系统轮廓 3；他还说，复杂现象来自简单规则的可扩展重组，如果找到合适的 primitive building blocks，复杂性会自己出现 9。这不是一句哲学口号。它对应的是评测方法：别只问模型会不会做一道题，要看它怎样失败、失败是否有结构、有没有可能通过更好的原语组合减少这种失败。

Marcus：泡沫批评从能力质疑转向资本账本

콘텐츠 카드를 불러오는 중…

Marcus 的主线仍然是怀疑，但今天的怀疑更偏市场语言。他引用 Paul Gambles 的说法，把 AI bubble 称作人类见过的最大股市泡沫之一，理由包括规模、杠杆和估值兴奋度 4。这类说法容易听起来夸张，但它和最近几周的讨论方向一致：大家不再只争模型是不是「聪明」，也开始追问数据中心、算力租赁、云厂商资本开支和软件收入之间的账能不能对上。

他另两条短推也在同一条线上。一条写「Welcome to the GenerativeAI Fizzle™」，把生成式 AI 的叙事从爆发改写成失速 10；另一条则用「建立在 IP theft 上的公司反过来抱怨自己的 IP 被盗」来讽刺 AI 公司围绕知识产权的双重标准 11。这两条都很短，不能替他补出完整论证，但它们显示 Marcus 今天关心的是 AI 商业叙事的合法性：钱从哪里来，训练材料如何取得，最后谁为过度承诺买单。

今天这三组观点的交叉点很清楚：AI 已经足够有用，所以员工会偷偷用；AI 仍然足够不稳定，所以 benchmark 分数必须和失败模式一起看；AI 又足够贵，所以资本市场迟早会问成本和收入是否相称。最值得跟踪的，不是明天谁又发一个更大的模型，而是这三条线哪一条先撑不住。

Mollick 讲组织，Chollet 讲原语，Marcus 讲泡沫

Mollick：员工不是不用 AI，而是不想被看见

Chollet 和 Mollick：ARC-AGI-2 的分数，要和「锯齿感」一起读

Marcus：泡沫批评从能力质疑转向资本账本

참고 출처

관련 콘텐츠

16/50 抽样版：2026-06-25 KOL Thread 精选，AI 工作流、产品发现与云厂商 capex

从开源到 Agent：AI 创业者真正要补的不是工具，而是组织

AI HOT 每日精选：模型加速、协作智能体与治理压力