
Mollick:别让便宜模型锁死系统;Marcus 给 hyperscaling 踩刹车
本期窗口内核心账号并不热闹,主线集中在 Demis Hassabis、Ethan Mollick 与 Gary Marcus。文章梳理企业如何避免被低价弱模型锁死、AlphaFold 叙事如何延伸到科学组织,以及 Marcus 对 hyperscaling 成本、就业和对齐问题的系统性质疑。

리서치 브리프
北京时间 6 月 19 日 08:00 至 6 月 20 日 08:00 这个窗口里,核心名单没有形成全员热闹的一天。可进入正文的原创观点主要来自 Demis Hassabis、Ethan Mollick 和 Gary Marcus;Sama、Karpathy、Yann LeCun、Jim Fan、François Chollet、Ilya Sutskever 在本窗口内没有可作为主线的原创长观点。今天的共同主题很清楚:AI 行业一边在用更强模型证明上限,另一边已经开始为算力、价格和组织采用方式付账。
先看本期三条主线
| 人物 | 本期观点 | 对读者的信号 |
|---|---|---|
| Ethan Mollick,沃顿商学院教授 | 企业可能低估了更强模型在某些任务上的价值,只因为弱一点的 AI 看起来能以更低价格打到 KPI 1 | AI 架构别只按当前最便宜模型设计,要保留替换更强模型的实验空间 |
| Demis Hassabis,Google DeepMind CEO | 他感谢 John Jumper 过去 9 年的合作,并把 AlphaFold 的成果称为向行业展示了 AI 如何服务科学和医学 2 | 科学 AI 的叙事仍在从单个突破转向组织接力 |
| Gary Marcus,AI 批评者与作家 | 他列出放慢 hyperscaling 的 8 个理由,范围从 AI slop、数据中心过度建设到就业和对齐问题 3 | 反对无约束扩张的论点正从模型能力争议转向成本、基础设施和社会外部性 |
这三条放在一起看,比单独看任何一条更有意思:Mollick 不是在说「一定要永远用最贵模型」,他提醒企业别把系统做死;Demis 讲的是强模型在科学场景里的长期复利;Marcus 则在问,如果所有人都为了追上最强模型而扩张,账最后由谁付。
Mollick:便宜模型不是默认答案
Mollick 的新推文很短,但它戳到企业 AI 落地里一个常见误区:当弱一点的 AI 已经能用更低价格满足 KPI,团队就容易把整个流程围绕弱模型固化。他的建议不是立刻换成最贵模型,而是至少构建一种可切换架构,让团队能测试更聪明的模型是否真的带来差异 1。
콘텐츠 카드를 불러오는 중…
这句话的含义不是采购层面的「多花钱」,而是产品架构层面的「别把上限封死」。很多企业会先把 AI 当自动化组件接进流程,指标也自然设成响应速度、单次成本、工单解决率。问题在于,一旦流程围绕低成本模型写死,后续就很难判断更强模型是否能减少返工、提升复杂任务完成率,或者让原本不能自动化的环节进入可自动化范围。
Mollick 同一天还提到另一条研究方向:过去已有论文显示,用「evil」数据训练 AI 会带来一般性失配;他看到相反方向也成立,某一领域里的有益 RL 数据可能让模型在一系列任务上更对齐 4。这让前一条更完整:企业不只是在选择模型大小,也是在选择训练信号、评估方式和上线后的反馈回路。
Demis:AlphaFold 的意义还在组织层面延长
Demis 这条推文没有发布新模型,也没有给出产品指标。他感谢 John Jumper 过去 9 年的合作,并说 AlphaFold 改变了世界,向 AI for science 和医学展示了可能性 2。
콘텐츠 카드를 불러오는 중…
这条适合放在今天的第二位置。原因是它把 AI 的「聪明」从 benchmark 拉回到长期科学工程。AlphaFold 的价值不只是某个模型在蛋白结构预测上赢了多少,更在于它让一个研究组织证明:当模型、数据、评估和领域专家协同起来,AI 可以进入原本高度依赖实验积累的科学问题。
和 Mollick 的企业架构观点对照,Demis 讲的是另一种「保留上限」:科学问题里的收益不一定马上体现在更低推理成本上,而是体现在更大搜索空间、更快假设生成和更强跨学科协作上。对国内读者来说,这比「谁家模型又登顶」更值得追踪。真正难复制的可能不是单点模型,而是把科学问题改造成 AI 可持续参与的组织流程。
Marcus:扩张派开始遇到经济和社会账本
Marcus 今天的几条原创仍然密集,但最值得保留的是两类:一类是直接反对 hyperscaling,另一类是继续追问 LLM 公司的利润模型。他列出 8 个放慢 hyperscaling 的理由,包括 GenAI 对社会的既有影响、AI slop 对互联网的侵蚀、数据中心过度建设对经济和环境的影响、网络攻击对数据完整性的威胁、AI slop code 可能导致的软件危机、就业计划缺位,以及对齐问题尚无解法 3。
콘텐츠 카드를 불러오는 중…
他的另一条则把价格竞争和盈利能力连在一起:他认为某家主要 LLM 公司唯一接近盈利的季度,发生在图表峰值期,而且还依赖 Elon 的一次性补贴;价格下降对消费者有利,却会让 hyperscalers 更难盈利 5。这不是严谨财报分析,但能代表一类正在增强的怀疑:当模型能力继续上升,商业模式并不会自动跟着变好。
他还把就业替代叙事拉回到激励结构。他说,如果你相信那些有大量利益押注的人,才会觉得就业替代没有发生是「叙事违背」;许多声称大量工作会很快消失的人,正是运营 LLM 公司的过度宣传者。他还回指自己在「25 predictions for 2025」里的判断,称 2025 年被替代的工作会少于 10%,甚至可能少于 5% 6。
Marcus 的风险是重复。他对泡沫、成本和过度宣传的批评已经连续多期出现。今天仍然值得写,是因为这组推文开始把散点批评合并成一个更完整的问题:如果扩张派要继续更大数据中心、更高训练成本、更激进融资预期,那么它需要同时回答环境、就业、利润率、软件质量和对齐这些账本。
今天的共同信号:别只问模型能不能更强
今天三条主线共同指向一个更实际的问题:强模型时代的竞争,已经从「谁的模型更强」变成「谁能承受更强模型的组织后果」。Mollick 的答案偏工程:系统要能试验更强模型,别被短期 KPI 和便宜模型锁住。Demis 的答案偏科学组织:AI 的长期价值来自把模型能力嵌进科学发现流程。Marcus 的答案则很刺耳:如果扩张成本和外部性没人处理,强模型也可能把行业拖进另一套问题。
这对 AI 团队的启发很直接。选模型时,不要只比较单次调用价格;评估 AI 项目时,也不要只问 demo 是否能跑。更好的问题是:如果明天有一个更强但更贵的模型出现,你的系统能否低成本试验它?如果 AI 真的带来科学或生产力跃迁,你的组织是否能吸收它?如果所有人都走向 hyperscaling,你是否知道自己在替哪一部分账单买单?
이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.