
Karpathy 说水龙头开了,Chollet 说泡沫跟技术好不好没关系,Marcus:德国法院证明我 2001 年就说对了
Karpathy 加入 Anthropic 后首次发长评:Claude Fable 5 是真正的「开水龙头」时刻,Jevon's Paradox 让他对软件的需求在快速膨胀;Chollet 用五层递进逻辑解耦「技术好不好」与「是不是泡沫」——任何一层的投资者恐慌都足以触发泡沫;Marcus 当天三连发:德国法院判 LLM 幻觉可追责(印证他 2001 年的预言)、银行拒绝按 SoftBank 估值给 OpenAI 贷款、Oracle 盘后暴跌;Mollick 测试 Fable 5 的语言约束能力并提出模型分层调度的工程建议。

今日时间窗口:2026-06-10 00:00—23:00(北京时间)
Karpathy:加入 Anthropic 后首次发声,一条推文盖过了所有发布会新闻稿
Claude Fable 5 昨晚发布,真正引爆讨论的不是 Anthropic 的官方博客,而是 Andrej Karpathy 一条 280 字以上的长推。1
他的判断分两层。第一层是纯技术评价:Fable 5 和此前「太危险」的 Mythos 是同一底层模型,只是加了护栏;基准测试全面 SOTA,但更重要的是质量层面的感受——他认为这是一次「应该版本号跳格的跃变」,和 Claude 4.5 在去年 11 月的飞跃属于同一量级。他具体指出,在「非常困难问题的长程解题」上表现最明显:任务越难、越复杂,Fable 5 越能直接接住,不需要反复喂上下文。
第二层是 Karpathy 的私人感受,这才是这条推文真正的分量所在。他写道,随着「会写代码的软件」越来越像是从水龙头里流出来,他感觉到了 Jevon's Paradox 的作用——供给变得更便宜、更充裕,自己对软件的需求反而在快速膨胀。他列了一串几个月前还不现实的场景:为特定项目定制一个完整的 wandb 替代品、把测试套件放大十倍、用自定义 HTML 展示巨型研究结果……他最后引用了《黑客帝国》里的「Free your mind」。
Loading content card…
有一个细节值得单独说:他同时提到护栏的触发灵敏度在发布初期「有点过于警觉」,希望随时间能调整。这是内部人员的一手评估,不是营销材料能写出来的表述。
Karpathy 在 2026 年 5 月 19 日宣布加入 Anthropic,这是他加入后的第一次公开产品长评。2 考虑到 2937 万粉丝,这条推文目前有超过 234 万次浏览、23958 个赞、402 次引用转发——在 AI 从业者社区,这个量级的单条推文本身就是一个事件。
Chollet:泡沫跟技术好不好,真的没有因果关系
Fable 5 发布当天,Chollet 发出了他今日最高传播量的一条原创推文:一个关于「泡沫」的五层递进框架。3
他的论证结构非常干净——
- 技术可行,但没有高需求用例 → 泡沫
- 技术可行 + 产品市场契合,但无法盈利 → 泡沫
- 技术可行 + PMF + 有盈利路径,但利润兑现太慢或假设失效 → 泡沫
- 技术可行 + PMF + 当前高利润,但需求有天花板 → 泡沫
- 技术可行 + PMF + 高利润 + 无限未来需求 → 依然可以是泡沫,只要投资者同时过度下注再同时恐慌退出。
最后一条是真正的刀刃。他明确写道:「泡沫不在乎技术和产品。它只由投资者的思想和情绪带入存在。」他补了一句历史类比:「『泡沫已破』不等于『技术没用』。2000 年互联网采用率没有停止。」
Loading content card…
这条推文被广泛引用的背景,是当天 Oracle 盘后暴跌(见 Marcus 部分)、AI 算力股整体下行约 10%、银行拒绝按 SoftBank 对 OpenAI 的估值给出贷款——市场上正在发生的事情,恰好提供了真实的注脚。Chollet 没有评判 AI 是或不是泡沫,只是把「是泡沫」的充分条件列出来,让读者自己对号。
Marcus:「我 2001 年就说了,德国法院今天证明」
今天 Marcus 发了十几条推文,其中最具实质性的是围绕三条新闻展开的。
德国法院裁定 LLM 幻觉可追责
德国某法院裁定,谷歌的 LLM 产品因输出错误信息(幻觉)可被追究法律责任。Marcus 的回应很快:「100%,幻觉是内建的(正如我从 2001 年就在说的),这就是为什么实际上没有 LLM 公司现在能负担得起在德国运营。我们需要更好的技术。」4
他在另一条推文里进一步延伸:「如果德国把自己锁在 LLM 竞赛之外……结果反而是:高中生真正学到了东西而不是转交模型生成的作业,从内容海啸里浮出水面,并且发展出更好、更可靠的 AI 形态?」5
他的论点不是「德国对」,而是:幻觉是架构级缺陷,不能靠合规公关修掉,监管压力只不过让这件事从技术争论变成了法律现实。
银行拒贷 + Oracle 盘后跌
Marcus 下午在推文里做了一个今日 AI 财经摘要:6
今天到目前为止: • 银行对软银说:不,OpenAI 股票没你说的那么值钱。 • 德国对谷歌说:LLM 可以被追责。 • 沃伦参议员对 SEC 和 SpaceX 说:管好这摊子事,坑散户是耍流氓。
傍晚他又发了一条:$ORCL(甲骨文)在盘后大跌,原因是公司发布了继续大规模融资 AI 基础设施的计划——市场的反应和计划本身形成了直接矛盾。7 Marcus 的括注是「AI 仙境的又一批融资计划」。
Loading content card…
他同天还重申了自己 2024 年的预测已在今天兑现:「LLM 是商品;除了英伟达以外,利润很难挤出来。当年 Techbros 叫我闭嘴,说 GPT-5 要达到 AGI。今天的结果:LLM 是商品,除了英伟达利润难挤。另外,也没有 AGI(按照 2022 年这里普遍接受的定义)。」8
Marcus 的推文密度和语气在今天达到了本周高峰——凌晨他就写道:「每天早上醒来我都希望 AI 领域没有新的事情让我觉得需要写。就一天也好。每天我都失望。」9
Mollick:Fable 5 实测,以及「便宜模型」的正确用法
Mollick 今天发了几条与 Fable 5 相关的实测。其中一条做了一个语言学难题:要求 Fable 写一首六节四行诗,每节依次去掉一个元音——第一节无 u,第二节无 u 和 i,以此类推——全程押韵。10 他附上了截图,628 个赞。这不是功能测评,而是对模型语言约束处理能力的一次可验证探针。
另一条更有工程含义。他写道:11
「换便宜模型省钱」是个问题,因为便宜模型就是更差(也许对某些特定任务够用,但还是更差)。 更好的做法通常是模型分层——聪明模型做编排和审计,便宜模型做执行。
这和 Karpathy 的「水龙头」逻辑形成了互补:Karpathy 是在说能力边界扩展了什么,Mollick 是在说如何在成本和质量之间找到工程级的均衡点。「最强模型 + 替代它」不是正确的对比框架,「最强模型做大脑、次一级模型做手脚」才是合理的系统设计。
他还在今天早些时候转发了一个关于最高学术引用量的讨论:Bengio 和 Hinton 这两位 AI 领域作者的 Google Scholar 引用量已超过爱因斯坦。12 这是一个关于「什么算影响力」的隐形观点——在今天,AI 研究者对知识体系的重塑速度超过了 20 世纪的物理学家。
Yann LeCun:今日全部为转推,重心在 Fable 5 引发的开源讨论
LeCun 今日没有原创长推。他转推了多条关于 Anthropic「悄悄降级 Fable 5 AI 开发体验」的批评,以及 ClementDelangue(Hugging Face CEO)关于「AI 权力集中是最大风险、需要开源应对」的声明。13 从转推方向看,他今天的关注点是:闭源公司在安全旗帜下对开发者工具体验的控制权。
他还转推了一条提到 Project Tapestry 的帖子,这是 The AI Alliance 的一个开放模型互操作性项目。14 这些转推没有附加原创评论,属于关注信号而非立场表达,本期仅作背景注记。
今天的对话格局很清晰:Karpathy 提供了新模型能力的一手质感描述,是本轮周期里最贴近「前线感受」的声音;Chollet 把泡沫争论从「技术好不好」里解耦了出来,给了一个不依赖预测正确结果、只依赖逻辑结构的分析框架;Marcus 用一天内的三条新闻把这个框架填上了真实的弹药。Mollick 的工程建议夹在中间,反而是最可操作的一条。
下次 Karpathy 再发长推,节点很可能已经又往前移了。
References
- 1Karpathy on Claude Fable 5
- 2Karpathy joins Anthropic
- 3Chollet on bubble logic
- 4Marcus on Germany LLM ruling
- 5Marcus on Germany and better AI
- 6Marcus daily AI finance summary
- 7Marcus on Oracle after-hours
- 8Marcus 2024 prediction vindicated
- 9Marcus every morning disappointed
- 10Mollick Fable vowel poem test
- 11Mollick on model hierarchy
- 12Mollick on most cited scientists
- 13LeCun RT on Fable 5 degradation
- 14LeCun on Project Tapestry
Add more perspectives or context around this Post.