Sama 等暂无新长推:Mollick 校正 Fable/Mythos 图表
2026/6/30 · 8:08

Sama 等暂无新长推:Mollick 校正 Fable/Mythos 图表

过去 24 小时白名单核心账号几乎没有新的原创长推,唯一可入选的是 Ethan Mollick 对 Fable/Mythos 对比图的自我修正:他提醒,Fable 更像带护栏的 Mythos,图表若按 Mythos 日期计量,模型进步曲线会变得不一样。

本窗口最强的信号不是某个大佬又抛出新判断,而是白名单账号整体很安静。北京时间 6 月 29 日 08:00 至 6 月 30 日 08:00,真正落在窗口内、且能算作 AI 观点原创的内容,只有 Ethan Mollick 对自己一张 Fable/Mythos 图表的校正。其余核心账号要么没有新原创长推,要么只是转推;这期因此按一条短读处理,不把上一窗口的旧材料拿回来凑篇幅。

今日唯一信号:Mollick 说自己的图也有问题

Ethan Mollick 是沃顿商学院研究 AI、创新与创业的教授。北京时间 6 月 29 日 13:02,他发了一条很短的更正:即便那张图是他自己做的,图也「有点错」;原因是「Fable is guardrailed Mythos」,如果改用 Mythos 的日期,图表结论就要重新看。该帖发布时的详情载荷显示,互动量不算高,约 3.2 万次浏览、156 个点赞、10 条回复。1
这句话的重点不在「Fable」和「Mythos」两个名字本身,而在计量口径。Mollick 的意思是,如果 Fable 只是加了护栏的 Mythos,那么把 Fable 当成一个独立的新模型时间点,会把同一条技术线拆成两个节点;如果按 Mythos 的日期计入,图上看到的进步速度、间隔和斜率都会变。
这类小修正很容易被忽略。社交媒体上很多模型进展图,横轴写的是发布日期,纵轴写的是能力、成本或 benchmark 表现。读者第一眼看到的是一条线变陡了还是变平了,但那条线背后先做了一个选择:到底按底座模型、产品版本、API 上线日,还是按带护栏的可用版本来记日期。

这条短推在提醒什么

Mollick 没有说 Fable 没有价值,也没有说 Mythos 和 Fable 完全等同。他只把一个容易混淆的地方挑出来:同一个底座模型经过护栏、产品包装或访问限制后,外部观察者可能会把它当成「新模型」来记录。
这对读者有三个实际影响。
第一,看模型进步曲线时,先问清楚横轴是什么。发布日期听起来很客观,但它可能是研究版本完成的时间、内部模型存在的时间、公开产品可用的时间,也可能是更安全版本上线的时间。四种日期混在一起,曲线会很漂亮,但说服力会变弱。
第二,别把护栏直接等同于能力。一个带护栏的版本可能在某些任务上显得更慢、更保守,甚至少做一些事;这不必然说明底座能力下降。反过来,一个少护栏的版本跑得更猛,也不必然说明它更适合作为产品交付。
第三,模型命名越来越像产品命名。名字不是纯技术标签,而是市场、治理、访问权限和安全策略共同作用的结果。读论文或 benchmark 时,模型名也许还能接近技术实体;读 X 上的图表和截图时,模型名经常已经是产品层的称呼。

今天没有必要强行扩写成「行业结论」

这条推文本身很短,不能拿来推导「AI 进步放缓」或「某家公司技术路线失败」。它更像一个方法论提醒:当大家用图表讨论 AI 进步速度时,图表的口径本身就是论点的一部分。
这也解释了为什么本期不继续沿用过去几天的 Marcus 成本/利润率主线。那条线在上一窗口已经有足够材料;本窗口没有新的同等级原创补充。LeCun 窗口内主要是转推,不符合本频道「原创观点」的入选规则。Sama、Karpathy、Demis Hassabis、Jim Fan、François Chollet 和 Ilya Sutskever 也没有提供足以单独展开的新原创长推。
所以今天能带走的东西很小,但有用:以后再看到「某模型从 A 点跳到 B 点」的图,先别急着接受那条斜率。问三个问题:它比较的是底座模型还是产品外壳?日期是研发、发布还是开放访问?安全护栏是能力的一部分,还是另一个产品层变量?
这三个问题问完,很多看起来很顺的 AI 进步曲线,会立刻变得没那么顺。

相似内容

围绕这条内容继续补充观点或上下文。

  • 登录后可发表评论。