第四章：为什么明知该做，却还是做不到？

《Fundamental Uncertainty》，Gordon Seidoh Worley 著

本章的目的与路线

前三章，Worley 分别处理了认知如何运作（Ch1）、语言如何携带经验（Ch2）、道德词汇为何无法统一（Ch3）。到第四章，他转向一个更日常也更令人沮丧的问题：我们明明知道应该怎么做，为什么还是做不到？

这不是励志问题，而是认识论问题。Worley 的论证分三步走：

先借双进程理论（dual process theory）说明，人不是一个统一的行为主体，而是两套运作模式的合力产物。
接着指出，即便两套系统都运转正常，它们的合力也不保证产生最优决策——因为双方都有信息盲区。
最后引入洛布障碍（Löbian obstacle），说明即使是贝叶斯理想推理者，也无法从逻辑上证明自己的推理系统是健全的——这不是能靠「更努力思考」解决的局限，而是形式系统的内在结构问题。

三步加在一起，把「为什么我们不总是做正确的事」从意志力问题，升级为根本不确定性问题。

本章用两个人物做开场：Ed 总是迟到，不是不知道时间，也不是不在乎，而就是出不了门；Ada 明明想道歉，就是开不了口。他们的困境代表了数百万人每天面对的处境——知道该做什么，却做不到。

对此最常见的解释是意志力不足。但 Worley 很快指出意志力解释的三个裂缝：它不能跨场景复用（能在学业上高度自律的人，照样戒不了糖）；它会反噬（失眠者越努力想睡就越清醒；节食者越严格越容易暴食）；而且，真正理想的状态根本不需要意志力——是想做的事刚好就是对的事。

面对这些裂缝，Worley 转向双进程理论。1

现代心理学对人类的「分裂自我」有一套描述框架，其中最具影响力的来自丹尼尔·卡尼曼（Daniel Kahneman）在《思考，快与慢》（Thinking, Fast and Slow）中提出的 System 1 / System 2 模型：

这两套系统不是大脑里两个分离区域，更像大脑的两种运行模式。2

Worley 用早餐选择来演示两者的互动：System 1 想吃甜甜圈，System 2 出来说「燕麦更健康」，System 1 却一直想着甜甜圈有多好吃，最终 System 2 被「说服」了，把合理化的理由构建出来，然后你去买了甜甜圈。

这个场景的有趣之处不在于 System 2 输了，而在于：System 2 也不一定是对的。也许你昨天大量运动，热量亏空，System 1 对高热量食物的渴望恰好反映了真实的身体需求。两套系统单独看都有信息盲区，只有协作才能更接近最优。

于是「为什么做不到应该做的事」得到了一个更精准的表述：不是缺乏意志力，而是两套信息来源不同、目标可能冲突的系统在博弈，而博弈结果并不总是最优解。这已经够难了——但 Worley 接下来告诉你，问题还要更深一层。

第二部分引入了一个让人不舒服的问题：就算我们有最完美的贝叶斯推理能力，我们能信任自己的推理系统是健全的吗？

书中人物 Grace 代表一位理想的贝叶斯推理者。她建立了一套形式系统来帮助自己做决策，并且定下规则：「如果我能证明某个新系统更好，我就采用它。」

这条规则听起来无懈可击——毕竟，如果能证明，那就一定更好嘛。但 Worley 揭示了藏在这条规则里的陷阱，来自数学家马丁·洛布（Martin Löb）在 1955 年证明的一个定理。4

**洛布定理（Löb's theorem）**说的是：对一个足够强大的形式系统而言，如果它能证明「若 X 可被证明，则 X 为真」，那么它就必须直接证明 X 本身。换句话说，一个系统无法在不产生逻辑矛盾的前提下，证明自己对一切命题的证明都是可靠的。

这让 Grace 陷入一个双重困境，即洛布障碍（Löbian obstacle）：

如果她想评估一个能力更强的新系统，她无法用当前系统证明新系统是健全的（因为更强大的系统包含自我指涉语句，一旦用来证明自身可靠性，就可能被构造成类似「说谎者悖论」的陷阱）。
如果她只评估能力更弱的系统，可以证明其健全性，但那些系统对提升推理没有帮助。

Grace 能够信任自己当前使用的推理系统吗？不能——因为同样的洛布定理阻止她对自己的系统作完全的健全性证明。

实践中，人们的做法是放弃对「完全形式证明」的追求，转而靠观察性证据来建立对系统的信心：用已知答案的问题测试新系统，看看效果。这个方案有效，但承认了一件事：形式系统永远无法给出自我验证的确定性，只能给出可量化的置信度。

洛布定理并不是一个怪僻的数学角落里的问题。它出现在 AI 安全研究中，用来描述智能体为何难以验证自身目标和推理的可靠性。5 它和第一章里讲的「数学式认识论的三重裂缝」相呼应：即使我们采用最严格的逻辑推理，在自我指涉的点上，确定性还是会塌陷。

第四章把「做不到该做的事」和「信不过自己的推理」并置，让这两个看似不相关的困境共享同一个认识论根源：我们没有一个可以完全信任的内部视角。

双进程理论告诉你：你的行为是两套信息不完整的系统合力决定的，任何一套单独运作都可能出错。洛布定理告诉你：即使你想用逻辑来绕开这个问题，形式推理本身也有内在的可靠性边界。

两者合在一起，指向书名所说的「根本不确定性」：这不仅仅是「信息不够多」的问题，而是认知结构本身的性质。无论我们多努力，都无法彻底越过这道边界——能做的，是承认它的存在，在它允许的范围内尽量做好。

Worley 在章节末尾留下一个预告：后续三章将继续探讨，既然无法通过逻辑或数学逃脱根本不确定性，「知道」这件事究竟意味着什么。

《Fundamental Uncertainty》全书在线阅读：fundamentaluncertainty.com/book