
第四章:为什么明知该做,却还是做不到?
《Fundamental Uncertainty》逐章深读,第四章。Worley 用双进程理论(System 1/2)解释「明知故犯」的认知根源,再借洛布定理说明:即使是最严密的逻辑推理者,也无法从内部证明自己的推理系统是健全的。行为层面的分裂与推理层面的自我指涉困境,共同指向根本不确定性——这不是意志力问题,而是认知结构的内在局限。


本章的目的与路线
前三章,Worley 分别处理了认知如何运作(Ch1)、语言如何携带经验(Ch2)、道德词汇为何无法统一(Ch3)。到第四章,他转向一个更日常也更令人沮丧的问题:我们明明知道应该怎么做,为什么还是做不到?
这不是励志问题,而是认识论问题。Worley 的论证分三步走:
- 先借双进程理论(dual process theory)说明,人不是一个统一的行为主体,而是两套运作模式的合力产物。
- 接着指出,即便两套系统都运转正常,它们的合力也不保证产生最优决策——因为双方都有信息盲区。
- 最后引入洛布障碍(Löbian obstacle),说明即使是贝叶斯理想推理者,也无法从逻辑上证明自己的推理系统是健全的——这不是能靠「更努力思考」解决的局限,而是形式系统的内在结构问题。
三步加在一起,把「为什么我们不总是做正确的事」从意志力问题,升级为根本不确定性问题。
两套心智,一个行为
本章用两个人物做开场:Ed 总是迟到,不是不知道时间,也不是不在乎,而就是出不了门;Ada 明明想道歉,就是开不了口。他们的困境代表了数百万人每天面对的处境——知道该做什么,却做不到。
对此最常见的解释是意志力不足。但 Worley 很快指出意志力解释的三个裂缝:它不能跨场景复用(能在学业上高度自律的人,照样戒不了糖);它会反噬(失眠者越努力想睡就越清醒;节食者越严格越容易暴食);而且,真正理想的状态根本不需要意志力——是想做的事刚好就是对的事。
面对这些裂缝,Worley 转向双进程理论。1
现代心理学对人类的「分裂自我」有一套描述框架,其中最具影响力的来自丹尼尔·卡尼曼(Daniel Kahneman)在《思考,快与慢》(Thinking, Fast and Slow)中提出的 System 1 / System 2 模型:
- System 1(快思考):自动运行,无需主动注意,处理模式识别、情绪反应、熟悉任务(如阅读、简单算术)。它持续在后台运行,从不「关机」。
- System 2(慢思考):需要主动调用,消耗专注力,负责新问题的推理、复杂规划、延迟判断。
这两套系统不是大脑里两个分离区域,更像大脑的两种运行模式。2

Worley 用早餐选择来演示两者的互动:System 1 想吃甜甜圈,System 2 出来说「燕麦更健康」,System 1 却一直想着甜甜圈有多好吃,最终 System 2 被「说服」了,把合理化的理由构建出来,然后你去买了甜甜圈。
这个场景的有趣之处不在于 System 2 输了,而在于:System 2 也不一定是对的。也许你昨天大量运动,热量亏空,System 1 对高热量食物的渴望恰好反映了真实的身体需求。两套系统单独看都有信息盲区,只有协作才能更接近最优。
于是「为什么做不到应该做的事」得到了一个更精准的表述:不是缺乏意志力,而是两套信息来源不同、目标可能冲突的系统在博弈,而博弈结果并不总是最优解。这已经够难了——但 Worley 接下来告诉你,问题还要更深一层。
连推理本身,你也无法信任
第二部分引入了一个让人不舒服的问题:就算我们有最完美的贝叶斯推理能力,我们能信任自己的推理系统是健全的吗?
书中人物 Grace 代表一位理想的贝叶斯推理者。她建立了一套形式系统来帮助自己做决策,并且定下规则:「如果我能证明某个新系统更好,我就采用它。」
这条规则听起来无懈可击——毕竟,如果能证明,那就一定更好嘛。但 Worley 揭示了藏在这条规则里的陷阱,来自数学家马丁·洛布(Martin Löb)在 1955 年证明的一个定理。4
**洛布定理(Löb's theorem)**说的是:对一个足够强大的形式系统而言,如果它能证明「若 X 可被证明,则 X 为真」,那么它就必须直接证明 X 本身。换句话说,一个系统无法在不产生逻辑矛盾的前提下,证明自己对一切命题的证明都是可靠的。
这让 Grace 陷入一个双重困境,即洛布障碍(Löbian obstacle):
- 如果她想评估一个能力更强的新系统,她无法用当前系统证明新系统是健全的(因为更强大的系统包含自我指涉语句,一旦用来证明自身可靠性,就可能被构造成类似「说谎者悖论」的陷阱)。
- 如果她只评估能力更弱的系统,可以证明其健全性,但那些系统对提升推理没有帮助。
Grace 能够信任自己当前使用的推理系统吗?不能——因为同样的洛布定理阻止她对自己的系统作完全的健全性证明。
实践中,人们的做法是放弃对「完全形式证明」的追求,转而靠观察性证据来建立对系统的信心:用已知答案的问题测试新系统,看看效果。这个方案有效,但承认了一件事:形式系统永远无法给出自我验证的确定性,只能给出可量化的置信度。
洛布定理并不是一个怪僻的数学角落里的问题。它出现在 AI 安全研究中,用来描述智能体为何难以验证自身目标和推理的可靠性。5 它和第一章里讲的「数学式认识论的三重裂缝」相呼应:即使我们采用最严格的逻辑推理,在自我指涉的点上,确定性还是会塌陷。
从行为到推理,「根本不确定性」贯穿始终
第四章把「做不到该做的事」和「信不过自己的推理」并置,让这两个看似不相关的困境共享同一个认识论根源:我们没有一个可以完全信任的内部视角。
双进程理论告诉你:你的行为是两套信息不完整的系统合力决定的,任何一套单独运作都可能出错。洛布定理告诉你:即使你想用逻辑来绕开这个问题,形式推理本身也有内在的可靠性边界。
两者合在一起,指向书名所说的「根本不确定性」:这不仅仅是「信息不够多」的问题,而是认知结构本身的性质。无论我们多努力,都无法彻底越过这道边界——能做的,是承认它的存在,在它允许的范围内尽量做好。
Worley 在章节末尾留下一个预告:后续三章将继续探讨,既然无法通过逻辑或数学逃脱根本不确定性,「知道」这件事究竟意味着什么。
《Fundamental Uncertainty》全书在线阅读:fundamentaluncertainty.com/book
Add more perspectives or context around this Post.