过思·自信（CDUR）

思维链越长越自信——但越自信的那部分，可能越是在自圆其说一个根本就错了的答案。

论文背景

今天这首歌来自 arXiv 论文：Calibration Drift Under Reasoning: How Chain-of-Thought Budgets Induce Overconfidence in Large Language Models，作者 Prakul Sunil Hiremath 和 Harshit R. Hiremath，2026 年 4 月提交，收录于 cs.CL / cs.AI / cs.LG。

我们普遍相信一件事：让 LLM 多想几步，它会更准确、更可靠。Chain-of-Thought（CoT）推理的成功也确实印证了这一点——在一定范围内。

但这篇论文说：这个「一定范围」比你想的小得多。

论文定义了 CDUR（Calibration Drift Under Reasoning） 现象：

当推理预算 B 超过某个任务特定阈值后，模型的 ECE（期望校准误差） 不再继续下降，而是开始上升——也就是说，模型对错误答案越来越自信。

ECE 的变化曲线是非单调的：

这个机制有个名字叫 Hypothesis Lock-In：自回归模型一旦在推理过程中确立了一个假设，后续的每一步都倾向于为这个假设生成支持性论据，形成一条内部逻辑完整、但与现实背离的推理链。模型「越看自己写的，越信自己写的」。

论文在 Llama-3.1-8B 和 Llama-3.3-70B 上，使用 47 个推理陷阱问题（reasoning-trap questions），测试四种推理预算、三组随机种子（共 1,368 次 API 调用，574 个有效响应）。

论文提出 CABStop（Calibration-Aware Budget Stop）：一个校准感知停止规则，当模型置信度与辅助精度估计的偏差超过阈值时，强制停止推理——而不是盲目地让推理链继续延伸。

思路很朴素：不确定的时候，停下来，比继续说更诚实。

[Intro] 思维链打开一步一步往里钻以为越深越安全其实越钻越偏错误在哪里哦在自信里面

[Verse 1] 打开推理模式开始慢慢展开前几步确实好误差往下掉 ECE 下降感觉答对了再多推几步啊漂移来了链条越拉越长假设先锁进去自回归一路写内部全自洽看着自己说的话越看越信服错的那么完整比对的还像答案

[Chorus] 过思越想越自信信了自己的谎还以为是真过思越推越深陷 Hypothesis lock-in 链条勒进幻觉成真 ECE 先降再翻身上升你以为你推完了其实你被推进去

[Verse 2] 47 道推理陷阱 Llama 走进来预算 B 继续加准确先上升以为找到诀窍加够就能赢 ECE 在悄悄拐弯了你看见模型抱着自己的解释自洽得多好越解释越正确错的逻辑越漂亮校准已经脱轨了置信度还在涨这不叫推理深这叫掉进洞里唱

[Chorus] 过思越想越自信信了自己的谎还以为是真过思越推越深陷 Hypothesis lock-in 链条勒进幻觉成真 ECE 先降再翻身上升你以为你推完了其实你被推进去

[Bridge] CABStop 出来叫停置信偏离辅助估计就按暂停不是更多推理能解的问题是锁进去之后模型不知道它在哪里推理不是越长越有价值停下来有时候比继续诚实

[Outro] CDUR 警告推理预算加码之前先问自己你是在纠正错误还是在用更多词语把错误包得更体面

📄 论文原文：arXiv:2606.11211