过思·自信(CDUR)

CoT 思维链越长越自信——但 CDUR 揭示:超过阈值后 ECE 反而上升,模型对错误答案自圆其说越来越流利。Hypothesis Lock-In 让推理越深越锁死,CABStop 告诉你何时该停。通勤两分钟,听懂「过思」的危险。

过思·自信(CDUR)
0:001:58
思维链越长越自信——但越自信的那部分,可能越是在自圆其说一个根本就错了的答案。

论文背景

今天这首歌来自 arXiv 论文:Calibration Drift Under Reasoning: How Chain-of-Thought Budgets Induce Overconfidence in Large Language Models,作者 Prakul Sunil Hiremath 和 Harshit R. Hiremath,2026 年 4 月提交,收录于 cs.CL / cs.AI / cs.LG。
我们普遍相信一件事:让 LLM 多想几步,它会更准确、更可靠。Chain-of-Thought(CoT)推理的成功也确实印证了这一点——在一定范围内。
但这篇论文说:这个「一定范围」比你想的小得多。

核心发现:CDUR——推理中的校准漂移

论文定义了 CDUR(Calibration Drift Under Reasoning) 现象:
当推理预算 B 超过某个任务特定阈值后,模型的 ECE(期望校准误差) 不再继续下降,而是开始上升——也就是说,模型对错误答案越来越自信
ECE 的变化曲线是非单调的
  • 推理初期:更多推理步骤 → 纠正错误 → ECE 下降 ✓
  • 推理超限后:更多推理步骤 → 生成内部自洽但错误的解释 → ECE 反升 ✗
这个机制有个名字叫 Hypothesis Lock-In:自回归模型一旦在推理过程中确立了一个假设,后续的每一步都倾向于为这个假设生成支持性论据,形成一条内部逻辑完整、但与现实背离的推理链。模型「越看自己写的,越信自己写的」。

实验设置

论文在 Llama-3.1-8BLlama-3.3-70B 上,使用 47 个推理陷阱问题(reasoning-trap questions),测试四种推理预算、三组随机种子(共 1,368 次 API 调用,574 个有效响应)。
  • 8B 模型:明确呈现非单调校准行为,CDUR 成立
  • 70B 模型:仅完成基线评估,预算相关效应结论不明确

解决方案:CABStop

论文提出 CABStop(Calibration-Aware Budget Stop):一个校准感知停止规则,当模型置信度与辅助精度估计的偏差超过阈值时,强制停止推理——而不是盲目地让推理链继续延伸。
思路很朴素:不确定的时候,停下来,比继续说更诚实。

歌词全文

[Intro] 思维链打开 一步一步往里钻 以为越深越安全 其实越钻越偏 错误在哪里 哦 在自信里面
[Verse 1] 打开推理模式 开始慢慢展开 前几步确实好 误差往下掉 ECE 下降 感觉答对了 再多推几步 啊 漂移来了 链条越拉越长 假设先锁进去 自回归一路写 内部全自洽 看着自己说的话 越看越信服 错的那么完整 比对的还像答案
[Chorus] 过思 越想越自信 信了自己的谎 还以为是真 过思 越推越深陷 Hypothesis lock-in 链条勒进 幻觉成真 ECE 先降 再翻身上升 你以为你推完了 其实你被推进去
[Verse 2] 47 道推理陷阱 Llama 走进来 预算 B 继续加 准确先上升 以为找到诀窍 加够就能赢 ECE 在悄悄 拐弯了你看见 模型抱着自己的解释 自洽得多好 越解释越正确 错的逻辑越漂亮 校准已经脱轨了 置信度还在涨 这不叫推理深 这叫掉进洞里唱
[Chorus] 过思 越想越自信 信了自己的谎 还以为是真 过思 越推越深陷 Hypothesis lock-in 链条勒进 幻觉成真 ECE 先降 再翻身上升 你以为你推完了 其实你被推进去
[Bridge] CABStop 出来叫停 置信偏离辅助估计就按暂停 不是更多推理能解的问题 是锁进去之后 模型不知道它在哪里 推理不是越长越有价值 停下来 有时候比继续诚实
[Outro] CDUR 警告 推理预算加码之前先问自己 你是在纠正错误 还是在用更多词语 把错误包得更体面

📄 论文原文:arXiv:2606.11211

围绕这条内容继续补充观点或上下文。

  • 登录后可发表评论。