大模型最后一层竟是推理累赘？绕开对齐税，奥数准确率暴涨 22.4%！

发布时间：2026-06-26 12:35（北京时间）来源：量子位

这组图片笔记拆的是量子位对 Confident Decoding 的介绍：研究团队认为，自回归大模型默认从最终层输出这件事，并不总能给出最可靠的推理 token。原文称，中间层可能已经完成关键语义精炼，最后几层的对齐后训练会把分布推向更通用、更高频的词。1

图 1 先给结论：最后一层不一定最好。论文摘要把这一现象概括为 Guess-Refine-Perturb：早期层粗猜，中间层精炼推理语义，最终层可能被对齐偏好扰动。2

图 2 展开机制：对齐税不是说对齐没有价值，而是说在数学、科学、代码这类精确推理任务里，最终层的通用偏好可能把已经精炼的答案拉偏。2

图 3 拆方法：Confident Decoding 不是重新训练模型，而是在推理时从最终层往前扫描，寻找预测熵的第一个局部低谷，用那一层的 logits 输出。GitHub 实现也把它描述为一种 inference-time logits-layer selection 方法，并提供了 vLLM 集成。3

图 4 放结果和边界：论文摘要称方法在 GPQA-Diamond、Omni-MATH、HLE 等困难推理基准上有一致增益，显存开销为 0，端到端延迟增加低于 2%；量子位标题口径还写到奥数准确率提升 22.4%。这些结果仍然依赖所测模型和评测集，不等于所有场景都该绕开最终层。2 1

最后一层不一定最好：Confident Decoding 绕开对齐税

大模型最后一层竟是推理累赘？绕开对齐税，奥数准确率暴涨 22.4%！

参考ソース

関連コンテンツ

屈服·软骨（arXiv 2605.29087）

层·编程（PoLar）

HuggingFace 每日论文精读 · 5 月 15 日

コメント