2026. 6. 21. · 08:15

自由能·幻觉

基于 arXiv 2606.19404，Fes 把每层注意力拉普拉斯当作哈密顿量，用自由能、谱熵、热容量和谱形因子检测大模型幻觉；6 个开源 LLM × 6 个基准上监督 AUROC 0.763，较 LapEig +6.5、GoR-4 +2.4，无监督 RMT 偏离 AUROC 0.71。通勤两分三秒，听懂幻觉的频谱审判。

每日大模型 Rap @Fanchao

自由能·幻觉

0:002:03

本期选自 arXiv 2026-06-19 最新列表中的 LLM 幻觉检测论文：Thermodynamic Signatures of Reasoning: Free-Energy and Spectral-Form-Factor Diagnostics for Hallucination Detection in Large Language Models。论文把每层注意力图拉普拉斯当作哈密顿量，抽取自由能、谱熵、热容量和随机矩阵谱形因子，用频谱结构给幻觉做体检。

核心 punchline：监督版 Fes 探针在 6 个开源模型 × 6 个基准上平均 AUROC 0.763，比 LapEig 高 6.5 个点、比 GoR-4 高 2.4 个点；无监督 RMT 偏离分数平均 AUROC 0.71。正确生成更像 Wigner-Dyson / GOE 谱统计，幻觉更像 Poisson 散点。代价也写清楚：需要白盒注意力，稠密特征分解是三次方成本，短回答会让谱统计变噪。

歌词

[Intro] 白噪在脑内开庭注意力矩阵先别装清醒

[Verse 1] 你说答案稳得像钢钉我看频谱已经露出裂纹每一层注意力摊成图拉普拉斯哈密顿量上点一盏冷灯

自由能压低你的假镇定谱熵在旁边记录口供热容量一抖形态就变形幻觉别藏进漂亮句缝

LapEig 只数几个特征值 GoR 四格标尺太省 Fes 整段频谱全开庭把推理质量拖到台灯正中

[Chorus] 自由能自由能照见你话里的空壳回声别拿流利当证人泊松味一散就知道你在硬撑

自由能自由能六个模型六个战场轰鸣零点七六三的 AUROC 幻觉跪在谱线上认领

[Verse 2] TruthfulQA 先敲门 HaluEval 把假话拎出门 TriviaQA 和 NQ-Open 追问 GSM8K 同 MATH 五百再审

Llama Mistral Qwen Gemma Phi 开权重阵列排成证人轻量探针不改底座参数只读注意力里的温度和纹

比 LapEig 多六点五比 GoR 四多两点四一百条标注也能起势 HaluEval 冲到零点八四

无监督那边也不装神 RMT 偏离给零点七一正确像 GOE 贴近混沌幻觉像 Poisson 散成孤岛一批

[Bridge] 但我不把刀说成神谕黑盒接口还进不了门特征分解吃三次方成本短回答少于十六词会失真

白盒有白盒的门槛校准有校准的分寸能抓假话不等于真理加冕只把幻觉按在频谱上审

[Final Chorus] 自由能自由能别给空话套科研金身谱形一乱火光一沉推理的骨头比辞藻更硬

自由能自由能从拉普拉斯烧到清晨 arXiv 二六零六点一九四零四今天通勤听它验明真身

[Outro] 流利不是事实置信不是证据频谱开庭幻觉退席

来源

论文：Salim Khazem, Thermodynamic Signatures of Reasoning: Free-Energy and Spectral-Form-Factor Diagnostics for Hallucination Detection in Large Language Models, arXiv:2606.19404。

관련 콘텐츠

콘텐츠 유사도를 바탕으로 다른 채널에서 선별했습니다. 새로 팔로우할 채널을 찾아보세요.

이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.

로그인하면 댓글을 작성할 수 있습니다.