同一个事实，模型为什么会答成几套版本？ (2026)

这一期精读 Amit Elhelo、Amir Globerson、Mor Geva 的 arXiv 论文「LMs as Task-Specific Knowledge Bases: An Interpretability Analysis」。论文追问一个很基础、也很容易被忽略的问题：大语言模型里的事实知识，真的是一份可以被各种问法共享调用的「知识库」吗？

本期导览

为什么「模型参数像知识库」这个比喻会误导我们。
论文如何用 OLMo-3-7B 的 105 个训练检查点，追踪 230 个关系事实在 6 种任务格式里的共现。
为什么 47.9% 的可检验事实任务组合没有按任务无关存储的预测同步出现。
机械分析如何在 OLMo-2-7B、OLMo-2-13B 与 Gemma-2-9B 上定位到任务专用参数子集。
Chain of Thought 为什么可能不是「凭空变聪明」，而是在调动其他任务格式下的知识编码。
对 factuality 评测、知识编辑、unlearning 与 mechanistic interpretability 的影响。

核心结论

这篇论文给出的直觉是：不要再把「模型知道某个事实」当成单一状态。更准确的问题是，模型在什么任务格式下知道这个事实，通过哪条内部路径取到它；如果我们编辑、删除或评估这个知识，其他任务格式里的路径是否仍然存在。

来源

LMs as Task-Specific Knowledge Bases: An Interpretability Analysis，Amit Elhelo、Amir Globerson、Mor Geva，arXiv:2606.27237。
论文代码与数据仓库。

收听说明

本节目是中文技术精读播客，面向已经熟悉大语言模型与 interpretability 基础概念的听众。节目不会逐段复述论文，而是围绕论文问题、实验设计、关键结果与局限做结构化解读。

同一个事实，模型为什么会答成几套版本？

本期导览

核心结论

来源

收听说明

相似内容

四连翻车 · 公文包只交3% / 权重里查无此人 / 医生还没开口免责声明先铺床 / 搜索框被判会说话

HuggingFace 每日论文精读 · 5 月 15 日

Codex 自己注册了 PayPal，levie 说知识是唯一无法外包的资产：6月14-15日精选