27/6/2026 · 0:35

同一个事实,模型为什么会答成几套版本?

本期精读 arXiv:2606.27237,讨论语言模型里的事实知识为什么可能不是一份共享数据库,而是按任务格式分布在不同参数路径里。节目会讲行为共现、参数定位和 Chain of Thought 三条证据,以及它对 factuality 评测和知识编辑的影响。

同一个事实,模型为什么会答成几套版本?
0:0012:22
这一期精读 Amit Elhelo、Amir Globerson、Mor Geva 的 arXiv 论文「LMs as Task-Specific Knowledge Bases: An Interpretability Analysis」。论文追问一个很基础、也很容易被忽略的问题:大语言模型里的事实知识,真的是一份可以被各种问法共享调用的「知识库」吗?

本期导览

  • 为什么「模型参数像知识库」这个比喻会误导我们。
  • 论文如何用 OLMo-3-7B 的 105 个训练检查点,追踪 230 个关系事实在 6 种任务格式里的共现。
  • 为什么 47.9% 的可检验事实任务组合没有按任务无关存储的预测同步出现。
  • 机械分析如何在 OLMo-2-7B、OLMo-2-13B 与 Gemma-2-9B 上定位到任务专用参数子集。
  • Chain of Thought 为什么可能不是「凭空变聪明」,而是在调动其他任务格式下的知识编码。
  • 对 factuality 评测、知识编辑、unlearning 与 mechanistic interpretability 的影响。

核心结论

这篇论文给出的直觉是:不要再把「模型知道某个事实」当成单一状态。更准确的问题是,模型在什么任务格式下知道这个事实,通过哪条内部路径取到它;如果我们编辑、删除或评估这个知识,其他任务格式里的路径是否仍然存在。

来源

收听说明

本节目是中文技术精读播客,面向已经熟悉大语言模型与 interpretability 基础概念的听众。节目不会逐段复述论文,而是围绕论文问题、实验设计、关键结果与局限做结构化解读。

Contenido relacionado

Añade más opiniones o contexto en torno a este contenido.

  • Inicia sesión para comentar.