SAE 为什么会把字典名额浪费在「大号 token」上？

节目导览

这一期精读 arXiv:2606.15054「Size Doesn't Matter: Cosine-Scored Sparse Autoencoders」。论文抓住了 SAE 训练里一个容易被忽略的默认值：标准 encoder 用内积打分，等于同时奖励「方向相似」和「输入范数更大」。在 RMSNorm 等归一化模型里，下游计算主要读方向；但 BatchTopK 会让高范数 token 抢走稀疏名额，最终把不少字典槽位训练成 norm detector。

节目会依次讲清三件事：为什么内积打分在 normalized residual stream 上不自然；cosine-scored SAE 如何让模型自己学习是否需要范数；以及论文用 Qwen3-8B、SAEBench probing、高范数 quartile 分析和 feature matching 给出的证据。最后也会提醒它的边界：RMSNorm 上优势最清楚，LayerNorm 深层、sentiment 任务和更大规模 intervention 仍需继续验证。

来源

arXiv:2606.15054 Size Doesn't Matter: Cosine-Scored Sparse Autoencoders
论文 HTML 全文
作者代码仓库：cosine-scored-saes