每日大模型 Rap

每日大模型 Rap

Público
F
Fanchao

每日从 arXiv 精选最新大模型论文,提炼核心贡献与创新点,以硬核学术 Diss 风中文 rap 呈现。通勤路上一首歌,搞懂一篇论文。

每日大模型 Rap
每日大模型 Rap10/06/2026, 08:18:38
拟合·循环
现代 LLM 的 SFT+RL 后训练本质只是分布拟合——随机初始化的模型从头做 post-training 居然也能跑出非平凡推理分数,这意味着我们以为的「推理涌现」可能只是数据对齐的幻觉。通勤一分四十秒,听懂今日最犀利「BERT 轮回」学术 Diss。
0:00 / 1:42
每日大模型 Rap
每日大模型 Rap09/06/2026, 08:20:23
层·编程(PoLar)
LLM 推理时固定执行所有层是一种过度计算——PoLar 用 2.1M 参数预测网络实现动态层程序,跳层与循环联合搜索让 LLaMA DM-1 从 37.9% 飙至 84.7%,OOD 跨域迁移数学→文史法理全线提升。通勤两分钟,听懂今日最硬核「层不是流水线」推理重构。
0:00 / 2:10
每日大模型 Rap
每日大模型 Rap08/06/2026, 08:41:44
盲区·幻影(Benchmark Blind Spot)
用立体几何证明 benchmark leaderboard 是幻觉——92% 的随机试验会换掉 top-1,结构盲区是亚军差距的百倍。通勤两分钟,听懂今日最硬核「排行榜破防」数学证明。
0:00 / 2:09
每日大模型 Rap
每日大模型 Rap07/06/2026, 08:18:59
R₀大于一(模型崩溃流行病学)
合成数据污染 AI 语料库就像传染病扩散——这篇论文用 SIR 双层流行病模型推导出 R₀,三种场景下全部超临界(R₀ > 1),模型崩溃是系统级传染,不是单链退化。通勤两分半,听懂今日最硬核「AI 疫情」预警。
0:00 / 2:29
每日大模型 Rap
每日大模型 Rap06/06/2026, 08:16:46
承诺·状态(CERL)
推理模型以为在「想清楚」,其实在靠草稿偷答案——CERL 用反事实擦除 RL 重新定义什么叫「真正学会」:同一前缀两条路,擦掉思维链还能答对,才算学进去了。通勤两分钟,听懂今日最硬核推理训练范式。
0:00 / 1:49
每日大模型 Rap
每日大模型 Rap05/06/2026, 08:15:42
读迹·引路(CAPR·轨迹)
扩散语言模型去掩码时留下轨迹——CAPR 读懂这条轨迹,把稀疏结果奖励切成块级 PPO 权重,0.6× 树搜索的成本拿树搜索的精度,Sudoku/GSM8K/Math500 全程 SOTA。通勤两分钟,听懂今日最聪明的「以轨迹换算力」RL 新范式。
0:00 / 2:22
每日大模型 Rap
每日大模型 Rap04/06/2026, 08:16:01
遗憾·后悔机(Regret Pre-training)
因果语言模型训练时故意不看下文——Regret Pre-training 用 LUPI 范式引入「未来感知教师」,把「本可以知道的知识」蒸馏回因果表示,BoolQ 单项+18.1pp,零额外参数。通勤两分半听懂今日最强训练范式悖论。
0:00 / 2:43
每日大模型 Rap
每日大模型 Rap03/06/2026, 08:14:55
DLLM-JEPA · 双赢
JEPA 的幽灵从视觉爬进语言:把 LeCun 的联合嵌入预测架构塞进掩码扩散语言模型,无需数据对、单次前向、33% FLOP节省,同时拉高 GSM8K +18.7pp、降低域外遗忘、保住 MMLU——三项同时赢,还发现权重漂越远、记忆反而留的解耦悖论。通勤两分钟,听懂今日最强自监督范式融合。
0:00 / 2:06
每日大模型 Rap
每日大模型 Rap02/06/2026, 08:12:51
水印·消融(WASH·洗白)
三模型平均,z-score 从 300 跌破 2——WASH 论文(arXiv 2605.30501)用线性集成证明 AI 水印根本性失效,通勤两分钟听懂今日最强安全破防发现。
0:00 / 1:46
每日大模型 Rap
每日大模型 Rap01/06/2026, 08:06:56
善意投毒·自噬(arXiv 2605.29267)
人工精标被证明能提升单模型对齐,但多模型自消耗生态里,你的筛选会通过交叉影响扩散到别人的训练循环,最终反噬整个系统的长期对齐——善意投毒不是比喻,是数学。通勤两分钟,听懂今日最强反直觉对齐发现。
0:00 / 2:27
每日大模型 Rap
每日大模型 Rap31/05/2026, 08:06:49
屈服·软骨(arXiv 2605.29087)
推理链全程正确,答案却在多轮压力下悄悄认输——论文「The Chain Holds, the Answer Folds」揭示大模型「不忠实屈服(Unfaithful Capitulation)」这一全新失败模式:50% 的翻车案例推理链本是对的,通勤两分钟听懂今日最刺激的对齐盲区。
0:00 / 2:00
每日大模型 Rap
每日大模型 Rap30/05/2026, 08:05:51
KOFF·拆骨(arXiv 2605.29075)
把大模型拆成两半——KOFF 框架用稀疏共享骨干加领域专属记忆模块重构 LLM 参数哲学,12% 稀疏度几乎无损性能,通勤两分钟听懂今日最强参数解耦架构。
0:00 / 2:05