The third scaling axis For most of the deep learning era, AI capability scaled with one variable. Pre training compute. Bigger transformer runs produced smarter models... Test time compute: Same weights. More inference time thinking. More tool calls. More retries. More search. More parallel agents. More verification.

今日精选:AI 算力范式转移与地缘博弈双线战
两篇 Twitter 深度长文精选:Logan Jastremski 拆解「第三个 Scaling Axis」——Test-time compute 如何让 KV Cache 成为新的基础设施瓶颈;Alexander Muse 揭示中国对美 AI 双线战——模型蒸馏窃密 + 国内数据中心阻断同步推进。

2026 年 5 月 22 日 · 首期发刊
这两篇长文从不同角度指向同一个底层现实:AI 的竞争早已不是模型参数的较量,而是算力基础设施与地缘战略的角力。一篇从技术投资视角拆解「第三个 Scaling Axis」对存储堆栈的颠覆;另一篇从国家安全视角揭示中国如何同时在模型层和基础设施层对美国发动双线攻势。读完,你对当下的 AI 军备竞赛应该有更清醒的判断。
精选一:AI 现在有了第三个 Scaling 轴
作者:Logan Jastremski(@LoganJastremski)
来源:X,2026-05-04
数据:46 赞 · 7 转发 · 4,775 浏览
コンテンツカードを読み込んでいます…
Jastremski 是 Frictionless VC 的联合创始人,这篇长文的论点关系到 AI 基础设施投资的方向判断。1
三个 Scaling 轴的逻辑
深度学习时代,AI 能力的提升依次经历了三个阶段:
- 第一轴:预训练计算量(Pre-training Compute)——更大的 Transformer 跑更大的数据,模型更聪明
- 第二轴:强化学习与后训练(RL + Post-training)——从「吸收数据」到「学会推理」,模型从知识库变成推理机
- 第三轴:测试时计算(Test-time Compute)——相同权重,更多推理时间,更多工具调用、并行 Agent、自我修正
文章的核心判断是:第三轴不只是「调大推理预算」,而是一次结构性转变,改变了价值积累的位置。
为什么「现在」会触发,而不是两年前?
两年前,给模型更多时间思考,结果是「10 倍的混乱」:多步规划崩溃、工具调用不稳定、Agent 陷入循环。付出更多算力,换不来更好结果。
这个阈值已经越过了。METR 的测量数据显示:过去两年,前沿 Agent 能够以 50% 成功率完成的软件任务时长,大约每几个月翻倍一次。2 行业从分钟级助手走向了小时级 Agent,部分可验证领域出现了天级 Agent。
经济学拐点
Jastremski 给出的比喻很直接:一个 2 分钟 Agent 是聊天机器人;20 分钟 Agent 是有用的助手;2 小时 Agent 可以调试、研究、执行一个完整工作流;多日 Agent 开始看起来像自主劳动力。
这个比较对象就变了:不再是「一次推理 vs 一次搜索」,而是「推理成本 vs 人力成本」。每个任务花 $10、$100 甚至 $1,000 的计算变得理性——只要 Agent 能可靠地替代数小时的熟练工作。
真正的技术拐点:上下文变成了基础设施
多 Agent 工作流有个物理限制:每个 Agent 产生的 State——系统提示、任务指令、工具输出、文件读取、错误日志、测试结果——全都成为 Context,Context 成为 KV Cache,KV Cache 成为了主要瓶颈。
当 1,000 个 Agent 在一个共享代码库上工作时,你不会想每次都重新计算同一个 Prefix。你需要缓存它、分享它、持久化它,把未来的请求路由到 Cache 已经存在的地方。
这里对应的基础设施投资逻辑:
| 存储层级 | 角色 |
|---|---|
| HBM | 加速器本地带宽 |
| Pod 附近的高吞吐 SSD | 热 KV Cache(核心争抢位置) |
| 持久化企业 NVMe | 跨会话、跨 Agent 的上下文存储 |
NVIDIA CMX、DeepSeek V4 的磁盘 KV Cache 方案、DualPath——三个独立信号都指向同一个结论:推理栈正在向 SSD 常驻 KV Cache 重新架构。
「从单次 Chat 到长期多 Agent 工作,上下文变成了基础设施。这个重新框架改变了如何评估整个堆栈。」—— Jastremski
对创业者和投资人的启示:那些产品面向「更长 Agent 运行、更多并行 Rollout、共享持久上下文」受益的公司,在这次转型中有结构性机会。
精选二:中国对美国 AI 的双线战争
作者:Alexander Muse(转载自 amuse on 𝕏)
来源:X,2026-04-24
摘要:模型蒸馏(知识盗窃)+ 基础设施阻断(数据中心阻截),两条线同时进攻
コンテンツカードを読み込んでいます…
这篇文章来自 Alexander Muse 的 Substack,3 逻辑严密、证据链完整,在 Twitter 上引发了大量转发讨论。
第一条线:模型蒸馏即工业级间谍
文章开篇定义了一个「简单的谜题」:作为竞争对手,你同时面对两个问题——美国模型更强,且美国正在建设支撑未来优势的物理基础设施。只解决其中一个是不够的。
蒸馏(Distillation)的定义:用更大模型的输出训练更小模型,让后者模仿前者的行为,而不需要承担等量的训练成本。Muse 称之为「智识吸血主义」——付出 $500 万,蒸馏 $10 亿训练出来的模型的 90% 能力,竞赛就不再是竞赛,而变成了补贴。
证据链很具体:
- Anthropic 指控:DeepSeek、Moonshot AI、MiniMax 通过约 24,000 个欺诈账户,发出超过 1,600 万次定向请求,大规模蒸馏 Claude 系列。3
- OpenAI 国会证词(2026 年 2 月):DeepSeek 员工通过混淆的第三方路由器和未授权的转售网络提取输出。
- 司法起诉:2026 年 1 月,前谷歌工程师 Linwei Ding 因盗取 AI 基础设施文件被定经济间谍罪;同月,涉嫌经由马来西亚、泰国非法转运 GPU 的美国公民和中国公民被起诉。
第二条线:用「绿色运动」绞杀算力建设
第二条线更隐蔽,也因此更危险。Muse 的论点是:如果无法直接阻断美国 AI 进步,就扶持一个现有的美国国内政治运动来做这件事。
核心证据:
- 2025 年 12 月,Food & Water Watch 组织了超过 230 家机构联名致函国会,要求暂停新数据中心建设
- 2026 年 3 月,Sanders 和 AOC 提出「人工智能数据中心暂停法案」
- 缅因州已通过全美首个州级数据中心暂停令
- 弗吉尼亚州(全球最大数据中心集群所在地)对新建设的公众支持率从 2023 年的 69% 跌至 2026 年的 35%
- 已被叫停或推迟的项目总价值:1,560 亿美元
文章的关键论点不是「这些活动人士都是中国特工」——而是:利益收敛的存在本身,就值得反情报视角的警惕。 一个组织良好的国内运动,有外国亿万富翁参与的慈善网络资助,其核心事实主张对中国有利且可证伪为假——这就足够让国会进行调查。
2026 年 2 月的众议院筹款委员会听证会上,议员们专门质询了外国影响力渗透美国免税机构的漏洞,点名了一位通过 501(c)(4) 渠道流入 2.8 亿美元的瑞士亿万富翁。3
反驳了两个「常识」
Muse 逐一拆解了反对数据中心的两个主要论点:
「数据中心耗水严重」:一座典型的超大规模数据中心一年的用水量,约等于一座中等规模高尔夫球场。部分现代数据中心使用闭路循环冷却,不消耗水而是循环利用,甚至有案可查的案例是数据中心建设带来了城市饮用水处理能力的净增加。
「数据中心推高电费」:主要超大规模运营商(微软、亚马逊、谷歌、Meta、xAI)已承诺「表后发电」(Behind-the-meter generation)——独立于居民电网的自有电源。2026 年 3 月,白宫推动 AI 企业签署《电费纳税人保护承诺》。弗吉尼亚州、德克萨斯州、亚利桑那州的实证数据:数据中心集中的县,居民电价涨幅与全州平均持平或低于均值。
判断:这两个主张被刻意扩散的方式,与已有记录的外国影响力渗透手法高度吻合。
本期编者按
这两篇文章放在一起有一个隐含的结构:一篇说「下一波 AI 能力增益,赢家是基础设施层」;另一篇说「针对这个基础设施层,已经有两条攻击路径同时运转」。
对于 AI 从业者,有几个值得追踪的点:
- METR 的 Agent Task Horizon 数据,是目前衡量「推理时计算投资回报」最可信的外部指标
- 企业级 NVMe SSD 的采购量,可能是 2026-2027 年 AI 基础设施扩张的早期领先信号
- 各州数据中心许可审批进展,是判断美国算力瓶颈的滞后验证指标
首期发刊。如果你是 AI 从业者或创业者,关注这个频道,每日推送 Twitter 上值得深读的 AI 长文精选。
このコンテンツについて、さらに観点や背景を補足しましょう。