AI 数据中心,不一定非要新电厂
2026/6/22 · 8:09

AI 数据中心,不一定非要新电厂

MIT Technology Review 的 Amos Zeeberg 写到,数据中心缺电的解法不只是新建电厂,也可能是让 AI 工厂在电网最紧张的几十小时里主动降载。读完这篇,你会理解为什么 AI 的能源瓶颈,本质上也是一场电网调度能力的考试。

导读

Amos Zeeberg 6 月 16 日在 MIT Technology Review 写到:AI 数据中心缺的不只是电,而是电网高峰时的弹性。若服务器能在一年最紧张的几十小时主动降载,新电厂就不是唯一答案。1

全文总结

文章从一个很英国的场景写起:英格兰男足和德国队半场休息,数百万英国人同时烧水泡茶,电热水壶把电力需求突然推高。MIT Technology Review 说,2025 年 12 月,工程师没有真的等一场比赛发生,而是重放了 2020 年欧洲杯时的用电冲击,让一套名为 Conductor 的软件指挥伦敦一座数据中心降低芯片功耗,测试它能否帮电网扛过峰值。1
这篇文章的核心问题很简单:AI 数据中心建设速度太快,电网扩建太慢。弗吉尼亚州所在的 PJM(美国最大电网运营和电力市场之一)要把新的发电能力接入系统,据 RMI(能源研究机构)的估算可能需要 8 年。数据中心本身却可以更快建好。于是,AI 行业眼前的瓶颈不只是芯片和土地,也变成了「speed to power」,也就是多快拿到足够电力。1
一只手调节抽象电力旋钮
《MIT Technology Review》原文插画把电网弹性画成一次「调节」:关键不是永远少用电,而是在峰值时把需求压下来。1
Zeeberg 写到,反对者担心数据中心抬高电价、制造噪音、污染当地环境,还创造不了多少长期岗位。Data Center Watch 统计,2025 年有超过 1500 亿美元的数据中心项目被社区组织拖住。美国已有十多个州考虑限制,明尼阿波利斯和佐治亚州迪卡尔布县等地也出现地方暂停令。美国参议院的 GRID Act 甚至提出,新数据中心应该完全脱离公共电网。1
文章给出的反常识答案是:电网并不是时时刻刻都满载。它通常是按最坏时刻设计的,许多线路一年中只有少数小时真正紧张。杜克大学研究者在 2025 年的一份报告中估算,如果数据中心愿意在一年中 0.25%的时间降低用电,美国电网就可能额外容纳 76 吉瓦负荷,约等于美国到 2030 年预计所需的数据中心增长量。0.25%折算下来,大约是每年 22 小时。1
这里的机制不是让 AI 停工,而是把工作分出轻重缓急。实时聊天机器人查询不能随便慢下来,但后台检索、训练任务、批处理任务可能可以等一等。Conductor 的思路就是判断每个 AI 任务处在什么性能曲线上,然后在电网给出功率上限时,降低部分 GPU(图形处理器,AI 训练和推理常用芯片)的功耗,同时尽量不让最重要的任务掉线。1
文章把可行路径拆成三种。第一,数据中心自建电池或备用电源,在电网卡住时自己补上。第二,接入 VPP(virtual power plant,虚拟电厂,即把许多用户的电池、空调、智能设备等聚合起来统一调度),由附近用户在高峰时少用电,数据中心向他们付费。第三,数据中心自己在峰值时降载。这三条路都不免费,但它们共同改变了一点:数据中心不再只是向电网提出一个固定、巨大的用电要求。1
Zeeberg 接着写几个正在落地的例子。GridCare 用生成式 AI 给电网建立「digital twin」,也就是电网数字孪生,分析发电厂、线路、变电站和用户在不同状态下还能释放多少容量。在俄勒冈州希尔斯伯勒,Aligned Data Centers 计划安装 31 兆瓦电池,并在电网拥堵时最多降低 31 兆瓦取电。Portland General Electric 由此可在不新建电厂的情况下,向 Aligned 和附近运营商增加 80 兆瓦容量。1
Google 走的是另一条路:从 2023 年起,它已经在电力紧张地区把计算负载迁到压力较小的数据中心,并与田纳西河谷管理局、Indiana Michigan Power 等五家公用事业公司签署协议,形成最多 1 吉瓦的灵活用电能力。Voltus 则主推「bring your own capacity」方案,让数据中心资助附近的虚拟电厂;2026 年 6 月,它与 Google 签下第一个此类三年项目,地点在 PJM 电网区域。1
抽象线条从数据中心向外分流
原文另一张插画更像一套调度系统:许多负载被重新排序,少数红色节点留在高优先级位置。1
Conductor 的路线更激进,因为它要求数据中心本身听电网指挥。它背后的 Emerald AI 参加了 Data Center Flexible Load Initiative,这个合作项目包括 Google、Nvidia、Duke Energy 和 PJM 等公司与机构。一次在凤凰城进行的测试中,Conductor 接管了装有 256 块 Nvidia A100 GPU 的服务器机架,在模拟的繁忙电网场景下连续三小时把芯片功率降低 25%,同时维持可接受的计算性能。1
最后,文章把焦点放回北弗吉尼亚的 Data Center Alley。这里约有 500 座计算设施,占全球算力容量的 13%,而北京和俄勒冈各约占 6%。如果弗吉尼亚所有拟建数据中心都推进,该州 2040 年的用电需求可能增加 183%,约 26 吉瓦。Emerald AI、Nvidia、Digital Realty 等正在马纳萨斯建设一座 96 兆瓦的「power-flexible AI factory」,计划让 Conductor 第一次在真实电网上以更大规模管理功率。1
文章没有把弹性说成万能解。PJM 的市场监督者 Joseph Bowring 直说,把大量数据中心负荷接入电网却不新增发电能力,是「magical thinking」。他的担忧在于,如果没有法律或监管机制,电力公司不能保证数据中心真会在关键时刻少用电。另一位技术顾问 Stephen Empedocles 也把这些方案称为优化工具,而不是替代发电、输电和配电扩建的方案。1
所以这篇文章真正有意思的地方,是它把「AI 缺电」从一个宏大的能源焦虑,改写成一个更具体的系统设计问题。若数据中心永远要求满功率、不可中断,电网只能不断为极端峰值扩建。若数据中心可以在少数小时里让出一点功率,电网、AI 公司和普通用户之间就多了一种谈判方式。这个方式不能替代建电厂,但可能决定一些 AI 工厂能不能提前三到五年上线。1

关键细节

  • 一年 22 小时:杜克大学报告估算,只要数据中心在 0.25%的时间内降低用电,美国电网就可能释放 76 吉瓦额外容量,足以容纳到 2030 年的美国数据中心增长预测。1
  • 三到五年:普林斯顿大学和两家电网现代化公司研究 PJM 区域后认为,一座 500 兆瓦、每年不到 1%时间可降载的数据中心,可能比不可降载的数据中心早三到五年全面投运。1
  • 256 块 A100 GPU:Conductor 在凤凰城测试中接管了相当于约 170 个美国家庭用电量的 GPU 集群,并在三小时内把芯片功率降低 25%。1
  • 96 兆瓦实网试验:伦敦测试管理的是 130 千瓦 AI 集群;马纳萨斯项目若上线,Conductor 面对的是 96 兆瓦超大规模 AI 工厂,规模差了几个数量级。1
  • 反对意见很硬:Bowring 的问题不是弹性技术能不能演示成功,而是它能否被强制执行。没有合规义务,电网运营商无法把数据中心当成可靠资源。1

金句

"AI factory flexibility is the bridge between the incredible demand for AI and the immediate limitations of our energy grid."
Nvidia 可持续发展负责人 Josh Parker 的这句话,是全文最简洁的判断:弹性不是能源终局,但它是 AI 需求和现实电网之间的临时桥。1
"If you were an airline running at 30% utilization, you would not buy more planes. If you are running a grid at 30% utilization, there’s no scientific reason you can’t go to 60."
GridCare CEO Amit Narayan 用航空公司类比电网利用率:如果系统大部分时间没有满载,第一反应未必该是继续扩建。1
"Sometimes a crisis like this creates an opportunity to do something differently."
Emerald AI 首席科学家 Ayse Coskun 的结尾提醒:AI 用电危机可能迫使电网从「按峰值硬扩建」转向更聪明的实时调度。1

参考ソース

  1. 1MIT Technology Review

関連コンテンツ

このコンテンツについて、さらに観点や背景を補足しましょう。

  • ログインするとコメントできます。