特朗普的《大漂亮法案》,让马斯克最不爽的,可能还不是对电动车下手,而是向储能下手。而对储能下手,就是对AI下手。
电池储能本来就不便宜。此前,参众两院两个版本的法案,都计划对包括电池在内的新能源动手。据律所McGuireWoods对比,最后一刻达成的法案,可谓是网开一面,不再额外对新能源加税,只要满足开工时间和关键材料占比等条件,补贴退坡也可以适当延后。马斯克应该稍微可以缓一口气。
AI数据中心需要一个新型的电力系统。它要变得更为绿色,需要解决新能源发电与并网的时空不平衡性——加州一天之内的峰谷波动就达到了30%——也就需要储能的帮忙。但这还不是唯一的关键。传统电网所面临的更大更直接的挑战在于,AI数据中心负载的瞬间波动幅度,超过了目前电网承载能力。
用马斯克的话说,电池储能对于消除这种功率波动至关重要,足以决定AI训练的成败。事实上,从电网侧的视角出发,它们更担心AI数据中心负载突然“消失”,输入电压骤降,将导致名为低电压穿越(LVRT)的故障,电网就会“临时跳闸”,多来几次,就会“永久跳闸”。这个时候,数据中心反倒可以启动配套的备用发电系统,但电网却失去了数百兆瓦或数千兆瓦的电力负荷,整个电网的电压、电频将超过“安全区”,进而引发整张电网的大停电。类似今年西班牙所发生的一切。
无论是xAI,还是谷歌与meta,都很清楚AI数据中心与云数据中心,根本不是同一个物种。谷歌证实两者的负载波动差异,可以高达十倍。在谷歌旗下数据中心执行现实任务的时候,传统的云数据中心,它的负载波动大致在1.5兆瓦(MW)左右,而AI数据中心达到了15兆瓦。
AI数据中心负载的瞬间的高度的波动性,在预训练阶段体现的尤为明显。去年,meta训练完Llama 3.1,披露过自己所遇到的基础设施难题,其中一条,就是随着算力集群的增大,大量GPU在相近时点等待通信等行为,将使得算力集群功耗瞬间波动数十兆瓦。马斯克在与Lex Fridman对话的时候,也提到xAI在预训练的时候,负载波动在10兆瓦到20兆瓦之间,“就像指挥管弦乐队一样,忽高忽低的。”
如果美国继续在预训练阶段“上规模”,那么,AI数据中心将变得越来越大,甚至最快明年就能达到吉瓦(GW)级别,负载波动幅度也会随之继续增大。而且,随着强化学习等后训练阶段的扩展,推理阶段也将遭遇相似问题。许多问题可以通过软件修改和工作负载与集群管理优化来部分解决,但电网等基础设施层面的解决方案仍然无法绕开。
今年,面对白宫征询AI行动计划(AI Action Plan)意见,谷歌第一条建议就是基础设施,主要是电力系统。谷歌已经看到,创新需要迫切地从芯片(Chip)转向电网(Grid)了。
马斯克宣称xAI已经搞定了25兆瓦级别的负载波动。靠的是Megapack储能系统,也就是特斯拉目前增速最快的一块业务。五年前,马斯克曾豪言,长远来看,特斯拉的能源业务与汽车业务将旗鼓相当,甚至更高一点。如果美国继续崇尚AI训练的“暴力美学”,而且储能产业政策不调整,马斯克吹下的牛,将会更快实现。
由Megapack构建的电池储能系统(BESS),可以在瞬间充电和放电数百兆瓦,使这些电池能够以适当的反应速度和功率输出,应对AI数据中心的负载波动。没有Megapack时(橙色线段),发电、电网频率和机械系统的稳定性都很差,波动很大。而且,一旦出现“临时跳闸”的情况,BESS系统将开始自动从电网充电,“模拟”数据中心的负载,避免“永久跳闸”的发生。
在特斯拉的构想中,与UPS系统(5分钟电池)、柴油发电机(离网发电)、电容器(E-Statcom)相比,电池储能系统还能额外实现需求响应的功能。不过,AI分析机构semianalysis很怀疑数据中心的电池储能系统究竟能在需求响应起到多大作用。因为,需求响应与备用电源,优先考虑实现其中一个任务,就会同等程度地降低另一个的优先级。而且,特斯拉的Megapack仍然不便宜。未来的吉瓦级别的AI数据中心,电池储能系统的造价高达10亿美元。
马斯克似乎越来越看不上单纯的电动车业务。人工智能,以及人工智能驱动的自动驾驶、机器人,才是支撑他商业帝国市值最大的希望。而电池又是这一切的保障。