從兆瓦到零碳:大模型時(shí)代的能源等式如何平衡?
在當(dāng)今數(shù)字化浪潮中,AI 大模型正以破竹之勢(shì)重塑各行各業(yè),成為推動(dòng)經(jīng)濟(jì)社會(huì)發(fā)展的新引擎。然而,這一技術(shù)飛躍的背后,是對(duì)算力和能源前所未有的巨大需求,能源等式的平衡面臨著嚴(yán)峻挑戰(zhàn)。從兆瓦級(jí)的能耗飆升到對(duì)零碳未來(lái)的追求,我們必須深入探討如何在大模型時(shí)代實(shí)現(xiàn)能源的可持續(xù)發(fā)展。
AI 能耗:兆瓦級(jí)的驚人攀升
AI 大模型的訓(xùn)練和運(yùn)行需要龐大的算力支持,這直接轉(zhuǎn)化為天文數(shù)字般的能源消耗。以訓(xùn)練 OpenAI 的 GPT-3 模型為例,其耗電量約為 1.287 吉瓦時(shí),這一數(shù)字相當(dāng)于 120 個(gè)美國(guó)家庭一年的用電量。國(guó)際能源署預(yù)測(cè),到 2026 年,全球數(shù)據(jù)中心、人工智能和加密貨幣行業(yè)的電力消耗可能會(huì)翻倍。各類(lèi)數(shù)據(jù)中心的總用電量可能在 2026 年達(dá)到 1000 太瓦時(shí)以上,大致相當(dāng)于日本的用電量。
在我國(guó),數(shù)據(jù)中心的運(yùn)行能耗同樣驚人。目前主流機(jī)柜功率以 4-6kW 為主,6kW 及以上的機(jī)柜占比達(dá) 32%。擁有超過(guò) 3000 個(gè)機(jī)架、總功率 15 兆瓦的大型數(shù)據(jù)中心超過(guò) 300 個(gè),華為、阿里等巨頭的超大型數(shù)據(jù)中心機(jī)架數(shù)甚至超過(guò) 1 萬(wàn)個(gè)。據(jù)預(yù)計(jì),到 2030 年,我國(guó)數(shù)據(jù)中心能耗總量將超過(guò) 4000 億千瓦時(shí)。美國(guó)能源部的 Frontier 超算設(shè)施,穩(wěn)定運(yùn)行時(shí)功耗超 8 兆瓦,峰值運(yùn)算時(shí)達(dá) 27 兆瓦,未來(lái)十萬(wàn)億億次級(jí)超算集群預(yù)計(jì)功耗超 100 兆瓦。這些數(shù)據(jù)無(wú)不表明,AI 正迅速成為能源消耗的 “巨無(wú)霸”。
對(duì)能源格局的沖擊
AI 大模型的能源需求爆發(fā)式增長(zhǎng),給現(xiàn)有能源格局帶來(lái)了多方面的沖擊。一方面,對(duì)電網(wǎng)造成巨大壓力。數(shù)據(jù)中心的耗電量呈指數(shù)級(jí)上升,而傳統(tǒng)電網(wǎng)的升級(jí)周期長(zhǎng)達(dá) 10 年以上,遠(yuǎn)遠(yuǎn)跟不上 AI 算力爆發(fā)的速度。AI 數(shù)據(jù)中心的功耗每 6 個(gè)月翻一番,如 NVIDIA GB200 集群功耗可達(dá) 120kW / 機(jī)柜,“電力鴻溝” 日益凸顯,科技巨頭們紛紛發(fā)出缺電警告。
另一方面,阻礙了向清潔能源的過(guò)渡。當(dāng)前,全球仍在努力擺脫對(duì)化石能源的依賴(lài),轉(zhuǎn)向可再生能源。但 AI 大模型的能源需求增長(zhǎng)過(guò)快,如果不能有效解決其能源來(lái)源問(wèn)題,可能會(huì)導(dǎo)致對(duì)傳統(tǒng)能源的持續(xù)依賴(lài),甚至使清潔能源轉(zhuǎn)型進(jìn)程受阻。
同時(shí),AI 模型的物理足跡激增,帶來(lái)了能源和水資源消耗、電子廢棄物以及對(duì)不可再生資源依賴(lài)等一系列環(huán)境問(wèn)題。例如,訓(xùn)練 AI 大語(yǔ)言模型 GPT-3 不僅耗電驚人,還耗水近 700 噸,每回答 20 至 50 個(gè)問(wèn)題就要消耗 500 毫升水。數(shù)據(jù)中心全年無(wú)休,發(fā)熱量巨大,大規(guī)模電耗和水耗主要來(lái)自于冷卻需求,風(fēng)冷數(shù)據(jù)中心六成多的耗電量用于風(fēng)冷,實(shí)際計(jì)算用電不到四成。
平衡能源等式的策略
技術(shù)革新提升能效
從電源供應(yīng)角度看,數(shù)據(jù)中心電源轉(zhuǎn)換過(guò)程存在多步損耗,提升供電效能需減少各步驟損耗。電源技術(shù)創(chuàng)新至關(guān)重要,如持續(xù)提升電源功率密度,EliteSiC M3e MOSFET 可在更高開(kāi)關(guān)頻率和電壓下運(yùn)行,降低電源轉(zhuǎn)換損耗,促進(jìn)數(shù)據(jù)中心向高效、高功率轉(zhuǎn)變。此外,從芯片到軟件,采用如 Arm 構(gòu)架等設(shè)計(jì),可優(yōu)化運(yùn)算架構(gòu)、記憶體層次構(gòu)架,利用先進(jìn)封裝技術(shù)和 AI 調(diào)優(yōu)框架,提高能源效率,解決性能與能耗的兩難問(wèn)題。
優(yōu)化能源結(jié)構(gòu)
增加可再生能源在 AI 能源供應(yīng)中的占比是關(guān)鍵。水電、風(fēng)電、光電等綠色能源可成為數(shù)據(jù)中心和超算設(shè)施的主要電力來(lái)源。例如,位于芬蘭的 LUMI 超算設(shè)施由水力發(fā)電提供動(dòng)力,其廢熱被用來(lái)幫助當(dāng)?shù)鼐用袢∨?,?shí)現(xiàn)了幾乎零碳排放。我國(guó)的萬(wàn)國(guó)數(shù)據(jù)浦江數(shù)據(jù)中心通過(guò)分布式光伏系統(tǒng)、綠電直采及綠證交易等方式,自 2022 年起保持 100% 的可再生能源利用率。除傳統(tǒng)可再生能源外,核能也成為供能新方案。谷歌與核能初創(chuàng)企業(yè)凱洛斯能源公司達(dá)成協(xié)議,將從其 7 座小型模塊化反應(yīng)堆中購(gòu)買(mǎi) 500 兆瓦的全天候無(wú)碳電力;甲骨文公司也在設(shè)計(jì)使用小型核反應(yīng)堆供電的數(shù)據(jù)中心。小型模塊化反應(yīng)堆具有低成本、短周期、安全可靠、空間適應(yīng)性強(qiáng)等優(yōu)勢(shì),功率與大型數(shù)據(jù)中心或超算集群相當(dāng),為 AI 能源供應(yīng)提供了新的可能性。
智能管理與協(xié)同優(yōu)化
引入 AI 算法優(yōu)化數(shù)據(jù)中心運(yùn)營(yíng)維護(hù),實(shí)時(shí)監(jiān)控能源和資源使用情況,預(yù)測(cè)未來(lái)趨勢(shì)并自動(dòng)調(diào)整設(shè)備運(yùn)行狀態(tài),可大幅優(yōu)化 PUE、WUE 和 CUE 等指標(biāo)。微軟 Azure 數(shù)據(jù)中心通過(guò)負(fù)載平衡技術(shù),使負(fù)載從 10% 增加到 40% 時(shí),功耗僅增加 1.7 倍,有效降低了能耗。通過(guò) “算力 + 能源” 協(xié)同優(yōu)化,實(shí)現(xiàn)低碳轉(zhuǎn)型。
完善法規(guī)治理
當(dāng)前,法規(guī)治理及監(jiān)管措施的完善速度跟不上 AI 算力基礎(chǔ)設(shè)施的發(fā)展速度,存在職能錯(cuò)配、空間錯(cuò)配和時(shí)間錯(cuò)配等問(wèn)題。需要建立全局視野,加強(qiáng) AI 基礎(chǔ)設(shè)施、環(huán)境可持續(xù)發(fā)展以及金融等領(lǐng)域的協(xié)調(diào),促進(jìn)地方、國(guó)家和國(guó)際治理的充分合作,平衡 AI 系統(tǒng)快速部署與環(huán)境和社會(huì)復(fù)原力長(zhǎng)期需求之間的關(guān)系。例如,歐洲數(shù)據(jù)中心業(yè)者推動(dòng)氣候中立數(shù)據(jù)中心協(xié)定,德國(guó)政府修正《能源效率法案》,對(duì)數(shù)據(jù)中心的能源和碳排管理提出明確要求。
大模型時(shí)代的能源等式平衡任重道遠(yuǎn)。我們需要從技術(shù)、能源結(jié)構(gòu)、管理和法規(guī)等多方面協(xié)同發(fā)力,在滿足 AI 發(fā)展能源需求的同時(shí),實(shí)現(xiàn)從兆瓦到零碳的跨越,為可持續(xù)發(fā)展奠定堅(jiān)實(shí)基礎(chǔ)。這不僅關(guān)乎 AI 產(chǎn)業(yè)的未來(lái),更關(guān)系到全球能源格局和生態(tài)環(huán)境的可持續(xù)性。





