在當今數(shù)字化浪潮中,AI 大模型正以破竹之勢重塑各行各業(yè),成為推動經(jīng)濟社會發(fā)展的新引擎。然而,這一技術(shù)飛躍的背后,是對算力和能源前所未有的巨大需求,能源等式的平衡面臨著嚴峻挑戰(zhàn)。從兆瓦級的能耗飆升到對零碳未來的追求,我們必須深入探討如何在大模型時代實現(xiàn)能源的可持續(xù)發(fā)展。
AI 能耗:兆瓦級的驚人攀升
AI 大模型的訓練和運行需要龐大的算力支持,這直接轉(zhuǎn)化為天文數(shù)字般的能源消耗。以訓練 OpenAI 的 GPT-3 模型為例,其耗電量約為 1.287 吉瓦時,這一數(shù)字相當于 120 個美國家庭一年的用電量。國際能源署預測,到 2026 年,全球數(shù)據(jù)中心、人工智能和加密貨幣行業(yè)的電力消耗可能會翻倍。各類數(shù)據(jù)中心的總用電量可能在 2026 年達到 1000 太瓦時以上,大致相當于日本的用電量。
在我國,數(shù)據(jù)中心的運行能耗同樣驚人。目前主流機柜功率以 4-6kW 為主,6kW 及以上的機柜占比達 32%。擁有超過 3000 個機架、總功率 15 兆瓦的大型數(shù)據(jù)中心超過 300 個,華為、阿里等巨頭的超大型數(shù)據(jù)中心機架數(shù)甚至超過 1 萬個。據(jù)預計,到 2030 年,我國數(shù)據(jù)中心能耗總量將超過 4000 億千瓦時。美國能源部的 Frontier 超算設(shè)施,穩(wěn)定運行時功耗超 8 兆瓦,峰值運算時達 27 兆瓦,未來十萬億億次級超算集群預計功耗超 100 兆瓦。這些數(shù)據(jù)無不表明,AI 正迅速成為能源消耗的 “巨無霸”。
對能源格局的沖擊
AI 大模型的能源需求爆發(fā)式增長,給現(xiàn)有能源格局帶來了多方面的沖擊。一方面,對電網(wǎng)造成巨大壓力。數(shù)據(jù)中心的耗電量呈指數(shù)級上升,而傳統(tǒng)電網(wǎng)的升級周期長達 10 年以上,遠遠跟不上 AI 算力爆發(fā)的速度。AI 數(shù)據(jù)中心的功耗每 6 個月翻一番,如 NVIDIA GB200 集群功耗可達 120kW / 機柜,“電力鴻溝” 日益凸顯,科技巨頭們紛紛發(fā)出缺電警告。
另一方面,阻礙了向清潔能源的過渡。當前,全球仍在努力擺脫對化石能源的依賴,轉(zhuǎn)向可再生能源。但 AI 大模型的能源需求增長過快,如果不能有效解決其能源來源問題,可能會導致對傳統(tǒng)能源的持續(xù)依賴,甚至使清潔能源轉(zhuǎn)型進程受阻。
同時,AI 模型的物理足跡激增,帶來了能源和水資源消耗、電子廢棄物以及對不可再生資源依賴等一系列環(huán)境問題。例如,訓練 AI 大語言模型 GPT-3 不僅耗電驚人,還耗水近 700 噸,每回答 20 至 50 個問題就要消耗 500 毫升水。數(shù)據(jù)中心全年無休,發(fā)熱量巨大,大規(guī)模電耗和水耗主要來自于冷卻需求,風冷數(shù)據(jù)中心六成多的耗電量用于風冷,實際計算用電不到四成。
平衡能源等式的策略
技術(shù)革新提升能效
從電源供應角度看,數(shù)據(jù)中心電源轉(zhuǎn)換過程存在多步損耗,提升供電效能需減少各步驟損耗。電源技術(shù)創(chuàng)新至關(guān)重要,如持續(xù)提升電源功率密度,EliteSiC M3e MOSFET 可在更高開關(guān)頻率和電壓下運行,降低電源轉(zhuǎn)換損耗,促進數(shù)據(jù)中心向高效、高功率轉(zhuǎn)變。此外,從芯片到軟件,采用如 Arm 構(gòu)架等設(shè)計,可優(yōu)化運算架構(gòu)、記憶體層次構(gòu)架,利用先進封裝技術(shù)和 AI 調(diào)優(yōu)框架,提高能源效率,解決性能與能耗的兩難問題。
優(yōu)化能源結(jié)構(gòu)
增加可再生能源在 AI 能源供應中的占比是關(guān)鍵。水電、風電、光電等綠色能源可成為數(shù)據(jù)中心和超算設(shè)施的主要電力來源。例如,位于芬蘭的 LUMI 超算設(shè)施由水力發(fā)電提供動力,其廢熱被用來幫助當?shù)鼐用袢∨瑢崿F(xiàn)了幾乎零碳排放。我國的萬國數(shù)據(jù)浦江數(shù)據(jù)中心通過分布式光伏系統(tǒng)、綠電直采及綠證交易等方式,自 2022 年起保持 100% 的可再生能源利用率。除傳統(tǒng)可再生能源外,核能也成為供能新方案。谷歌與核能初創(chuàng)企業(yè)凱洛斯能源公司達成協(xié)議,將從其 7 座小型模塊化反應堆中購買 500 兆瓦的全天候無碳電力;甲骨文公司也在設(shè)計使用小型核反應堆供電的數(shù)據(jù)中心。小型模塊化反應堆具有低成本、短周期、安全可靠、空間適應性強等優(yōu)勢,功率與大型數(shù)據(jù)中心或超算集群相當,為 AI 能源供應提供了新的可能性。
智能管理與協(xié)同優(yōu)化
引入 AI 算法優(yōu)化數(shù)據(jù)中心運營維護,實時監(jiān)控能源和資源使用情況,預測未來趨勢并自動調(diào)整設(shè)備運行狀態(tài),可大幅優(yōu)化 PUE、WUE 和 CUE 等指標。微軟 Azure 數(shù)據(jù)中心通過負載平衡技術(shù),使負載從 10% 增加到 40% 時,功耗僅增加 1.7 倍,有效降低了能耗。通過 “算力 + 能源” 協(xié)同優(yōu)化,實現(xiàn)低碳轉(zhuǎn)型。
完善法規(guī)治理
當前,法規(guī)治理及監(jiān)管措施的完善速度跟不上 AI 算力基礎(chǔ)設(shè)施的發(fā)展速度,存在職能錯配、空間錯配和時間錯配等問題。需要建立全局視野,加強 AI 基礎(chǔ)設(shè)施、環(huán)境可持續(xù)發(fā)展以及金融等領(lǐng)域的協(xié)調(diào),促進地方、國家和國際治理的充分合作,平衡 AI 系統(tǒng)快速部署與環(huán)境和社會復原力長期需求之間的關(guān)系。例如,歐洲數(shù)據(jù)中心業(yè)者推動氣候中立數(shù)據(jù)中心協(xié)定,德國政府修正《能源效率法案》,對數(shù)據(jù)中心的能源和碳排管理提出明確要求。
大模型時代的能源等式平衡任重道遠。我們需要從技術(shù)、能源結(jié)構(gòu)、管理和法規(guī)等多方面協(xié)同發(fā)力,在滿足 AI 發(fā)展能源需求的同時,實現(xiàn)從兆瓦到零碳的跨越,為可持續(xù)發(fā)展奠定堅實基礎(chǔ)。這不僅關(guān)乎 AI 產(chǎn)業(yè)的未來,更關(guān)系到全球能源格局和生態(tài)環(huán)境的可持續(xù)性。





