數據中心進化論:曙光數創的風液混冷與綠電融合雙重奏

作者:王聰彬

從DC到IDC,再到AIDC,數據中心的演進彷彿一場算力的飛躍。

截至2024年6月,中國在用算力總規模達246EFLOPS(指每秒進行百億億次浮點運算的能力),算力應用項目超過1.3萬個,在用算力中心機架總規模超過830萬標準機架。

其中,智能算力規模在2024年6月底突破76EFLOPS,同比增長65%,中國已建和正在建設的智算中心超250個。預計到2025年,中國算力總規模將超過300EFLOPS,智能算力佔比將達到35%。

然而,每一次升級,不僅帶來了計算能力和效率的飛速提升,同時也伴隨着功耗的劇增。

根據國際能源署數據,2022年,全球數據中心用電總量爲460太瓦時(TWh),而到2026年,這個數字將達到1000TWh,是 2022 年的兩倍多,相當於“大約相當於日本的電力消耗量”。

中國的情況也不容忽視,預計到2025年,數據中心的電力消耗將接近4000億千瓦時(KWh),佔全國總電力消耗的5%以上。而隨着生成式AI的崛起,這一預測可能會提前到來。

最近,中科曙光與曙光數創聯合編寫發佈了《新型綠電融合“風液混冷”智算數據中心解決方案》白皮書,提出了一種創新的“算電融合”+“風液混冷”架構的智算中心解決方案,解決智算中心的散熱問題和用電“焦慮”。

“風液混冷”未來數據中心的冷卻之道

液冷技術的發展本質上是芯片需要更高效的散熱形式,隨着功耗不斷上升,散熱遇到瓶頸後,液冷可能就不再是一道選擇題。

2000年到2020年,CPU作爲主要算力核心,功率基本保持在150至200瓦之間。但隨着2020年AI的逐漸崛起,GPU逐漸成爲主流算力單元,功率開始大幅上升,達到450瓦、750瓦,甚至突破1000瓦。

當芯片TDP超過350W時,風冷逼近極限,液冷成爲最佳解決方案。然而,目前冷板式液冷數據中心普遍採用兩套冷卻系統獨立部署的形式,無法滿足彈性部署,更不用說未來液冷數據中心的能效優化。

能否用一套冷源,來解決整個數據中心的風冷和液冷的所有冷卻需求?

這也是一體化“風液混冷”解決方案的優勢之處,通過液冷+風冷混合散熱形式,即CPU、內存等主要發熱部件利用液冷冷板套件進行冷卻,其餘少部分熱量採用風冷形式冷卻。

“風液混冷服務器可能會是未來5到10年的一個趨勢。“曙光數創副總裁兼CTO張鵬博士說,隨着算力需求激增和散熱挑戰的日益嚴峻,曙光數創通過持續投入研發,推出了高能效的液冷解決方案,爲解決高密度計算帶來的散熱難題提供了新的途徑。

該解決方案結合風冷與液冷系統,共享一次側管路和室外散熱冷源,簡化了系統結構,同時實現了風液冷卻的彈性調節。通過“風液混冷”模式,不僅降低了建設和運維成本,還能根據不同場景和需求靈活調整冷卻方式,從而大幅提升能源利用效率。

自去年發佈以來,曙光數創與某互聯網企業合作成立了一個示範項目,並且曙光數創已有兩個在建項目。

解決方案還提供了風冷系統和液冷系統的彈性調節能力,能夠滿足現有風冷機房及未來液冷機房的靈活擴容需求。張鵬表示,系統調優本質上是針對服務器以外的能耗進行優化,包括風扇、水泵和空調末端的風機等循環設備,通過靈活調整這些輔助系統,可以實現能效提升。

“源網荷儲”數據中心與可再生能源的協同之道

數據中心是“耗能大戶”,也是節能降碳的核心發力領域之一,新建數據中心與可再生能源發電的協同佈局已成爲亟待解決的重要課題。

《數據中心綠色低碳發展專項行動計劃》指出,到2025年底,全國數據中心佈局更加合理,整體上架率不低於60%,平均電能利用效率降至1.5以下,可再生能源利用率年均增長10%,平均單位算力能效和碳效顯著提高。

傳統數據中心的電力系統通常由高可靠的電源(電網供應+UPS+柴發)+相對穩定的用電負荷+不可或缺的儲能(UPS)組成。

隨着能源需求的增加和可再生能源比例的提升,解決方案還引入了“源網荷儲”一體化的概念。“源”指電源側,“網”指電力輸送,“荷”指負載,“儲”指配儲能。通過將能源的生成、電網、電力負荷與儲能系統有機整合,旨在實現能源的高效利用並優化供需平衡。

“目前,電網存在像閃斷、跌落等問題,數據中心需要配備UPS保證可靠性,‘源網荷儲’通過將新能源併入電網,有效補充電力供應,提升系統穩定性。同時由於綠電的引入,降低了整體數據中心的用電成本,推動雙碳目標的實現。”曙光數創產品部高級總監黃元峰博士解釋稱,新能源發電存在隨機性和不穩定性挑戰,而數據中心“源網荷儲”一體化則有效解決了兩個關鍵性問題。

通過源源互補、源網協調、網荷互動、網儲互動和源荷互動等多種交互形式,“源網荷儲”一體化能夠顯著提升電力系統的功率動態平衡能力,爲智算中心提供經濟、高效、安全的能源解決方案。

此外,智能化預測與調度能夠大幅減少儲能系統的建設規模,合理的分配風電光伏、儲能系統、電網之間的電力採用比例,同時決策對本地的算力設備、製冷設備、輔助設備的功率如何調節,實現“源、網、荷、儲”的精準匹配。

“隨着智算中心建設的加速,電力消耗將不斷攀升,PUE和雙碳目標的實現面臨挑戰。“源網荷儲”這一高效節能方案,可以有效化解兩者之間的矛盾,推動綠色低碳發展的落實。”黃元峰說。