《科技》資料中心「液冷」散熱高門檻 沒有真本事難吃到(3-2)
目前液冷散熱有兩種方式在競爭,一種是Open Loop Rack(開放回路式機櫃水冷),也就是大型資料庫中心成千上百臺立式機櫃(Rack),每臺立式機櫃透過核心設備CDU(流量控制單元)將冷卻液體供應到每一層伺服器對半導體晶片進行冷卻,讓水在一個個機櫃(Rack)中形成內循環,將熱量帶走變成熱液體,再連結回到CDU將熱量移轉到大型資料中心廠區外部循環管路散熱;但Open Loop Rack挑戰來自於漏水問題,不只是在伺服器內部,甚至有可能是整個機房,此外,即使可以去除CPU的熱,伺服器其他零組件的熱還是需要透過風冷來排除,PUE能否降到低於1.3是另一個關鍵。
另一種散熱方式爲immersion Liquid cooling(浸沒式散熱),浸沒式散熱大致可分爲「單相」及「兩相」兩種方式,其中「單相浸沒式」是將Rack立式機櫃變成Tank(腔體)臥式機櫃放進介電液冷桶,伺服器上半導體晶片直接把熱源傳遞給介電液,再傳遞到外部循環管路散熱,每一層伺服器都透過類似「泡冷泉」概念來進行浸泡式液冷散熱;「兩相浸沒式」方案中,低沸點的冷卻液吸收熱量後會蒸發爲氣體,上升至密封槽蓋或冷凝圈,再凝結爲液體返回冷卻液中。
就兩種液冷散熱方式來看,Open Loop Rack Liquid cooling優點是可以透過感測器快速精準反應某個機櫃溫度變化,再借由CDU液冷內循環適時調整液體供應量和溫度調節晶片散熱,而浸泡式則是均溫的概念。
臺達電表示,浸沒式散熱以冷卻液取代風扇降溫,無噪音且隔絕粉塵,浸沒式冷卻PUE值可以達到低於1.1,大幅減少資料中心的非運算能耗,不過在技術上,因爲浸沒式電源需要長時間浸泡在冷卻液中運作,電源本身在防護力的設計上需要特別注意,目前整體成本也較高,以客製化專案爲主,此外,浸沒式又分爲單相和兩相,兩相浸沒式的散熱效率更好,但技術門檻也更高。雙鴻表示,液冷散熱可靠度很重要,其中浸沒式散熱除了不能滲漏,如何降低水冷液對零組件的腐蝕性也是問題,至於Open Loop Rack liquid cooling優點是可以即時把熱傳出去,但整個系統設計很複雜,需要具備各系統專業知識及整合能力。
在均熱片方面,由於均熱片的金屬材料包括:銅合金、鋁材、鋁矽碳及不鏽鋼等,每種金屬材料傳熱速度不一,均熱片廠須依晶片客戶熱導需求(即每小時要導多少熱)選擇材質,且因均熱片須與CPU完全貼合才能均勻導熱,不僅平坦度很重要,也因要與CPU一起封裝,而各家晶片廠又有特殊的封裝需求,致使均熱片成爲高度客製化的產品。新一代伺服器平臺因放入更大晶片及更多被動元件,基板變大,散熱要求更高,均熱片尺寸較前一代更大、更厚,設計複雜度高,尺寸公差控制必須更精準,「高精密鍛造」生產技術門檻非常高,如何讓均熱片從冷間鍛造、衝壓成型、CNC加工成型、電鍍鍍鎳(金)/化學鍍鎳、黑化處理/塗膠處理,到陽極處理/鈍化處理大量生產時維持相同品質、符合客戶要求成爲均熱片廠最大考驗。除生產技術門檻甚高,由於高階產品使用的鍛造機每臺動輒數千萬元,成爲廠商跨足擴產另一個門檻!此外,針對大尺寸HPC封裝,均熱片廠亦投入研發新一代均熱片,希望減少界面熱阻,更有效快速將熱點均勻散開,進一步提高晶片運算效能,被視爲3到10年內封裝散熱解決方案之一。(3-2)