在當前“東數(shù)西算”時代背景下,隨著云計算、大數(shù)據、人工智能等信息技術的快速發(fā)展,數(shù)據呈現(xiàn)幾何級增長,作為“動力源”的數(shù)據中心,其計算、存儲和網絡資源的性能不斷提升,密度也在不斷變大,隨之而來的是單位空間內功耗的增加;而在節(jié)能減排需求的驅動下,通信領域對數(shù)據中心節(jié)能降耗的要求越來越嚴格。
算力的增長帶來硬件能耗的攀升,在保證算力運轉的前提下,只有通過降低數(shù)據中心輔助能源的消耗,才能達成節(jié)能目標下的PUE(Power Usage Effectiveness)要求。典型數(shù)據中心制冷系統(tǒng)能耗占比達到24%以上,是數(shù)據中心輔助能源中占比最高的部分,因此,降低制冷系統(tǒng)能耗能夠極大促進PUE的降低。
液冷技術是中興通訊打造極致PUE、助力綠色數(shù)據中心的關鍵路徑之一。中興通訊已推出全液冷系統(tǒng)解決方案,由室外冷源、液冷服務器機柜、CDU(Coolant Distribution Unit)、EDU(External cooling system Distribution Unit)四部分組成(見圖1)。
圖1 液冷系統(tǒng)架構
整個系統(tǒng)包含兩個熱量傳遞路徑:其一,液冷服務器內主要發(fā)熱元件產生的熱量經液冷板傳遞給二次側工質,二次側工質在二次側水泵的驅動下進入板式換熱器,換熱器內二次側工質將熱量傳遞給一次側工質,一次側工質在一次側水泵的驅動下進入閉式冷卻塔,在冷卻塔內一次側工質與室外空氣進行換熱,完成散熱循環(huán);其二,室內空氣在風機的驅動下帶走液冷服務器內次要發(fā)熱元件產生的熱量,之后空氣經過液冷背門將熱量傳遞給一次側工質,一次側工質在一次側水泵的驅動下進入閉式冷卻塔,在冷卻塔內一次側工質與室外空氣進行換熱,完成散熱循環(huán)。
中興通訊自研高性能液冷服務器采用雙路Intel XEON高性能CPU、32根內存條,可應用于大規(guī)模數(shù)據計算與存儲場景,關鍵部件包含:液冷工質、液冷板、流體連接器、液冷管路以及漏液檢測裝置等。
液冷工質
二次側液冷工質是IT液冷方案設計中首先需要確定的部分,直接影響液冷系統(tǒng)的設計方案、工作環(huán)境、可靠性、維護方式等。選型過程中需要考慮工質熱物性(密度、粘度、比容、導熱系數(shù)等)、兼容性(金屬、非金屬)、成本和可獲取性等多種因素的綜合影響。中興通訊液冷服務器選用了水基溶液,如去離子水、乙二醇水溶液、丙二醇水溶液等,并配合具有一定緩蝕、殺菌、阻垢功能的化學藥劑使用,在保證可靠性的同時,兼具高性價比。
液冷板
服務器液冷板設計需滿足定制化和通用性,首先液冷板設計需要根據單板芯片和芯片布局進行芯片冷板和管路布局設計,具有一定的定制化特性,其次在定制化結構設計中應盡量保證內部零件的通用性,如芯片冷板內部流道、外形尺寸,以及液冷板進出口組件結構盡可能一致,以降低成本。液冷板的選型還需要結合實際功耗、工作壓力、流速等條件,綜合考慮冷板材質、工藝等。
同時,為了提升節(jié)能效果,IT設備應盡可能提高冷板板式液冷占比。中興通訊自研液冷服務器支持不同的液冷解決方案,如CPU液冷、CPU+內存條液冷,以及CPU+內存條散熱+VR液冷,冷板液冷占比最高可達80%以上,滿足不同的制冷需求。
流體連接器
流體連接器主要用于液冷散熱系統(tǒng)環(huán)路中各部件間的快速連接和斷開。選型要點包括工作流量、溫度、壓力、介質、殼體材料、流阻特性、顏色標識、安裝方式、接口形式等多方面因素。現(xiàn)階段,中興通訊自研液冷服務器產品選擇了業(yè)界主流的UQD(Universal Quick Disconnect)系列流體連接器,促進行業(yè)標準化進程,滿足最終用戶兼容替代需求。
分液器
分液器安裝在IT設備液冷機柜內,起到流量分配作用,將系統(tǒng)的循環(huán)工質分配到各個IT設備節(jié)點,在液冷板內換熱后將熱量帶出到主水管路。其設計選型需要考慮流量分配一致性,并根據結構空間、充注量和機柜總重量綜合考慮分液器的體積。
液冷軟管
液冷管路是循環(huán)工質流通通路,參與整個液冷系統(tǒng)的流量-流阻分配,同時為外接液冷設備提供簡便的轉接接口。液冷管路選型需要考慮材料兼容性、流速、管路布置、安裝方式、流量分配設計以及可靠性方面的要求。
漏液檢測裝置
漏液檢測采用節(jié)點級和整柜級智能監(jiān)控漏液檢測技術,及時告警,快速處理。主板提供了液冷方案漏液偵測接口,可快速識別泄漏情況,提供漏液檢測秒級精細化告警,并支持應急下電動作。
液冷技術實現(xiàn)全年自然冷卻,除制冷系統(tǒng)自身的能耗降低外,采用液冷散熱技術有利于進一步降低芯片溫度,帶來更高的可靠性和更低的能耗,整機能耗預計可降低約5%。液冷數(shù)據中心PUE可降至1.2以下,每年可節(jié)省大量電費,在確?!皷|數(shù)西算”數(shù)據運輸“大動脈”的暢通和高效前提下,更加綠色節(jié)能。
作者:中興通訊 范皓龍