C114訊 3月24日消息(苡臻)當(dāng)人工智能的浪潮席卷全球,算力需求正以超摩爾定律的速度狂飆突進(jìn)。數(shù)據(jù)中心作為算力的核心承載單元,其發(fā)展態(tài)勢(shì)深刻影響著各行業(yè)的數(shù)字化進(jìn)程。
近日,在“算電協(xié)同綠色發(fā)展及應(yīng)用跨行業(yè)生態(tài)論壇”期間,中國(guó)石油天然氣股份有限公司勘探開發(fā)研究院數(shù)據(jù)中心專家、高級(jí)工程師于慶友在接受C114等媒體采訪時(shí),針對(duì)當(dāng)前算力激增背景下,數(shù)據(jù)中心領(lǐng)域一系列新動(dòng)態(tài),展開了深入且獨(dú)到的解讀。
算力浪潮下 數(shù)據(jù)中心現(xiàn)狀
隨著人工智能產(chǎn)業(yè)的發(fā)展,智能化成為算力快速增長(zhǎng)的驅(qū)動(dòng)力,數(shù)據(jù)中心、智算中心等多種算力相互融合協(xié)同趨勢(shì)明顯。至2024年底,我國(guó)智算規(guī)模快速發(fā)展,近三年年均增速達(dá)到55%。
于慶友表示,當(dāng)前,數(shù)據(jù)中心、智算中心建設(shè)呈綠色化、高密化、協(xié)同化的發(fā)展趨勢(shì)。
按工信部要求,到2025年全國(guó)新建大型、超大型數(shù)據(jù)中心、智算中心電能利用效率(PUE)應(yīng)降到1.3以下,液冷和風(fēng)液結(jié)合將成為主流趨勢(shì);同時(shí)數(shù)據(jù)中心每5年功率密度提升1倍,10KW、20KW、40KW機(jī)柜將逐漸成為主流趨勢(shì);隨著工業(yè)互聯(lián)網(wǎng)應(yīng)用,人工智能訓(xùn)練推理場(chǎng)景聯(lián)動(dòng),數(shù)據(jù)中心呈現(xiàn)集團(tuán)-邊緣多級(jí)、協(xié)同聯(lián)動(dòng)。
另外,網(wǎng)絡(luò)系統(tǒng)方面,呈現(xiàn)用戶帶寬需求劇增、網(wǎng)絡(luò)質(zhì)量快速提升、光纖容量大幅增加的發(fā)展趨勢(shì)。2000-2023年,用戶接入帶寬從傳統(tǒng)互聯(lián)網(wǎng)5M發(fā)展至移動(dòng)互聯(lián)網(wǎng)500M、再至人工智能時(shí)代10G,網(wǎng)絡(luò)帶寬需求增長(zhǎng)2000倍。
目前,網(wǎng)絡(luò)質(zhì)量呈現(xiàn)更高網(wǎng)絡(luò)可靠性、更低轉(zhuǎn)發(fā)時(shí)延、更快接入效率的趨勢(shì)。數(shù)據(jù)傳輸技術(shù)不斷發(fā)展,商用單波速率從100G至400G快速發(fā)展,單光纖容量經(jīng)過(guò)40年發(fā)展容量提升200萬(wàn)倍。
設(shè)備設(shè)施方面,算力體系設(shè)備設(shè)施含IT設(shè)備(信息技術(shù)設(shè)備)和基礎(chǔ)設(shè)施(數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)施)兩類。IT設(shè)備主要指服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)等設(shè)備,基礎(chǔ)設(shè)施主要指電氣、暖通、空調(diào)等設(shè)施。
根據(jù)“設(shè)備設(shè)施浴盆曲線”,IT設(shè)備使用超過(guò)6年、基礎(chǔ)設(shè)施使用超過(guò)8年,故障率指數(shù)級(jí)增長(zhǎng)、運(yùn)行風(fēng)險(xiǎn)劇增、運(yùn)維服務(wù)費(fèi)用高企。業(yè)界IT設(shè)備更新周期為5至8年(其中互聯(lián)網(wǎng)企業(yè)為3至5年),基礎(chǔ)設(shè)施更新周期為7至15年,亟需進(jìn)行設(shè)備更新。
數(shù)據(jù)中心新趨勢(shì)與應(yīng)對(duì)之策
近年來(lái),隨著智算及超算的發(fā)展,數(shù)據(jù)中心對(duì)設(shè)備功率的要求顯著增加,這對(duì)網(wǎng)絡(luò)、供電穩(wěn)定性和連續(xù)性、以及制冷環(huán)境等提出了新的挑戰(zhàn)。
于慶友指出,為提高數(shù)據(jù)中心、智算中心基礎(chǔ)設(shè)施可靠性,通常根據(jù)建設(shè)等級(jí)要求選用容錯(cuò)或冗余配置方式提高網(wǎng)絡(luò)、供配電、空調(diào)等系統(tǒng)可靠性,
例如,網(wǎng)絡(luò)需有2~3個(gè)運(yùn)營(yíng)商提供保障,且應(yīng)避免布置在同一物理空間內(nèi)以防發(fā)生意外中斷。供配電系統(tǒng)需要根據(jù)建設(shè)等級(jí)、安裝容量、用途重要性等選用容錯(cuò)或冗余配置的供電方式,提高系統(tǒng)的可靠性;合理配備柴油發(fā)電機(jī)系統(tǒng)或其他應(yīng)急電源。充分利用可再生能源和儲(chǔ)能策略可有效降低運(yùn)行能耗。
他指出,在低碳背景下,數(shù)據(jù)中心應(yīng)利用外部自然冷卻、使用可再生能源,如風(fēng)能、光伏、潮汐能等,以降低 PUE值和WUE值,減少碳排放。
此外,從冷卻技術(shù)層面看,主要有風(fēng)冷、液冷和風(fēng)液混合配置。“目前,大部分企事業(yè)單位的數(shù)據(jù)中心主要還是以風(fēng)冷為主,但液冷在市場(chǎng)中的份額正迅速增加,未來(lái)液冷的比例將高于風(fēng)冷,根據(jù)不同需求風(fēng)冷與液冷混合配置將是一大趨勢(shì)。”
液冷技術(shù)是利用液體介質(zhì)與熱源直接或間接接觸進(jìn)行換熱,再由冷卻液體將熱量傳遞出去的冷卻技術(shù)。液冷包括浸沒式、冷板式、噴淋式。其中,浸沒式液冷將服務(wù)器里面所有硬件直接浸泡在冷媒液體中,依靠流動(dòng)的冷媒液體吸收服務(wù)器的發(fā)熱量,浸沒式換熱效率高、運(yùn)行能耗低,但維修不便、推廣難度較大;冷板式液冷的冷卻液不與服務(wù)器元器件直接接觸,而是通過(guò)冷板間接對(duì)CPU和GPU進(jìn)行熱交換,換熱效率較高、安全風(fēng)險(xiǎn)較小、適用范圍廣目前業(yè)界使用最多;噴淋式目前有少數(shù)廠家在做,其對(duì)安全和可操作性要求高,實(shí)際應(yīng)用少。
采訪最后,于慶友還提到了數(shù)據(jù)中心標(biāo)準(zhǔn)制修定方面的工作。他指出,《數(shù)據(jù)中心設(shè)計(jì)規(guī)范》計(jì)劃于今年12月前完成重新修訂,目前正在參與編寫《算力設(shè)施工程技術(shù)標(biāo)準(zhǔn)》,預(yù)計(jì)明年6月前完成,后續(xù)還將對(duì)《數(shù)據(jù)中心基礎(chǔ)設(shè)施運(yùn)行維護(hù)標(biāo)準(zhǔn)》等相關(guān)標(biāo)準(zhǔn)進(jìn)行修訂。