C114通信網(wǎng)  |  通信人家園

資訊
2024/9/20 15:51

開放兼容,聯(lián)合創(chuàng)新:新華三加速LPO規(guī)模商用

C114通信網(wǎng)  水易

C114訊 9月20日消息(水易)大模型訓(xùn)練需要大算力的支撐,GPU性能迭代也隨之加速。即便如此,單片GPU的性能永遠(yuǎn)無(wú)法跟上大模型的需求,智算集群成為必選項(xiàng),千卡已是常態(tài),萬(wàn)卡如火如荼,十萬(wàn)卡成為目標(biāo)。同時(shí),為充分發(fā)揮每一分算力的效能,智算網(wǎng)絡(luò)的技術(shù)演進(jìn)成為關(guān)鍵。

這一輪智算網(wǎng)絡(luò)建設(shè),為滿足大模型更大數(shù)據(jù)量、更快速度的計(jì)算任務(wù),更高端口速率和交換容量的交換機(jī)成為剛需,隨之也帶來(lái)了能耗挑戰(zhàn)。目前已有專家指出,以電力為代表的能源可能成為掣肘智算中心建設(shè)的瓶頸。

數(shù)據(jù)顯示,在網(wǎng)絡(luò)設(shè)備中,以光模塊為代表的關(guān)鍵器件是能耗大戶,為了實(shí)現(xiàn)高速傳輸與低功耗之間的平衡,LPO等光互連技術(shù)受到重視,已經(jīng)有頭部互聯(lián)網(wǎng)企業(yè)開始試點(diǎn)部署,展現(xiàn)了良好的光鏈路性能。

作為致力于推動(dòng)標(biāo)準(zhǔn)化聯(lián)接促進(jìn)智算網(wǎng)絡(luò)創(chuàng)新的“領(lǐng)頭羊”,新華三基于400G智算交換機(jī)與十余家模塊廠商的DSP&LPO模塊現(xiàn)場(chǎng)互聯(lián)測(cè)試,良好的測(cè)試結(jié)果充分體現(xiàn)了新華三智算交換機(jī)的穩(wěn)定性與兼容性,基于光互連技術(shù)為智算網(wǎng)絡(luò)建設(shè)提速、降耗,全面賦能AI產(chǎn)業(yè)高速發(fā)展。

聯(lián)調(diào):促進(jìn)LPO技術(shù)驗(yàn)證

從光模塊的技術(shù)演進(jìn)來(lái)看,隨著速率的不斷提升,為確保信號(hào)在傳輸過(guò)程中的準(zhǔn)確性和可靠性,業(yè)界通過(guò)引入DSP芯片,對(duì)本端/多端的交換機(jī)電信號(hào)進(jìn)行整形重塑,降低誤碼率。因此在高速光模塊內(nèi)部,DSP一直是必備器件。

不過(guò),DSP的不足之處就是成本高、功耗大,統(tǒng)計(jì)顯示,傳統(tǒng)DSP芯片方案會(huì)占模塊50%以上的功耗。光模塊速率的不斷提升,功耗也會(huì)數(shù)量級(jí)的攀升,對(duì)智算中心帶來(lái)極大的技術(shù)挑戰(zhàn),也與綠色低碳的發(fā)展理念相悖。

如何降低光模塊功耗,最直接的手段就是去掉或減少DSP在光模塊內(nèi)部的使用。LPO去掉了傳統(tǒng)DSP模塊中的DSP芯片,利用交換機(jī)芯片進(jìn)行電信號(hào)的處理。同時(shí),LPO仍然保持可插拔模塊形態(tài),可重用現(xiàn)有成熟的部分光模塊產(chǎn)業(yè)鏈,最大限度的實(shí)現(xiàn)低功耗、低時(shí)延、低成本和高可靠。

綜合來(lái)看,LPO是一個(gè)綠色節(jié)能的技術(shù),業(yè)界也認(rèn)為400G/800G周期的下一波需求將會(huì)是LPO,解決的重點(diǎn)就是功耗挑戰(zhàn)。不過(guò),真正落地還有一系列的挑戰(zhàn),首先是標(biāo)準(zhǔn),LPO由于無(wú)DSP,互操作性存在挑戰(zhàn),目前產(chǎn)業(yè)界已經(jīng)發(fā)起LPO MSA,建立相關(guān)標(biāo)準(zhǔn)規(guī)范。

更為重要的是如何確保以上提到的效果能實(shí)現(xiàn)。今年的CIOE中國(guó)光博會(huì)期間,某頭部測(cè)試測(cè)量廠商在接受C114專訪時(shí)談到,LPO將光模塊DSP拿掉之后,將會(huì)強(qiáng)烈依賴交換機(jī)芯片SerDes,這對(duì)測(cè)試策略產(chǎn)生巨大的影響,LPO如何對(duì)標(biāo)交換機(jī)的性能指標(biāo),是最大的挑戰(zhàn)。

新華三認(rèn)為,LPO模塊需要和設(shè)備聯(lián)合起來(lái),才能真正實(shí)現(xiàn)LPO所帶來(lái)的效果。新華三同鈞恒科技進(jìn)行聯(lián)合400G QSFP112 LPO開發(fā),通過(guò)模塊底層光電芯片合理選型、SI仿真優(yōu)化、系統(tǒng)級(jí)參數(shù)調(diào)優(yōu)、完善的測(cè)試策略,充分保證了LPO模塊與交換機(jī)的良好適配和快速部署。

兼容加速LPO規(guī)模商用

當(dāng)然,聯(lián)合開發(fā)并不意味著只能適配某一特定廠商的模塊。此次新華三作為設(shè)備廠商,同時(shí)跟十余家光模塊廠商完成了DSP&LPO模塊現(xiàn)場(chǎng)互聯(lián)測(cè)試,這是國(guó)內(nèi)第一次交換機(jī)設(shè)備與十多家光模塊的批量實(shí)測(cè),充分體現(xiàn)了新華三在生態(tài)合作方面的廣度。

值得一提的是,考慮到前文提到了聯(lián)合調(diào)優(yōu)的重要性,新華三還打造了多種智能軟件調(diào)優(yōu)方案,助力不同廠商的LPO模塊與新華三主機(jī)的適配調(diào)優(yōu),以實(shí)現(xiàn)更良好的兼容性,為不同端口走線的LPO模塊提供良好的電信號(hào)驅(qū)動(dòng)能力。

據(jù)了解,在本次DSP&LPO模塊互聯(lián)測(cè)試中,數(shù)據(jù)顯示不同廠商的LPO模塊在H3C S9827上的誤碼率均低于IEEE定義的門限要求,且經(jīng)過(guò)與主機(jī)適配調(diào)優(yōu)后的LPO模塊具有更好的性能參數(shù)、誤碼率更貼近DSP模塊,也進(jìn)一步說(shuō)明主機(jī)與LPO適配的重要性。

不止于此,新華三智算交換機(jī)的產(chǎn)品布局豐富,H3C S9827系列能夠?qū)崿F(xiàn)對(duì)各廠家的不同模塊規(guī)格(VR4、DR4等)、不同芯片方案(DSP、LPO)、不同激光器方案(EML、硅光)、多種應(yīng)用模式(一對(duì)一、一分二)的QSFP112模塊的類型讀取,可靈活智能識(shí)別端口模塊模式。

回頭看LPO技術(shù)的初衷,尋找高速傳輸與低功耗之間的平衡。更高速率在短期內(nèi)挑戰(zhàn)不大,難的是低功耗。目前業(yè)界對(duì)于綠色光互連技術(shù)探索主要從光模塊功耗、網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)以及系統(tǒng)散熱方案三方面入手。

LPO是業(yè)界對(duì)于降低光模塊功耗的探索,而從系統(tǒng)散熱的角度看,今年的CIOE中國(guó)光博會(huì)期間,C114也看到頭部光模塊廠商都推出了相應(yīng)的浸沒式液冷方案,多管齊下滿足智算中心低功耗的需求。

新華三積極探索與實(shí)踐多樣化的節(jié)能降耗策略,將綠色低碳理念融入交換機(jī)產(chǎn)品研發(fā)設(shè)計(jì)當(dāng)中,H3C S9827系列不僅支持全端口LPO可插拔模塊應(yīng)用,還具備風(fēng)冷液冷兼容設(shè)計(jì),通過(guò)LPO與液冷技術(shù)的融合,實(shí)現(xiàn)整機(jī)功耗降低25%~40%,滿足PUE≤1.14的要求。

開放踐行標(biāo)準(zhǔn)化聯(lián)接

回到文章開頭提到的智算網(wǎng)絡(luò)的創(chuàng)新變革,新華三始終倡導(dǎo)標(biāo)準(zhǔn)化聯(lián)接,創(chuàng)新性提出“算力×聯(lián)接”的理念,通過(guò)開放、標(biāo)準(zhǔn)的聯(lián)接技術(shù),構(gòu)建開放多元的智算生態(tài),滿足人工智能應(yīng)用對(duì)海量多元異構(gòu)算力的需求。

光模塊是其中智算網(wǎng)絡(luò)的“關(guān)鍵環(huán)節(jié)”之一,也是智算生態(tài)產(chǎn)業(yè)中的一環(huán),本次與十余家光模塊廠商的現(xiàn)場(chǎng)實(shí)測(cè),進(jìn)一步證明了新華三交換機(jī)具備標(biāo)準(zhǔn)開放的特性。另外,與鈞恒科技聯(lián)合研發(fā)的LPO模塊,其內(nèi)部的兼容設(shè)計(jì)允許多芯片方案并行開發(fā)和驗(yàn)證。

據(jù)悉,在追求高效率、高能效、低功耗的AI智算應(yīng)用的解決方案的道路上,新華三持續(xù)精進(jìn),在當(dāng)下趨于成熟化的400G LPO解決方案的火熱探討中,新華三也已具備800G LPO的高密智算交換機(jī),以前瞻性視角推動(dòng)智算網(wǎng)絡(luò)的發(fā)展。

除了創(chuàng)新的LPO交換機(jī)產(chǎn)品外,新華三打造的算力集群核心交換機(jī)H3C S12500 AI將傳統(tǒng)框式設(shè)備的控制引擎、交換網(wǎng)板、業(yè)務(wù)板卡分別獨(dú)立為盒式設(shè)備,通過(guò)高速光模塊互聯(lián),滿足靈活組網(wǎng)需求,斬獲第八屆未來(lái)網(wǎng)絡(luò)大會(huì)“創(chuàng)新科技成果獎(jiǎng)”殊榮。

與此同時(shí),新華三還推出了《智算網(wǎng)絡(luò)異構(gòu)連通專項(xiàng)測(cè)試》標(biāo)準(zhǔn),現(xiàn)已完成包括GPU、光模塊、網(wǎng)卡等在內(nèi)等全異構(gòu)硬件平臺(tái)連通性驗(yàn)證,以及不同技術(shù)方案間的聯(lián)調(diào)適配,進(jìn)一步推動(dòng)國(guó)內(nèi)智算產(chǎn)業(yè)的生態(tài)協(xié)作。

面向未來(lái),新華三也將持續(xù)與更多的光模塊廠商合作,打造開放市場(chǎng)生態(tài),共研高品質(zhì)模塊組件,為客戶提供從主機(jī)到互連組件的高可靠性、高穩(wěn)定性、高兼容性的全套方案產(chǎn)品,促進(jìn)光通信產(chǎn)業(yè)的發(fā)展,滿足人工智能應(yīng)用對(duì)算力的需求,為百行百業(yè)的數(shù)智發(fā)展注入強(qiáng)勁動(dòng)能。

給作者點(diǎn)贊
0 VS 0
寫得不太好

版權(quán)說(shuō)明:C114刊載的內(nèi)容,凡注明來(lái)源為“C114通信網(wǎng)”或“C114原創(chuàng)”皆屬C114版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來(lái)源。編譯類文章僅出于傳遞更多信息之目的,不代表證實(shí)其描述或贊同其觀點(diǎn);翻譯質(zhì)量問題請(qǐng)指正。

熱門文章
    最新視頻
    為您推薦

      C114簡(jiǎn)介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號(hào)

      C114 通信網(wǎng) 版權(quán)所有 舉報(bào)電話:021-54451141