近日,浙江聯(lián)通聯(lián)合中國聯(lián)通研究院、聯(lián)通服裝制造軍團(tuán)、產(chǎn)業(yè)鏈各方協(xié)同攻關(guān),針對AI敏感數(shù)據(jù)的本地存儲異地訓(xùn)練需求提出了創(chuàng)新的業(yè)務(wù)模式,并成功在金華聯(lián)通浙中人工智能算力中心與杭州聯(lián)通存儲集群間實施了業(yè)界首次30TB樣本數(shù)據(jù)的跨200公里存算分離拉遠(yuǎn)訓(xùn)練,經(jīng)過實際測算,訓(xùn)練效率高達(dá)97%以上。通過本次測試充分驗證了存算分離技術(shù)的安全性、可行性和高效性,為未來AI技術(shù)的發(fā)展提供了新的思路和方向。
當(dāng)前,AI智算需求旺盛,海量樣本數(shù)據(jù)處理過程中存在兩大挑戰(zhàn):一是數(shù)據(jù)多存儲于企業(yè)端,部分安全性要求較高的數(shù)據(jù)不便外遷;二是樣本數(shù)據(jù)量激增,AI智算中心在具備強(qiáng)大算力的同時,還需額外配備存儲資源,顯著提升了建設(shè)成本。在此背景下,業(yè)內(nèi)對實現(xiàn)“存算分離拉遠(yuǎn)、樣本隨訓(xùn)隨拉”需求迫切。
作為“數(shù)字信息運營服務(wù)國家隊,數(shù)字技術(shù)融合創(chuàng)新排頭兵”,中國聯(lián)通針對該需求積極開展智算互聯(lián)網(wǎng)體系架構(gòu)、關(guān)鍵技術(shù)和相關(guān)場景研究,提出了存算分離的創(chuàng)新服務(wù)模式。本次測試實現(xiàn)了多項算網(wǎng)創(chuàng)新“黑科技”:長距RDMA廣域無損技術(shù),支持百公里到千公里覆蓋范圍的RDMA遠(yuǎn)距離、高吞吐無損傳輸;精準(zhǔn)流控技術(shù)可實現(xiàn)租戶級流控,保證租戶間業(yè)務(wù)隔離,計算效率不損失;拉遠(yuǎn)場景下存儲讀寫性能優(yōu)化,通過采用多線程處理、增強(qiáng)并發(fā)能力以及系統(tǒng)級的優(yōu)化等措施,將分布式存儲文件系統(tǒng)在拉遠(yuǎn)場景中的文件讀/寫性能提升超過5倍,從而滿足了NLP模型和CV模型在拉遠(yuǎn)訓(xùn)練中的需求。
在聯(lián)通服裝制造軍團(tuán)“衣瞳行業(yè)模型”訓(xùn)練場景中,原始數(shù)據(jù)主要基于服裝多模態(tài)數(shù)據(jù),服裝生產(chǎn)廠家使用“衣瞳行業(yè)模型”可實現(xiàn)實時檢測,但是很多服裝廠家的服裝數(shù)據(jù)需要產(chǎn)權(quán)保護(hù)不愿公開,而基于存算分離的創(chuàng)新訓(xùn)練模式,剛好完美契合了用戶需求。
本次存算拉遠(yuǎn)測試驗證的主要特色包括:
第一,以跨地市AI大模型訓(xùn)練能力創(chuàng)新重構(gòu)智算訓(xùn)練模式。傳統(tǒng)的智算集中訓(xùn)練模式,需要用戶將樣本上傳到智算中心進(jìn)行落盤訓(xùn)練,但是部分用戶對隱私樣本落盤存在安全顧慮。浙江聯(lián)通通過IP廣域無損方案,實現(xiàn)了杭州存、金華訓(xùn)的“數(shù)據(jù)不落盤”拉遠(yuǎn)訓(xùn)練,以算網(wǎng)協(xié)同的能力,為企業(yè)用戶隱私樣本訓(xùn)練探索出了一條新路。
第二,樣本數(shù)據(jù)總量達(dá)30TB,傳輸距離超200公里,計算拉遠(yuǎn)效率大于97%。通過聯(lián)通服裝制造軍團(tuán)“衣瞳行業(yè)模型”的AI訓(xùn)練存算分離現(xiàn)網(wǎng)測試。充分驗證了針對AI訓(xùn)練業(yè)務(wù)存算拉遠(yuǎn)的技術(shù)可行性,未來有相關(guān)數(shù)據(jù)敏感業(yè)務(wù)需求的用戶可通過運營商算力服務(wù),完成隱私樣本不出園區(qū)的拉遠(yuǎn)訓(xùn)練,實現(xiàn)成本與安全的最佳平衡。
浙江聯(lián)通網(wǎng)絡(luò)部(科技創(chuàng)新部)總經(jīng)理湯瀅琪表示,浙江聯(lián)通將加速推進(jìn)數(shù)字融合,持續(xù)助力傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級,特別是打造“高通量、高性能、高智能”的算力智聯(lián)網(wǎng)AINet,積極探索彈性帶寬、任務(wù)式服務(wù)、數(shù)據(jù)快遞、無損傳輸?shù)葎?chuàng)新服務(wù)模式。
面向未來,中國聯(lián)通將持續(xù)深耕算網(wǎng)技術(shù)創(chuàng)新,通過算力智聯(lián)網(wǎng)研發(fā)建設(shè),推進(jìn)網(wǎng)絡(luò)向新、技術(shù)向新、服務(wù)向新,持續(xù)提供領(lǐng)先的聯(lián)網(wǎng)通信和算網(wǎng)數(shù)智產(chǎn)品,加速推動以算力和數(shù)據(jù)為核心的新質(zhì)生產(chǎn)力發(fā)展,賦能千行百業(yè)的數(shù)字化轉(zhuǎn)型升級。