C114通信網(wǎng)  |  通信人家園

 
2024/12/10 11:15

浙江聯(lián)通完成業(yè)界首例AI大模型30TB數(shù)據(jù) 跨200公里存算分離拉遠(yuǎn)訓(xùn)練

廠商供稿  

近日,浙江聯(lián)通聯(lián)合中國聯(lián)通研究院、聯(lián)通服裝制造軍團(tuán)、產(chǎn)業(yè)鏈各方協(xié)同攻關(guān),針對AI敏感數(shù)據(jù)的本地存儲異地訓(xùn)練需求提出了創(chuàng)新的業(yè)務(wù)模式,并成功在金華聯(lián)通浙中人工智能算力中心與杭州聯(lián)通存儲集群間實施了業(yè)界首次30TB樣本數(shù)據(jù)的跨200公里存算分離拉遠(yuǎn)訓(xùn)練,經(jīng)過實際測算,訓(xùn)練效率高達(dá)97%以上。通過本次測試充分驗證了存算分離技術(shù)的安全性、可行性和高效性,為未來AI技術(shù)的發(fā)展提供了新的思路和方向。

當(dāng)前,AI智算需求旺盛,海量樣本數(shù)據(jù)處理過程中存在兩大挑戰(zhàn):一是數(shù)據(jù)多存儲于企業(yè)端,部分安全性要求較高的數(shù)據(jù)不便外遷;二是樣本數(shù)據(jù)量激增,AI智算中心在具備強(qiáng)大算力的同時,還需額外配備存儲資源,顯著提升了建設(shè)成本。在此背景下,業(yè)內(nèi)對實現(xiàn)“存算分離拉遠(yuǎn)、樣本隨訓(xùn)隨拉”需求迫切。

作為“數(shù)字信息運營服務(wù)國家隊,數(shù)字技術(shù)融合創(chuàng)新排頭兵”,中國聯(lián)通針對該需求積極開展智算互聯(lián)網(wǎng)體系架構(gòu)、關(guān)鍵技術(shù)和相關(guān)場景研究,提出了存算分離的創(chuàng)新服務(wù)模式。本次測試實現(xiàn)了多項算網(wǎng)創(chuàng)新“黑科技”:長距RDMA廣域無損技術(shù),支持百公里到千公里覆蓋范圍的RDMA遠(yuǎn)距離、高吞吐無損傳輸;精準(zhǔn)流控技術(shù)可實現(xiàn)租戶級流控,保證租戶間業(yè)務(wù)隔離,計算效率不損失;拉遠(yuǎn)場景下存儲讀寫性能優(yōu)化,通過采用多線程處理、增強(qiáng)并發(fā)能力以及系統(tǒng)級的優(yōu)化等措施,將分布式存儲文件系統(tǒng)在拉遠(yuǎn)場景中的文件讀/寫性能提升超過5倍,從而滿足了NLP模型和CV模型在拉遠(yuǎn)訓(xùn)練中的需求。

在聯(lián)通服裝制造軍團(tuán)“衣瞳行業(yè)模型”訓(xùn)練場景中,原始數(shù)據(jù)主要基于服裝多模態(tài)數(shù)據(jù),服裝生產(chǎn)廠家使用“衣瞳行業(yè)模型”可實現(xiàn)實時檢測,但是很多服裝廠家的服裝數(shù)據(jù)需要產(chǎn)權(quán)保護(hù)不愿公開,而基于存算分離的創(chuàng)新訓(xùn)練模式,剛好完美契合了用戶需求。

本次存算拉遠(yuǎn)測試驗證的主要特色包括:

第一,以跨地市AI大模型訓(xùn)練能力創(chuàng)新重構(gòu)智算訓(xùn)練模式。傳統(tǒng)的智算集中訓(xùn)練模式,需要用戶將樣本上傳到智算中心進(jìn)行落盤訓(xùn)練,但是部分用戶對隱私樣本落盤存在安全顧慮。浙江聯(lián)通通過IP廣域無損方案,實現(xiàn)了杭州存、金華訓(xùn)的“數(shù)據(jù)不落盤”拉遠(yuǎn)訓(xùn)練,以算網(wǎng)協(xié)同的能力,為企業(yè)用戶隱私樣本訓(xùn)練探索出了一條新路。

第二,樣本數(shù)據(jù)總量達(dá)30TB,傳輸距離超200公里,計算拉遠(yuǎn)效率大于97%。通過聯(lián)通服裝制造軍團(tuán)“衣瞳行業(yè)模型”的AI訓(xùn)練存算分離現(xiàn)網(wǎng)測試。充分驗證了針對AI訓(xùn)練業(yè)務(wù)存算拉遠(yuǎn)的技術(shù)可行性,未來有相關(guān)數(shù)據(jù)敏感業(yè)務(wù)需求的用戶可通過運營商算力服務(wù),完成隱私樣本不出園區(qū)的拉遠(yuǎn)訓(xùn)練,實現(xiàn)成本與安全的最佳平衡。

浙江聯(lián)通網(wǎng)絡(luò)部(科技創(chuàng)新部)總經(jīng)理湯瀅琪表示,浙江聯(lián)通將加速推進(jìn)數(shù)字融合,持續(xù)助力傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級,特別是打造“高通量、高性能、高智能”的算力智聯(lián)網(wǎng)AINet,積極探索彈性帶寬、任務(wù)式服務(wù)、數(shù)據(jù)快遞、無損傳輸?shù)葎?chuàng)新服務(wù)模式。

面向未來,中國聯(lián)通將持續(xù)深耕算網(wǎng)技術(shù)創(chuàng)新,通過算力智聯(lián)網(wǎng)研發(fā)建設(shè),推進(jìn)網(wǎng)絡(luò)向新、技術(shù)向新、服務(wù)向新,持續(xù)提供領(lǐng)先的聯(lián)網(wǎng)通信和算網(wǎng)數(shù)智產(chǎn)品,加速推動以算力和數(shù)據(jù)為核心的新質(zhì)生產(chǎn)力發(fā)展,賦能千行百業(yè)的數(shù)字化轉(zhuǎn)型升級。

給作者點贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個人觀點,與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報電話:021-54451141