近期,中國移動在北京、重慶、湖北、青海、浙江、內蒙及福建七省市順利完成業(yè)界首批IP網(wǎng)絡智算互聯(lián)關鍵技術現(xiàn)網(wǎng)試點。
近年來,隨著生成式人工智能(artificial intelligence generated content,AIGC)大模型和智能計算應用的高速發(fā)展,對于智算企業(yè)到智算中心間大規(guī)模數(shù)據(jù)的傳輸、異地計算、存儲和處理需求日益增加,主要涵蓋存算分離、樣本數(shù)據(jù)上傳、分布式訓練、推理下發(fā)這四大場景,其流量特征表現(xiàn)為大規(guī)模、周期性、大突發(fā)、高并發(fā)的“大象流”,對網(wǎng)絡造成巨大沖擊,IP廣域網(wǎng)面臨負載不均,擁塞丟包,帶寬資源無法充分利用等問題。為解決上述問題,中國移動在“MATRIXES”技術體系下,提出面向企業(yè)入算場景的微流級負載均衡、分時分網(wǎng)調度、精準擁塞控制三大關鍵技術,本次試點對其進行了充分的實踐和驗證,對構建大運力、低時延、無阻塞的新一代IP智算互聯(lián)網(wǎng)絡具有重大參考和指導意義。
微流級負載均衡:通過新一代的負載均衡技術,將大突發(fā)高并發(fā)的大象流數(shù)據(jù)分擔到多個SRv6 Segmelist網(wǎng)絡路徑上,解決傳統(tǒng)網(wǎng)絡設備負載分擔不均的問題,在確保數(shù)據(jù)傳輸完整性的同時,有效降低網(wǎng)絡擁堵現(xiàn)象,極大提升了網(wǎng)絡的吞吐量和傳輸速度。
分時分網(wǎng)調度:為應對智算業(yè)務高并發(fā)大象流的大帶寬傳輸需求,充分利用網(wǎng)絡空閑帶寬資源,分時分網(wǎng)調度技術,基于對網(wǎng)絡運力的預測和管理,結合網(wǎng)絡帶寬的時空變化規(guī)律,通過靈活調整路徑編排策略,對流量進行動態(tài)調度,為用戶提供可敏捷彈性擴縮的運力服務,從而實現(xiàn)更高效的網(wǎng)絡資源利用。
精準擁塞控制:為解決智算中心間互聯(lián)場景擁塞丟包導致業(yè)務性能下降的問題,通過精準擁塞控制技術突破,實現(xiàn)網(wǎng)絡擁塞提前發(fā)現(xiàn)、主動調整、擁塞范圍不擴散等,從而有效控制擁塞。
本次現(xiàn)網(wǎng)試點工作由中國移動集團計劃建設部牽頭,中國移動研究院、設計院負責整體技術方案制定,中國移動集團網(wǎng)絡事業(yè)部、7省公司、云能力中心負責技術驗證工作。試點基于中國移動云專網(wǎng)架構與新平臺路由器設備開展創(chuàng)新,實現(xiàn)了智算中心側400G大象流在IP廣域網(wǎng)100G 鏈路中的高效傳輸,不同網(wǎng)絡路徑的負載均衡精度控制在5%以內,帶寬利用率從60%提升到90%,完全達到試點驗證目標。
展望未來,中國移動將繼續(xù)與產業(yè)各方緊密攜手、開拓創(chuàng)新,共同推動 IP 網(wǎng)絡智算互聯(lián)技術不斷發(fā)展演進,在超寬管道、低時延加密、主動擁塞避免等方面進一步深入探索研究,助力構建超越連接、突破性能、極低時延的智算互聯(lián)IP網(wǎng)絡,實現(xiàn)以網(wǎng)強算、以網(wǎng)促算,為 AI 智算業(yè)務的蓬勃發(fā)展注入新動能,為國家數(shù)字經濟發(fā)展貢獻堅實力量。