4月9日至11日,2025中國移動云智算大會在蘇州金雞湖國際會議中心盛大開幕。中興通訊承載網(wǎng)產品副總經理李新雙受邀出席“云智算原創(chuàng)技術策源”論壇活動并發(fā)表《星云智算網(wǎng)絡,實現(xiàn)AI算力無界互聯(lián)》主題演講。演講聚焦AI算力網(wǎng)絡的技術革新與產業(yè)實踐,深入解讀中興星云智算網(wǎng)絡如何通過全調度以太網(wǎng)(GSE)技術解決DeepSeek 創(chuàng)新技術帶來的AI網(wǎng)絡的流量擁塞、流量均衡、時延等問題,助力中國移動構建“算力無界”的智算生態(tài)。
論壇上,李新雙參與了由中國移動主導的“智算互聯(lián)GSE產業(yè)鏈攻堅計劃”發(fā)布儀式,與產業(yè)鏈十余家合作伙伴共同啟動這一國家級技術攻關行動,標志著GSE技術從標準制定向產業(yè)落地邁出了關鍵一步。
AI普惠浪潮下的算力網(wǎng)絡挑戰(zhàn)
李新雙指出,以DeepSeek為代表的AI技術通過算法創(chuàng)新(如MoE混合專家架構、雙向流水線并行架構)實現(xiàn)了從“拼算力”到“拼算法”的跨越,推動AI應用成本大幅降低,但同時也對算力網(wǎng)絡提出了更高要求。他提到,在訓練場景中,DeepSeek模型因使用專家并行(EP,Expert Parallelism)技術導致的機間All-to-all通信流量翻倍,從而引發(fā)網(wǎng)絡擁塞增加;而推理場景中,PD分離的分布式處理對網(wǎng)絡時延提出了更高的要求。
星云智算網(wǎng)絡:GSE技術驅動無界互聯(lián)
針對上述挑戰(zhàn),中國移動與產業(yè)伙伴聯(lián)合研發(fā)了GSE技術。該技術針對流量均衡、流量擁塞、低時延的需求提出了創(chuàng)新的解決思路:
容器化負載均衡:將數(shù)據(jù)封裝為固定長度的“容器”均勻噴灑,鏈路利用率趨近100%,較傳統(tǒng)方案大幅提升;
主動流控機制:引入“CREDIT授權”模式,將流量推送變?yōu)榱髁坷。瑥母瓷媳苊舛啻蛞粨砣麊栴};
智能糾錯優(yōu)化:通過靈活前向糾錯(FlexFEC)技術動態(tài)適配鏈路誤碼率,在保證傳輸可靠性的同時減少糾錯時延。
中興星云智算網(wǎng)絡已通過軟件升級實現(xiàn)GSE E2E功能,并計劃在2025年推進現(xiàn)網(wǎng)驗證。此外,中興星云智算網(wǎng)絡方案的99X系列設備憑借60倍于盒式設備的緩存容量,可高效應對DeepSeek等模型高All-to-all流量場景,顯著提升突發(fā)流量吸收能力,降低網(wǎng)絡擁塞程度,是DeepSeek等模型的最佳網(wǎng)絡方案選擇。
GSE技術突破:從標準驗證到超大規(guī)模組網(wǎng)
“最終我們的目標是實現(xiàn)GSE N2N方案,不依賴于網(wǎng)卡、GPU能力,從網(wǎng)絡層面解決智算場景流量大、擁塞多等問題。這兩年,中國移動牽頭業(yè)界同仁一起發(fā)布了GSE標準并進行了相關能力驗證;下一步,我們將把驗證確認的技術固化到智算網(wǎng)絡方案中。”該GSE N2N方案兩層組網(wǎng)的情況下可鏈接2萬張400GE接口GPU卡,三層組網(wǎng)的情況可支持最大50萬卡以上集群互聯(lián),大大超車傳統(tǒng)ROCE技術的組網(wǎng)規(guī)模,為智算網(wǎng)絡提供高吞吐、全均衡、低時延的底座支撐。
展望:技術協(xié)同推動產業(yè)升級
GSE技術不僅是網(wǎng)絡協(xié)議的革新,更是算力網(wǎng)絡從“可用”向“高效”躍遷的關鍵。中興通訊將與中國移動攜手并肩,秉承“星云智算網(wǎng)絡,自主領航、解耦共生”理念,積極推進GSE技術商用落地,通過"算法+算力+網(wǎng)絡"的協(xié)同創(chuàng)新加速AI普惠進程,共推國產智算生態(tài)加速繁榮。