C114通信網(wǎng)  |  通信人家園

專題
2025/1/16 15:56

中國聯(lián)通唐雄燕:構(gòu)建算力智聯(lián)網(wǎng)AINet,推進(jìn)算網(wǎng)協(xié)同

C114通信網(wǎng)  顏翊

C114訊 1月16日消息(顏翊)AI時(shí)代已經(jīng)來臨。大模型等新興AI應(yīng)用需求海量的算力支撐,一座座智算中心拔地而起,規(guī)模龐大的萬卡集群逐漸投入商用。如何更好地實(shí)現(xiàn)智算中心互聯(lián),服務(wù)AI應(yīng)用創(chuàng)新發(fā)展,業(yè)界做了大量研究工作。

1月16日,作為“2025中國光通信高質(zhì)量發(fā)展論壇”的開篇之作,“智算中心互聯(lián):算網(wǎng)協(xié)同,構(gòu)筑智算互聯(lián)新底座”線上研討會順利召開,邀約產(chǎn)業(yè)鏈專家代表,圍繞智算中心間跨地域、跨層級、跨主體、高可靠的算力協(xié)同與調(diào)度,以及智算中心互聯(lián)關(guān)鍵技術(shù)等話題展開了深入探討。

中國聯(lián)通研究院副院長、首席科學(xué)家唐雄燕應(yīng)邀作了題為《構(gòu)建算力智聯(lián)網(wǎng)AINet,推進(jìn)算網(wǎng)協(xié)同》的主題報(bào)告。在報(bào)告中,唐雄燕結(jié)合中國聯(lián)通正在建設(shè)的算力智聯(lián)網(wǎng)AINet,探討了對于智算中心互聯(lián)網(wǎng)的認(rèn)識,并介紹中國聯(lián)通開展的相關(guān)工作。

打造算力智聯(lián)網(wǎng)AINet

智能計(jì)算的發(fā)展對帶寬和網(wǎng)絡(luò)質(zhì)量提出了越來越高的要求,主要體現(xiàn)在高通量、低時(shí)延、高可靠三個方面。為了更好地支撐智算互聯(lián)的需要,2024年,中國聯(lián)通正式發(fā)布算力智聯(lián)網(wǎng)AINet,通過IP+光融合打造新質(zhì)運(yùn)力,實(shí)現(xiàn)算力服務(wù)與網(wǎng)絡(luò)服務(wù)協(xié)同,構(gòu)建算力互聯(lián)網(wǎng)的新底座。

唐雄燕指出,AINet具備三個重要特征,即“三高”核心能力,分別是高通量、高性能、高智能。其中,高通量主要是針對數(shù)據(jù)傳輸管道,構(gòu)建高通量廣域網(wǎng)能力,提升承載計(jì)算任務(wù)的數(shù)量,保障海量計(jì)算任務(wù)高效率、差異化、分布式流通,使能算的多;高性能是指要確保智算中心網(wǎng)絡(luò)實(shí)現(xiàn)零丟包、無阻塞、低時(shí)延運(yùn)營,保障算得快;高智能則是通過算網(wǎng)大腦實(shí)現(xiàn)算力和運(yùn)力之間協(xié)同編排和調(diào)度,提供算力與連接的融合服務(wù),促進(jìn)算得優(yōu)。

對于廣域網(wǎng)來說,主要是通過IP+光技術(shù)形成高通量能力,即打造大帶寬、低時(shí)延、無損的高通量廣域承載網(wǎng)絡(luò),提供高效靈活算力數(shù)據(jù)傳輸服務(wù)。當(dāng)前,主要依靠建設(shè)超大容量、端到端高速直達(dá)的400G全光網(wǎng)絡(luò),實(shí)現(xiàn)高速可靠的海量數(shù)據(jù)傳送。

在智算中心網(wǎng)絡(luò)中,對網(wǎng)絡(luò)性能要求非常高,需使用IB、RoCE等無損電交換技術(shù),同時(shí)逐步引入光交換,實(shí)現(xiàn)光電融合。此外,智能管控也非常關(guān)鍵,中國聯(lián)通研發(fā)了智算中心管控平臺“智馭”,能夠?qū)崿F(xiàn)算網(wǎng)、光電一體化管理以及智算流量端到端優(yōu)化調(diào)度,并能實(shí)時(shí)呈現(xiàn)網(wǎng)絡(luò)狀態(tài)。

在算網(wǎng)大腦層面,主要是實(shí)現(xiàn)算力和連接的協(xié)同編排和智能調(diào)度,提供“算力+連接”的算網(wǎng)融合服務(wù)。

光網(wǎng)絡(luò)演進(jìn)支撐智算網(wǎng)絡(luò)發(fā)展

唐雄燕表示,光網(wǎng)絡(luò)是構(gòu)建AINet“三高”能力的關(guān)鍵底座。AINet部署了雙平面立體組網(wǎng)的400G ROADM全光智算網(wǎng)絡(luò),同時(shí)部署了智算網(wǎng)關(guān),實(shí)現(xiàn)網(wǎng)絡(luò)與智算的高效連接。

對于光網(wǎng)絡(luò)未來如何更好支撐智算網(wǎng)絡(luò),他表示,過去幾十年來,光網(wǎng)絡(luò)的演進(jìn)方向一直朝著提高速率和增強(qiáng)智能兩個方向發(fā)展。

在智算廣域網(wǎng)方面,光網(wǎng)絡(luò)的速率和容量快速增長是演進(jìn)特征。骨干光網(wǎng)絡(luò)已邁入單波超400G速率時(shí)代,并朝著800G方向發(fā)展。容量提升上,已經(jīng)實(shí)現(xiàn)了C6T+L6T寬頻譜系統(tǒng),未來還可通過繼續(xù)擴(kuò)展頻譜進(jìn)一步提升容量。同時(shí),AINet是基于G.654.E新型光纖,可更好支撐400G和800G超高速傳輸要求。

在智算中心內(nèi)部,光交換扮演著越來越重要的角色。智算中心內(nèi)互聯(lián)架構(gòu)正在從電交換向光電混合/光交換演進(jìn),可以充分發(fā)揮光連接和光交換的大帶寬低時(shí)延低功耗等優(yōu)勢。LightCounting數(shù)據(jù)顯示,光交換機(jī)OCS出貨量2023年為1萬臺,預(yù)計(jì)2029年將超過5萬臺。同時(shí),智算中心內(nèi)新型光模塊不斷涌現(xiàn),LPO、CPO等技術(shù)未來發(fā)展前景良好,尤其是在1.6T之后,光電共封裝對于降低功耗、降低成本重要性凸顯。

另外,在光纖技術(shù)方面,新型光纖空芯光纖近年得到快速發(fā)展。其具有更低時(shí)延、更低損耗和更小非線性,尤其是時(shí)延能降低30%,對于智算互聯(lián)網(wǎng)來說有著非常重要的價(jià)值。例如,微軟去年就宣布要部署15000公里空芯光纖。我國也在積極開展空芯光纖相關(guān)實(shí)驗(yàn)驗(yàn)證工作。不過,空芯光纖的應(yīng)用仍然面臨著多方面挑戰(zhàn)。

針對三大典型場景開展試驗(yàn)

唐雄燕介紹,針對入算、訓(xùn)練、推理這三大典型智算業(yè)務(wù)場景,去年中國聯(lián)通開展了一些重要實(shí)驗(yàn)。

一是海量數(shù)據(jù)入算場景,主要提供任務(wù)式數(shù)據(jù)傳遞服務(wù),通過構(gòu)建高通量數(shù)據(jù)網(wǎng)來增大有效帶寬、提高單位帶寬下數(shù)據(jù)傳輸通量,解決低帶寬等不起、高帶寬用不起等問題。去年聯(lián)通開展了從上海到寧夏3000公里長距RDMA流量傳輸驗(yàn)證,通過無損流控技術(shù)以及端網(wǎng)協(xié)同擁塞控制等技術(shù),端口帶寬利用率從20%提升到90%。

二是存算分離拉遠(yuǎn)訓(xùn)練場景,政務(wù)、醫(yī)療、金融等行業(yè)租用智算中心算力進(jìn)行大模型訓(xùn)練,因涉及敏感信息,為最大限度地防止數(shù)據(jù)泄露,需要隱私訓(xùn)練數(shù)據(jù)“不落盤”,進(jìn)行存算分離拉遠(yuǎn)訓(xùn)練。為此,中國聯(lián)通完成業(yè)界首例跨地市(杭州-金華)、存算分離200 km 的AI大模型拉遠(yuǎn)訓(xùn)練,即杭州存儲、金華計(jì)算,通過廣域RDMA無損高吞吐傳輸,保障存儲與計(jì)算跨廣域模型高效訓(xùn)練,實(shí)測訓(xùn)練效率大于95%(與本地?cái)?shù)據(jù)本地訓(xùn)的效率相比損失5%)。

三是跨DC協(xié)同訓(xùn)練場景,超大規(guī)模的訓(xùn)練和算力租賃業(yè)務(wù)帶來智算新需求,需要進(jìn)行跨DC協(xié)同訓(xùn)練,這也是技術(shù)挑戰(zhàn)最大的應(yīng)用場景,由于跨DC涉及時(shí)延問題,往往難以保障參數(shù)面拉遠(yuǎn)下的等效算力。為驗(yàn)證這個場景,在中國聯(lián)通臨港智算中心采用了光傳送網(wǎng)OTN技術(shù),成功完成AI大模型300公里分布式協(xié)同訓(xùn)練技術(shù)驗(yàn)證,充分驗(yàn)證了跨DC協(xié)同訓(xùn)練技術(shù)的商用可行性,實(shí)現(xiàn)了300公里跨域協(xié)同訓(xùn)練保持等效算力95%以上,為AI大模型訓(xùn)練模式提供了全新的解決方案。

最后,唐雄燕指出,中國聯(lián)通通過打造算力智聯(lián)網(wǎng)AINet,可為人工智能發(fā)展提供多樣性服務(wù),包括高效入算、靈活聯(lián)算、算力互聯(lián)、數(shù)據(jù)快遞、數(shù)據(jù)高鐵、算網(wǎng)一體服務(wù)等服務(wù)形式,更好地賦能人工智能產(chǎn)業(yè)發(fā)展。

給作者點(diǎn)贊
0 VS 0
寫得不太好

版權(quán)說明:C114刊載的內(nèi)容,凡注明來源為“C114通信網(wǎng)”或“C114原創(chuàng)”皆屬C114版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來源。編譯類文章僅出于傳遞更多信息之目的,不代表證實(shí)其描述或贊同其觀點(diǎn);翻譯質(zhì)量問題請指正

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報(bào)電話:021-54451141