C114通信網(wǎng)  |  通信人家園

專題
2025/1/16 17:09

騰訊李方超:光電融合創(chuàng)新解決方案全力支持MegaScaleOut

C114通信網(wǎng)  艾斯

C114訊 1月16日消息(艾斯)AI時代已經(jīng)來臨。大模型等新興AI應(yīng)用需求海量的算力支撐,一座座智算中心拔地而起,規(guī)模龐大的萬卡集群逐漸投入商用。如何更好地實現(xiàn)智算中心互聯(lián),服務(wù)AI應(yīng)用創(chuàng)新發(fā)展,業(yè)界做了大量研究工作。

1月16日,作為“2025中國光通信高質(zhì)量發(fā)展論壇”的開篇之作,“智算中心互聯(lián):算網(wǎng)協(xié)同,構(gòu)筑智算互聯(lián)新底座”線上研討會順利召開,會議邀約產(chǎn)業(yè)鏈專家代表,圍繞智算中心間跨地域、跨層級、跨主體、高可靠的算力協(xié)同與調(diào)度,以及智算中心互聯(lián)關(guān)鍵技術(shù)等話題展開了深入探討。

騰訊光網(wǎng)絡(luò)架構(gòu)師李方超應(yīng)邀作了題為《 超大規(guī)模橫向擴(kuò)展網(wǎng)絡(luò)》的主題報告。在報告中,李方超針對AI大模型飛速發(fā)展對于網(wǎng)絡(luò)提出的全新挑戰(zhàn)與需求進(jìn)行了深入分析,并詳細(xì)介紹了騰訊針對網(wǎng)絡(luò)超大規(guī)模擴(kuò)展所打造的MegaScaleOut軟硬件創(chuàng)新解決方案。

以算力換智力存在物理上限 跨IDC的ScaleOut成為剛需

大模型的能力每2-3年就會上一個全新的臺階,同時伴隨著GPU規(guī)模相應(yīng)擴(kuò)大了數(shù)倍乃至數(shù)10倍。如今,大模型訓(xùn)練已從早期GPT3的千卡規(guī)模迅速擴(kuò)展至GPT5的10萬卡規(guī)模。顯然,AI的發(fā)展與GPU資源線性相關(guān)。不過,以算力替換智力天然存在物理資源上限。

“從業(yè)務(wù)的需求與物理供給之間的矛盾可以推斷出,大園區(qū)的擴(kuò)展是必然的!崩罘匠谘葜v中介紹道,參考國際市場發(fā)展來看,以谷歌、微軟、Meta為代表的北美巨頭們正在積極布局算力園區(qū),這些Hyperscalers通過在自己的優(yōu)勢區(qū)域部署多個子園區(qū),以3-4個IDC的方式共建一個超大規(guī)模的算力集群,以此來實現(xiàn)對于電力的供應(yīng)和投資安全的保證。

作為對比,在國內(nèi)環(huán)境中,如果想訓(xùn)練一個對標(biāo)GPT5或者Llama4的大模型,由于GPU的性能限制,我們可能需要更多的GPU來實現(xiàn)相同的算力。同時,隨著多模態(tài)訓(xùn)練的到來,不同型號、不同性能的GPU對應(yīng)不同類型的訓(xùn)練存在最優(yōu)選擇,這對于網(wǎng)絡(luò)的靈活和任務(wù)分配帶來了更多挑戰(zhàn)。此外,由于交付與工程的因素,會存在不同型號的GPU與不同廠商的GPU混布在同一個IDC的可能,這些最終會導(dǎo)致出現(xiàn)GPU碎片池化的問題。

“因此,結(jié)合AI的發(fā)展和規(guī)模的限制,跨IDC的ScaleOut可能會成為剛需!崩罘匠瑥(qiáng)調(diào)。

跨IDC ScaleOut存在多重挑戰(zhàn) IP與光的融合成為最優(yōu)解

他進(jìn)一步分析稱,當(dāng)進(jìn)入到DCI以后,收斂比與可靠將變成一個全新的挑戰(zhàn)。

對于DCI出口而言,大象流是一個需要解決的問題。不過,通過優(yōu)化擁塞控制算法與擴(kuò)容帶寬等方式,便可以有效應(yīng)對高并發(fā)需求。更大的挑戰(zhàn)在于解決可靠性問題,這主要歸因于跨機(jī)房之后對于光纜的不可控。相比傳統(tǒng)網(wǎng)絡(luò)來說,無損系統(tǒng)在帶寬下降的時候會直接影響算力能力,網(wǎng)絡(luò)抖動與丟包也會直接影響RDMA的性能,光纜故障與抖動成為新的變數(shù)。

“根據(jù)我們的測算,在丟包0.1%數(shù)據(jù)的情況下,RDMA的吞吐量會下降10%,因此從機(jī)房內(nèi)到機(jī)房間,對于跨IDC的場景,帶寬充裕、鏈路可靠是必備的基本需求!崩罘匠窒砹艘唤M詳細(xì)的測試數(shù)據(jù),并指出無法簡單通過光纜與設(shè)備來換取可靠性的絕對提升,其中深層次的原因在于“交換機(jī)無法實時預(yù)見到即將到來的劣化和故障”。

于是,騰訊光網(wǎng)絡(luò)團(tuán)隊意識到,如果可以讓交換機(jī)快速地了解物理層到底發(fā)生了什么,使交換機(jī)有時間去提前執(zhí)行預(yù)定好的策略,并規(guī)避物理層的一些變化,這對于IDC的無損網(wǎng)絡(luò)來說非常有意義。因此,該團(tuán)隊提出,IP與光的融合是跨園區(qū)無損網(wǎng)絡(luò)的最優(yōu)解。

李方超談到,“針對IP over DWDM,我們正積極推動光器件的小型化與標(biāo)準(zhǔn)化,也即微光學(xué)模塊。這一次我們將通過這些創(chuàng)新,讓IP與光可以真正地拉近,實現(xiàn)打破硬件的隔閡,完成真正的融合。通過相干芯片與交換芯片的融合創(chuàng)新,我們讓交換機(jī)具備了物理層健康度的評估能力,為跨IDC的Scaleout做好了一切準(zhǔn)備。”

此外,他還詳細(xì)介紹了騰訊在ODCC立項的MegaScaleOut項目組,及其在IP over DWDM當(dāng)中的全新硬件DTS在解決DCI可靠性問題方面的應(yīng)用,以及通過OCS全光交換設(shè)備解決DCI側(cè)應(yīng)用解決容量按需分配的應(yīng)用。

給作者點贊
0 VS 0
寫得不太好

版權(quán)說明:C114刊載的內(nèi)容,凡注明來源為“C114通信網(wǎng)”或“C114原創(chuàng)”皆屬C114版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來源。編譯類文章僅出于傳遞更多信息之目的,不代表證實其描述或贊同其觀點;翻譯質(zhì)量問題請指正

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報電話:021-54451141