C114訊 3月24日消息(水易)前不久的GTC 2025期間,英偉達(dá)發(fā)布了兩款CPO交換機(jī),光通信行業(yè)市場(chǎng)研究機(jī)構(gòu)LightCounting對(duì)這一舉動(dòng)進(jìn)行了點(diǎn)評(píng)。
與此前的傳聞一致,英偉達(dá)正式推出了面向InfiniBand和以太網(wǎng)的兩大CPO(共封裝光學(xué))交換機(jī)產(chǎn)品線,分別命名為Quantum-X Photonics與Spectrum-X Photonics。InfiniBand CPO將于2025年下半年首發(fā),以太網(wǎng)CPO則計(jì)劃在2026年下半年面市。
值得注意的是,CPO將作為可選配置,英偉達(dá)仍會(huì)繼續(xù)提供采用可插拔模塊的傳統(tǒng)交換機(jī)系統(tǒng)。
鑒于目前CPO技術(shù)滲透緩慢,人們不禁要問英偉達(dá)為何押注這一方向。首要驅(qū)動(dòng)力在于功耗優(yōu)化,英偉達(dá)創(chuàng)始人兼CEO黃仁勛在主題演講中重點(diǎn)強(qiáng)調(diào),采用CPO技術(shù)后,1.6T端口的功耗從可插拔光模塊的30W驟降至9W,降幅高達(dá)70%。
英偉達(dá)的CPO方案采用了新型微環(huán)調(diào)制器(MRM)以實(shí)現(xiàn)能效躍升。此前博通的CPO方案通過去除DSP實(shí)現(xiàn)了50%的功耗降低,但其技術(shù)基礎(chǔ)是傳統(tǒng)光模塊中常見的Mach-Zehnder調(diào)制器(MZM)。
下圖展示了該技術(shù)涉及的多元組件生態(tài):由臺(tái)積電制造的電子芯片與光子芯片通過3D堆疊封裝集成,臺(tái)積電的緊湊型通用光子引擎(COUPE)技術(shù)整合了用于光纖陣列表面耦合的微透鏡。在Quantum-X Photonic平臺(tái)中,光學(xué)引擎組件通過中介層與交換機(jī)ASIC連接。雖然英偉達(dá)未披露各環(huán)節(jié)的具體分工,但其CPO合作伙伴名單已涵蓋Browave、Coherent、康寧、Fabrinet、富士康、Lumentum、Senko、SPIL、住友、天孚通信和臺(tái)積電等產(chǎn)業(yè)鏈巨頭。
LightCounting指出,光模塊廠商或許可以暫時(shí)松一口氣,英偉達(dá)首款CPO產(chǎn)品是InfiniBand交換機(jī),而該協(xié)議在英偉達(dá)的AI戰(zhàn)略中的地位已被以太網(wǎng)反超。實(shí)際上,Quantum-X Photonic平臺(tái)甚至未出現(xiàn)在產(chǎn)品路線圖中。加之英偉達(dá)目前已推出搭載OSFP端口(支持1.6T光模塊)的Quantum-X800系統(tǒng),預(yù)計(jì)首批CPO部署將主要用于自有集群。Quantum-X Photonic平臺(tái)更多承擔(dān)技術(shù)驗(yàn)證的角色,短期內(nèi)對(duì)光模塊需求影響有限。
黃仁勛在演講中將Spectrum-X稱為“全壘打式創(chuàng)新”,旨在將以太網(wǎng)提升至InfiniBand的性能水平。他表示Spectrum-X將在Rubin平臺(tái)時(shí)代實(shí)現(xiàn)“數(shù)十萬GPU”的互聯(lián)。盡管英偉達(dá)未透露細(xì)節(jié),但Spectrum-X Photonics平臺(tái)采用了與Quantum-X Photonic不同的設(shè)計(jì)架構(gòu),可能代表第二代技術(shù)演進(jìn)。
無論如何,英偉達(dá)的入局將為CPO生態(tài)注入強(qiáng)心劑。自2021年初起,該技術(shù)主要由博通推動(dòng)。預(yù)計(jì)到2027年,兩家巨頭都將推出基于單通道200G的CPO交換機(jī),屆時(shí)產(chǎn)業(yè)生態(tài)將趨于成熟。
Scale-out是CPO的低風(fēng)險(xiǎn)切入點(diǎn),但Scale-up才是決勝關(guān)鍵。混合專家(MoE)模型所需的快速響應(yīng)時(shí)間依賴于跨GPU的專家并行計(jì)算。黃仁勛通過案例展示了吞吐量與響應(yīng)時(shí)間的權(quán)衡,指出最佳實(shí)踐需要將單個(gè)專家分割到64個(gè)GPU實(shí)例上運(yùn)行。Blackwell架構(gòu)的NVL72機(jī)架通過NVLink+無源銅纜背板構(gòu)建了72 GPU縱向擴(kuò)展域,預(yù)計(jì)2026年下半年推出的Vera Rubin NVL144將采用類似設(shè)計(jì),無源銅纜用量可能翻倍。
雖然英偉達(dá)未透露Rubin Ultra NVL576的細(xì)節(jié),但Kyber機(jī)架布局顯然對(duì)NVLink互連提出了新要求。盡管如此,144個(gè)GPU封裝仍可容納在一個(gè)機(jī)柜中,最大距離約為2米。路線圖中未提及Feynman平臺(tái)的NVLink擴(kuò)展能力,LightCounting預(yù)計(jì)其將支持多機(jī)柜級(jí)聯(lián),屆時(shí)必然需要光互連方案。
英偉達(dá)早在2022年GTC大會(huì)就公布了基于光纖的NVLink計(jì)劃。公司內(nèi)部已建成至少一個(gè)此類集群,但由于重定時(shí)光模塊功耗過高,未能大規(guī)模推廣。雖然去除DSP是重要進(jìn)步,但仍需持續(xù)技術(shù)突破。這也解釋了英偉達(dá)為何冒險(xiǎn)押注MRM等新技術(shù)。鑒于Scale-up能力對(duì)AI集群的重要性,英偉達(dá)可能正在研究一系列創(chuàng)新光學(xué)技術(shù)。
NVLink CPO定檔2028年,意味著英偉達(dá)將有兩代產(chǎn)品周期在Scale-out網(wǎng)絡(luò)中驗(yàn)證技術(shù)可行性。這將大幅降低未來GPU集成CPO的風(fēng)險(xiǎn),雖然具體時(shí)間未定,但這已成為不可避免的技術(shù)演進(jìn)方向。