C114訊 4月17日消息(南山)過去幾年,大模型掀起算力基礎設施建設的“軍備競賽”,對用于數據中心光互聯的高速數通光模塊需求顯著增長,且速率從400G迅速迭代到800G,再到1.6T。在此背景下,“超大規(guī)模智算中心:1.6T時代的全光互連”研討會于4月17日下午舉辦,就智算中心內光互連進行深入探討,展示光互連技術的最新進展情況,介紹未來發(fā)展趨勢, 推動智算中心互連技術的創(chuàng)新發(fā)展。
作為光模塊供應商的“甲方”,阿里巴巴集團在今年初宣布了三年投入3800億元建設云和人工智能硬件基礎設施的規(guī)劃,超過去十年總和,震撼業(yè)界。“全球人工智能基礎設施市場規(guī)模持續(xù)保持高水平增長,無論是北美還是中國都在加大投資。”在研討會上,阿里云計算有限公司技術專家王鵬發(fā)表主題演講表示。
AI已成光通信技術演進的核心驅動力,光模塊作為基礎設施中的“高速公路”,對其數量和帶寬的提升均有強烈訴求,2025年持續(xù)保持強勢增長勁頭。王鵬介紹,滿足智算中心的光模塊具有幾大特質:高速率高帶寬、低功耗、低時延、低成本,以及高交付能力和高穩(wěn)定性。2024年各廠家的800G光模塊陸續(xù)亮相,今年已經規(guī);逃茫蔀锳I集群的標配。1.6T光模塊成為新焦點,3.2T光模塊也進入業(yè)界視野。
王鵬談到幾個要點:一是光模塊隨著速率提升,功耗也在提升,低功耗設計因而非常重要。二是智算中心在GPU服務器部署后,需要光模塊快速完成部署,避免設備折損浪費。三是智算中心對鏈路抖動更加敏感,對光模塊的穩(wěn)定性提出了更高要求。
具體到光模塊技術方面,ISP服務商要具備多種技術方案評估的能力、芯片方案選型的能力、快速迭代技術方案的能力;在交付方面,具備突發(fā)需求供應和大規(guī)模交付能力;在運營方面,具備千萬級光模塊運營的能力,包括建立優(yōu)勝劣汰機制,選擇可靠性更優(yōu)的模塊技術、型號和廠家。
在演講中,王鵬介紹了阿里云的光模塊演進路標。從2014年設計40G光模塊,到2017年批量交付100G光模塊,2021年和2022年,阿里云實現傳統(tǒng)數據中心和智算中心的200G光模塊批量交付。2023年,400G光模塊批量交付。預計2025年在智算中心導入800G光模塊,2026年開始導入1.6T光模塊。
在光模塊技術方案上,阿里云在400G及以下速率,多模用量大于單模用量,主要采用VCSEL/SiPh/EML方案,LPO小批量部署。800G繼續(xù)采用VCSEL/SiPh/EML方案,并儲備LPO/LRO技術。到1.6T,預計單模成為主流應用,以SiPh和EML方案為主。王鵬補充,1.6T光模塊主要解決四個挑戰(zhàn),一是功耗和系統(tǒng)散熱,二是高速設計和制造,三是可靠性,四是供應和成本。
王鵬最后總結,在光模塊領域,阿里云將聚焦400G、800G、1.6T光模塊的批量部署應用,關注交換芯片的RX Serdes信號處理能力,探索LRO/LPO應用,同時推動光電芯片技術成熟和供應多元化、國產化。一切技術方案均以支撐業(yè)務發(fā)展為主,高帶寬、低能耗、低成本、可以穩(wěn)定供應的技術方案依然會是主流選擇。