C114訊 1月16日消息(水易)AI時代已經來臨。大模型等新興AI應用需求海量的算力支撐,一座座智算中心拔地而起,規(guī)模龐大的萬卡集群逐漸投入商用。如何更好地實現(xiàn)智算中心互聯(lián),服務AI應用創(chuàng)新發(fā)展,業(yè)界做了大量研究工作。
1月16日,作為“2025中國光通信高質量發(fā)展論壇”的開篇之作,“智算中心互聯(lián):算網(wǎng)協(xié)同,構筑智算互聯(lián)新底座”線上研討會順利召開,邀約產業(yè)鏈專家代表,圍繞智算中心間跨地域、跨層級、跨主體、高可靠的算力協(xié)同與調度,以及智算中心互聯(lián)關鍵技術等話題展開了深入探討。
中國電信研究院副院長傅志仁表示,數(shù)字中國建設需要打通以“云網(wǎng)融合”為核心特征的新型信息基礎設施大動脈。同時,隨著以大模型為代表的新應用的出現(xiàn),云網(wǎng)融合加速邁入以AIDC為核心的云網(wǎng)融合3.0新階段。
AI時代下,云網(wǎng)融合發(fā)展新思路
作為在業(yè)界最早提出“云網(wǎng)融合”理念的運營商,中國電信的愿景目標是通過實施虛擬化、云化和服務化,形成一體化的融合技術架構,最終實現(xiàn)簡潔、敏捷、開放、融合、安全、智能的新型數(shù)字基礎設施的資源供給。
圍繞這一愿景目標,中國電信堅持并積極踐行“網(wǎng)是基礎、云為核心、網(wǎng)隨云動、云網(wǎng)一體”的云網(wǎng)融合方向,構建融合5G/6G、千兆光網(wǎng)、統(tǒng)一承載、算力網(wǎng)絡、智能管控多要素的云網(wǎng)一體信息基礎設施。
傅志仁介紹,隨著AI/大模型等新需求的出現(xiàn),云網(wǎng)融合下算力和網(wǎng)絡的發(fā)展途徑也開始有了新的變化,云網(wǎng)融合也隨之邁入云網(wǎng)融合3.0新階段。具體而言,算力發(fā)展核心逐步變化成構建以GPU為核心的智算集群,網(wǎng)絡的發(fā)展核心逐漸變化成基于智算架構的新型網(wǎng)絡,向AI native Network演進。
傅志仁強調,云網(wǎng)融合3.0是數(shù)字經濟新階段,是中國電信以提供全新數(shù)字化供給為目標的重點行動,是落實云改數(shù)轉戰(zhàn)略的關鍵抓手,是堅持云網(wǎng)融合方向的階段升級,是把握戰(zhàn)略機遇挑戰(zhàn)的主動謀劃。
早在2020年,中國電信就發(fā)布了《云網(wǎng)融合2030技術白皮書》,邁向以AIDC為核心的云網(wǎng)融合3.0階段,中國電信持續(xù)升級發(fā)布《智算時代云網(wǎng)融合技術白皮書》,一方面繼承云網(wǎng)融合2030的愿景和藍圖,另一方面結合AI時代的海量訓練算力、數(shù)據(jù)高效流通、軟硬協(xié)同加速等新需求,提出了云網(wǎng)融合的新內涵、新特征、新技術。
據(jù)了解,目前,中國電信圍繞云網(wǎng)一體化賦能算力、數(shù)據(jù)、AI大模型算法及產數(shù)業(yè)務等四大方面已打造十大云網(wǎng)融合創(chuàng)新方案,包括算力分發(fā)服務、算力測評服務、數(shù)據(jù)要素服務、數(shù)據(jù)流通服務、智算拉遠、云邊訓推、視聯(lián)網(wǎng)服務、車聯(lián)網(wǎng)服務等。
創(chuàng)新實踐,構建云網(wǎng)融合3.0底座
中國電信不僅在業(yè)界率先提出、積極實踐云網(wǎng)融合,而且持續(xù)深化云網(wǎng)融合的內涵和外延。傅志仁介紹,圍繞云網(wǎng)融合3.0底座,中國電信在運力、算力、存力,以及算網(wǎng)融合、存算融合的云網(wǎng)融合底座、數(shù)據(jù)和底座融合、大模型和底座融合、應用和底座融合方面進行了一系列布局。
中國電信在國際上首次提出并闡述算力網(wǎng)絡理念,發(fā)布首個算力網(wǎng)絡國際標準ITU-T Y.2501“算力網(wǎng)絡框架與架構”,在產業(yè)伙伴的共同努力下,已衍生出標準30余項,完成算網(wǎng)協(xié)同系統(tǒng)的研制并在多省規(guī)模部署應用。
在基礎網(wǎng)絡層面,打造高速光網(wǎng)、5G移動網(wǎng)絡、新型城域網(wǎng),為云網(wǎng)融合構建堅實網(wǎng)絡底座。
同時,中國電信積極投身算力基礎設施建設,建成豐富的通、智、超算力資源。聚焦全國一體化算力網(wǎng)絡樞紐節(jié)點區(qū)域,當前智算自有算力 21EFLOPS,同時接入 50 家算力合作伙伴,各類智能算力合計 27 EFLOPS。
另外,中國電信先行先試,構建大規(guī)模萬卡算力集群,已建成上海、北京兩個萬卡集群,在網(wǎng)絡布局和綠色低碳方面形成創(chuàng)新優(yōu)勢;同時開展十萬卡集群建設研究,在機房基建、計算、網(wǎng)絡、存儲、平臺管理等方面嘗試技術突破。
存算融合方面,中國電信面向HPC和AI等大內存場景,基于高速總線,實現(xiàn)內存層智能調度和存儲層加速的融合解決方案;積極擁抱RISC-V生態(tài),面向視頻場景,打造業(yè)界首個基于RISC-V的專用硬件產品,實現(xiàn)商用部署。
值得一提的是,中國電信積極打造一體化算力服務平臺和運營體系,構建一體化智算服務平臺“息壤”,實現(xiàn)算網(wǎng)調度一體化、技術架構一體化、訓練推理一體化、資源管理一體化。能夠面向萬億參數(shù)基礎大模型訓練場景構建行業(yè)領先的萬卡解決方案,面向行業(yè)大模型訓推場景提供一站式智算服務。
“要素融合”,賦能數(shù)字經濟發(fā)展
構建云網(wǎng)融合3.0底座的基礎之上,中國電信推進“要素融合”,打造智算能力體系、數(shù)據(jù)要素能力體系、星辰大模型能力體系,并實現(xiàn)智算能力、創(chuàng)新環(huán)境、應用場景開放,賦能千行百業(yè),推動數(shù)字經濟發(fā)展。
數(shù)據(jù)方面,創(chuàng)新IP業(yè)務網(wǎng)架構以及IPv6+協(xié)議,面向數(shù)據(jù)入算/入云、算間/云間互聯(lián)、數(shù)據(jù)流通等場景,研發(fā)算力快線產品,提供普惠互聯(lián)、彈性帶寬、安全可信的海量數(shù)據(jù)傳輸服務,構建面向一體化算力網(wǎng)絡的網(wǎng)絡運力服務,目前已實現(xiàn)應用推廣
另外,創(chuàng)新IP業(yè)務網(wǎng)架構及其在直播場景的解決方案“翼智播”,1.0版本解決直播上行QoS保障和秒級彈性帶寬提速,2.0版本實現(xiàn)甄別直播等業(yè)務流量挖掘客戶需求實現(xiàn)端到端差異化保障能力。
大模型方面,為解決單節(jié)點規(guī)模不足的問題,通過IP層(長距無損RDMA)和光傳輸層(超高速大帶寬傳輸能力)技術協(xié)同優(yōu)化構建分布式無損智算網(wǎng),實現(xiàn)多數(shù)據(jù)中心協(xié)同提供服務,以網(wǎng)強算。
目前,中國電信已經完成業(yè)內首例現(xiàn)網(wǎng)智算長距無損互聯(lián)技術驗證。通過跨百公里、千億參數(shù)、千卡規(guī)模的分布式智算中心互聯(lián)驗證,性能可達到集中式訓練的95%以上,驗證多節(jié)點協(xié)同提供算力方案可行。
同時,為打破異構算力壁壘,中國電信發(fā)布業(yè)界首次英偉達、天數(shù)智芯、壁仞、沐曦四芯混訓解決方案,有效解決了異構芯片間“生態(tài)豎井”、“算力孤島”問題,破解異構算力互調難、互通難、互聯(lián)難的“三難”困境。
此外,為解決國產算力“測試難不敢用”“ 適配難不想用”“ 優(yōu)化難不會用”等“三難三不”問題,中國電信打造一個模型與芯片間的中間層算力使能平臺-翼芯,是業(yè)內首個集算力評測、適配優(yōu)化和跨架構遷移等能力的一站式大模型服務平臺。
面對模型應用逐步從訓練走向推理,智能算力需求中推理類任務占比逐漸提升。業(yè)界預計2025年推理占中國AI服務器工作負載的60.8%,中國電信正聯(lián)合產業(yè)界積極探索分離式推理加速以助力節(jié)省成本提高利用率。
應用方面,中國電信積極推進端云AI模型同源,提升端側模型部署的效率,助力復雜業(yè)務場景下端云之間的高效協(xié)同,由傳統(tǒng)的人找服務到服務找人,最后進化到服務找服務的AI超級智能體階段。
最后,傅志仁表示,中國電信愿與產業(yè)合作伙伴攜手,繁榮未來網(wǎng)絡生態(tài),構筑新質生產力堅實底座,依托WBBA等平臺,讓基于云網(wǎng)融合構建新型信息基礎設施的經驗、方案和標準走向世界。