華為中國合作伙伴大會(huì)2025于3月20日在深圳開幕。3月21日上午主論壇上,華為董事、ICT BG CEO楊超斌指出,數(shù)據(jù)中心網(wǎng)絡(luò)因負(fù)載不平衡和擁塞,集群效率通常會(huì)降低20%以上。他還提到,美國Meta在訓(xùn)練Llama 3模型時(shí),54天內(nèi)發(fā)生了419次故障,平均每3小時(shí)一次,其中80%的故障由硬件問題引起,尤其是處理器互聯(lián)問題。針對(duì)這些問題,華為推出了NSLB(網(wǎng)絡(luò)負(fù)載平衡)方案,通過智能化調(diào)度,將網(wǎng)絡(luò)負(fù)載效率提升至95%以上,訓(xùn)練效率提升10%。科大訊飛應(yīng)用該技術(shù)后,大模型訓(xùn)練時(shí)間從34天縮短至25天。此外,華為還設(shè)計(jì)了高可靠性光模塊,用于數(shù)據(jù)中心場(chǎng)景,可靠性提升10倍以上。楊超斌還提到,中國移動(dòng)去年的集群可靠性遠(yuǎn)高于Meta Llama 3模型的訓(xùn)練集群,后者平均每3小時(shí)故障一次,而中國移動(dòng)的集群二十幾天未出現(xiàn)故障。
楊超斌:數(shù)據(jù)中心效率提升95% Meta Llama 3頻繁故障凸顯差距
免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版
Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號(hào)
C114 通信網(wǎng) 版權(quán)所有 舉報(bào)電話:021-54451141