C114訊 9月14日消息(趙婷婷)在日前召開的2024服貿(mào)會(huì)通用人工智能算力論壇上,中國工程院院士、清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系教授鄭緯民發(fā)表題為《構(gòu)建國產(chǎn)智算系統(tǒng)的關(guān)鍵》的主題演講。
鄭緯民表示,當(dāng)前大模型進(jìn)入多模態(tài)發(fā)展,不僅限于文本處理,還包括圖像與視頻等多媒體形式;并且大模型的應(yīng)用領(lǐng)域正在不斷拓展,涵蓋了金融、醫(yī)療、汽車以及智能制造等多個(gè)行業(yè)。
隨著AI快速發(fā)展,對(duì)算力的需求呈現(xiàn)出爆炸式增長。而大模型的開發(fā)與部署尤其依賴于強(qiáng)大的算力支持。大模型的研發(fā)通常涉及五個(gè)關(guān)鍵階段:數(shù)據(jù)獲取、數(shù)據(jù)預(yù)處理、模型訓(xùn)練、模型微調(diào)以及模型推理,每一個(gè)階段都需要大量的計(jì)算資源。尤其是在模型訓(xùn)練與推理過程中,算力消耗分別占據(jù)了整體需求的大約70%與95%。
目前,用于訓(xùn)練的設(shè)備主要包括英偉達(dá)的GPU。盡管英偉達(dá)的GPU以其出色的硬件性能及成熟的編程生態(tài)體系受到廣泛歡迎,但由于國際供應(yīng)受限,導(dǎo)致價(jià)格高漲且供不應(yīng)求。在此背景下,算力的國產(chǎn)化勢在必行。目前國內(nèi)相關(guān)企業(yè)已開始自主研發(fā)AI芯片,并取得顯著進(jìn)展,多家公司如華為、曙光、寒武紀(jì)及摩爾線程等均已有產(chǎn)品問世。然而,盡管國產(chǎn)化取得了積極成果,但在實(shí)際應(yīng)用中仍面臨挑戰(zhàn),尤其是軟件生態(tài)系統(tǒng)的建設(shè)尚需加強(qiáng)。
鄭緯民指出,為了改善這一狀況,清華大學(xué)開發(fā)了一套名為“八卦爐”的核心基礎(chǔ)軟件,包括并行系統(tǒng)、編程框架、AI編譯器、算子庫等十個(gè)軟件,旨在優(yōu)化國產(chǎn)智算系統(tǒng)的軟件環(huán)境。該軟件已在多個(gè)平臺(tái)進(jìn)行測試,并成功應(yīng)用于大模型訓(xùn)練任務(wù),如LLAMA、百川和悟道等,不僅能夠正確完成訓(xùn)練任務(wù),而且在成本效益方面表現(xiàn)出色,僅英偉達(dá)GPU的六分之一。
此外,“八卦爐”還在其他應(yīng)用場景中展現(xiàn)出了卓越的性能提升能力,例如,在沐曦、燧原、摩爾線程等企業(yè)的實(shí)踐中,提升了算力效率,并降低成本。
演講最后,鄭緯民總結(jié)道,“發(fā)展人工智能,構(gòu)建國產(chǎn)智能算力至關(guān)重要。智能算力的軟件生態(tài)是當(dāng)前制約我國人工智能發(fā)展的關(guān)鍵因素,優(yōu)秀的系統(tǒng)軟件能夠充分釋放底層硬件算力的潛力。”