中國人工智能產(chǎn)業(yè)聯(lián)盟第十三次全會于 11 月 12 日在北京召開,華為數(shù)據(jù)存儲聯(lián)合中國信通院、工信部人工智能關(guān)鍵技術(shù)和應(yīng)用評測實驗室、工商銀行、中國移動、中國聯(lián)通、百度、阿里云、騰訊云、螞蟻集團等正式發(fā)起“大模型基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃”。
從大會獲悉,該計劃以提升大模型基礎(chǔ)設(shè)施的質(zhì)量與效能為目標,共同加快布局“高效計算調(diào)度 + 高性能 AI 存儲 + 高通量網(wǎng)絡(luò) + 高效能開發(fā)平臺 + 智能化運維平臺”,助力大模型工程化落地。
華為閃存存儲領(lǐng)域總裁黃濤表示,人類利用數(shù)據(jù)在 AI 領(lǐng)域取得長足發(fā)展,數(shù)智時代是數(shù)據(jù)的黃金時代,隨著數(shù)據(jù)規(guī)模爆炸式增長、數(shù)據(jù)價值不斷攀升,但同時我們面臨 xPU 與存儲的帶寬不足、算力集群可用度低、推理時延長等挑戰(zhàn),這對存儲提出更高要求。黃濤提出,具備極致性能、高擴展性、數(shù)據(jù)韌性、可持續(xù)發(fā)展、新數(shù)據(jù)范式以及數(shù)據(jù)編織能力的新一代 AI 存儲是通往 AI 數(shù)智時代的必由之路。
黃濤還稱,隨著大模型的規(guī)模法則(Scaling Law)不斷演進,無論是在進行 CKPT 的并行保存與加載、多模態(tài)數(shù)據(jù)的收集與清洗、全局數(shù)據(jù)的 Shuffle(混洗)與模態(tài)對齊,還是 AI 算法的調(diào)優(yōu)以及大規(guī)模集群的運維診斷跟蹤,都迫切需要一個全局對等共享、單一命名空間、且具備高性能并行讀寫能力的大型文件系統(tǒng)。這樣的系統(tǒng)能夠避免多文件系統(tǒng)和多集群之間聯(lián)邦式的低效堆疊,從而顯著簡化大規(guī)模集群環(huán)境下的數(shù)據(jù)調(diào)度和數(shù)據(jù)管理流程,進而持續(xù)提高數(shù)據(jù)供應(yīng)的效率。