C114通信網(wǎng)  |  通信人家園

會展
2024/9/18 15:13

專訪江波龍曹潯峰:從標準化到定制化,PTM模式打造價值合作新范式

C114通信網(wǎng)  九九

C114訊 9月18日消息(九九)“AI應用層出不窮,算力技術飛速提升,存儲技術和產(chǎn)品發(fā)展相對緩慢,成為AI大模型訓練過程中的性能瓶頸。”在日前舉行的2024開放數(shù)據(jù)中心大會(ODCC)上,江波龍企業(yè)級存儲事業(yè)部高級市場總監(jiān)曹潯峰在接受C114專訪時如是說。

從ChatGPT火遍全球到Sora橫空出世,AI的進化與普及日新月異。曹潯峰指出,在此過程中,大模型參數(shù)呈指數(shù)級增長,據(jù)市場機構分析,兩年增加410倍,“GPU算力8年增長1000倍”,與之形成鮮明對比的是,GPU內(nèi)存僅以每2年2倍的速度擴展。緩存的容量和性能跟不上AI算力的提升。

作為在存儲市場深耕25年的“老兵”,江波龍如何迎戰(zhàn)算力產(chǎn)業(yè)發(fā)展的新趨勢?曹潯峰在訪談中分享了對于AI應用數(shù)據(jù)存儲優(yōu)化的思考,大模型AI應用下江波龍的企業(yè)級產(chǎn)品矩陣,并深度解讀了江波龍新近提出的PTM(存儲產(chǎn)品技術制造)模式:集芯片設計、固件開發(fā)、技術定制、封裝測試、生產(chǎn)制造于一體,實現(xiàn)從標準化產(chǎn)品到存儲產(chǎn)品一站式服務的升級跨越,打造價值合作新范式。

創(chuàng)新存儲技術與產(chǎn)品,迎戰(zhàn)萬卡AI訓練集群

江波龍擁有嵌入式存儲、固態(tài)硬盤(SSD)、移動存儲及內(nèi)存條四大產(chǎn)品線。產(chǎn)品廣泛應用于主流消費類智能終端(如智能手機、可穿戴設備、電腦等)、數(shù)據(jù)中心、汽車電子、物聯(lián)網(wǎng)、安防監(jiān)控、工業(yè)控制等領域,以及個人消費類存儲零售市場。隨著AI的爆發(fā),江波龍基于自身產(chǎn)業(yè)能力與時俱進,創(chuàng)新存儲技術與產(chǎn)品滿足多樣化的市場要求。

在AI應用實踐中,原始數(shù)據(jù)需經(jīng)過精細的清洗和預處理,轉化為高質(zhì)量的數(shù)據(jù)集,進而通過網(wǎng)絡傳輸至AI服務器的本地SSD存儲,并最終upload至GPU HBM緩存中進行訓練。曹潯峰指出,隨著AI訓練模型參數(shù)量的增長,現(xiàn)有HBM緩存和系統(tǒng)內(nèi)存RDIMM容量已難以滿足需求。“采用高性能、大容量的CXL存儲器或8x GPU卡AI服務器,將是理想的緩存優(yōu)化解決方案。”

大模型需要大算力,大算力需要大集群。據(jù)悉,江波龍正積極探索支持AIC和E3.S的JBOM系統(tǒng),并結合即將到來的支持CXL2.0服務器系統(tǒng),為萬卡AI訓練集群提供更具成本效益的內(nèi)存池化共享硬件解決方案。

曹潯峰介紹,江波龍基于CXL協(xié)議研發(fā)了兩款存儲方案:E3.S形態(tài)CXL2.0內(nèi)存拓展模塊最大支持192GB容量,能夠適配參數(shù)量在萬億級別以下的大模型,相比業(yè)界同期水平實現(xiàn)成本大幅下降的優(yōu)勢;針對10萬億參數(shù)規(guī)模的大模型,江波龍升級研發(fā)了AIC形態(tài)、最大支持512GB內(nèi)存的拓展模塊,目前正在與一些國家級實驗室做聯(lián)合測試,面市后將進一步推動AI應用的存儲優(yōu)化。

打造企業(yè)級產(chǎn)品矩陣,攻關產(chǎn)品可靠性和穩(wěn)定性

數(shù)據(jù)中心是存儲產(chǎn)品的重要應用領域,特別是隨著算力的極速發(fā)展,數(shù)據(jù)中心成為更具潛力的存儲市場。曹潯峰介紹,江波龍從2020年開始投入用于數(shù)據(jù)中心企業(yè)級存儲產(chǎn)品的研發(fā),截至目前已成功構建了完整的企業(yè)級存儲布局,推出包括企業(yè)級PCIe 4.0 NVMe SSD、企業(yè)級SATA SSD、企業(yè)級RDIMM、CXL 2.0內(nèi)存拓展模塊在內(nèi)的多款高性能產(chǎn)品。

曹潯峰指出,對于AI服務器,企業(yè)級SSD的高性能和大容量特性,能夠有效支持復雜的機器學習模型訓練、數(shù)據(jù)分析和內(nèi)容生成等AI應用,加速AI計算過程,提高整體的系統(tǒng)效率和智能分析能力。同時,隨著AI服務器計算密度的顯著提升,單機的功耗密度也相應增加,不僅對服務器的能源管理提出了更高要求,也加速了SSD取代傳統(tǒng)機械硬盤(HDD)的進程,以實現(xiàn)更優(yōu)的能效比。

曹潯峰進一步指出,AI訓練應用主要涉及順序讀寫操作,QLC SSD在順序讀寫性能上與TLC相近,且成本更具優(yōu)勢。隨著PCIe Gen5帶寬的提升,QLC技術完全能夠滿足AI訓練過程中Checkpoint數(shù)據(jù)存儲的高帶寬高并發(fā)需求,預示著QLC SSD有望成為大語言模型AI訓練應用的更優(yōu)選擇。曹潯峰介紹,江波龍未來有望推出更具有性價比的QLC SSD產(chǎn)品。

曹潯峰強調(diào):“對于企業(yè)級產(chǎn)品而言,性能并不是唯一的指標,更為關鍵的是產(chǎn)品的可靠性和穩(wěn)定性。”江波龍對此投入巨大,通過顆粒研究和測試算法等手段將產(chǎn)品的抖動降至最低,可靠性和穩(wěn)定性具有較大的競爭優(yōu)勢。”

從標準化到定制化,PTM模式為客戶提供全棧式服務和一站式交付

訪談中,曹潯峰重點介紹了江波龍新近提出的PTM(存儲產(chǎn)品技術制造)模式,該模式的核心在于將公司的自研存儲控制芯片、自研固件和硬件以及自有的先進封測制造等技術優(yōu)勢進行無縫銜接,實現(xiàn)更靈活、高效的全棧式定制化服務和一站式交付。

不難看出,PTM模式的兩個關鍵詞分別是“全棧式定制”和“一站式交付”。與這種創(chuàng)新的商業(yè)模式相匹配的是江波龍布局多年的自主研發(fā)與智能制造能力,以及隨之構建的高端存儲全棧能力。“存儲全棧式定制服務就像高級西裝的量身定制,每一細節(jié)都經(jīng)過一對一精心打造,確保每款產(chǎn)品方案‘裁剪’出來都能貼合、匹配客戶的獨特需求。”曹潯峰說。

在技術領域,江波龍擁有自主研發(fā)NAND Flash芯片、主控芯片、固件和硬件的能力,并采用多顆粒類型產(chǎn)品布局,能夠根據(jù)客戶的特定技術需求提供定制化的存儲解決方案。此外,江波龍匯聚了眾多行業(yè)資深專家,積累了豐富的技術經(jīng)驗,特別是在顆粒研究、測試算法和設備開發(fā)等方面,能夠深入分析NAND Flash和DRAM的特性,并與客戶預先確認技術需求。通過建立專業(yè)、專項的FAE+AE+R&D團隊,PTM商業(yè)模式能夠幫助企業(yè)級客戶高效實現(xiàn)產(chǎn)品創(chuàng)新和大幅成本優(yōu)化,從而提升客戶的業(yè)務競爭力。

在制造方面,江波龍通過在中山存儲產(chǎn)業(yè)園、蘇州和南美洲封裝測試基地的國內(nèi)、海外雙循環(huán)產(chǎn)業(yè)鏈布局,實現(xiàn)了從存儲芯片到模組產(chǎn)品的全鏈條覆蓋。不僅保證了業(yè)內(nèi)領先的企業(yè)級生產(chǎn)產(chǎn)能,還實現(xiàn)了高效的全站點追溯能力,如同餐廳的開放式廚房,確保每道工序都可視化、透明化,讓客戶對產(chǎn)品品質(zhì)和生產(chǎn)流程擁有更為清晰而直觀的了解。

通過上述綜合措施,PTM商業(yè)模式已經(jīng)實現(xiàn)了從技術到制造再到產(chǎn)品的全方位支持,成功為華勤等客戶提供定制化的一站式交付產(chǎn)品,產(chǎn)品性價比得到客戶高度評價。

對于存儲產(chǎn)品未來的發(fā)展方向,曹潯峰認為是存儲池化,以適應AI大模型應用發(fā)展的緩存需求。曹潯峰表示,江波龍將聚焦于開發(fā)性能更好、容量更大、成本更低存儲產(chǎn)品,并引入QLC NAND Flash作為資源補充,以滿足不同客戶的差異化需求,與產(chǎn)業(yè)鏈合作伙伴共同推動算力產(chǎn)業(yè)進步。

給作者點贊
0 VS 0
寫得不太好
熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權所有 舉報電話:021-54451141