隨著人工智能技術(shù)的飛速發(fā)展,企業(yè)在推動(dòng)AI技術(shù)落地時(shí),不僅需要高性能的推理能力,更希望能夠降低部署成本,提升應(yīng)用效率。中興通訊近日推出了NTele-R1-Lite-32B-v2星云大模型,這款僅有32B參數(shù)的輕量級(jí)大模型,不僅性能出眾,而且顯著降低了AI推理的部署成本,成為企業(yè)快速落地AI技術(shù)的理想選擇。
一、32B星云大模型,為何備受矚目?
1、性能卓越,樹(shù)立行業(yè)新標(biāo)桿
作為一款32B參數(shù)規(guī)模的輕量大模型,該大模型在多項(xiàng)權(quán)威基準(zhǔn)測(cè)試中全面領(lǐng)先,展現(xiàn)出卓越的推理性能:
·數(shù)學(xué)推理:在AIME2024評(píng)測(cè)中,以83.3分的高分領(lǐng)先,超越QWQ-32B 4.1%,DeepSeek-R1 4.3%。
·代碼生成:LiveCodeBench綜合通過(guò)率達(dá)到76.2%,優(yōu)于QWQ-32B 3.7%,DeepSeek-R1 15.6%。
·數(shù)學(xué)競(jìng)賽:OlympiadBench測(cè)試得分74.8分,領(lǐng)先QWQ-32B 1.1%。
這些成績(jī)不僅證明了32B星云大模型的卓越推理能力,更凸顯了其在高效AI應(yīng)用領(lǐng)域的巨大潛力。
2、成本降低,為企業(yè)節(jié)省每一分錢(qián)
除了卓越的性能外,32B星云大模型還大幅降低了AI推理的部署成本。相比于參數(shù)規(guī)模高達(dá)671B的DeepSeek-R1,32B星云大模型通過(guò)架構(gòu)優(yōu)化與動(dòng)態(tài)稀疏化技術(shù),部署成本下降了高達(dá)90%。得益于這一突破,企業(yè)可通過(guò)單卡部署實(shí)現(xiàn)高效的AI應(yīng)用,從而大大降低了入門(mén)門(mén)檻,助力企業(yè)快速落地AI技術(shù)。
二、技術(shù)創(chuàng)新,性能與成本雙突破
中興通訊在追求“高性能 × 低成本”AI推理模型的道路上,憑借多項(xiàng)核心技術(shù)創(chuàng)新,為32B星云大模型注入澎湃動(dòng)能,使其在真實(shí)應(yīng)用場(chǎng)景中實(shí)現(xiàn)性能與效率的雙重躍升。
1.蒸餾+拒絕采樣,低成本打造高質(zhì)量訓(xùn)練語(yǔ)料
借助 DeepSeek-R1和QWQ-32B 作為教師模型,通過(guò)篩選最優(yōu)答案,提升數(shù)學(xué)、代碼等任務(wù)的正確率。多類型語(yǔ)料與多重校驗(yàn)機(jī)制結(jié)合,保證數(shù)據(jù)的有效性與多樣性。
·雙源協(xié)同蒸餾:以DeepSeek-R1/QWQ-32B為教師模型,取長(zhǎng)補(bǔ)短。采用了先進(jìn)的自研蒸餾技術(shù),通過(guò)減少40%的訓(xùn)練數(shù)據(jù)量,就能提升數(shù)學(xué)和代碼生成的表現(xiàn),訓(xùn)練資源消耗減少60%。
·拒絕采樣:AI生成多個(gè)答案,僅選擇最優(yōu)答案進(jìn)行訓(xùn)練,類比于挑選最高分的答卷作為標(biāo)準(zhǔn)答案,優(yōu)化解題方式。
2.強(qiáng)化學(xué)習(xí)Self-Improvement,讓AI更聰明
中興通訊創(chuàng)新性地提出了“回溯修正+驗(yàn)證增強(qiáng)+子目標(biāo)分解+逆向推導(dǎo)”四大方法論,結(jié)合LCPO強(qiáng)化學(xué)習(xí), 持續(xù)優(yōu)化推理鏈,減少無(wú)效回答,讓AI推理更加精準(zhǔn)、高效。
·四大方法論協(xié)同構(gòu)建初始知識(shí)框架:回溯修正機(jī)制實(shí)現(xiàn)動(dòng)態(tài)錯(cuò)誤檢測(cè)與路徑優(yōu)化;驗(yàn)證增強(qiáng)引擎負(fù)責(zé)中間過(guò)程驗(yàn)證和多維一致性校驗(yàn);子目標(biāo)分解引擎將復(fù)雜問(wèn)題模塊化處理;逆向推導(dǎo)算法生成目標(biāo)導(dǎo)向的最優(yōu)推理路徑。
·LCPO(Length Controlled Policy Optimization)強(qiáng)化學(xué)習(xí):引入輸出正確性與推理鏈長(zhǎng)度的雙重約束機(jī)制,一方面實(shí)時(shí)校驗(yàn)推理結(jié)果的準(zhǔn)確性,另一方面動(dòng)態(tài)優(yōu)化推理過(guò)程,顯著提升整體推理精度與效率。
3.負(fù)載均衡集群+動(dòng)態(tài)訓(xùn)練,訓(xùn)練效率倍增
高效分布式集群和動(dòng)態(tài)訓(xùn)練機(jī)制,同時(shí)提升訓(xùn)練效率與模型能力:
·負(fù)載均衡集群:數(shù)據(jù)并行、流水線并行和張量并行,訓(xùn)練效率提升200%。
·動(dòng)態(tài)訓(xùn)練機(jī)制:通過(guò)“混合語(yǔ)料+定向增強(qiáng)訓(xùn)練”兩階段動(dòng)態(tài)精調(diào)策略,在訓(xùn)練初期側(cè)重通識(shí)語(yǔ)料,后期逐步提高推理語(yǔ)料占比至1:5;并在訓(xùn)練過(guò)程中使用拒絕采樣,剔除簡(jiǎn)單樣本,平衡模型的探索與收斂速度,實(shí)現(xiàn)通用能力與特定場(chǎng)景能力的雙提升。
4.三維評(píng)估體系,安全與性能并重
32B星云大模型還通過(guò)“價(jià)值觀安全+推理能力+通用智能”三大維度的綜合評(píng)估體系,確保其推理輸出的可信性、準(zhǔn)確性與多樣性,使企業(yè)在應(yīng)用AI時(shí)更加放心。
三、面向未來(lái),開(kāi)啟“低成本×高性能”AI推理新時(shí)代
32B星云大模型的發(fā)布,不僅證明了合成數(shù)據(jù)引擎能夠降低90%的數(shù)據(jù)成本,還通過(guò)協(xié)同驗(yàn)證機(jī)制提高了語(yǔ)料過(guò)濾效率三倍,實(shí)現(xiàn)了消費(fèi)級(jí)硬件的部署。這標(biāo)志著中興通訊在AI推理模型研發(fā)領(lǐng)域的領(lǐng)先地位。未來(lái),中興通訊將繼續(xù)深化AI核心技術(shù)的研發(fā),不斷拓展技術(shù)邊界,將AI能力推廣至更多行業(yè)和場(chǎng)景。