騰訊云AI代碼助手最新宣布,正式搭載DeepSeek-V3-0324頂級模型。
無需配置,下載/更新AI代碼助手插件即可用,官方號稱開發(fā)效率能直接提升100倍。
DeepSeek-V3-0324是DeepSeek-V3系列的小版本迭代,模型參數(shù)從初代V3的6710億小幅增至6850億,依然采用混合專家(MoE)架構(gòu),每個token激活約370億參數(shù),在推理、編程、數(shù)學(xué)、中文處理等多個領(lǐng)域達(dá)到行業(yè)領(lǐng)先水平。
甚至最近討論火熱的“7米甘蔗過2米門”AI測試題也能自主發(fā)現(xiàn)隱藏解法,給出合理答案。
騰訊總結(jié)了DeepSeek-V3-0324的五大強(qiáng)項:
創(chuàng)新的訓(xùn)練策略
-采用無輔助損失的負(fù)載均衡,避免傳統(tǒng)方法的性能損失
-多token預(yù)測訓(xùn)練提升推理速度,F(xiàn)P8混合精度訓(xùn)練顯著降低計算成本
-在超大規(guī)模模型上驗證FP8訓(xùn)練的有效性,提高訓(xùn)練效率
優(yōu)化的MoE架構(gòu)
-動態(tài)調(diào)整偏差項,防止路由崩潰,性能提升15%以上
-節(jié)點(diǎn)受限路由機(jī)制減少跨節(jié)點(diǎn)通信流量至1/3,結(jié)合FP8調(diào)度與RDMA優(yōu)化,訓(xùn)練效率提升40%
-支持128K超長上下文,可處理50頁P(yáng)DF或完整代碼庫,多輪對話記憶更強(qiáng)
綜合能力大幅提升
-關(guān)鍵指標(biāo)突破性進(jìn)步,在各項權(quán)威基準(zhǔn)測試中相較于初代V3,在關(guān)鍵指標(biāo)上展現(xiàn)了突破性進(jìn)步。
MMLU-Pro:75.9→81.2(+5.3)-多領(lǐng)域知識理解能力
GPQA:59.1→68.4(+9.3)-專業(yè)問答能力
AIME:39.6→59.4(+19.8)-數(shù)學(xué)競賽解題能力,進(jìn)步最為顯著
LiveCodeBench:39.2→49.2(+10.0)-代碼生成與調(diào)試能力
-數(shù)學(xué)推理能力突出,AIME競賽正確率提升近20%,超越Grok3
-中文處理優(yōu)勢,中長篇寫作邏輯更嚴(yán)密,聯(lián)網(wǎng)搜索報告更精準(zhǔn)
頂尖的編程生成能力,代碼生成質(zhì)量達(dá)到行業(yè)頂尖水平
-單一提示詞中,可精準(zhǔn)生成800行無錯誤網(wǎng)頁代碼(含動態(tài)交互,視覺美觀)
-代碼可運(yùn)行率92%,支持20+編程語言,前端開發(fā)效率提升80%
-在kcores-llm-arena評測超越Claude 3 Sonnet普通版
高效的推理與開發(fā)者體驗
-推理任務(wù)顯著提升,借鑒DeepSeek R1模型訓(xùn)練技術(shù),上線每秒20+token生成速度(M3 Ultra設(shè)備),響應(yīng)比前代快40%
-智能補(bǔ)全、代碼糾錯、API兼容性檢測等功能大幅提升開發(fā)效率