日前,DeepSeek宣布DeepSeek V3模型完成小版本升級,版本號為DeepSeek-V3-0324。
27日晚,摩爾線程宣布,其迅速響應(yīng)并完成了對DeepSeek-V3的無縫升級,實現(xiàn)了零報錯、零兼容性問題的光速部署。
摩爾線程表示,在Deepseek-V3-0324模型上的光速適配,再次有力驗證了國產(chǎn)全功能GPU在推動大模型產(chǎn)業(yè)化落地方面的巨大潛力。
據(jù)了解,DeepSeek-V3-0324模型參數(shù)從初代V3的6710億小幅增至6850億,依然采用混合專家(MoE)架構(gòu),每個token激活約370億參數(shù),在推理、編程、數(shù)學(xué)、中文處理等多個領(lǐng)域達(dá)到行業(yè)領(lǐng)先水平。
根據(jù)DeepSeek官方發(fā)布的測試報告,DeepSeek-V3-0324在各項能力評測中表現(xiàn)出色。
DeepSeek-V3-0324不僅全面超越Claude-3.7-Sonnet與Qwen-Max等同類型優(yōu)質(zhì)模型,更在數(shù)學(xué)、代碼類等相關(guān)評測集上勝過了GPT-4.5。