2025/1/15 15:18

上海AI實(shí)驗(yàn)室書生·浦語大模型升級：僅用4T數(shù)據(jù)訓(xùn)練而成，通用模型首次融合常規(guī)對話與深度思考

IT之家清源

從上海人工智能實(shí)驗(yàn)室獲悉，其書生大模型今日獲得重要版本升級 —— 書生浦語 3.0（InternLM3）。據(jù)官方介紹，其通過精煉數(shù)據(jù)框架大幅提升了數(shù)據(jù)效率，實(shí)現(xiàn)思維密度的躍升。

InternLM3-8B-Instruct 僅使用 4T 數(shù)據(jù)訓(xùn)練，官方宣稱其綜合性能超過同量級開源模型，節(jié)約超 75% 訓(xùn)練成本；首次在通用模型中實(shí)現(xiàn)了常規(guī)對話與深度思考能力融合，可應(yīng)對更多真實(shí)使用場景。

基于司南 OpenCompass 開源評測框架，該模型研究團(tuán)隊(duì)使用統(tǒng)一可復(fù)現(xiàn)的方法對該模型進(jìn)行評測。評測采用 CMMLU、GPQA 等十多個權(quán)威評測集，維度包括推理、數(shù)學(xué)、編程、指令跟隨、長文本、對話及綜合表現(xiàn)等多方面性能，結(jié)果顯示，書生浦語 3.0 在大多數(shù)評測集得分領(lǐng)先，綜合性能“十分接近 GPT-4o-mini”。

上海 AI 實(shí)驗(yàn)室披露了部分該模型的體驗(yàn)案例，如解答“箭頭迷宮問題”等推理謎題，讓模型在棋盤格中找到從起點(diǎn)到終點(diǎn)的可行路徑。

以及“猜數(shù)字”問題：

此外，其深度思考能力也拓展到了智能體任務(wù)，成為了開源社區(qū)內(nèi)首個支持瀏覽器使用的通用對話模型，支持 20 步以上網(wǎng)頁跳轉(zhuǎn)以完成深度信息挖掘。

體驗(yàn)頁面：https://internlm-chat.intern-ai.org.cn

GitHub鏈接：https://github.com/InternLM/InternLM

HuggingFace鏈接：https://huggingface.co/internlm

ModelScope鏈接：https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm3-8b-instruct

給作者點(diǎn)贊

0 VS 0

寫得不太好

免責(zé)聲明：本文僅代表作者個人觀點(diǎn)，與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí)，對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考，并請自行核實(shí)相關(guān)內(nèi)容。

相關(guān)鏈接

融合

上海AI實(shí)驗(yàn)室書生·浦語大模型升級：僅用4T數(shù)據(jù)訓(xùn)練而成，通用模型首次融合常規(guī)對話與深度思考

上海AI實(shí)驗(yàn)室書生·浦語大模型升級：僅用4T數(shù)據(jù)訓(xùn)練而成，通用模型首次融合常規(guī)對話與深度思考