C114通信網(wǎng)  |  通信人家園

人工智能
2025/1/6 11:18

天工大模型4.0 o1版/4o版上線,App及網(wǎng)頁(yè)可免費(fèi)使用

IT之家  清源

昆侖萬(wàn)維集團(tuán)今日宣布,天工大模型 4.0 o1 版和 4o 版同步上線,全量登陸網(wǎng)頁(yè)端和 App 端,可免費(fèi)使用。

天工大模型 4.0 o1 版號(hào)稱國(guó)內(nèi)首款具備中文邏輯推理能力的 o1 模型,不僅包含上線即開(kāi)源的模型,還有兩款性能更強(qiáng)的專用版本。其能夠熟練處理各種推理挑戰(zhàn),包括數(shù)學(xué)、代碼、邏輯、常識(shí)、倫理決策等問(wèn)題。

天工大模型 4.0 4o 版則是一款多模態(tài)模型,官方還推出了由其賦能的實(shí)時(shí)語(yǔ)音對(duì)話助手 Skyo,是一個(gè)“具備情感表達(dá)能力、快速響應(yīng)能力、多語(yǔ)言流暢切換”的智能語(yǔ)音對(duì)話工具。

從官方獲悉,Skywork o1 具備三階段自研訓(xùn)練方案:

推理反思能力訓(xùn)練:Skywork o1 通過(guò)自研的多智能體體系構(gòu)造高質(zhì)量的分步思考,反思和驗(yàn)證數(shù)據(jù)。通過(guò)高質(zhì)量的、多樣性的長(zhǎng)思考數(shù)據(jù)對(duì)基座模型進(jìn)行繼續(xù)預(yù)訓(xùn)練和監(jiān)督微調(diào)。此外,我們?cè)诎姹镜型ㄟ^(guò)大規(guī)模使用自蒸餾和拒絕采樣,顯著提升了模型的訓(xùn)練效率和邏輯推理能力。

推理能力強(qiáng)化學(xué)習(xí):Skywork o1 團(tuán)隊(duì)研發(fā)了最新的適配分步推理強(qiáng)化的 Skywork o1 Process Reward Model(PRM)。實(shí)驗(yàn)證明 Skywork-PRM 可有效地捕捉到復(fù)雜推理任務(wù)中間步驟和思考步驟對(duì)最終答案的影響。結(jié)合自研分步推理強(qiáng)化算法進(jìn)一步加強(qiáng)模型推理和思考能力。

推理 planning:基于天工自研的 Q * 線上推理算法配合模型在線思考,并尋找最佳推理路徑。這也是全球首次將 Q * 算法實(shí)現(xiàn)和公開(kāi)。Q * 算法落地也大大提升了模型線上推理能力。

給作者點(diǎn)贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與C114通信網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡(jiǎn)介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號(hào)

      C114 通信網(wǎng) 版權(quán)所有 舉報(bào)電話:021-54451141