2022年9月1日,世界人工智能大會(huì)(WAIC)“AI領(lǐng)SHOW”欄目在上海世博會(huì)議中心火熱拉開(kāi)序幕!癆I領(lǐng)SHOW”是本屆WAIC整場(chǎng)會(huì)議活動(dòng)全新升級(jí)后的配套欄目,“鎮(zhèn)館之寶”、“SAIL獎(jiǎng)Top30代表”、“重磅新品發(fā)布”、“元宇宙”等代表紛紛閃亮登場(chǎng),全程通過(guò)大會(huì)官網(wǎng)及CCTV.com直播。
中科院自動(dòng)化所研究員、武漢人工智能研究院院長(zhǎng)王金橋首先在AI領(lǐng)SHOW欄目登臺(tái)演講,展示了基于昇騰 AI 基礎(chǔ)軟硬件平臺(tái)打造的全球首個(gè)三模態(tài)大模型“紫東.太初”。“紫東.太初”通過(guò)跨模態(tài)多任務(wù)自監(jiān)督學(xué)習(xí),實(shí)現(xiàn)了圖像、文字、語(yǔ)音和視頻等不同模態(tài)數(shù)據(jù)之間的統(tǒng)一表示和互相生成的,且形成了完整的智能表示、推理和生成能力。
王院長(zhǎng)在AI領(lǐng)SHOW欄目向與會(huì)嘉賓講述道:“傳統(tǒng)人工智能學(xué)習(xí)當(dāng)中,通過(guò)視覺(jué)模型可以實(shí)現(xiàn)人臉的識(shí)別,但是并不知道機(jī)器怎么表征每個(gè)人的特征差異,只能從圖像中間結(jié)果的特征圖解釋機(jī)器學(xué)習(xí)的過(guò)程,而通過(guò)“紫東.太初”三模態(tài)的模型,可以把圖像、語(yǔ)音等實(shí)現(xiàn)跨模態(tài)的統(tǒng)一到人類語(yǔ)言的維度,更接近于人類的理解和思考方式!
細(xì)數(shù)“紫東.太初”四大大突破
1.多任務(wù)多層次的跨模態(tài)自監(jiān)督學(xué)習(xí)
提出了多任務(wù)多層次的跨模態(tài)自監(jiān)督學(xué)習(xí)的訓(xùn)練框架,支持詞條級(jí)別、模態(tài)級(jí)別和樣本級(jí)別的訓(xùn)練,實(shí)現(xiàn)了跨模態(tài)理解與生成的統(tǒng)一建模。
2.首次使“以圖生音”和“以音生圖”成為現(xiàn)實(shí)
“紫東.太初”首次貫通了語(yǔ)音、圖像、文字這幾種信息,形成了完整的智能表示、推理和生成能力,是當(dāng)前數(shù)據(jù)智能領(lǐng)域的最新發(fā)展趨勢(shì),為探索人類智能本質(zhì)提供了一個(gè)極佳的平臺(tái)。
3.首個(gè)千億參數(shù)多模態(tài)預(yù)訓(xùn)練大模型
“紫東.太初”作為全球范圍內(nèi)首個(gè)千億參數(shù)的三模態(tài)大模型,標(biāo)志著我國(guó)從限定領(lǐng)域的弱人工智能正式邁向通用人工智能路徑的重要探索。
4.“一專一能”突破至“多專多能”
“紫東.太初”多項(xiàng)算法指標(biāo)性能全球第一。讓AI從“一專一能”邁向“多專多能”的同時(shí),在多項(xiàng)下游任務(wù)中超越業(yè)界最好的性能,構(gòu)建了全自主人工智能技術(shù)體系。
除了向線上線下參會(huì)嘉賓展示“紫東.太初”的技術(shù)優(yōu)勢(shì),王院長(zhǎng)還表示已經(jīng)實(shí)現(xiàn)基礎(chǔ)模型開(kāi)源和大模型的服務(wù)開(kāi)放,近期將開(kāi)放“紫東.太初”服務(wù)平臺(tái)新的版本,支持低代碼人工智能模型的訓(xùn)練、微調(diào)和部署,通過(guò)API調(diào)用的模式,自動(dòng)上傳數(shù)據(jù),自動(dòng)標(biāo)注模型,自動(dòng)形成推理部署的工具,自動(dòng)體驗(yàn)效果。