C114通信網(wǎng)  |  通信人家園

人工智能
2025/4/25 22:24

解析百度“高說服力數(shù)字人”:AI技術(shù)如何說服用戶“買買買”?

C114通信網(wǎng)  南山

C114訊 4月25日消息(南山)作為AI技術(shù)的重要應(yīng)用方向,數(shù)字人去年以來迅速崛起,憑借“24小時(shí)直播”、“只需一部手機(jī)即可直播”、“低成本高收益”等賣點(diǎn),成為電商、營(yíng)銷、文旅等一眾行業(yè)的新寵。但問題也隨之浮現(xiàn):數(shù)字人不夠真實(shí),直播效果不佳;供應(yīng)商魚龍混雜,軟件價(jià)格暗藏陷阱;電商平臺(tái)態(tài)度不一等,為商家采用這一新型AI技術(shù)帶來了很多困擾。

很顯然,電商直播數(shù)字人市場(chǎng)還處于草創(chuàng)時(shí)期。百度嘗試通過AI技術(shù)創(chuàng)新實(shí)現(xiàn)引領(lǐng),在4月25日舉辦的“Create 2025百度AI開發(fā)者大會(huì)”上,百度創(chuàng)始人李彥宏發(fā)布了高說服力數(shù)字人,他介紹說,高說服力數(shù)字人具備聲形超擬真、內(nèi)容更專業(yè)、互動(dòng)更靈活的特點(diǎn),相比傳統(tǒng)數(shù)字人文案枯燥、動(dòng)作少、機(jī)器音重等問題,高說服力數(shù)字人在表情、語(yǔ)氣、動(dòng)作等都非常自然,甚至表現(xiàn)力超過真人。

而在這背后,發(fā)揮作用的重要是 “劇本生成”能力,能讓表情、語(yǔ)氣、動(dòng)作都匹配臺(tái)詞內(nèi)容實(shí)時(shí)調(diào)整,讓數(shù)字人的情緒轉(zhuǎn)折和動(dòng)作切換順暢。


比如現(xiàn)場(chǎng)演示的高說服力數(shù)字人講《蘇軾十講》視頻,可以看到慧播星生成的艾彌兒數(shù)字人非常逼真,表情、語(yǔ)氣、動(dòng)作都十分真實(shí),和真人無異,匹配臺(tái)詞實(shí)時(shí)調(diào)整,情緒轉(zhuǎn)折和動(dòng)作切換都很順暢,直播表現(xiàn)力甚至超越真人。

據(jù)悉,在文心4.5 Turbo和文心X1升級(jí)版的基礎(chǔ)上,通過視頻生成、劇本驅(qū)動(dòng)多模匹配、高感染力TTS等能力建設(shè),打造出的一種超擬真、會(huì)思考、能協(xié)同的數(shù)字人。

讓數(shù)字人超越真人,無疑極具吸引力,帶來了巨大的想象空間。問題在于,這是現(xiàn)在,還是未來?

逼近真人與超越真人

相比以前的數(shù)字人,在百度App電商平臺(tái)中直播的數(shù)字人,不僅外形如同真人,言談舉止甚至一些不經(jīng)意的小動(dòng)作,也和真人一般無異,還能夠和買家互動(dòng),渾然讓人忘記對(duì)面其實(shí)是一個(gè)虛擬人物,

可以看到不少數(shù)字人主播已經(jīng)“營(yíng)業(yè)”,效果極為擬真,不僅外形如同真人,言談舉止甚至一些不經(jīng)意的小動(dòng)作,也和真人一般無異,還能夠和買家互動(dòng),渾然讓人忘記對(duì)面其實(shí)是一個(gè)虛擬人物。

筆者基于個(gè)人的4分鐘視頻信息,創(chuàng)建了一個(gè)自己的慧播星電商直播數(shù)字人,并基于自己撰寫的文案一鍵開播。視頻直播中如同一個(gè)全新的自己:相貌一模一樣,說話方式也幾乎一樣,談?wù)摰膬?nèi)容則遠(yuǎn)非自己所能,讓筆者感到新鮮的同時(shí)也感到震驚。

在動(dòng)態(tài)的直播環(huán)境中,慧播星數(shù)字人的呈現(xiàn)效果,足夠驚艷。百度副總裁、百度電商總經(jīng)理平曉黎接受C114等媒體采訪時(shí)表示,慧播星數(shù)字人直播基于真人底板,因而視覺感知實(shí)現(xiàn)了和真人直播一樣的效果;同時(shí),基于語(yǔ)音大模型,聲音也實(shí)現(xiàn)了類似真人的表達(dá)感染力;基于預(yù)設(shè)的劇本,數(shù)字人的動(dòng)作也更加協(xié)調(diào)、自然,除了直播,也會(huì)通過一些細(xì)節(jié),例如翻看手機(jī),展現(xiàn)出更好的親和力。

百度慧播星數(shù)字人不僅擁有擬真的外貌和表現(xiàn),它還擁有基于龐大云端知識(shí)庫(kù)的豐富知識(shí)儲(chǔ)備,從而做到“美貌與實(shí)力并存”。因此,在某種程度上來看,畫慧播星數(shù)字人直播能夠?qū)崿F(xiàn)超越真人直播的效果。

上述逼近真人的表現(xiàn)之外,慧播星數(shù)字人還有龐大的云端知識(shí)庫(kù),無疑比真人主播更加“博學(xué)”、更具文采,從而在某些方面實(shí)現(xiàn)超越真人直播的效果。平曉黎提到,電商直播具有一定的門檻,滲透率還比較低,而通過慧播星數(shù)字人,大量商家將直接擁有直播能力,切入這一領(lǐng)域,從而實(shí)現(xiàn)銷售額的增長(zhǎng)。百度采取開放的態(tài)度,為商家打造了強(qiáng)大的數(shù)字人直播平臺(tái)。

數(shù)字人有望迎來“DeepSeek時(shí)刻”

高說服力數(shù)字人的概念,建立在多項(xiàng)AI技術(shù)取得突破的基礎(chǔ)之上。相比建模、綁定、渲染等傳統(tǒng)數(shù)字人技術(shù),以及上一代的語(yǔ)音交互、自然語(yǔ)言處理、視覺等AI技術(shù),新一代大模型帶來了多模態(tài)融合、腳本智能創(chuàng)作、自主思考決策、多智能體調(diào)度等核心技術(shù),使得數(shù)字人能力、制作時(shí)間、成本等一降再降低,效果也迎來質(zhì)的飛躍。

平曉黎重點(diǎn)講解了兩大新應(yīng)用:一方面基于多模態(tài)融合,從大模型驅(qū)動(dòng)的腳本模式,演進(jìn)到了劇本模式。劇本模式在生成上不僅指導(dǎo)數(shù)字人主播表達(dá)的語(yǔ)言腳本,更是進(jìn)入了劇本,直播時(shí)用什么樣的表情和動(dòng)作,語(yǔ)調(diào)是激情澎拜還是娓娓道來,均可通過“克隆”實(shí)現(xiàn),以及業(yè)內(nèi)領(lǐng)先的唇動(dòng)生成技術(shù),用戶上傳真人視頻,可一鍵克隆真人聲音、形象與直播間裝修,0門檻開啟24小時(shí)數(shù)字人直播。

另一方面多智能體協(xié)同實(shí)現(xiàn)了AI大腦,配合主播的口播文案,AI大腦能夠?qū)崟r(shí)調(diào)度素材,展現(xiàn)和文本一一對(duì)應(yīng)的內(nèi)容。而當(dāng)用戶提問時(shí),AI大腦也能及時(shí)根據(jù)用戶需求,調(diào)度視頻來呈現(xiàn)用戶想要看到的畫面。這種毫秒級(jí)的響應(yīng)能力,讓專業(yè)講解變得可視化、記憶點(diǎn)十足,同時(shí)主播還能夠根據(jù)用戶歷史行為,主動(dòng)發(fā)起提問和用戶互動(dòng),且能夠持續(xù)互動(dòng),從而說服用戶“買買買”。

基于文心4.5turbo等大模型作為底座能力,百度慧播星上線了“一鍵開播”、“一鍵克隆”等新功能,每一位入駐百度電商平臺(tái)的商家,無需付費(fèi)購(gòu)買軟件,均可0成本制作數(shù)字人主播,且靈活切換主播風(fēng)格,從而帶來業(yè)務(wù)的增長(zhǎng)。亂象橫生的電商直播數(shù)字人市場(chǎng),可能迎來了“DeepSeek時(shí)刻”,人人皆可直播,帶來了巨大的創(chuàng)造力。

AI大模型的“殺手級(jí)應(yīng)用”

在Create 2025上演講時(shí),李彥宏認(rèn)為數(shù)字人是2025 年最令人激動(dòng)的突破性應(yīng)用之一。

基于高說服力數(shù)字人所呈現(xiàn)的突破性創(chuàng)新,筆者看到了數(shù)字人徹底擺脫傳統(tǒng)動(dòng)作神情呆板、聲音機(jī)械化缺乏情感等形象,變得“有血有肉”,甚至展現(xiàn)出一個(gè)有趣的靈魂,有望成為AI大模型的“殺手級(jí)應(yīng)用”。

百度做了大量工作。在技術(shù)側(cè),百度慧播星在IDC評(píng)選的綜合實(shí)力排名行業(yè)第一基礎(chǔ)上再度升級(jí),高說服力數(shù)字人首先說服的是廣大商家,再由商家說服顧客;在市場(chǎng)側(cè),據(jù)平曉黎透露,百度正在通過業(yè)務(wù)部署,正在與外貿(mào)商家密切溝通,幫助他們出口轉(zhuǎn)內(nèi)銷,打開新渠道。數(shù)字人是重要一環(huán),可以幫助外貿(mào)商家更低成本、更快地適應(yīng)國(guó)內(nèi)電商市場(chǎng),無需招聘直播團(tuán)隊(duì)、準(zhǔn)備直播場(chǎng)地,即可開展直播電商業(yè)務(wù)。


盡管和真人主播、尤其是頭部大主播的人設(shè)打造、粉絲經(jīng)營(yíng)相比,數(shù)字人主播還存在不足,但從新一輪技術(shù)突破的角度看,數(shù)字人主播已能成為商家直播電商的重要幫手,起到輔助甚至主攻的作用,也擁有了成為頭部主播的潛力。尤其是教育、圖書、醫(yī)療、法律等考驗(yàn)主播的文化素養(yǎng)或知識(shí)技能的領(lǐng)域,數(shù)字人直播憑借擁有云端知識(shí)庫(kù)的AI大腦,能力已整體超過真人主播。

用戶用百度慧播星創(chuàng)造一個(gè)數(shù)字人直播,或者在百度App上觀看幾場(chǎng)數(shù)字人直播,就會(huì)直觀地感受到數(shù)字人技術(shù)的巨大突破。隨著AI技術(shù)迭代,數(shù)字人直播電商市場(chǎng)有望快速越過草創(chuàng)期,進(jìn)入行業(yè)走向規(guī)范、繁榮的發(fā)展期。

給作者點(diǎn)贊
0 VS 0
寫得不太好

版權(quán)說明:凡注明來源為“C114通信網(wǎng)”的文章皆屬C114版權(quán)所有,除與C114簽署內(nèi)容授權(quán)協(xié)議的單位外,其他單位未經(jīng)允許禁止轉(zhuǎn)載、摘編,違者必究。如需使用,請(qǐng)聯(lián)系021-54451141。其中編譯類僅出于傳遞更多信息之目的,系C114對(duì)海外相關(guān)站點(diǎn)最新信息的翻譯稿,僅供參考,不代表證實(shí)其描述或贊同其觀點(diǎn),投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān);翻譯質(zhì)量問題請(qǐng)指正。

熱門文章
    最新視頻
    為您推薦

      C114簡(jiǎn)介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號(hào)

      C114 通信網(wǎng) 版權(quán)所有 舉報(bào)電話:021-54451141