全球生成式人工智能(AI)市場仍處于起步階段。根據(jù)最新預(yù)測,該市場將在五年內(nèi)增長五倍,從2024年的146億美元增長到2029年的728億美元。頂尖的應(yīng)用領(lǐng)域包括消費類、企業(yè)服務(wù)、零售業(yè)、媒體娛樂業(yè)以及醫(yī)療保健業(yè)。
作為生成式AI的下一個前沿領(lǐng)域,多模態(tài)生成式AI技術(shù)憑借其日益增強的多樣化功能,正在推動各行業(yè)的應(yīng)用案例,例如客戶服務(wù)、企業(yè)知識管理、3D數(shù)字分身以及制造業(yè)等。
目前,專注于多模態(tài)生成服務(wù)的生成式AI基礎(chǔ)模型廠商的能力主要面向通用用途,缺乏針對特定用例的定制化選項,無法重新訓(xùn)練以滿足特定需求,尤其是在高度監(jiān)管的行業(yè)或業(yè)務(wù)關(guān)鍵的應(yīng)用場景中。盡管這些模型在用戶中很受歡迎,但對于希望構(gòu)建企業(yè)級多模態(tài)生成式AI應(yīng)用的企業(yè)來說,這些模型的限制性很高。
相反,企業(yè)始終需要尋求基于最適合企業(yè)數(shù)據(jù)和業(yè)務(wù)目標的模型來開發(fā)多模態(tài)生成式AI應(yīng)用。這些模型需要具備高度的定制化能力、準確性、安全性,并符合市場的數(shù)據(jù)安全法規(guī)。由于并非所有開發(fā)者和企業(yè)都精通多模態(tài)生成式AI,因此他們需要一個開發(fā)平臺,該平臺能夠提供多樣化的多模態(tài)生成式AI模型選擇,同時易于部署、優(yōu)化和維護,以及滿足高標準的AI治理和安全要求。
百度智能云在多模態(tài)生成式AI上已經(jīng)在支持廣泛的開發(fā)者和企業(yè),從生成式AI模型廠商,如生數(shù)科技,到系統(tǒng)集成商如軟通動力和大型企業(yè)如蔚來汽車,協(xié)助他們推動多模態(tài)生成式AI的應(yīng)用。與此同時,百度智能云其強大的開發(fā)者社區(qū)與用戶積極互動,也有助于其持續(xù)優(yōu)化其產(chǎn)品與服務(wù)。
Omdia 觀點
生成式AI已在各行各業(yè)得到廣泛應(yīng)用。在開源和專有大型語言模型(LLM)的推動下,生成式AI已應(yīng)用于所有行業(yè)的120個應(yīng)用場景中。雖然基于LLM的應(yīng)用程序越來越受歡迎,但其本身仍存在固有的局限性。LLM主要針對文本和語音數(shù)據(jù)的理解、處理和生成進行了優(yōu)化,無法進行多模態(tài)學習,也無法生成除文本和語音之外的其他輸出。
為了解決上述問題,越來越多的廠商和開發(fā)者開始采用多模態(tài)生成式AI技術(shù)。該技術(shù)能夠處理多種輸入形式,包括文本、圖像和音頻,并將這些提示轉(zhuǎn)換為幾乎任意類型的輸出。這將進一步提升用戶體驗,因為模型可以實現(xiàn)多模態(tài)的理解和生成。
一方面,憑借其理解能力,用戶可以通過文本、語音、圖像和視頻與應(yīng)用程序自然交互。通過多模態(tài)數(shù)據(jù)理解上下文,多模態(tài)生成式AI應(yīng)用能夠以更全面的方式作出響應(yīng),幫助企業(yè)從其他數(shù)據(jù)類型中獲取情景感知的見解。
另一方面,多模態(tài)生成式AI技術(shù)的多模態(tài)生成能力允許用戶生成從文本到語音、圖像、視頻、音頻、音樂、點云數(shù)據(jù)、遙測數(shù)據(jù)、3D模型和數(shù)字孿生等各種類型的輸出。通過充分的預(yù)訓(xùn)練和微調(diào),這些模型可以生成高保真且物理準確的輸出,非常適合企業(yè)應(yīng)用場景。
希望部署多模態(tài)生成式AI應(yīng)用的企業(yè)可以與兩類廠商合作。
第一類:專注于多模態(tài)生成服務(wù)的生成式AI基礎(chǔ)模型廠商。這類廠商以提供多模態(tài)生成服務(wù)為主,例如,OpenAI推出了Sora,這是一項文本到視頻的生成服務(wù),能夠生成超逼真的視頻,主要面向消費、媒體和娛樂行業(yè)。
第二類:提供多模態(tài)的生成式AI模型和應(yīng)用的生成式AI開發(fā)平臺廠商。這些廠商通常是擁有深厚生成式AI基礎(chǔ)設(shè)施、工程和服務(wù)專業(yè)知識的超大規(guī)模企業(yè)。例如,百度智能云支持文心大模型、多模態(tài)模型系列和多模態(tài)生成式AI應(yīng)用,如百度智能云曦靈(數(shù)字人),能幫助企業(yè)快速構(gòu)建多模態(tài)生成式AI應(yīng)用。
與這兩類廠商合作各有利弊:
第一類廠商提供的模型對于不熟悉該技術(shù)的開發(fā)者和企業(yè)提供了一個甚佳的起點。由于多模態(tài)生成能力是通過服務(wù)方式提供的,用戶可以輕松訪問并使用該能力。這種使用便利性也為個人開發(fā)者降低開發(fā)門檻。然而,這類模型的多模態(tài)生成能力主要面向通用的應(yīng)用場景,缺乏針對特定用例的定制化選項,無法重新訓(xùn)練以滿足特定需求,尤其是在高度監(jiān)管的行業(yè)或業(yè)務(wù)關(guān)鍵的應(yīng)用場景中。盡管這些模型在用戶中很受歡迎,但對于希望構(gòu)建企業(yè)級多模態(tài)生成式AI應(yīng)用的企業(yè)來說,這些模型的限制性很高。
相反,企業(yè)始終需要尋求基于最適合企業(yè)數(shù)據(jù)和業(yè)務(wù)目標的模型來開發(fā)多模態(tài)生成式AI應(yīng)用。這些模型需要具備高度的定制化能力、準確性、安全性,并符合市場的數(shù)據(jù)安全法規(guī)。由于并非所有開發(fā)者和企業(yè)都精通多模態(tài)生成式AI,因此他們需要一個開發(fā)平臺,該平臺能夠提供多樣化的多模態(tài)生成式AI模型選擇,同時易于部署、優(yōu)化和維護,以及滿足高標準的AI治理和安全要求。
為了創(chuàng)建真正符合業(yè)務(wù)目標的多模態(tài)生成式AI應(yīng)用,提供全面多模態(tài)生成式AI解決方案的全棧廠商更適合企業(yè)。鑒于該領(lǐng)域缺乏專業(yè)知識和資源,企業(yè)難以期望僅提供基礎(chǔ)模型的廠商(第一類廠商)提供完全可定制的模型以及相關(guān)服務(wù)。全棧生成式AI解決方案廠商的核心業(yè)務(wù)并非僅銷售生成式AI模型及服務(wù),而是致力于推動企業(yè)落地。他們不會將自己局限于單一模型,而是會幫助客戶挑選最合適的生成式AI模型。企業(yè)和開發(fā)者可以使用其云產(chǎn)品和服務(wù)開發(fā)、部署和優(yōu)化這些模型,從而實現(xiàn)業(yè)務(wù)目標。
為何要將百度智能云千帆大模型平臺納入您的關(guān)注焦點?
隨著越來越多的企業(yè)和開發(fā)者意識到多模態(tài)生成式AI的潛力,一款從模型開發(fā)到智能體的端到端解決方案,同時具備無縫開發(fā)和集成能力的多模態(tài)生成式AI開發(fā)平臺,將對技術(shù)的普及至關(guān)重要。
百度智能云已經(jīng)注意到了上述市場需求,并正在迅速行動以抓住機遇。該云服務(wù)提供商已經(jīng)推出了一系列多模態(tài)生成式AI產(chǎn)品和服務(wù),即文心系列基礎(chǔ)模型以及千帆生成式AI開發(fā)平臺。多模態(tài)生成式AI對百度智能云而言已是駕輕就熟,因為該云服務(wù)提供商早在2023年初就推出了其大語言模型文心一言,并通過百度智能云千帆大模型平臺為客戶和開發(fā)者提供了全面的應(yīng)用開發(fā)工具、豐富的大模型、完善的模型開發(fā)工具鏈以及易用的應(yīng)用模板,用于多模態(tài)生成式AI應(yīng)用開發(fā),使百度智能云成為企業(yè)在構(gòu)建多模態(tài)生成式AI應(yīng)用時,無論處于哪個階段,都能信賴的理想合作伙伴。
雖然百度智能云將繼續(xù)在中國引領(lǐng)多模態(tài)生成式AI應(yīng)用的部署和實施。不過,其需要進一步鞏固其行業(yè)領(lǐng)導(dǎo)地位,必須向市場傳達其多模態(tài)專業(yè)知識,創(chuàng)造更多超越日常用例的多模態(tài)生成式AI應(yīng)用模板,并加大對多模態(tài)多智能體開發(fā)框架和解決方案的投入。
咨詢購買報告請掃碼聯(lián)系我們
本文作者
蘇廉節(jié)