C114訊 11月14日消息(艾斯)阿瑪拉定律說,人們總是高估技術(shù)短期變化,卻低估長期的變革。
無疑,這一觀點放置于眼下如日中天的人工智能(AI)浪潮背景中也是恰如其分的。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏作為AI的堅定支持者之一,顯然并不迷信于由這一波生成式AI推動的“超級應(yīng)用”會如眾人期待那般短期內(nèi)就從天而降,而是更愿意將這一由智能化開啟的新時代比作“新工業(yè)革命”的到來。
但同時,這也意味著更長遠(yuǎn)的發(fā)展周期與更深刻的顛覆性。
為什么是“應(yīng)用來了”
本周,百度世界2024于上海世博中心舉辦,今年的大會主題是“應(yīng)用來了”。
過去一兩年,大模型成為全球各行業(yè)談及AI時的核心聚焦點,同時也成為一部分加入這一賽道的創(chuàng)業(yè)企業(yè)的焦慮點。利用不斷迭代的大模型,究竟可以做些什么?機(jī)會在哪里?
“模型本身不產(chǎn)生直接價值,只有在模型之上開發(fā)各種應(yīng)用,在各種場景找到所謂的PMF,才能真正產(chǎn)生價值。如果說2023年大家還在卷模型,讓模型能力逐步達(dá)到可用的話,那未來所謂的‘可用’,就是真的有東西用,應(yīng)用的‘用’。”李彥宏在期間接受媒體采訪時強(qiáng)調(diào),只有把大模型真正化作能夠產(chǎn)生價值的實用應(yīng)用,才能讓更多從業(yè)者找到發(fā)展的路徑和方向。
因此,無代碼秒噠和文生圖檢索增強(qiáng)(iRAG)的發(fā)布,成為了此次百度世界的重點。
需要了解的一個背景是,去年10月,百度發(fā)布了智能體機(jī)制,并研制了系統(tǒng)2。其核心是思考模型,包括理解、規(guī)劃、反思和進(jìn)化,能夠做到可靠執(zhí)行,自我進(jìn)化,并在一定程度上將思考過程白盒化,從而讓機(jī)器像人一樣思考和行動,自主完成復(fù)雜任務(wù),同時在環(huán)境中持續(xù)學(xué)習(xí)、自主進(jìn)化。
無代碼秒噠和文生圖檢索增強(qiáng)(iRAG)則是激發(fā)智能體爆發(fā)的關(guān)鍵。
百度表示,無代碼秒噠能夠讓任何人,用自然語言開發(fā)應(yīng)用,實現(xiàn)想法。其中,零代碼工具就是多智能體協(xié)作的應(yīng)用,采用了智能體的中心化模式,其中的代碼智能體通過場景知識的增強(qiáng),顯著提升復(fù)雜代碼生成的質(zhì)量與穩(wěn)定性,高效實現(xiàn)用戶需要的功能,讓人人都可以成為程序員。
關(guān)于文生圖檢索增強(qiáng)(iRAG),百度研發(fā)了「理解-檢索-生成」協(xié)同優(yōu)化的檢索增強(qiáng)技術(shù),提升了大模型技術(shù)及應(yīng)用效果;面向不同應(yīng)用場景的生圖需求,進(jìn)一步研發(fā)了檢索增強(qiáng)的文生圖技術(shù),既可以生成精確的圖片,也可以進(jìn)行泛化生圖。
所有這些都建立在百度文心一言快速成長的基礎(chǔ)之上。自去年3月16日發(fā)布文心一言以來,“文心一言用戶規(guī)模達(dá)到4.3億,”百度首席技術(shù)官王海峰在會上宣布了這一數(shù)據(jù)。同時,文心大模型日均調(diào)用量已超過15億。
超級應(yīng)用一定會有,只是時機(jī)未到
正如從4G跨越到5G時代,移動通信行業(yè)在苦等一個顛覆性Killer APP一樣,AI行業(yè)經(jīng)過過去兩年生成式AI浪潮的轟炸式席卷,也在翹首期盼一個讓大家為之興奮的“超級應(yīng)用”。
對此,李彥宏表示,百度的愿景并不是要推出一個“超級應(yīng)用”,而是希望不斷地幫助更多人、更多企業(yè)打造出數(shù)以百萬“超級有用”的應(yīng)用。
從商業(yè)邏輯上講,這對于百度這樣一家擁有如此體量和歷史積累的企業(yè)來說是合理的。做平臺型的企業(yè),賦能更多開發(fā)者基于其平臺底座打造更多的應(yīng)用,而不是成為一家實力雄厚的應(yīng)用開發(fā)商,這意味著更廣闊的生態(tài)和更響亮的話語權(quán)以及更多元的收入機(jī)會。
但也如開篇所說,從李彥宏所述的產(chǎn)業(yè)發(fā)展邏輯來講,這樣的做法是將眼光放置到了更長遠(yuǎn)的發(fā)展周期。
“大家很容易把這波生成式AI和上一波移動互聯(lián)網(wǎng)或者上上一波PC互聯(lián)網(wǎng)相比,那之后的確出現(xiàn)了超級應(yīng)用。但人工智能很像是一次新的工業(yè)革命,這意味著它不是三五年就結(jié)束,不是一兩年就出現(xiàn)超級應(yīng)用的過程,它更像是三五十年對于整個社會的方方面面一個非常徹底的重構(gòu)!袄顝┖暾f,AI的超級應(yīng)用會有,只是現(xiàn)在時機(jī)未到。
另外,他在本次峰會上提出的另一個觀點亦引發(fā)了極大關(guān)注與反響——過去24個月,這個行業(yè)最大的變化是大模型基本消除了幻覺,回答問題的準(zhǔn)確性大幅提升。
實際上,正是得益于文生圖檢索增強(qiáng)(iRAG)這類技術(shù)的逐漸成熟,才使得AI工具在落地使用時能夠減少幻覺,提升準(zhǔn)確性與可控性。
務(wù)實的AI理想主義者
這里面還繞不開的一部分則包括百度自身在大模型等底層技術(shù)與框架的不斷增強(qiáng)升級。
C114了解到,在文生圖檢索增強(qiáng)(iRAG)的實現(xiàn)中,首先,基于大模型對用戶的需求進(jìn)行分析理解,自動規(guī)劃精確或泛化方案,比如對哪些實體進(jìn)行增強(qiáng);接著在增強(qiáng)階段,對需要增強(qiáng)的實體,檢索并選擇相應(yīng)的參考圖。最后在生成階段,百度自研了多模可控生圖大模型,一方面,通過局部注意力計算,在保持實體特征不變的情況下,實現(xiàn)了圖像的高泛化生成,比如根據(jù)牛頓的肖像,生成繪本風(fēng)格的牛頓;另一方面,通過整體注意力計算,進(jìn)行高精確的圖像生成,比如生成圖中的汽車跟原圖片保持完全一致。
不過,這并非李彥宏在大會上的演講重點。比起追逐大模型不斷迭代衍生的超級能力,他更愿意討論應(yīng)用的場景和真正的市場需求,而且這些應(yīng)用是被千千萬萬普羅大眾用戶所使用。
說回上面提到的“無代碼秒噠”。利用AI來進(jìn)行輔助代碼生成已非什么新鮮事,而百度這一有望于明年第一季度上線試用的新產(chǎn)品,則是希望將這樣的先進(jìn)生產(chǎn)力能力下沉到規(guī)模更大的、可能毫不具備相關(guān)基礎(chǔ)知識的用戶群。簡單來說,通過無代碼編程,由大模型直接生成代碼,不需要人寫一行代碼,這意味著門檻低,人人可上手。按李彥宏的話來說,這將開啟一個“只靠想法就能賺錢的時代”。
身處AI這樣一個瞬息萬變的前沿行業(yè),他認(rèn)為面向未來做出判斷時并不是在做猜謎游戲。而是先擁有一個愿景,然后再去實現(xiàn)這個愿景。在C114看來,李彥宏所描述的愿景中,既有手可摘星辰的浪漫主義,也有堅持普惠大眾的務(wù)實精神。
李彥宏表示,“今天,隨著基礎(chǔ)模型和智能體的能力逐步提升,我們把這些能力綜合在一起,就可以讓普通人,一行代碼都看不懂的人,具備程序員的能力。當(dāng)幾億、十幾億人都具備這種能力的時候,它對于創(chuàng)造力的爆發(fā),是輔助代碼生成工具沒法比的。輔助代碼工具還是讓金字塔塔尖的人更加powerful。而我們希望金字塔中間層和底層的人,擁有金字塔塔尖這些人的能力,這個意義更大”。李彥宏在采訪中說到。