發(fā)展概述:AI Agent歷經(jīng)兩階段蛻變,邁向多領(lǐng)域自主執(zhí)行的廣泛應(yīng)用
AI智能體(AI Agent)是一種能夠自主感知環(huán)境、進行決策并執(zhí)行任務(wù)的智能系統(tǒng)。從早期專注于特定任務(wù)的AI系統(tǒng),到如今能自主執(zhí)行復(fù)雜任務(wù)的智能實體,演進歷經(jīng)兩個關(guān)鍵時期:
基于規(guī)則和早期機器學(xué)習(xí)階段:AI Agent專注于特定領(lǐng)域的任務(wù),能力有限。1997年,IBM的深藍在國際象棋中戰(zhàn)勝世界冠軍,展示基于規(guī)則的AI在特定領(lǐng)域的潛力,但缺乏通用性。2016年,谷歌的AlphaGO通過深度學(xué)習(xí)和蒙特卡洛樹搜索戰(zhàn)勝圍棋高手,拓寬AI在策略博弈領(lǐng)域的應(yīng)用。
基于大語言模型的快速發(fā)展階段:大語言模型強勢崛起,基于LLM的AI Agent應(yīng)運而生。2018年,谷歌發(fā)布BERT模型開啟大語言模型時代,AI Agent進入快速發(fā)展期。2019年,OpenAI推出GPT系列,尤其是GPT-3和GPT-3.5,大幅提升AI Agent的文本生成和知識儲備能力。2023年,LLaMA、BLOOM等開源大模型降低了行業(yè)門檻,促進技術(shù)生態(tài)的多元化。今年3月GPT-4和AutoGPT的發(fā)布,使AI Agent能夠自主規(guī)劃和執(zhí)行復(fù)雜任務(wù),實現(xiàn)了從被動執(zhí)行到主動工作的轉(zhuǎn)變。據(jù)Gartner預(yù)計,Agentic AI是2025年十大技術(shù)趨勢之一,并預(yù)測到2028年,至少有15%的日常工作決策將由Agentic AI自主完成。
功能應(yīng)用:基于LLM的AI Agent的關(guān)鍵功能受限,有待未來突破
基于LLM的AI Agent不僅讓每個人都有增強能力的專屬智能助理,還會改變?nèi)藱C協(xié)同的模式。生成式AI帶來的人機協(xié)同,呈現(xiàn)出三種模式。在智能體模式中,AI的互動性、自主性和適應(yīng)性得到充分發(fā)揮,可以作為獨立行動者自主完成任務(wù),人類則從執(zhí)行者轉(zhuǎn)變?yōu)楸O(jiān)督者和評估者,與嵌入模式的命令執(zhí)行工具和副駕駛模式的合作伙伴有本質(zhì)區(qū)別。
表1 生成式AI帶來的三種人機協(xié)同模式對比
AI Agent的關(guān)鍵功能,如自主思考、規(guī)劃與工具調(diào)用、記憶、多模態(tài)理解,當前均存在一定的局限性。一是自主思考能力有限。當前AI Agent多基于RPA理念,依賴人為設(shè)定的規(guī)則和干預(yù),自主探索能力較弱。二是規(guī)劃與工具調(diào)用能力低。AI Agent在復(fù)雜場景下的推理和規(guī)劃能力尚待提高,對于模糊或不完整的指令,其表現(xiàn)可能不穩(wěn)定。三是長期記憶構(gòu)建能力不足。大多數(shù)AI Agent依賴Prompt構(gòu)建短期記憶,而事實性記憶則通過RAG技術(shù)實現(xiàn),但缺乏長效、穩(wěn)固的記憶體系,難以支撐連貫且深入的交互需求。四是多模態(tài)理解能力差。AI Agent主要依賴大語言模型,在圖像、音頻、視頻等多模態(tài)信息理解上能力有限。隨著技術(shù)不斷進步,未來AI Agent有望在這些領(lǐng)域?qū)崿F(xiàn)顯著突破,變得更加智能和自適應(yīng)。
市場發(fā)展:2024年企業(yè)AI設(shè)計模式中,AI Agent異軍突起
據(jù)Menlo Ventures數(shù)據(jù),在企業(yè)AI設(shè)計模式中,AI Agent今年異軍突起,占比從0上升至12%。Agent具備復(fù)雜推理能力、能執(zhí)行多步驟任務(wù),有望與企業(yè)應(yīng)用深度結(jié)合,在企業(yè)服務(wù)等各類場景中發(fā)揮巨大價值。
圖1 企業(yè)AI設(shè)計模式采用率變化
2024年以來,全球AI Agent賽道資本市場也愈加活躍,融資數(shù)量超25起,融資金額超665億元1,其中下半年融資數(shù)量是上半年2倍多。隨著AI相關(guān)技術(shù)的快速發(fā)展,未來AI Agent領(lǐng)域有望獲得更多融資,市場發(fā)展前景也更加廣闊,據(jù)Markets and Markets預(yù)測,全球AI Agent市場將從2024年的51億美元增長到2030年的471億美元,年復(fù)合增長率達44.8%。
AI Agent已成科技巨頭必爭之地。微軟在Ignite 2024技術(shù)大會宣布建立全球最大的企業(yè)級AI Agent生態(tài)系統(tǒng),已有超過10萬家公司利用Copilot Studio創(chuàng)建或編輯AI Agent。谷歌推出商用AI Agent市場AI Agent Space,上架19款解決方案,并且還在持續(xù)更新中。國內(nèi)科技巨頭也在快速布局AI Agent領(lǐng)域,智譜在11月29日的OpenDay上發(fā)布AutoGLM、AutoGLM-Web、AutoGLMPC三款A(yù)gent產(chǎn)品,字節(jié)、騰訊、百度、阿里等大廠也推出扣子、騰訊元器、文心智能體、千帆AgentBuilder等Agent產(chǎn)品。AI Agent成為“新風(fēng)口”。
典型應(yīng)用:Agent成為個性化需求和企業(yè)智能化轉(zhuǎn)型的重要工具
隨著AI技術(shù)的發(fā)展,有以下幾個典型Agent產(chǎn)品:
AutoGLM更關(guān)注手機端使用。AutoGLM是智譜科技推出的一款A(yù)I智能體產(chǎn)品,旨在提升用戶的生活和工作效率。一是模擬人類操作,通過文字或語音指令,完成如微信點贊評論、淘寶購物、攜程酒店預(yù)訂、12306購票、美團外賣等多項任務(wù)。二是無需API支持,擺脫特定接口依賴,直接對接圖形用戶界面。三是具備跨App能力,支持抖音、京東、餓了么等主流APP,為用戶在多APP交互場景中提供便利,如可在美團和餓了么比價、在小紅書搜攻略后去攜程訂酒店等。四是自動化任務(wù)執(zhí)行,在真實環(huán)境中執(zhí)行自動化任務(wù),簡化用戶的操作流程。AutoGLM在7款常見手機APP中應(yīng)用測試中表現(xiàn)良好,絕大多數(shù)任務(wù)都能圓滿完成,少數(shù)未完成的任務(wù)也能部分推進。
圖2 AutoGLM在7款常見的安卓APP表現(xiàn)情況
Claude 3.5 Sonnet具備“像人一樣使用電腦”的能力。2024年10月,Anthropic發(fā)布升級版Claude 3.5 Sonnet模型。一是推理能力大幅升級,在研究生水平推理能力GPQA、一般推理能力MMLU、編程能力等方面表現(xiàn)優(yōu)于GPT-4o和Gemini 1.5。二是新增“Computer use”功能,可模擬人類操作電腦,通過API指令,Claude能觀察屏幕、移動光標、點擊按鈕和輸入文本,從而執(zhí)行網(wǎng)站設(shè)計、表格填充等任務(wù),顯著提升AI的自動化能力。三是分步驟拆解規(guī)劃,在模擬人類操作電腦時,Claude將任務(wù)拆解成了若干步驟,并對每一步給出詳細解釋,使用合適的工具去完成規(guī)劃。四是具備自我調(diào)整過程,如遇到瀏覽器閃崩可以再次打開瀏覽器并展示結(jié)果。升級版Claude 3.5 Sonnet在OSWorld2測試中,雖然得分為AI模型中首位,但其電腦使用能力表現(xiàn)較人類水平仍有提升空間。
Agentforce商業(yè)化進展加速。Agentforce是由Salesforce在2024年9月推出的一款自主AI Agent產(chǎn)品,旨在通過智能化和自動化的方式提升企業(yè)的服務(wù)、銷售和營銷效率。Agentforce由Agent Builder和Agentforce Service Agent兩部分組成。一是提供定制服務(wù),Agent Builder可以讓企業(yè)用戶可通過低代碼/無代碼等方式來定制AI Agent,以適應(yīng)不同的業(yè)務(wù)場景需求。二是支持即用服務(wù),Agentforce Service Agent是面向客戶的AI服務(wù)助手,支持多渠道(如語音、WhatsApp、Facebook Messenger)自助服務(wù),幫助企業(yè)快速響應(yīng)客戶需求。Agentforce已面向服務(wù)和銷售全面推出,起價為每對話2美元。根據(jù)Salesforce FY2025Q3業(yè)績會,第三季度公司獲得超過100萬美元的AI交易數(shù)量,同比增長兩倍多。
表2 典型AI agent應(yīng)用對比
注釋
1.數(shù)據(jù)來源:來覓數(shù)據(jù)
2.一項評估 AI 模型電腦使用能力的測試
本文作者
左芳芳
戰(zhàn)略發(fā)展研究所
二級分析師
中級統(tǒng)計師,就職于中國電信研究院,長期從事產(chǎn)業(yè)數(shù)字化、數(shù)據(jù)要素等研究領(lǐng)域。
張秀鳳
戰(zhàn)略發(fā)展研究所
二級分析師
碩士、高級工程師。具有多年通信行業(yè)、零售行業(yè)研究經(jīng)驗。近年來主要從事數(shù)字政府、行業(yè)數(shù)字化轉(zhuǎn)型等領(lǐng)域的研究。
鄧麗華
戰(zhàn)略發(fā)展研究所
一級分析師
就職于中國電信研究院,長期從事價值評估、行業(yè)洞察等,近年來專注產(chǎn)業(yè)數(shù)字化、人工智能等領(lǐng)域研究。
田盼
戰(zhàn)略發(fā)展研究所
副主任分析師