C114通信網(wǎng)  |  通信人家園

人工智能
2024/11/14 10:29

OpenAI“下一個重大突破” 首個AI助理產(chǎn)品或明年1月發(fā)布 人機交互變革已至?

財聯(lián)社  宋子喬

據(jù)媒體報道,OpenAI正準(zhǔn)備推出一款代號為“Operator”的全新AI助理產(chǎn)品,可以自動執(zhí)行各種復(fù)雜操作,包括編寫代碼、預(yù)訂旅行、自動電商購物等。根據(jù)內(nèi)部員工爆料,OpenAI領(lǐng)導(dǎo)層預(yù)計將在2025年1月發(fā)布該產(chǎn)品,首先作為研究預(yù)覽版和開發(fā)工具推出,屆時將為開發(fā)人員開放API接口。

報道稱,OpenAI一直在進行幾個與智能體相關(guān)的研究項目。其中一位人士表示,最接近完成的將是一個在網(wǎng)絡(luò)瀏覽器中執(zhí)行任務(wù)的通用工具。

AI助理(AI Agent)是一種能夠感知環(huán)境、進行決策和執(zhí)行動作的智能實體,具備通過獨立思考、調(diào)用工具去逐步完成給定目標(biāo)的能力,既能為C端提供個性化應(yīng)用,也能為B端提供降本增效方案。對于普通用戶而言,AI助理最核心的功能是AI自主操作手機,輔助完成復(fù)雜推理任務(wù)。

OpenAI首席執(zhí)行官阿爾特曼早已透露下場意愿。幾周前,他在Reddit的“問我任何問題”(Ask Me Anything)論壇上表示,“我們將擁有越來越好的模型,但我認(rèn)為下一個重大突破將是AI助手。”在上個月公司年度開發(fā)日之前的OpenAI新聞發(fā)布會上,該公司首席產(chǎn)品官Kevin Weil稱:“我認(rèn)為2025年將是Agent系統(tǒng)最終進入主流的一年。”

站在OpenAI的角度,其在商業(yè)化進程中面臨著越來越大的壓力, ChatGPT漸進式的改進可能無法吸引用戶支付更高的價格。高管急切需要一款突破性產(chǎn)品,以證明對AI開發(fā)的巨額投資是值得的。

目前,OpenAI已開源了多功能協(xié)同AI Agent——Swarm,可創(chuàng)建多個智能體協(xié)同工作,以更高效地完成任務(wù)。其GPT o1模型增強了推理能力,使其在復(fù)雜問題的解決和用戶交互的自然性方面均有顯著進步,亦使其更加適用于AI Agent場景。

AI助理被視作通往AGI的核心基礎(chǔ),在硬件廠商言必稱AI的時代,AI助理或成為終端智能化的突破口。甬興證券表示,AI Agent或?qū)⒄莆找苿踊ヂ?lián)新入口,流量分發(fā)格局有望重塑AI Agent智能體因具備較強交互性以及便利性,或可打通原先同個終端不同App之間的天然壁壘。

據(jù)《科創(chuàng)板日報》不完全梳理,國內(nèi)外頭部廠商正爭先推出AI助理產(chǎn)品——

微軟近期低調(diào)開源了AI工具OmniParser,其可幫助用戶創(chuàng)建個性化智能體,以操作個人計算機;10月22日,微軟宣布在Dynamics 365中集成10個自主AI Agent,支持OpenAI最新模型o1,具備自主學(xué)習(xí)能力,可自動執(zhí)行跨平臺復(fù)雜業(yè)務(wù);9月,微軟推出了一款名為Windows Agent Arena的基準(zhǔn)框架,同樣屬于AI助理開發(fā)范疇。

據(jù)The Information報道,谷歌計劃在12月預(yù)覽其大型動作模型“Project Jarvis”,該項目將幫助用戶執(zhí)行諸如“收集研究、購買產(chǎn)品或預(yù)訂航班”等任務(wù)。

10月22日,Anthropic為大模型Claude迭代了新功能——Computer Use,讓AI可以像人一樣操控電腦。Claude3.5 Sonnet是首個支持計算機控制的模型,能夠模擬人類操作計算機,包括移動光標(biāo)、點擊按鈕和輸入文本。

蘋果選擇將Siri與ChatGPT集成,實現(xiàn)更智能的人機交互,另有網(wǎng)友發(fā)現(xiàn)蘋果已經(jīng)默默發(fā)布了Ferret-UI的兩個實現(xiàn)版本(分別基于Gemma 2B和Llama 8B),這是蘋果今年5月發(fā)布的一個可讓AI理解手機屏幕的技術(shù)。

華為則公布了一項可讓AI像人類一樣操作手機的新研究成果,相關(guān)團隊提出了一個手機控制架構(gòu):Lightweight Multi-modal App Control(輕量級多模態(tài)應(yīng)用控制,簡稱LiMAC)。

中國獨角獸企業(yè)智譜AI已上線AI助理工具AutoGLM,無需手動操作,用戶對著手機說話(發(fā)出指令),便可讓其自動打開手機上的各類App,進行網(wǎng)購、點外賣、訂高鐵票,甚至發(fā)微信、搶紅包、評論朋友圈、整理筆記并生成攻略、總結(jié)論文。

中信證券表示,AutoGLM等終端AI助理技術(shù)將帶來更短路徑的交互形式,接受語音指令并自動完成復(fù)雜操作的能力將為消費者帶來極大便利,其有望成為AI終端的亮點功能并吸引消費者升級換代。

華泰證券也表示,AI助理落地將帶來多個層次的產(chǎn)業(yè)機遇,其中,Agent+終端有望推動人機交互變革,除了在終端銷售量價方面的變化外,可能對終端應(yīng)用的商業(yè)模式產(chǎn)生更加深遠的影響。

給作者點贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個人觀點,與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報電話:021-54451141