科技媒體 AndroidAuthority 昨日(11 月 21 日)發(fā)布博文,報(bào)道稱谷歌正為安卓16 系統(tǒng)開發(fā)全新 API,可以讓 Gemini 代表用戶,操作其他應(yīng)用交互。
現(xiàn)狀
援引博文介紹,谷歌希望將 Gemini 打造成手機(jī)上的真正 AI 智能體,實(shí)現(xiàn)谷歌曾對(duì) Pixel 4 的 Google Assistant 許下的承諾。
Gemini 目前主要通過擴(kuò)展程序,訪問 Google Flights、Google Hotels 等網(wǎng)絡(luò)服務(wù),從而在用戶提出相關(guān)問題后,從中提取數(shù)據(jù)并回答相關(guān)問題。
但這種方式擴(kuò)展性有限,難以覆蓋海量 Android 應(yīng)用。雖然理論上 Gemini 可通過屏幕閱讀、多模態(tài) AI 等技術(shù)控制任何應(yīng)用,但效果并不理想。
進(jìn)化:從擴(kuò)展到 API
這個(gè)新 API 的核心是“應(yīng)用功能”(app functions),應(yīng)用開發(fā)者可以通過定義服務(wù)來創(chuàng)建相關(guān)功能,并將其分享給 Android 的 App Search 框架。
“應(yīng)用功能”具有唯一標(biāo)識(shí)符,例如“orderFood”,系統(tǒng)應(yīng)用可以通過 EXECUTE_APP_FUNCTIONS 或 EXECUTE_APP_FUNCTIONS_TRUSTED權(quán)限執(zhí)行這些功能。
EXECUTE_APP_FUNCTIONS
EXECUTE_APP_FUNCTIONS_TRUSTED
其中 EXECUTE_APP_FUNCTIONS_TRUSTED權(quán)限具有更高的安全級(jí)別,應(yīng)用開發(fā)者可以選擇僅允許擁有此權(quán)限的應(yīng)用執(zhí)行其功能。