據(jù)報道,OpenAI發(fā)布了專為構(gòu)建AI Agents設(shè)計的新工具和API。
OpenAI此次發(fā)布的核心產(chǎn)品包括Responses API和Agents SDK。
Responses API 融合了Chat Completions API的簡潔性和Assistants API的工具使用能力,為開發(fā)者提供了一個強大的基礎(chǔ)架構(gòu)。通過單次API調(diào)用,開發(fā)者就能使用多種工具和模型輪次解決復(fù)雜任務(wù),極大地簡化了開發(fā)流程。
Agents SDK 是一個開源的多智能體工作流編排框架。它讓開發(fā)者能夠輕松定義智能體角色和工具,實現(xiàn)智能體之間的無縫交接任務(wù),還提供了安全檢查機制和實時監(jiān)控功能,讓智能體的協(xié)作更加高效、可控。
為了讓AI Agents更加實用,OpenAI還提供了三大內(nèi)置工具,包括Web搜索工具、文件搜索工具、計算機使用工具。
Web搜索工具支持GPT-4o和GPT-4o-mini模型,能夠?qū)崟r從互聯(lián)網(wǎng)上抓取最新數(shù)據(jù),并提供清晰且相關(guān)的引用來源。這就像給智能體配備了一個實時更新的知識庫,讓它們能夠隨時掌握最新的動態(tài)。
文件搜索工具支持向量存儲與元數(shù)據(jù)過濾,能夠快速、準確地從大量文檔中檢索相關(guān)信息。對于企業(yè)來說,這無疑是一個高效的知識檢索利器。
計算機使用工具則相當(dāng)于在API中內(nèi)置了Operator,可以自動控制計算機,實現(xiàn)點擊、輸入、拖動等復(fù)雜操作。這對于需要與傳統(tǒng)系統(tǒng)交互的場景來說,是一個巨大的突破。
OpenAI首席產(chǎn)品官Kevin Weil在直播中提到:“2025年將會是AI智能體爆發(fā)的一年,也是ChatGPT和我們開發(fā)者工具從‘僅僅回答問題’升級為‘真正能在現(xiàn)實世界里為你執(zhí)行任務(wù)’的一年。”