谷歌正式推出Gemini 2.5系列。谷歌表示,作為該系列的首發(fā)版本,實驗版Gemini 2.5 Pro在多項基準測試中均達到最先進水平,并以顯著優(yōu)勢登頂LMArena排行榜首位。
Gemini 2.5系列的一大創(chuàng)新亮點在于,它具備思維鏈推理能力。在處理任務(wù)時,該模型不會急于給出回應(yīng),而是會先進行系統(tǒng)化思考推演,如同人類在面對復(fù)雜問題時進行深入分析一般。這種獨特的思考方式使得Gemini 2.5系列在性能提升和準確性增強方面取得了顯著成效。
Gemini 2.5 Pro更是擁有令人矚目的功能特性。它支持多種輸入模式,無論是文本、圖像、音頻、視頻,還是代碼,都能輕松解析。其上下文窗口高達100萬token,相當(dāng)于約75萬單詞,如此龐大的容量足以解析像《指環(huán)王》這樣的長篇巨著。
而且,谷歌還計劃進一步升級這一能力,將上下文窗口擴大至200萬token。這一升級將使Gemini 2.5 Pro在處理跨模態(tài)復(fù)雜問題時,展現(xiàn)出前所未有的優(yōu)勢,能夠更全面地理解和處理不同類型的信息。
Gemini 2.5傳承了該系列模型的核心優(yōu)勢——原生多模態(tài)支持與超長上下文窗口。目前發(fā)布的2.5 Pro版本已具備100萬token的上下文窗口(即將升級至200萬),這使得它在處理復(fù)雜任務(wù)時能夠更加游刃有余,為用戶提供更精準、更全面的服務(wù)。
在可用性方面,Gemini 2.5 Pro已正式登陸谷歌AI Studio開發(fā)平臺及Gemini應(yīng)用生態(tài)中的Gemini Advanced用戶專區(qū),支持移動端與桌面端。這意味著開發(fā)者與企業(yè)用戶可以立即接入體驗這一強大的模型,將其應(yīng)用于各種實際場景中,如智能客服、數(shù)據(jù)分析、內(nèi)容創(chuàng)作等。
此外,Gemini 2.5 Pro在需要高級推理能力的系列基準測試中均達到業(yè)界領(lǐng)先水平。?在不采用多數(shù)投票(majority voting)等增加計算成本的測試階段技術(shù)情況下?,該模型已在GPQA(通用問題解答評估)與2025年AIME(國際數(shù)學(xué)邀請賽)等數(shù)學(xué)與科學(xué)類基準測試中排名榜首。