科技媒體 The Decoder 昨日(9 月 24 日)發(fā)布博文,報道谷歌升級旗下 Gemini 1.5 AI 模型,推出了 Gemini-1.5-Pro-002和 Gemini-1.5-Flash-002,相比較此前版本成本更低、性能更強、響應(yīng)更快。
成本更低
谷歌下調(diào)了 token 輸入和輸出費用,Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 最高降幅 50%,提高了兩種模型的速率限制,并減少了延遲。
新定價于 2024 年 10 月 1 日生效。
性能更強
IT之家援引新聞稿內(nèi)容,附上新款模型的性能情況如下:
在更具挑戰(zhàn)性的 MMLU-Pro 基準(zhǔn)測試中,模型的性能提高了約 7%。
在 MATH 和 HiddenMath 基準(zhǔn)測試中,數(shù)學(xué)性能顯著提高了 20%。
視覺和代碼相關(guān)任務(wù)也有所改進,在視覺理解和 Python 代碼生成評估中提高了 2-7%。
谷歌聲稱,這些模型現(xiàn)在能在保持內(nèi)容安全標(biāo)準(zhǔn)的同時,提供更有幫助的回復(fù)。該公司根據(jù)開發(fā)人員的反饋意見,改進了模型的輸出風(fēng)格,旨在實現(xiàn)更精確、更經(jīng)濟高效的使用。
其它改進
谷歌還升級了 8 月發(fā)布的 Gemini 1.5 實驗?zāi)P,推出?Gemini-1.5-Flash-8B-Exp-0924升級版,進一步增強了文本和多模態(tài)應(yīng)用。
用戶可以通過 Google AI Studio、Gemini API 和 Vertex AI(面向 Google Cloud 客戶)訪問新的 Gemini 模型。針對 Gemini Advanced 用戶的 Gemini 1.5 Pro-002 聊天優(yōu)化版即將推出。