2024/11/19 15:16

Mistral發(fā)布Pixtral Large多模態(tài)AI模型：登頂復(fù)雜數(shù)學(xué)推理，圖表/文檔推理超過GPT-4o

IT之家故淵

Mistral AI 公司昨日（11 月 18 日）發(fā)布公告，宣布了全新的多模態(tài) AI 模型 Pixtral Large。該模型擁有 1240 億參數(shù)，基于 Mistral Large 2，主要用于處理文本和圖片。

Pixtral Large 現(xiàn)已在 Mistral 研究許可證和商業(yè)許可證下提供，適用于研究、教育以及商業(yè)用途。

Pixtral Large 是 Mistral AI 多模態(tài)家族中的第二個(gè)模型。IT之家援引官方新聞稿，該模型在 MathVista、DocVQA 和 VQAv2 等標(biāo)準(zhǔn)多模態(tài)基準(zhǔn)測(cè)試中表現(xiàn)出色，尤其在 MathVista 中達(dá)到了 69.4% 的準(zhǔn)確率，超越了所有競(jìng)爭(zhēng)對(duì)手。

在 ChartQA 和 DocVQA 測(cè)試中，Pixtral Large 同樣表現(xiàn)優(yōu)異，超越了 GPT-4o 和 Gemini-1.5 Pro。

該模型配備了 123B 的多模態(tài)解碼器和 1B 的視覺編碼器，支持 128K 的上下文窗口，能夠處理至少 30 張高分辨率圖像。Pixtral Large 不僅在視覺數(shù)據(jù)上表現(xiàn)出色，同時(shí)在復(fù)雜推理和圖表理解方面也具備強(qiáng)大能力。

給作者點(diǎn)贊

0 VS 0

寫得不太好

免責(zé)聲明：本文僅代表作者個(gè)人觀點(diǎn)，與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí)，對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾，請(qǐng)讀者僅作參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

相關(guān)鏈接

測(cè)試

英偉達(dá)2024年在AI項(xiàng)目上投資10億美元達(dá)成交易超過微軟和亞馬遜
C114通信網(wǎng) 蔣均牧1-3
阿里入局AI眼鏡：與雷鳥達(dá)成戰(zhàn)略合作，產(chǎn)品將接入通義大模型
IT之家清源1-3
英偉達(dá)攪動(dòng)AI風(fēng)云：2024年參與50輪融資、投資總額達(dá)10億美元，收購公司數(shù)量超過去4年總和
IT之家故淵1-3
消息稱英偉達(dá)GB300 AI服務(wù)器預(yù)計(jì)今年Q2發(fā)布，水冷散熱需求更強(qiáng)
IT之家清源1-3

Mistral發(fā)布Pixtral Large多模態(tài)AI模型：登頂復(fù)雜數(shù)學(xué)推理，圖表/文檔推理超過GPT-4o

Mistral發(fā)布Pixtral Large多模態(tài)AI模型：登頂復(fù)雜數(shù)學(xué)推理，圖表/文檔推理超過GPT-4o