2024/8/31 20:34

OpenAI的GPT-4變身考證能手：無(wú)額外訓(xùn)練通過(guò)日本理療師考試，正確率 73.4%

IT之家故淵

一項(xiàng)新的同行評(píng)審研究表明，OpenAI 的 GPT-4 大語(yǔ)言模型無(wú)需任何額外訓(xùn)練，即可通過(guò)日本國(guó)家理療考試。

最新發(fā)表在《Cureus》雜志上的新研究，測(cè)試了 GPT-4 的文字和視覺(jué)技能。

IT之家注：日本國(guó)家物理理療師考試包括 160 道綜合題和 40 道實(shí)踐題，測(cè)試記憶、理解、應(yīng)用、分析和評(píng)估能力。

研究人員在 GPT-4 中輸入了 1000 個(gè)問(wèn)題，并將答案對(duì)比了官方解決方案。

GPT-4 通過(guò)了所有五個(gè)測(cè)試部分，正確回答了 73.4% 的問(wèn)題。不過(guò)，人工智能在處理技術(shù)性問(wèn)題和包含圖片或表格的問(wèn)題時(shí)顯得有些吃力。

該模型在常規(guī)問(wèn)題上的表現(xiàn)（正確率為 80.1%）遠(yuǎn)遠(yuǎn)好于實(shí)際問(wèn)題（正確率為 46.6%）。

同樣，GPT-4 在處理純文本問(wèn)題（正確率為 80.5%）時(shí)的表現(xiàn)也遠(yuǎn)好于那些帶有圖片和表格的問(wèn)題（正確率為 35.4%）。這些發(fā)現(xiàn)與之前有關(guān) GPT-4 視覺(jué)理解局限性的研究結(jié)果一致。

有趣的是，問(wèn)題難度和文本長(zhǎng)度對(duì) GPT-4 的性能影響不大。盡管該模型主要以英語(yǔ)數(shù)據(jù)為基礎(chǔ)進(jìn)行訓(xùn)練，但在使用日語(yǔ)輸入時(shí)也表現(xiàn)出色。

給作者點(diǎn)贊

0 VS 0

寫得不太好

免責(zé)聲明：本文僅代表作者個(gè)人觀點(diǎn)，與C114通信網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí)，對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾，請(qǐng)讀者僅作參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

相關(guān)鏈接

測(cè)試

貝索斯、OpenAI等資本方以24億美元估值投資機(jī)器人初創(chuàng)公司Physical Intelligence
IT之家問(wèn)舟11-7
沙特計(jì)劃斥資1000億美元打造AI中心
愛(ài)集微 11-7
OpenAI宣布收購(gòu)Chat.com域名
IT之家問(wèn)舟11-7
OpenAI CEO：2024年不會(huì)推出GPT-5，將專注于GPT-o1
愛(ài)集微孫樂(lè)11-5

OpenAI的GPT-4變身考證能手：無(wú)額外訓(xùn)練通過(guò)日本理療師考試，正確率 73.4%

OpenAI的GPT-4變身考證能手：無(wú)額外訓(xùn)練通過(guò)日本理療師考試，正確率 73.4%