C114通信網(wǎng)  |  通信人家園

人工智能
2025/2/19 10:26

豪擲20萬塊GPU訓(xùn)練Grok-3,馬斯克“大力出奇跡”了嗎?

極客網(wǎng)  小菲

當(dāng)時間周一,埃隆·馬斯克旗下的xAI公司正式發(fā)布了最新大模型Grok-3。這次,馬斯克不僅帶來了性能更強的AI,還秀了一把“肌肉”——20萬塊GPU組成的超級計算集群。這背后,到底是真正的技術(shù)突破,還是一場“大力出奇跡”的豪賭呢?

Grok-3確實很強,但很難算突破

從性能上看,Grok-3確實很能打。在標準AI基準測試中,它在數(shù)學(xué)(AIME)、科學(xué)(GPOA)和編程(LCB)測試中穩(wěn)居榜首,盲測表現(xiàn)也相當(dāng)出色。此前代號為“Chocolate”的測試版曾在LLM Arena平臺上獲得最高ELO評分,這意味著用戶更喜歡Grok-3的回答,而不是其他模型的輸出。

更厲害的是,Grok-3的“推理測試版”在AIME 2025基準測試中拿到了93分,其他頂尖模型的得分都在87分以下。這說明,Grok-3在數(shù)學(xué)推理上確實有獨到之處。

盡管Grok-3的性能很強,但現(xiàn)場演示時,它更像是在“追趕”而不是“超越”。xAI展示了Grok-3解決物理問題和從頭編寫游戲代碼的能力,但這些功能,ChatGPT、Claude和谷歌的Gemini早就實現(xiàn)了。

換句話說,Grok-3更像是在用更強的算力,把別人已經(jīng)做過的事情做得更好,而不是開辟了一條全新的道路。

20萬塊GPU集群,比模型還出圈

不過,相比Grok-3模型的表現(xiàn),業(yè)界對馬斯克搭建的20萬塊GPU集群更感興趣——尤其是在DeepSeek掀起低成本模型訓(xùn)練的浪潮之下。

想象一下,20萬塊GPU堆在一起,這得是個多么龐大的“鋼鐵巨獸”!xAI的這個超級計算集群被命名為“巨像”(Colossus),名字霸氣,實力也不容小覷。

這個系統(tǒng)分兩個階段訓(xùn)練:先在10萬塊GPU上訓(xùn)練了122天,然后又花了92天擴展到20萬塊。xAI團隊直言,搭建這個集群比開發(fā)模型本身還難,可以說是“硬件先行,軟件跟上”的典型范例。

先跟隨再創(chuàng)新,馬斯克還有“大招”

不過,xAI的野心顯然不止于此。他們計劃在未來幾周內(nèi)推出語音交互功能,馬斯克強調(diào)這不是普通的TTS,而是真正的AI語音模型。

此外,開發(fā)者還將獲得API訪問權(quán)限和音頻轉(zhuǎn)錄功能,這意味著Grok-3將成為第三方應(yīng)用的強大工具。

更有趣的是,xAI還計劃成立一個AI游戲工作室,讓開發(fā)者利用Grok-3構(gòu)建游戲。這或許會成為Grok-3的一個新亮點,畢竟,用AI開發(fā)游戲,這事兒本身就挺酷的。

小結(jié):

20萬塊GPU的投入,讓Grok-3在性能上確實有了質(zhì)的飛躍。但技術(shù)突破的本質(zhì),不僅僅是“堆料”,更在于創(chuàng)新。Grok-3目前的表現(xiàn)更像是“大力出奇跡”的結(jié)果,但未來能否真正開辟新天地,還得看它在預(yù)告的語音、游戲和API等新領(lǐng)域的表現(xiàn)。

給作者點贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個人觀點,與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報電話:021-54451141