2025/4/1 10:49

OpenAI 官宣將發(fā)布自 GPT-2 以來的首個(gè)開放權(quán)重語言模型，并具有推理功能

IT之家汪淼

OpenAI CEO 薩姆奧爾特曼今日官宣，將在未來幾個(gè)月發(fā)布一個(gè)“強(qiáng)大的新開放權(quán)重語言模型”，并具有推理功能。

我們計(jì)劃發(fā)布自 GPT-2 以來的首個(gè)開放權(quán)重語言模型。

我們考慮這件事已經(jīng)很久了，但其他優(yōu)先事項(xiàng)占了上風(fēng)�，F(xiàn)在感覺做這件事很重要。

發(fā)布前，我們將根據(jù)準(zhǔn)備的框架評(píng)估這個(gè)模型，就像我們會(huì)對(duì)任何其他模型做的那樣。鑒于我們知道這個(gè)模型將在發(fā)布后進(jìn)行修改，因此還會(huì)做額外的工作。

我們還有一些決定要做，所以將舉辦開發(fā)者活動(dòng)來收集反饋，并在之后嘗試早期原型。我們將在幾周內(nèi)在舊金山開始（舉辦開發(fā)者活動(dòng)），隨后在歐洲和亞太地區(qū)舉行會(huì)議。

我們很期待看到開發(fā)者們將如何構(gòu)建，以及大型公司和政府如何使用它，在他們更愿意自己運(yùn)行模型的地方。

到目前為止，用戶只能通過 OpenAI 的界面或?qū)⑵?API 密鑰集成到他們的應(yīng)用中來使用其模型，這意味著模型本身保持秘密和專有。

然而，開放權(quán)重模型是不同的。這些模型中預(yù)訓(xùn)練的參數(shù)（定義模型如何響應(yīng)的“權(quán)重”）是向公眾公開共享的。開發(fā)人員和研究人員可以下載它們，在本地運(yùn)行它們，針對(duì)特定用例進(jìn)行微調(diào)，或?qū)⑺鼈儾迦氲阶远x應(yīng)用中。IT之家提醒，僅僅因?yàn)闄?quán)重是開放的并不意味著就是開源的，訓(xùn)練代碼、數(shù)據(jù)集和詳細(xì)日志可能仍然保持專有或未公開，因此可能并不是完全的開源。

Meta 和 Mistral 等公司已經(jīng)發(fā)布了 Llama 和 Mixtral 等強(qiáng)大模型，而 DeepSeek、阿里巴巴和百川等新玩家也在推出可以與其匹敵的開源模型。從學(xué)術(shù)研究人員到獨(dú)立開發(fā)者，許多人開始擁抱開放權(quán)重模型，OpenAI 也是時(shí)候做出改變了。

給作者點(diǎn)贊

0 VS 0

寫得不太好

免責(zé)聲明：本文僅代表作者個(gè)人觀點(diǎn)，與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí)，對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾，請(qǐng)讀者僅作參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

相關(guān)鏈接

阿里巴巴

ChatGPT 圖像生成功能火爆，OpenAI CEO 稱容量問題將導(dǎo)致產(chǎn)品延期
IT之家遠(yuǎn)洋4-2
OpenAI宣布完成400億美元新融資
C114通信網(wǎng) 南山4-1
OpenAI 宣布完成 400 億美元超大規(guī)模融資，估值達(dá) 3000 億美元
IT之家遠(yuǎn)洋4-1
ChatGPT 新圖像生成器可輕松生成逼真的假收據(jù)，OpenAI 回應(yīng)
IT之家遠(yuǎn)洋4-1