在昨日舉行的火山引擎 Force 大會上,字節(jié)跳動正式發(fā)布豆包視覺理解模型,為企業(yè)提供多模態(tài)大模型能力。千 tokens 輸入價格僅為 3 厘,一元錢就可處理 284 張 720P 的圖片,官方宣稱比行業(yè)價格便宜 85%。
對此,抖音集團副總裁李亮今日發(fā)文稱:
這不是價格戰(zhàn)。豆包大模型通過技術(shù)創(chuàng)新來降低成本,在算法、軟件工程和硬件方案上做了非常多優(yōu)化,3 厘 / 千 tokens 的定價也有可觀的毛利。而且這是一步到位的透明價格,并不是“刊例價 + 折扣”的玩法。我們希望用更低成本推動 AI 技術(shù)普惠和應(yīng)用發(fā)展,就像譚待說的:‘好的模型就是要讓每一家企業(yè)都用得起。’
IT之家注意到,豆包 3D 生成模型也在本次活動中正式亮相。將其與火山引擎數(shù)字孿生平臺 veOmniverse 結(jié)合使用,可完成智能訓(xùn)練、數(shù)據(jù)合成和數(shù)字資產(chǎn)制作,官方稱之為“一套支持 AIGC 創(chuàng)作的物理世界仿真模擬器”。
豆包大模型旗下多款產(chǎn)品也迎來了更新:
豆包通用模型 pro:全面對齊 GPT-4o,使用價格僅為后者的 1/8;
音樂模型:可生成 3 分鐘的完整作品;