據(jù)報(bào)道,今日,在火山引擎AI創(chuàng)新巡展杭州站的現(xiàn)場(chǎng),字節(jié)跳動(dòng)旗下火山引擎總裁譚待正式發(fā)布了備受矚目的豆包1.5深度思考模型。
譚待指出,豆包1.5深度思考模型在多個(gè)關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能。在數(shù)學(xué)、編程、科學(xué)推理這類專業(yè)領(lǐng)域中,它能夠精準(zhǔn)高效地處理復(fù)雜問(wèn)題;在創(chuàng)意寫(xiě)作等通用任務(wù)方面,同樣表現(xiàn)出色。
該模型采用MoE架構(gòu),總參數(shù)為200B,激活參數(shù)是20B ,相較于業(yè)界同類模型,其參數(shù)規(guī)模降低了50%,這使得它在推理成本上具備顯著優(yōu)勢(shì),能夠以更低的成本實(shí)現(xiàn)更高效的推理運(yùn)算。
豆包1.5深度思考模型進(jìn)一步拓展了功能邊界,將視覺(jué)理解融入其中,解鎖了諸多實(shí)用功能。比如,它能依據(jù)照片精準(zhǔn)分析地貌特征;在人們旅行時(shí),輔助進(jìn)行點(diǎn)餐決策;在企業(yè)辦公場(chǎng)景中,助力完成項(xiàng)目管理流程圖繪制等,為用戶帶來(lái)了更為多元且便捷的服務(wù)體驗(yàn)。
與此同時(shí),火山引擎對(duì)豆包文生圖模型也進(jìn)行了重大升級(jí),推出3.0版本。新版本在文字排版上更加美觀,圖片生成能力更加精細(xì),還新增了2K圖片直出功能,大幅提升了圖片生成的質(zhì)量與效率,為用戶帶來(lái)更優(yōu)質(zhì)的視覺(jué)內(nèi)容創(chuàng)作體驗(yàn)。
新模型還具備了更強(qiáng)視頻搜索能力,模型能夠根據(jù)用戶搜索問(wèn)題在視頻中尋找相應(yīng)答案。
此外,譚待表示,豆包大模型使用量持續(xù)高速增長(zhǎng)。截至2025年3月,豆包大模型日均tokens使用量超12.7萬(wàn)億,較發(fā)布之初增長(zhǎng)超106倍。