C114通信網(wǎng)  |  通信人家園

人工智能
2024/9/19 14:59

開源,升級,降價:通義大模型“殺瘋了”

C114通信網(wǎng)  九九

C114訊 9月19日消息(九九)9月19-21日,2024云棲大會在杭州云棲小鎮(zhèn)舉行。在今天下午的主論壇上,阿里云CTO周靖人發(fā)布通義千問新一代開源模型Qwen2.5,同時宣布通義旗艦?zāi)P蚎wen-Max、通義靈碼和通義萬相全面升級,并發(fā)布全新視頻生成模型。

另外值得一提的是,阿里云百煉平臺上的三款通義千問主力模型再次降價:Qwen-Turbo價格直降85%,低至百萬tokens 0.3元,Qwen-Plus和Qwen-Max分別再降價80%和50%。

通義千問新一代開源模型Qwen2.5性能超越Llama

新一代開源模型Qwen2.5全系列涵蓋多個尺寸的大語言模型、多模態(tài)模型、數(shù)學(xué)模型和代碼模型,每個尺寸都有基礎(chǔ)版本、指令跟隨版本、量化版本,總計上架100多個模型,刷新業(yè)界紀(jì)錄。

周靖人介紹,Qwen2.5全系列模型都在18T tokens數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,相比Qwen2整體性能提升18%以上,擁有更多的知識、更強(qiáng)的編程和數(shù)學(xué)能力。在語言模型方面,Qwen2.5開源了7個尺寸:0.5B、1.5B、3B、7B、14B、32B、72B,它們在同等參數(shù)賽道都創(chuàng)造了業(yè)界最佳成績,型號設(shè)定充分考慮下游場景的不同需求。其中,3B是適配手機(jī)等端側(cè)設(shè)備的黃金尺寸;32B是最受開發(fā)者期待的“性價比之王”,可在性能和功耗之間獲得最佳平衡;旗艦?zāi)P蚎wen2.5-72B性能超越Llama 405B,再登全球開源大模型王座

自從2023年8月開源以來,通義在全球開源大模型領(lǐng)域后來居上,成為開發(fā)者尤其是中國開發(fā)者的首選模型。性能上,通義大模型日拱一卒,逐步趕超美國最強(qiáng)開源模型Llama,多次登頂Hugging Face全球大模型榜單;生態(tài)上,通義從零起步、開疆拓土,與海內(nèi)外的開源社區(qū)、生態(tài)伙伴、開發(fā)者共建生態(tài)網(wǎng)絡(luò),截至2024年9月中旬,通義千問開源模型下載量突破4000萬,Qwen系列衍生模型總數(shù)超過5萬個,成為僅次于Llama的世界級模型群。

旗艦?zāi)P蚎wen-Max性能接近GPT-4o

2024云棲大會上,周靖人宣布通義旗艦?zāi)P蚎wen-Max全方位升級,性能接近GPT-4o。通義官網(wǎng)和通義APP的后臺模型均已切換為Qwen-Max,繼續(xù)免費為所有用戶提供服務(wù)。用戶也可通過阿里云百煉平臺調(diào)用Qwen-Max的API。

相比上一代模型,Qwen-Max在訓(xùn)練中使用了更多的訓(xùn)練數(shù)據(jù)、更大的模型規(guī)模、更強(qiáng)的人類對齊,最終達(dá)到了更高的智能水平。在MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench等十多個權(quán)威基準(zhǔn)上,Qwen-Max表現(xiàn)接近GPT-4o,數(shù)學(xué)能力、代碼能力則超越了GPT-4o。數(shù)學(xué)和代碼所代表的推理能力是大模型智能水平的最重要體現(xiàn)。

相比2023年4月的初代通義千問大模型,Qwen-Max的理解能力提升46%、數(shù)學(xué)能力提升75%、代碼能力提升102%、幻覺抵御能力提升35%、指令遵循能力提升105%,模型與人類偏好的對齊水平更是有了質(zhì)的飛躍,提升了700%以上。

通義萬相視頻生成模型一鍵創(chuàng)作影視級高清視頻

與Qwen-Max一同進(jìn)行升級的還有通義萬相,并首批上線文生視頻、圖生視頻功能,在文生視頻功能中,用戶輸入任意文字提示詞,即可生成一段高清視頻,支持中英文多語言輸入,并可以通過靈感擴(kuò)寫功能智能豐富視頻內(nèi)容表現(xiàn)力,支持16:9、9:16等多種比例生成;在圖生視頻功能中,支持用戶將任意圖片轉(zhuǎn)化為動態(tài)視頻,按照上傳的圖像比例或預(yù)設(shè)比例進(jìn)行生成,同時可以通過提示詞來控制視頻運動。

通義萬相視頻生成大模型集成了多項創(chuàng)新技術(shù),有效解決畫面表現(xiàn)力和大幅度運動等視頻生成技術(shù)難題。針對運動生成和物理模擬等難點優(yōu)化算法,實現(xiàn)了大幅度主體運動和運鏡控制,并有效模擬真實世界物理特性;設(shè)計了高壓縮比、高質(zhì)量視頻VAE框架,有效降低視頻信息冗余,并保持高質(zhì)量視頻重構(gòu)能力;同時,基于輕量微調(diào)框架和精選數(shù)據(jù)集優(yōu)化訓(xùn)練,在中式傳統(tǒng)元素、風(fēng)格化視頻生成上表現(xiàn)更好。

去年7月,通義萬相圖像生成大模型首次亮相,目前已累計生成7500萬張圖片。2024云棲大會現(xiàn)場,通義萬相宣布視覺生成大模型全面升級為Diffusion Transformer框架,同時結(jié)合通義千問復(fù)雜提示詞解釋能力,有效提升畫面表現(xiàn)力、語義理解能力、可控生成能力。隨著通義萬相視頻生成模型的發(fā)布,通義大模型已覆蓋文本生成、圖像理解、視頻理解、音頻理解、圖像生成、視頻生成等全模態(tài)場景。

除此之外,通義靈碼AI編程能力也再次進(jìn)化,從一年前只能完成基礎(chǔ)的輔助編程任務(wù),進(jìn)化到幾句話就能完成需求理解、任務(wù)拆解、代碼編寫、修改BUG、測試等開發(fā)任務(wù),最快幾分鐘可從0到1完成應(yīng)用開發(fā),提升數(shù)十倍開發(fā)效率。

通義千問三款主力模型再降價,最高降幅85%

繼5月首次大幅降價后,2024云棲大會上,阿里云百煉平臺上的三款通義千問主力模型再次官宣降價。Qwen-Turbo價格直降85%,低至百萬tokens 0.3元,Qwen-Plus和Qwen-Max分別再降價80%和50%。其中,Qwen-Plus推理能力追平GPT4,可應(yīng)用于復(fù)雜任務(wù),是效果、速度及成本均衡的最優(yōu)選擇,降價后,Qwen-Plus性價比達(dá)到業(yè)界最高,同等規(guī)模較行業(yè)價格低84%。同時,阿里云百煉平臺還為所有新用戶免費贈送超5000萬tokens及4500張圖片生成額度。

周靖人介紹,自首次宣布降價后,阿里云百煉付費客戶數(shù)較上一個季度增長超過200%,大批企業(yè)和開發(fā)者放棄私有化部署,選擇直接在百煉上調(diào)用各類AI大模型。目前,阿里云百煉已服務(wù)超30萬客戶,包括一汽、金山、獵聘、哈啰集團(tuán)、國家天文臺等眾多知名企業(yè)和機(jī)構(gòu)。“本次通義第二輪降價,將繼續(xù)提升AI在各行各業(yè)的滲透率。”周靖人說。

給作者點贊
0 VS 0
寫得不太好

版權(quán)說明:凡注明來源為“C114通信網(wǎng)”的文章皆屬C114版權(quán)所有,除與C114簽署內(nèi)容授權(quán)協(xié)議的單位外,其他單位未經(jīng)允許禁止轉(zhuǎn)載、摘編,違者必究。如需使用,請聯(lián)系021-54451141。其中編譯類僅出于傳遞更多信息之目的,系C114對海外相關(guān)站點最新信息的翻譯稿,僅供參考,不代表證實其描述或贊同其觀點,投資者據(jù)此操作,風(fēng)險自擔(dān);翻譯質(zhì)量問題請指正。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報電話:021-54451141