“類Sora”開啟年末團戰(zhàn)
時至年末,喧囂已久的國內AI視頻生成市場不僅沒有將息之勢,還卷起了新的高潮:
12月4日,騰訊混元大模型正式上線視頻生成能力,繼文生文、文生圖、3D生成功能之后,又補全了一塊功能版圖。同日騰訊宣布將開源該視頻生成模型,這也是當前最大的視頻開源模型。
至此,國內互聯(lián)網大廠騰訊、字節(jié)、快手、阿里、百度已在AI視頻市場齊聚。
不僅如此,不少大模型創(chuàng)企和中小技術廠商,也仍在奮力擠上AI視頻這條已顯密集的大模型應用賽道。
11月底,曾有消息稱大模型創(chuàng)企月之暗面正在內測AI視頻生成功能“Kimi創(chuàng)作空間”,并計劃在正式上線后為用戶提供每天免費生成100秒個性化視頻的“福利”功能。
而在12月17日,智能駕駛企業(yè)圖森未來也官宣發(fā)布“Ruyi”圖生視頻大模型,并將Ruyi-Mini-7B版本開源,允許用戶從huggingface上下載使用。
“追趕Sora的窗口期,也就是在OpenAI由于受到成本等因素影響,尚未推動Sora大規(guī)模落地應用的這幾個月。”AIGC視頻市場創(chuàng)業(yè)者柳橙向「鳳凰網科技」分享了他對市場的判斷。多位從業(yè)人士也向鳳凰網科技講道,大約一年的窗口期是業(yè)內的某種共識。
而曾驚艷四座的OpenAI Sora已在12月10日凌晨正式開放使用,這從某種程度上,解釋了近期國內類Sora工具沖刺亮相的原因。
而Sora的亮相,也推動著視頻生成的底層技術架構向Diffusion與Transformer路線收斂,讓國產AI視頻生成工具能夠快速走完需求定義、產品研發(fā)的路徑。
如果將時間線拉至更長范圍,更容易感知到2024年國內AI視頻生成市場所呈現的井噴態(tài)勢:
上半年,1月下旬,百度相關團隊發(fā)布了視頻生成模型UniVG;3月底,字節(jié)跳動旗下“即夢AI”平臺內測,并在5月開放網頁版;4月27日,清華系Vidu發(fā)布了具有“長時長、高一致性、高動態(tài)性”性能標簽的同名視頻大模型 Vidu;6月6日,快手“可靈”視頻生成大模型官網正式上線。
邁進下半年的7月4日,商湯科技發(fā)布人物視頻生成大模型Vimi;7月6日,智譜AI上線視頻生成模型“清影”;9月19日,阿里云發(fā)布通義萬相視頻生成模型;9月24日,字節(jié)跳動接連發(fā)布豆包視頻生成-PixelDance、豆包視頻生成-Seaweed,并面向企業(yè)市場開啟邀測……
據鳳凰網科技不完全統(tǒng)計,目前國內市場上已有20余款AI視頻生成工具同臺競技。
AI應用的火熱,也帶動著從業(yè)生態(tài)的蓬勃。一名AI領域獵頭告訴「鳳凰網科技」,如今快手字節(jié)等大廠,為視頻生成算法工程師開出的年薪總包上限可達70萬。“如果有頂會頂刊,或者相關產品經驗,還有一定的上浮空間可以談,這在整個市場里看都是非?捎^的”。
上半場:國產“文生視頻”追擊Sora的10個月
在國內某家大廠文生視頻研發(fā)團隊工作的李日一認為,從Sora亮相到發(fā)布的10個月里,“不斷追趕與對標”堪稱整個國內視頻生成市場的主旋律。
而在12月10日凌晨觀看完Sora正式發(fā)布后,他卻“松下了一口氣”:“通過自己試用以及看網上大家分享的生成結果,說實話(對Sora的表現)感覺還是有些失望的,也感到慶幸。”
他回憶道,2024年2月份的春節(jié)假期中,以一支“皮衣女走過東京街頭”demo視頻宣告存在的Sora曾讓其感受到“驚艷的代差感”;但等到Sora真正公開發(fā)布,卻沒有帶來同樣的沖擊:“這也是好事,說明我們起碼不會再是一個措手不及的狀態(tài),當然Sora仍然有值得敬佩的地方,但在文生視頻這方面,我們也樹立了一些自己的優(yōu)勢。”
如李日一所言,在國內的輿論場中,對Sora生成效果仍有瑕疵、國內模型部分指標更勝一籌的討論并不鮮見,但由此帶來的輕松感持續(xù)得并不長久。
12月17日凌晨,谷歌旗下AI研究實驗機構DeepMind官宣,推出對標OpenAI Sora的視頻生成模型“Veo 2”,以及圖像生成模型“Imagen 3”。
盡管Veo 2還在預約排隊階段,根據官方信息,其熟悉電影拍攝語言以及物理規(guī)律,并能生成分辨率高達4K(4096×2160像素)、時長可達2分鐘以上的視頻。
相形之下,OpenAI Sora最多能生成分辨率高達1080p、時長為20秒的視頻。
又一家“宇宙級”大廠秀出文生視頻肌肉,將國內的大模型多模態(tài)混戰(zhàn),再推至了新的階段——谷歌預計,到2025年Veo 2將廣泛集成至YouTube Shorts等平臺。
李日一對「鳳凰網科技」解釋道,這構成了其緊張感的來源:“不同于OpenAI沒有成熟產品,對于谷歌而言,YouTube的商業(yè)化管道是通暢的,這意味著Veo 2未來的‘期貨變現’之路,甚至模型迭代速度,很可能是很快的,甚至是‘碾壓級’的。”
如果說以2月份Sora亮相為開始,市場掀開了一場爭奪入局資格的限時賽。那么在大小玩家列隊集齊、技術路線已然明晰的當下,如何在商業(yè)化端攻城略地,則成了新的難題。
下半場:出海撒錢,搶奪流量,誰能先盈利?
如今不少國產視頻生成模型,都已開啟對商業(yè)化變現的探索。
在這場商業(yè)化的戰(zhàn)役之中,有玩家試圖用曾經在互聯(lián)網產品上驗證過成功的增長策略實現目的。
從7月底開始,快手可靈AI陸續(xù)向國內和海外的用戶推出了會員付費體系,并在9月底開放了API服務。據快手CEO程一笑于2024年第三季度業(yè)績說明會透露,9月份可靈的月活躍用戶數已超過150萬,可靈AI單月流水超過了千萬人民幣。
圖|可靈AI生成
而據媒體報道,從6月份開始,可靈就開始借助B2B銷售自動化工具哈希增長,在X、YouTube、Newsletter等多平臺進行投放。據光子星球援引Similarweb估算,從6月24日至9月24日三個月期間,可靈海外投放費用約在33.2萬美元,折合人民幣約232.4萬元。
另據DataEye統(tǒng)計,國內投放市場中,可靈App近30天投放渠道分布以優(yōu)量匯、QQ音樂、酷狗音樂為主,QQ閱讀、歡樂斗地主等緊隨其后;而字節(jié)即夢App近30天投放渠道聚焦于B站與抖音平臺,其中B站為主要渠道。
即夢App、可靈App分別自8月份、11月份上線以來,手機端下載量不斷走高。其中即夢大陸市場蘋果端最高單日下載量接近3萬,可靈最高單日下載量接近1萬。
相較深諳互聯(lián)網增長術的大廠,也有中小玩家選擇深耕ToB標桿案例。以生數科技為例,除了建設ToC會員體系、打造垂類應用產品按照訂閱等形式收費外,公司還以API的形式向B端機構直接提供模型能力。
據稱,目前生數科技已與多家游戲公司、個人終端廠商、互聯(lián)網平臺等B端機構開展合作,開放模型服務,提供AIGC個性化體驗、定制化內容生產等方面的能力。
但短時間內,無論B端還是C端市場的探索,都遠還沒進行到終局。
今年10月份,百度李彥宏就曾在內部講話中表達過自己對Sora類似應用的不看好,他認為Sora這種視頻生成模型的投入周期太長,10年、20年都可能拿不到業(yè)務收益,因此“無論多火爆,百度都不去做”。
而視頻生成從業(yè)者李日一,也表達了自己的思考:“從一開始,國內市場做視頻生成就是奔著商業(yè)化去的,一邊迭代技術一邊找落地方向,但在我看來后者比前者更難。”
(因為)這不僅僅是技術比拼,還涉及到人員、資金等等全方位的要素,要試錯成本,也需要一點運氣。”
“總之,我們還有一場硬仗要打。”他最后講道。