C114訊 2月8日消息(章葭)作為一款繼ChatGPT之后的現(xiàn)象級AI產(chǎn)品,DeepSeek(深度求索)的沖擊波還在繼續(xù)。
據(jù)國內(nèi)AI產(chǎn)品榜統(tǒng)計數(shù)據(jù),DeepSeek應(yīng)用在上線僅20天后,其日活躍用戶數(shù)(DAU)迅速突破2000萬大關(guān),達2215萬。
DeepSeek不僅讓中國生成式人工智能技術(shù)進入全球視野,同時也直接激活了整個人工智能產(chǎn)業(yè)鏈,無論是云服務(wù)廠商、芯片公司,還是下游應(yīng)用層,均紛紛進行部署和適配。當然,對于國內(nèi)AI產(chǎn)業(yè)生態(tài)而言,DeepSeek更重要的貢獻是,通過“技術(shù)瘦身+開源共享”的創(chuàng)新,大幅降低大模型訓練成本。這一突破讓市場驚呼:“算力‘卡脖子’也能玩轉(zhuǎn)AI?屢試不爽的AI scaling law失效了嗎?”
什么是AI scaling law?
OpenAI在2022年提出的Scaling Law定律,是現(xiàn)今算力“軍備競賽”的基礎(chǔ)。Scaling Law之于AI,正如摩爾定律之于芯片。
簡單說就是"大力出奇跡"定律:數(shù)據(jù)越多、算力越強、模型越大,AI的表現(xiàn)(比如對話質(zhì)量、圖像生成精度)就會指數(shù)級提升。
正因如此,所有AI模型公司都在不停地堆資源,這也導致算力軍備競賽以及數(shù)據(jù)中心的瘋狂擴容。
這一現(xiàn)象背后,硬件商成最大贏家。英偉達包攬了全球95%的AI芯片市場,光模塊作為數(shù)據(jù)傳輸?shù)?quot;光纖血管",需求暴增。這就是英偉達市值沖上3萬億美元,光模塊企業(yè)股價一年漲700%的核心邏輯。
DeepSeek的出現(xiàn)從根本上打破了這個邏輯。讓作為AI信仰的英偉達以及國內(nèi)的光模塊企業(yè)等,股票價格出現(xiàn)了劇烈波動。
英偉達近年股價,圖源東方財富網(wǎng)
中際旭創(chuàng)近年股價,圖源東方財富網(wǎng)
AI scaling law真的失效了嗎?
那么AI scaling law真的失效了嗎?是否真的不需要算力堆積了?從美國幾個主流AI廠商發(fā)布的2025年CAPEX指引可以看到,全球科技巨頭仍在不遺余力地加大算力投入。
2月6日,亞馬遜宣布,計劃在2025年將資本支出提升至1000億美元,持續(xù)加大在人工智能領(lǐng)域的投入力度。這一數(shù)額顯著高于去年約830億美元的支出規(guī)模。
本周二,谷歌公布預計今年資本開支高達750億美元,比市場預期高出近三分之一;
此外,Meta預測2025年的資本支出為600至650億美元,比華爾街的預期高出30%。
微軟預計2025財年資本開支為800億美元,其中AI投入為600億美元。
這四大科技公司的資本支出合計將超過3000億美元?梢钥吹,即便面臨算法優(yōu)化的技術(shù)路徑,高端算力儲備仍是大型科技公司普遍認為的實現(xiàn)模型突破的基礎(chǔ)條件。
不僅是海外科技巨頭,國內(nèi)科技公司其實也在加大投入,例如字節(jié)跳動2025年的資本開支將達1600億人民幣,其中在AI基礎(chǔ)設(shè)施上投入約900億元,據(jù)知情人士透露,字節(jié)跳動已為2025年在中國購買人工智能芯片編列了400億元的預算,是去年支出的兩倍。
從短期來看,DeepSeek的優(yōu)化確實降低了AI訓練成本,可能會導致短期內(nèi)訓練需求下降。然而,但從長遠角度而言,推理成本的下降將加速AI技術(shù)的不斷發(fā)展和應(yīng)用場景的擴展,進而推動算力需求呈指數(shù)級增長。
業(yè)內(nèi)分析指出,端側(cè)AI的規(guī);涞、多模態(tài)應(yīng)用的爆發(fā),以及企業(yè)私有化部署需求,都將持續(xù)推高全球算力消耗總量。
因此,我們需要客觀看待deepseek沖擊波,理性看待算力需求以及AI產(chǎn)業(yè)發(fā)展路徑。
AI scaling law并未失效,但游戲規(guī)則變了
DeepSeek的突破揭示了一個關(guān)鍵趨勢:AI scaling law并未失效,但游戲規(guī)則變了。這里沒有永恒的巨頭,只有持續(xù)進化的生存者。美國的技術(shù)主導地位將失效,中國企業(yè)正在迎頭趕上。未來,“算力-算法-場景”的協(xié)同進化將取代單一的“暴力堆算力”模式。
值得注意的是,據(jù)報道,DeepSeek繞過了英偉達的CUDA框架,使用更底層的編程語言PTX做優(yōu)化,為未來兼容國產(chǎn)GPU芯片做準備。這或許解釋了為什么,眾多國產(chǎn)AI算力芯片公司幾乎一夜之間紛紛宣布適配DeepSeek模型。
據(jù)悉,華為旗下ModelEngine AI平臺基于昇騰芯片,將模型部署周期從3周壓縮至3小時。中國電信表示天翼云“息壤”已深度適配DeepSeek-R1/V3,實現(xiàn)“國產(chǎn)模型+國產(chǎn)算力+國產(chǎn)云服務(wù)”的全產(chǎn)業(yè)鏈閉環(huán),實測昇騰國產(chǎn)算力顯示推理性能與主流高端GPU持平。在國內(nèi)產(chǎn)業(yè)鏈的協(xié)同創(chuàng)新之下,大模型技術(shù)與產(chǎn)業(yè)場景將實現(xiàn)深度融合。
當然,在底層算力仍是基礎(chǔ)的情況下,國產(chǎn)AI算力生態(tài)仍然要穩(wěn)扎穩(wěn)打。一方面,可以強化全棧協(xié)同優(yōu)化,縮小性能差距。在硬件層推動芯片設(shè)計貼近模型需求,降低多卡協(xié)同損耗。軟件層面,加大自主計算框架對國產(chǎn)芯片的支持力度,構(gòu)建統(tǒng)一API標準,降低模型遷移成本。此外,通過異構(gòu)計算實現(xiàn)靈活部署,結(jié)合國產(chǎn)算力性價比優(yōu)勢,逐步替代英偉達市場。
另一方面,構(gòu)建開放生態(tài)至關(guān)重要。例如設(shè)立國產(chǎn)算力專項開源項目,提供適配工具鏈,降低技術(shù)門檻吸引開發(fā)者。針對中小企業(yè)需求,提供全面應(yīng)用場景展示,通過實際案例驗證國產(chǎn)算力可行性。
推動產(chǎn)業(yè)鏈垂直整合也是關(guān)鍵。通過組建芯片設(shè)計、制造、封裝測試的產(chǎn)業(yè)聯(lián)盟,集中資源突破先進制程和HBM存儲技術(shù)等關(guān)鍵核心技術(shù),減少對外依賴。同時制定標準化的國產(chǎn)算力接口協(xié)議,提升跨廠商設(shè)備兼容性,避免生態(tài)碎片化。
此外,政策引導同樣不可或缺。通過稅收優(yōu)惠、采購傾斜等政策引導行業(yè)資源投入,加速國產(chǎn)方案規(guī);涞。
總結(jié)
當前,國產(chǎn)AI算力生態(tài)正處于發(fā)展的關(guān)鍵轉(zhuǎn)折點。通過技術(shù)協(xié)同、生態(tài)開放、產(chǎn)業(yè)鏈整合和政策引導,有望形成與英偉達并行的“雙軌制”算力格局,助力中國AI走上一條完全獨立自主的發(fā)展路徑。
無論Scaling Law如何演變,AI競爭的終極目標始終是將算力轉(zhuǎn)化為生產(chǎn)力。在AI全球化競爭中,如何讓AI走進車間、商鋪、街道,讓AI真正成為水電煤一樣的基礎(chǔ)設(shè)施,才是更為重要的事情,而中國正朝著這個目標穩(wěn)步前進。