英偉達市值蒸發破紀錄 DeepSeek“連招”重新定義AI
21世紀經濟報道記者倪雨晴 深圳報道
2025年,AI的開局無疑令人振奮。
中國AI初創公司DeepSeek正掀起新的AI變革,熱潮燃至除夕夜。1月28日凌晨,DeepSeek深夜出招,發佈開源多模態人工智能模型Janus-Pro,宣佈在GenEval和DPG-Bench基準測試中擊敗DALL-E 3和Stable Diffusion。
一週前,DeepSeek剛剛發佈了AI推理大模型R1,不亞於OpenAI o1的高性能、訓練的極低成本直接“震動”了全球AI市場,本週一度登頂蘋果免費APP排行榜首位。
熱度攀升的同時,大洋彼岸,DeepSeek在華爾街、AI界引發蝴蝶效應。圈內外激辯AI泡沫和價值,股市的風暴率先來臨。
美東時間1月17日收盤,英偉達下跌16.86%,市值一夜蒸發5888.62億美元(約合人民幣4.27萬億元),創下美股歷史上最大單日個股蒸發規模;博通大跌17.40%、臺積電下跌13.33%,兩者的市值都回落到1萬億美元以下;此外,美光科技下跌11.71%、AMD下跌6.37%。
面對劇烈的股價波動和DeepSeek的發展,1月28日,英偉達向21世紀經濟報道記者回應道:“DeepSeek是一項卓越的人工智能進展,也是測試時擴展的絕佳範例。DeepSeek的研究展示瞭如何運用該技術,藉助廣泛可用的模型以及完全符合出口管制規定的算力,創建新模型。推理過程需要大量NVIDIA GPU和高性能網絡。如今我們有三條擴展定律:持續適用的預訓練和後訓練定律,以及新的測試時擴展定律。”
在迴應中,英偉達肯定了DeepSeek在AI領域的進步,澄清了出售的GPU芯片是合規的,並表示GPU還將有大量需求。短期內,以英偉達爲首的算力產業鏈在猛漲後有回調受挫壓力,長期對於AI前景的展望還要動態觀察。
同時值得注意的是,此次暴跌的集中地主要在AI算力板塊,或者說AI芯片的上下游領域,互聯網等軟件大廠微跌甚至有所上漲。比如,微軟僅下跌2.14%,而亞馬遜微漲0.24%、Meta上漲1.91%,Salesforce上漲3.96%。
從中能看到的趨勢是,AI要素三角——算法、算力、數據當中,算力面臨價值重估挑戰。DeepSeek在算力制約下另闢蹊徑,用算法進化和高質量數據,一定程度上衝擊着芯片巨頭們的算力壁壘。另一方面,大模型訓練成本、推理成本的下降,未來將加速催化AI應用的爆發,軟件在重生、新的軟硬件體系也在重構,一起把AI蛋糕做大,方能促進整體市場的繁榮。
DeepSeek“奇襲”算力壁壘
近期,DeepSeek被冠上了不少標籤,“英偉達算力大空頭”“來自東方的神秘力量”“AI的斯普特尼克時刻”“AI界拼多多”“AI界SpaceX”等,已然成爲AI界創業新星。
DeepSeek最廣爲傳播的突破就在於效率和成本。公開信息顯示,2024年底,DeepSeek-V3開源基礎模型發佈後,性能對標GPT-4o,訓練成本只有2048塊英偉達H800,總花費約557.6萬美元。
同樣是開源模型,Meta的Llama 3.1訓練使用了16384塊英偉達H100 GPU,GPT-4o模型的訓練成本約爲1億美元,使用的英偉達GPU也在萬塊以上。
上萬的加速卡曾經是訓練的常規門檻,但是DeepSeek正在打破常規。R1的訓練成本尚未可知,但是API定價遠低於OpenAI o1,R1每百萬輸入tokens在1~4元人民幣,每百萬輸出tokens爲16元人民幣。OpenAI在前兩年一枝獨秀後,迎來更多的勁敵。
最新的DeepSeek Janus-Pro公佈後,OpenAI的CEO Sam Altman也忍不住對DeepSeek進行了評論,並劇透發佈新品。
1月28日上午,Sam Altman在社交平臺上表示:“Deepseek的R1是一個令人印象深刻的模型,尤其是考慮到性價比。我們顯然會推出更好的模型,而且看到一個新的競爭者真是令人振奮!我們將發佈一些新版本。
不過最讓我們興奮的還是能夠繼續推進我們的研究路線圖,我們相信,現如今比以往任何時候都更加需要計算力讓我們的使命成功。全球將會大量使用人工智能,下一代模型也將令人驚歎,期待將AGI以及更多技術帶給大家。”
首先,從大模型橫向對比看,開源的力量正在放大,事實上在2024年,DeepSeek已經憑藉V2開源模型的高性價比一戰成名,國內的公司紛紛跟進降價,到了2025年,戰火也蔓延到全球AI企業。
同時,當前更受關注的是,業內人士認爲,DeepSeek R1的成功可能會削弱英偉達等AI芯片需求的預期。與其他創業公司、科技巨頭相比,DeepSeek既然能以更低的算力成本提供高計算性能的大模型,在不使用大量最尖端芯片的情況下,也有機會突破壁壘。
因此,也引發了業界對算力鉅額投資的質疑,可以說,DeepSeek戳破大模型高成本的現狀,算力的比重和角色正在發生變化。尤其是到了推理時代,異構計算的結構配比,又將發生變化。所以我們看到,不光是英偉達,博通、AMD等一同股價下跌,尤其是英偉達狂飆的增速或面臨下滑。
近期,英偉達經歷了多次股價波動,下滑的因素是多重的,包括大盤迴調、利潤增速下降、高估值隱憂、GB200交付問題、勁敵增多、各國反壟斷審查等等。各種背景因素交織着情緒,在資本市場上拉扯。
但是英偉達創始人兼CEO黃仁勳一直強調,Blackwell平臺的產品需求高,數據中心領域還將持續增長。隨着接下來2月底新一季度財報的發佈,英偉達將回應更多,只是短期還將承壓。
但是這並不意味着算力從此一文不值,有了前期算力基建的基礎上,方能涌現出如此多的創新,長期來看,AI應用的爆發繼續需要算力支持。
當前美股科技巨頭們還在算力軍備競賽中。美國最新公佈的“星際之門”AI基礎設施計劃,由OpenAI、軟銀和甲骨文等公司合作開展,計劃在未來4年內籌集5000億美元,用於建設超大規模數據中心。微軟計劃在2025年在AI基礎設施上投入800億美元,Meta CEO扎克伯格最近剛表示,Meta計劃在2025年投資600億至650億美元的資本支出,投入到AI戰略中。
摩根士丹利(Morgan Stanley)2024年11月發佈的報告顯示,亞馬遜、Google、Meta和微軟2025年的資本支出合計將達到3000億美元左右,2026年將進一步增長至3365億美元,這些支出多數將投入固定資產,例如數據中心和房地產。
接下來,如何更有效率得使用算力、打造更先進的算力網絡,將是新的考驗。
新舊交替掀起AI新變革
一位AI從業者向21世紀經濟報道記者評價道:“DeepSeek價格是拼多多,它的性價比無需多言;工程上是SpaceX,SpaceX在供應鏈降低成本上有目共睹,DeepSeek也是如此;軟件上則是蘋果,蘋果並不太強調參數,軟硬件優化達到高性能體驗是它的實力。”
多位業內人士向記者分析稱,DeepSeek的創新集中在系統工程上,在訓練大模型的各個環節中都進行了升級迭代,從而形成了強大的新模型。
比如,DeepSeek採用了MoE架構模型(Mixture of Experts,專家混合)、MLA多層注意力架構、FP8混合精度訓練框架、各類通信技術、MTP技術(Multi-Token Prediction,多token預測)、蒸餾R1等等,在各個環節上進行工程化的創新升級,讓效率持續上升。
很多架構或者技術並不是DeepSeek原創,但是DeepSeek卻將這些技術應用得爐火純青。以MoE架構爲例,MoE架構是一種用於提升深度學習模型性能和效率的架構,最早由谷歌提出,將模型劃分爲多個“專家”,動態選擇最相關的專家參與特定項目的計算。怎麼樣讓專家高效的滿載運轉,就是各家的本事了,目前看來DeepSeek做到了更優的動態調節。
又比如MTP技術,其實是Meta此前率先提出的技術,相比傳統生成一個Token,MTP技術能同步生成多個Token,這就加快了AI生成的速度。DeepSeek很快就將MTP引入,並且應用的更快更好。同時,在數據上,DeepSeek也處理的很好,數據量大、質量高。
當然,也有專家指出,DeepSeek存在偏科現象,尤其擅長數學和編程,大模型還有進步空間,在基礎技術上也要進一步突破。
或許,DeepSeek並沒有達到範式的創新,但是工程上的創新、應用的創新,也在孕育新的變革。不斷推陳出新的新模型,DeepSeek也向外界展示了更多的可能性,新一代的AI路徑正在生成中。
雖然DeepSeek探索出了低成本的大模型訓練方法,但是前期的投入卻不少。DeepSeek孵化於國內頂級量化基金幻方量化,創始人樑文鋒是浙江大學大學信息與通信工程專業碩士,2023年4月才成立了子公司DeepSeek,但是幻方量化已經在AI的路上佈局多年。
根據官網介紹,幻方量化成立於2015年,到了2017 年底,幾乎所有的量化策略都已經採用AI模型計算。2018年進一步確立以AI爲發展方向,但是複雜的模型計算需求使得單機訓練遭遇算力瓶頸,同時日益增加的訓練需求和有限的計算資源產生了矛盾,尋求大規模算力解決方案。
在此背景下,2019年成立了幻方AI,致力於AI算法與基礎應用研究,研發團隊自研幻方“螢火一號”AI 集羣,搭載了500塊顯卡,2020年“螢火一號”總投資近2億元,搭載1100加速卡;2021年開始,幻方AI投入10億建設“螢火二號”,2022年突破了一期的物理限制,算力擴容翻倍。
這也意味着,從2019年,幻方就開始購買卡建設AI集羣,當時chatGPT還沒有全球爆火,但是幻方就已經拿到了AI昂貴的船票,並在2021年左右就達到了萬卡的儲備。此前就有大廠高管向記者表示,金融和醫療是目前生成式AI應用最廣的領域,因爲數據基本上雲且完備合規。從這個邏輯看來,從金融創業公司跑出來AI大模型也不奇怪,而且DeepSeek的一大商用場景就已經是量化金融。
對於創業公司與大廠的競爭,此前樑文鋒接受暗涌採訪時談道:“說實話我們不太care這件事,只是順便做了這件事。提供雲服務不是我們的主要目標。我們的目標還是去實現AGI。目前沒有看到什麼新解法,但大廠也沒有明顯佔優。大廠有現成的用戶,但它的現金流業務也是它的包袱,也會讓它成爲隨時被顛覆的對象。”
談及其他中國的大模型創業公司,樑文鋒表示,可能活下來2到3家,那些自我定位清晰、更能精細化運營的,更有機會活下來。其它公司可能會脫胎換骨。有價值的東西不會煙消雲散,但會換一種方式。
DeepSeek現象級爆發之後
新銳AI企業DeepSeek憑藉其R1模型的強勁表現和現象級爆發,成爲行業焦點。極低的訓練成本展現出媲美主流大模型的性能,這一成果在AI領域引發了巨大轟動,並對行業格局帶來了影響。
目前看來,DeepSeek的崛起或許標誌着AI技術從“規模優先”轉向“效率優先”的新階段。數據顯示,我們的人腦功耗僅20瓦(相當於一盞節能燈),卻支持複雜的認知功能,未來大模型或許能進一步朝着大腦的方向進化。
可以確定的是,來到新的一年,AI競技場上的技術創新和行業競爭將進入全新層次。其一,DeepSeek爲AI市場注入了新的變量,在其推動下,AI巨頭可能不得不調整商業策略,降價以應對競爭壓力。未來,行業內的價格戰或愈演愈烈,迫使企業優化成本結構,探索更具吸引力的商業模式。
其二,低成本催生應用爆發,AI普及正在加速,DeepSeek的技術突破降低了AI服務的總體成本,讓更多傳統行業能以更低門檻部署AI解決方案。這將加速AI在各行各業的滲透,進一步推動數字化轉型。同時,低成本還使定製化AI應用成爲可能,個人和中小型企業均可打造專屬AI服務,催生個性化AI時代的到來。
其三,算力價值面臨重估,R1模型展現的高效算力利用引發了行業對計算資源價值的重新思考。傳統上,AI模型的發展高度依賴於昂貴的硬件資源,然而,DeepSeek通過優化架構減少了對算力的需求,這可能導致算力市場的供需關係發生結構性變化。未來,企業將更加註重通過算法創新提升效率,而非一味增加硬件投入。與此同時,在最高端算力受限的情況下,國產芯片也有新的替代機會。
其四,DeepSeek正在掀起效率革命,小而精模型或成新趨勢。DeepSeek的成功表明,在AI模型開發中,“更大”並不一定代表“更優”,效率導向的大模型開發或成爲新潮流。人腦功耗僅 20瓦(相當於一盞節能燈),卻支持複雜的認知功能,或許接下來的進化。
其五,AI行業中開源與閉源生態的競爭在加劇。開源模式因其靈活性和創新性受到更多關注,而閉源企業可能通過生態建設和增值服務守住市場。然而,隨着低成本技術的普及,開源社區的影響力或將持續擴大,進一步挑戰閉源巨頭的壟斷地位。
而正是這樣的英雄輩出、各領風騷,推動着AI世界波瀾壯闊地進化。從全新的計算架構到革命性的芯片技術,下一個英偉達、下一個DeepSeek或許正從實驗室中走向舞臺。在新的AI浪潮中,行業格局將被重塑,全球的AI戰略投入和人才爭奪將更加白熱化。