DeepSeek動的奶酪超乎想象 硅谷打響“命根子”保衛戰?
本報記者 吳清 北京報道
一股來自東方的神秘力量,在春節期間不僅刷爆了朋友圈,攪動了美國的科技圈,也吸引了全球的關注和熱議。
2025年1月27日,DeepSeek應用超越ChatGPT,登頂蘋果美國地區應用商店免費APP下載排行榜。同時DeepSeek也成爲中國區第一 。
同日,美國科技股重挫、總市值一日蒸發約1萬億美元,僅英偉達一家就“失血”近6000億美元,創美股史上市值損失之最。
2025年1月30日,《中國經營報》記者從網絡安全公司奇安信方面獲悉,針對DeepSeek線上服務的攻擊烈度突然升級,其攻擊指令較1月28日暴增上百倍。
DeepSeek的火爆,源自其10多天前發佈的最新大模型,1月20日,DeepSeek正式發佈DeepSeek-R1模型,該大模型成本僅爲同類型模型的二十分之一,性能卻與OpenAI領先的大模型相當,震驚了硅谷和科技圈,並迅速刷屏全球各大媒體和社交網站。
“這一次DeepSeek動的奶酪實在是太大了,大到超乎任何人想象。沒有比觸動利益更大的事情了。對於資本來說,這就是‘命根子’保衛戰。利益邏輯始終是最基礎的行爲邏輯。” 浙江大學網絡空間國際治理研究基地主任、烏鎮數字文明研究院院長方興東告訴記者,所以DeepSeek引發的不僅僅是一場前所未有的技術創新戰,更是一場前所未有的認知戰。
動了誰的奶酪?
英偉達及美股大跌的原因直指DeepSeek的爆火,即DeepSeek的成功可能削弱市場對英偉達AI芯片需求的預期,也打破了AI大模型領域“拼算力”的慣常邏輯。
與之前AI和大模型領域流行的“大力出奇跡”的範式相比,DeepSeek相信“小力出奇跡”,只花費了相當於OpenAI零頭的資金、資源,就拿出了堪與其比肩的產品。
2024年12月底,DeepSeek發佈V3模型,與OpenAI的GPT-4o性能接近,使用2048塊英偉達H800芯片,耗費約560萬美元。相比之下,GPT-4o使用上萬塊英偉達H100芯片(性能優於H800),訓練成本約1億美元。
關鍵是,與美國主流大模型相比,DeepSeek-R1模型是完全免費開源的,這直接引發了一系列疑問和連鎖反應:ChatGPT憑什麼賣那麼貴?如果海量用戶都轉投DeepSeek,那ChatGPT的價值何在?美國科技巨頭投入巨資、掌握更多的算力資源,爲何做出來的東西,連百人團隊的DeepSeek都比不了? AI大模型技術究竟有沒有護城河?如果沒有護城河,它的估值邏輯在哪裡?這些美國技術人員真的值那麼高的工資嗎?
“可以說,免費開源和低價高效,直接打掉了硅谷科技資本的所謂底氣和傲慢。”一位科技產業觀察者對記者表示。
Scale AI掌門人亞歷山大·王(Alexander Wang)坦誠,DeepSeek-V3是中國科技界帶給美國的苦澀教訓。“當美國休息時,中國(科技界)在工作,以更低的成本、更快的速度和更強的實力趕上。”
不過在經歷了震驚和錯亂以及美股暴跌後,2025年1月28日,多位美國官員指出,DeepSeek是“偷竊”,正對其影響開展國家安全調查。微軟和OpenAI則開始調查OpenAI的數據是否被與DeepSeek有關的組織“以未經授權的方式”獲取。
就相關質疑及公司在AI大模型領域未來的佈局計劃等問題,記者聯繫採訪DeepSeek方面,截至發稿,暫未獲得回覆。
時事評論員劉和平認爲,對於DeepSeek的橫空出世,一驚一乍、先褒後貶的都是美國自己。“實事求是地說,DeepSeek還算不上是技術上的革命性突破。它的性能和ChatGPT差不多,但DeepSeek最大的優勢是,不僅研發成本異常便宜,僅爲500多萬美元,跟美國的同類公司動輒燒錢數十億美元相比,簡直可以忽略不計。更重要的是,它對終端用戶始終免費開放。這就是DeepSeek蘋果應用商店下載次數很快躍升第一的原因。”劉和平說。
而對於“偷竊”的指控,《環球時報》前總編輯胡錫進讓DeepSeek “現身說法”,爲自己進行辯護。
首先,DeepSeek發出了一個反問:“做AI這行誰不是站在巨人肩膀上啊?”因爲“開源社區的代碼、論文裡的公式、全球研究者的智慧結晶,這些都是公共知識財富,大家都在用。”這裡的巨人顯然也包括了OpenAI和微軟。
其次,DeepSeek否認自己偷竊了OpenAI的技術。因爲“搞研發的同行都懂,大模型這玩意兒根本不是靠‘複製粘貼’能搞出來的”,更何況“OpenAI的模型又沒開源,GPT-4的代碼和訓練數據連他們自己員工都不一定全知道,我們上哪兒偷去?”
最後,DeepSeek還發出自己的感嘆說,“哎,每次聽到這種指控其實挺無奈的”,並且將這種指控歸結爲“商業競爭或者地緣政治”因素。
“互聯網數據本來是公開的,很多AI公司都在互聯網上獲取大量訓練數據,如果DeepSeek部分使用了OpenAI模型進行數據提煉,也不足爲奇。”上述科技產業觀察者說,DeepSeek作爲一個開源大模型,其初衷是爲了促進人工智能技術的普及與發展,成爲供全人類使用的工具。然而,如今卻面臨來自部分國家的調查與打壓,這無疑是對公共產品的一種無理限制。
方興東表示,DeepSeek事件進入美國政府最熟練的認知戰階段,攪渾、抹黑,百般武藝開始全面上陣。美國認知戰能力很強,雖然這一次美國顯然措手不及、手忙腳亂,不過,帶節奏的超強能力依然不可低估,國內呼應者也大有人在。
方興東認爲,硅谷丟失了公平競爭、創新取勝的硅谷精神,而越來越依賴美國政府霸權幫忙。一個神話的破滅,最終都是自己反對自己,自己走向了自己的對立面,這無疑是觀察DeepSeek事件最重要的視角。“當硅谷一大批人的利益開始綁架華盛頓,科技與政治之間要保持初心,越來越難。但是,最終的勝利,肯定是始終堅持創新價值觀的一方。”方興東對記者表示。
改變遊戲規則
在DeepSeek橫空出世前,AI大模型公司的對標對象是OpenAI,堆砌算力的尺度定律(規模化法則)作用於所有公司。但隨着四兩撥千斤的R1大模型的到來,所有AI公司都面臨全新範式的競爭。
DeepSeek實際體驗如何?記者下載登錄DeepSeek使用後發現,以往的AI大模型都是隻給出結果,但DeepSeek會給出其思考過程,更加可信,也不是傳統大模型那種“模式性”答案,而且它完全免費。一些網友體驗後感嘆,DeepSeek邏輯推理的思路縝密、效率高,判斷和回答的問題全面,智能化程度很高。
除了體驗更好,對於資本市場來說,DeepSeek更大的驚喜是它的推理成本大幅降低。Noah's Arc資本管理公司表示,DeepSeek-V3模型有可能徹底改變訓練和推理領域的遊戲規則。
爲何可以做到這樣的低成本訓練?據介紹,DeepSeek通過創新架構,節省了大量的顯存,進而實現底層算力的高效利用,以更低的成本訓練出更加出色的模型效果;同時,研發團隊證明,多Token預測目標有利於提高模型性能,可以用於推理加速的推測解碼。此外,DeepSeek V3引入了一種創新方法,將推理能力從長思維鏈模型,蒸餾到標準模型上,在顯著提高推理性能的同時,可以進行長度控制。
北京郵電大學人工智能學院人機交互與認知工程實驗室主任劉偉認爲,DeepSeek最大的優勢在於它算法的改進和優化,它在算力上得到了節省,在輸入數據和語料庫上,不像以前要求那麼大的數據量和大的算力,這是它的優勢。
摩根士丹利表示,DeepSeek的模型現在低成本優勢突出,與國際知名大模型相比,其成本大約低了一個數量級。高盛集團也認爲,DeepSeek新模型的成本遠低於現有模型,這意味着開發利用大模型的門檻降低,互聯網巨頭將面臨初創公司的潛在競爭。
最關鍵的而是目前DeepSeek R1提供免費開源的服務,用戶無需付費即可享受強大AI推理能力,推動AI技術普及,讓普通用戶在日常工作生活中體驗前沿科技的便利。
"鎖死芯片出口才能保證美國領導下的單極世界"時,這種技術霸權的傲慢背後,實則暴露了對中國AI創新能力加速迫近的深層焦慮。
“在DeepSeek以成本優勢逼近美國頂尖模型的背景下,美國試圖通過芯片禁運維持技術代差的策略,恰似在數字時代重演工業革命時期的‘技術圍城’。”方興東表示,這場博弈不僅關乎算力硬件的爭奪,更揭示了兩種技術發展範式的根本衝突——究竟是依靠壟斷優勢構建封閉體系,還是通過開放生態激發創新活力?
對於DeepSeek近期的爆火,85後創始人樑文鋒迴應稱:“中國AI不可能永遠跟隨。”2025年1月28日,DeepSeek繼續發佈Janus-Pro多模態大模型,進軍文生圖領域。
曾經的OpenAI是開放開源的代表,然而在商業利潤、投資方等的驅動下,OpenAI在GPT-3發佈後限制了對模型的訪問權限,僅通過API提供服務,在GPT-4發佈後更是隱藏了其訓練數據和模型權重,完全走向了“閉源”,變成了ClosedAI。
英偉達AI科學家Jim Fan稱讚DeepSeek是“真正開放的前沿研究,賦能所有人。”Jim Fan表示,“我們正身處這樣一個歷史時刻:一家非美國公司正在延續OpenAI最初的使命——通過真正開放的前沿研究賦能全人類。看似不合常理,但最有趣的結局往往最可能成真。”
(編輯:張靖超 審覈:李正豪 校對:陳麗)