☰

不僅開源還便宜好用，硅谷員工直呼“火燒屁股”的DeepSeek大模型強在哪

國產大模型公司深度求索（DeepSeek）發佈的最新AI（人工智能）大模型在海外引起開發者和投資者的熱議。

1月20日，量化巨頭幻方量化旗下大模型公司DeepSeek正式發佈推理大模型DeepSeek-R1。作爲一款開源模型，R1在數學、代碼、自然語言推理等任務上的性能能夠比肩OpenAI o1模型正式版，並採用MIT許可協議，支持免費商用、任意修改和衍生開發等。目前，在國外大模型排名榜Chatbot Arena上，DeepSeek-R1的基準測試排名已經升至全類別大模型第三，與OpenAI的ChatGPT-4o最新版並列，並在風格控制類模型（StyleCtrl）分類中與OpenAI的o1模型並列第一。

更令市場驚訝的是，據DeepSeek介紹，R1的預訓練費用只有557.6萬美元，在2048塊英偉達H800 GPU（針對中國市場的低配版GPU）集羣上運行55天完成，僅是OpenAI GPT-4o模型訓練成本的不到十分之一。DeepSeek表示，R1在後訓練階段大規模使用了強化學習技術，在僅有極少標註數據的情況下，極大提升了模型推理能力。此外，DeepSeek不僅將R1訓練技術全部公開，還蒸餾了6個小模型向社區開源，允許用戶藉此訓練其他模型。

開源模型正在趕超，比OpenAI便宜九成

一經推出，DeepSeek-R1便憑藉其“物美價廉”的特性在海外開發者社區中引發了轟動。在API定價方面，DeepSeek R1服務對每百萬輸入token收取0.55美元，對每百萬輸出token收取2.19美元/百萬，而OpenAI最新版o1模型的相應收費分別爲15美元/百萬和60美元/百萬。在海外AI社區中小有名氣的研究者Shubham Saboo表示，作爲一款“100%開源”的模型，R1比OpenAI o1便宜96.4%，同時提供類似的性能，建議已經訂閱ChatGPT的開發者“放棄沉沒成本”。

除了性能方面的突出表現外，DeepSeek還給出了新的AI大模型搭建思路。英偉達高級研究科學家Jim Fan表示，DeepSeek-R1可能是“首個展示了RL（強化學習）飛輪可以發揮作用且能帶來持續增長的OSS（開源軟件）項目”。其中，“飛輪”用來形容AI系統中自我強化、正向循環的過程。DeepSeek的論文顯示，不同於過去AI模型往往依賴於監督微調（SFT，指AI模型通過已標註的數據進行訓練），R1完全由強化學習驅動，證明了直接強化學習是可行的。

Jim Fan寫道：“我們正處於一個奇特的時間線上，一家非美國公司正在踐行OpenAI最初的使命，即實現真正開放的前沿研究並讓所有人受益。這種情況簡直無法理解。最有娛樂性的結果卻是可能性最大的結果。”

硅谷知名投資機構A16z的合夥人、Mistral AI董事會成員Anjney Midha表示：“從斯坦福到麻省理工，DeepSeek-R1幾乎在一夜之間成爲美國頂尖大學研究人員的首選模型。”德國馬克斯·普朗克量子光學研究所AI科學家實驗室負責人馬里奧·克倫（Mario Krenn）也盛讚DeepSeek-R1的開放性，相比之下，OpenAI旗下的模型“本質上都是黑箱”。

憑藉極低的訓練成本，DeepSeek-R1也讓華爾街和投資者感到了震撼。1月24日，參投過OpenAI、Databricks、Character.AI等知名企業的風險投資巨頭安德森·霍洛維茨基金（Andreessen Horowitz）的聯合創始人馬克·安德森（Marc Andreesen）連轉了幾篇關於Deepseek-R1的推文，並對其進行了公開讚賞。他在X（原推特）平臺上寫道：“Deepseek R1是我見過的最令人驚歎和印象深刻的突破之一——作爲開源項目，它是對世界的一份深刻饋贈。”

隨後，法國企業家、推特意見領袖阿諾德·貝特朗（Arnaud Bertrand）轉發了安德森的推文，並稱中國AI的發展速度令人驚豔：“Deepseek時刻不僅是關於AI的，而是讓世界意識到中國在技術和創新方面已經趕上了美國，並且在某些領域甚至超過了美國，儘管有人努力阻止這種情況的發生。”

在近日舉辦的2025年達沃斯論壇上，AI科技初創公司Scale AI創始人亞歷山大·王（Alexandr Wang）表示，DeepSeek的AI大模型性能“大致與美國最好的模型相當”。去年12月，DeepSeek發佈上一代模型V3後，Alexandr Wang就在X平臺上評價道：“DeepSeek-V3帶給外界的教訓是：當美國人在休息時，中國人在工作，並以更便宜、更快、更強的產品迎頭趕上。”

而Meta首席AI科學家楊立昆（Yann LeCun）指出，比起“中國AI超越了美國”的觀點，DeepSeek-R1更重要的是證明了“開源模型正在超越專用模型”：“DeepSeek得益於開源研究和開源項目（例如PyTorch和來自Meta的Llama）。這就是開放研究與開源的力量。”

1月26日，360創始人周鴻禕發視頻談“中國大模型DeepSeek反超GPT”，稱中美AI競爭“最終一定是中國勝利”，就像中國已經在製造業領域戰勝了美國：“DeepSeek這家公司最近的表現簡直逆天，我相信將來如果要對抗美國的AI技術霸權，中國大模型技術復仇者聯盟戰隊裡一定有DeepSeek的一份，因爲這家公司和它的創始人非常低調，他們技術能力和未來前景被市場嚴重低估了。”

AI競賽發展加速，“燒錢”潮流能否持續

同時，市場開始猜測，DeepSeek-R1的橫空出世是否會影響一味“砸錢”投入AI競賽的美國科技巨頭們。分析指出，AI行業競爭或將以比預想中更快的速度加劇，並有可能影響到上游AI硬件企業的收入。

加州大學伯克利分校的AI政策研究員Ritwik Gupta表示，DeepSeek-R1的出現證明了“AI能力沒有技術護城河”，並稱“中國的系統工程師人才庫比美國大得多，他們懂得如何充分利用計算資源來更高效地訓練和運行模型”。

1月23日，一名Meta員工在匿名職場論壇Teamblind上發帖稱，Meta內部已經因爲DeepSeek-R1而進入“恐慌模式”。這位員工寫道：“Meta的工程師們正在爭分奪秒地分析DeepSeek，試圖複製其中一切可能的技術，管理層正爲生成式AI研發部門的鉅額投入而發愁。”

該員工表示，DeepSeek-R1的訓練成本不到550萬美元，而Meta的生成式AI部門裡“每位領導的薪資都超過了這個數字”：“（AI部門）本應是一個以工程爲核心的小型組織，但因爲很多人都想進來分一杯羹，人爲膨脹了組織的規模，結果人人都是輸家。”

隨後，有認證爲谷歌員工的網友回覆上述言論稱：“DeepSeek做的事情很瘋狂。不僅是Meta，OpenAI、谷歌和Anthropic都因爲他們而火燒屁股。這是一件好事，我們可以見證公開競爭對創新的推動作用。”

或許是因爲感受到了競爭壓力，Meta的CEO馬克·扎克伯格（Mark Zuckerburg）於24日在旗下社交平臺上表示，公司計劃在2025年投資600億至650億美元用於資本支出，並計劃大幅擴張AI團隊。到2025年年底，Meta將擁有超過130萬個GPU。扎克伯格稱“今年將是AI的關鍵一年”，公司還將在路易斯安那州建設一座價值100億美元的數據中心。

不僅開源還便宜好用，硅谷員工直呼“火燒屁股”的DeepSeek大模型強在哪

相關資訊