☰

DeepSeek：不僅是中國AI技術的里程碑

DeepSeek因爲對美股的“暴擊”迅速站上市場暴風眼，這隻“來自東方的神秘力量”引發海內外空前的高度關注。DeepSeek的爆火，不僅是中國AI技術的里程碑，更是全球AI行業的一次“範式革命”。

這種關注是把雙刃劍。在這個過程中，DeepSeek迅速經歷自身宕機到被攻擊的諸多事件。但這並沒有妨礙其最新開源模型的發佈。

除夕，DeepSeek發佈分別名爲Janus-Pro等開源多模態AI模型，文生圖測試優於OpenAI。有科技圈人士表示，這“絕對是AI行業最難眠的一夜了”。

從宕機到被攻擊

DeepSeek的輿情熱度崛起，幾乎是一夜之間。從力壓ChatGPT，登頂美區App Store 免費榜，到國內 App Store 免費榜，均樣位居第一。

熱度是把雙刃劍。昨晚至今日，DeepSeek連續發佈聲明稱：近期 DeepSeek 線上服務受到大規模惡意攻擊，註冊可能繁忙，請稍等重試。已註冊用戶可以正常登錄，感謝理解和支持。

就在一日前，新模型發佈後的訪問量激增，一度讓DeepSeek閃崩，但問題都在數分鐘內得到解決。AI界上一次出現宕機情況，還是月之暗面的Kimi出圈爆火之時。

DeepSeek爆火的原因，在於其能與OpenAI“掰手腕”。

當DeepSeek-V3和R1橫空出世，全球AI界彷彿被投下了一顆“技術核彈”。推出後不久，R1就憑藉其性價比、開源及推理能力的提升等方面獲得了廣泛關注。DeepSeek表示，最新的AI模型可以與OpenAI的ChatGPT媲美，且開發成本遠低於競爭產品。海外AI界評論，這是大模型行業的最大“黑馬”，在外網被不少人稱爲“神秘的東方力量”。

這股力量在資本市場掀起巨浪。當地時間1月27日，美國股市開盤即大幅下跌，科技板塊尤爲慘重。尤其是英偉達，1月27日美股收盤，英偉達股價暴跌17%。

對此，英偉達方面迴應稱：“DeepSeek是一項卓越的人工智能進展，也是測試時擴展的絕佳範例。DeepSeek的研究展示瞭如何運用該技術，藉助廣泛可用的模型以及完全符合出口管制規定的算力，創建新模型。推理過程需要大量英偉達GPU和高性能網絡。如今我們有三條擴展定律：持續適用的預訓練和後訓練定律，以及新的測試時擴展定律。”

根據初步統計，隨着英偉達股價的暴跌，黃仁勳的身家大幅縮水210億美元。

此外，還有報道表示，美國總統特朗普在佛羅里達州邁阿密舉行的共和黨會議上表示，中國人工智能初創公司DeepSeek的崛起應當爲美國企業敲響“警鐘”，美國公司“需要專注於競爭以贏得勝利。”

又推新模型

1月28日凌晨，人工智能社區Hugging Face顯示，DeepSeek剛剛發佈了開源多模態人工智能模型Janus-Pro，擁有10億和70億參數規模。其中Janus-Pro-7B在GenEval和DPG-Bench基準測試中擊敗了OpenAI的DALL-E 3和Stable Diffusion。

這個模型既能讓AI讀圖（基於SigLIP-L），又能讓AI生圖（借鑑LlamaGen），分1.5B和7B兩個大小。對比來看，GPT-4o的圖片生成多模態模型至今沒開放。

主流市場分析認爲，作爲中國人工智能初創公司的DeepSeek，其最新突破動搖了美國科技行業的“無敵”地位。

那麼，DeepSeek究竟厲害在哪？低成本、高性能、開源是外界提到的高頻詞。

實際上，在推出後不久，R1就憑藉其開源的性質、大幅下降的售價和訓練成本獲得了廣泛關注。作爲一款開源模型，R1在數學、代碼、自然語言推理等任務上的性能能夠比肩OpenAI o1模型正式版，並採用MIT許可協議，支持免費商用、任意修改和衍生開發等。

同時，R1的預訓練費用只有557.6萬美元，在2048塊英偉達H800 GPU（針對中國市場的低配版GPU）集羣上運行55天完成。

這是個什麼概念？557.6萬美元，僅是OpenAIGPT-4o模型訓練成本的不到十分之一。因此，這有望引發行業重估大模型成本——有一種分析認爲，大模型和算力這兩個親兄弟，有望從此分道揚鑣。

據統計，2024年1—8月，微軟、Meta、谷歌、亞馬遜總計向AI數據中心投入1250億美元，包括AI資本支出、總數據中心運營成本，現金運營費用、軟件、折舊和電費也納入統計。預計2024年美國四大科技巨頭全年投入約2180億美元。而隨着DeepSeek的發佈，會否引發市場對科技巨頭越來越多AI投入的質疑，值得關注。

量化基金轉型“AI拼多多”

在國內7家頭部的大模型創業公司當中，DeepSeek可以說是最不顯山不露水的一家。另一方面，雖然市場是從最近纔開始突然關注DeepSeek，但是它卻是中國AI界的老面孔。

最受關注的事件之一，就是去年引爆的“大模型價格戰”。

去年5月，字節跳動宣佈旗下豆包主力模型，輸入價格爲0.0008元/千Tokens。6天后，阿里巴巴宣佈通義千問主力模型大幅降價，主力模型Qwen-Long，API輸入價格從0.02元/千tokens降至0.0005元/千tokens，直降97%。此後，百度跳過降價，直接宣佈，旗下大模型文心一言的兩款入門級產品ERNIE Speed和ERNIE Lite免費。大模型價格戰戰火點燃。

雖然市場普遍關注大廠，但實際上，DeepSeek與智譜AI的入門級大模型降價得更早。去年5月7日DeepSeek就曾宣佈將旗下大模型DeepSeek-V2的價格降到了每百萬token輸入1元、輸出2元（32K上下文）。

對此，幻方創始人樑文鋒曾迴應稱，“大廠的模型成本比DeepSeek高很多，所以DeepSeek沒想到會有人虧錢做這件事，最後就變成了互聯網時代的燒錢補貼的邏輯。”

再往前回溯，DeepSeek被視爲量化基金轉型人工智能的典型代表。

在DeepSeek背後是量化私募巨頭幻方，也是大廠外唯一一家儲備上萬張英偉達 A100芯片的公司。幻方總部位於杭州，專注於利用數學、統計學和計算機技術進行金融市場的量化分析和交易。相當一段時間內，還曾受到負面輿情的困擾。

此後，DeepSeek-V2發佈，主流判斷認爲，幻方量化轉型爲人工智能先驅，其超低價格甚至引發了國內大模型的價格戰，DeepSeek也被迅速冠以“AI界拼多多”之稱。

無論是DeepSeek的橫空出世，還是後來的價格戰戰火點燃，AI界人士普遍認爲，這反映出百度和阿里巴巴等科技巨頭，儘管在生成式人工智能領域已處於領先地位，但仍需要面對着來自新玩家的激烈競爭。

從目前來看，這種轉型不僅仍在推進，而且在這一年多時間裡，DeepSeek進展迅速。

更多故事或啓幕

“投身於探索 AGI 的本質，不做中庸的事，帶着好奇心，用最長期的眼光去回答最大的問題”，這是DeepSeek官方微信號寫下的簡介。

對於DeepSeek大火，e公司記者嘗試聯繫通義千問、文心一言、騰訊等大廠，均表示“未有迴應。”有些則對記者回復，會及時關注。

出圈後的DeepSeek，目前依然低調。

從產業生態來看，不少大模型廠商都已開啓投放買量，以期早日實現商業化變化。不過，記者的通過多種方式試圖聯繫DeepSeek，但都未成功。多信源透露，其至今尚未有公關團隊。

不過這反而增加了市場討論的熱情。從昨天開始，各科技羣中，關於DeepSeek的討論不絕於耳。有人問：“今年春晚，（DeepSeek）會不會露下臉？

業內普遍認爲，DeepSeek的進展顯示出，美國的領先優勢正在縮小，各國應該採取合作方式建設先進AI，而不是在AI領域進行“軍備競賽”。

不過也有觀點認爲，客觀來看，雖然DeepSeek勢頭驚人，但其技術目前仍落後於OpenAI和谷歌。爆火出圈後，DeepSeek未來可能將面臨更多的壓力和挑戰。

但不可否認的是，衍生影響仍將蔓延。有AI界人士接受e公司記者採訪時預判，不止是中國，世界上很多AI公司本來因爲大模型訓練的高昂成本，已經放棄了自研大模型。現在看到DeepSeek的成功，未來有望繼續研究起來。

從這個意義來看，DeepSeek的爆火，不僅是中國AI技術的里程碑，更是全球AI行業的一次“範式革命”。

從更廣闊的視野來看，DeepSeek代表了中國“硬核技術創新”的一種敘事。而除了DeepSeek之外，市場還在關注更多類似的中國科技硬核力量。隨着DeepSeek的爆火，包括人形機器人公司宇樹科技等，也都在被市場寄予更多期待。

DeepSeek：不僅是中國AI技術的里程碑

相關資訊