DeepSeek:不僅是中國AI技術的里程碑

DeepSeek因爲對美股的“暴擊”迅速站上市場暴風眼,這隻“來自東方的神秘力量”引發海內外空前的高度關注。DeepSeek的爆火,不僅是中國AI技術的里程碑,更是全球AI行業的一次“範式革命”。

這種關注是把雙刃劍。在這個過程中,DeepSeek迅速經歷自身宕機到被攻擊的諸多事件。但這並沒有妨礙其最新開源模型的發佈。

除夕,DeepSeek發佈分別名爲Janus-Pro等開源多模態AI模型,文生圖測試優於OpenAI。有科技圈人士表示,這“絕對是AI行業最難眠的一夜了”。

從宕機到被攻擊

DeepSeek的輿情熱度崛起,幾乎是一夜之間。從力壓ChatGPT,登頂美區App Store 免費榜,到國內 App Store 免費榜,均樣位居第一。

熱度是把雙刃劍。昨晚至今日,DeepSeek連續發佈聲明稱:近期 DeepSeek 線上服務受到大規模惡意攻擊,註冊可能繁忙,請稍等重試。已註冊用戶可以正常登錄,感謝理解和支持。

就在一日前,新模型發佈後的訪問量激增,一度讓DeepSeek閃崩,但問題都在數分鐘內得到解決。AI界上一次出現宕機情況,還是月之暗面的Kimi出圈爆火之時。

DeepSeek爆火的原因,在於其能與OpenAI“掰手腕”。

當DeepSeek-V3和R1橫空出世,全球AI界彷彿被投下了一顆“技術核彈”。推出後不久,R1就憑藉其性價比、開源及推理能力的提升等方面獲得了廣泛關注。DeepSeek表示,最新的AI模型可以與OpenAI的ChatGPT媲美,且開發成本遠低於競爭產品。海外AI界評論,這是大模型行業的最大“黑馬”,在外網被不少人稱爲“神秘的東方力量”。

這股力量在資本市場掀起巨浪。當地時間1月27日,美國股市開盤即大幅下跌,科技板塊尤爲慘重。尤其是英偉達,1月27日美股收盤,英偉達股價暴跌17%。

對此,英偉達方面迴應稱:“DeepSeek是一項卓越的人工智能進展,也是測試時擴展的絕佳範例。DeepSeek的研究展示瞭如何運用該技術,藉助廣泛可用的模型以及完全符合出口管制規定的算力,創建新模型。推理過程需要大量英偉達GPU和高性能網絡。如今我們有三條擴展定律:持續適用的預訓練和後訓練定律,以及新的測試時擴展定律。”

根據初步統計,隨着英偉達股價的暴跌,黃仁勳的身家大幅縮水210億美元。

此外,還有報道表示,美國總統特朗普在佛羅里達州邁阿密舉行的共和黨會議上表示,中國人工智能初創公司DeepSeek的崛起應當爲美國企業敲響“警鐘”,美國公司“需要專注於競爭以贏得勝利。”

又推新模型

1月28日凌晨,人工智能社區Hugging Face顯示,DeepSeek剛剛發佈了開源多模態人工智能模型Janus-Pro,擁有10億和70億參數規模。其中Janus-Pro-7B在GenEval和DPG-Bench基準測試中擊敗了OpenAI的DALL-E 3和Stable Diffusion。

這個模型既能讓AI讀圖(基於SigLIP-L),又能讓AI生圖(借鑑LlamaGen),分1.5B和7B兩個大小。對比來看,GPT-4o的圖片生成多模態模型至今沒開放。

主流市場分析認爲,作爲中國人工智能初創公司的DeepSeek,其最新突破動搖了美國科技行業的“無敵”地位。

那麼,DeepSeek究竟厲害在哪?低成本、高性能、開源是外界提到的高頻詞。

實際上,在推出後不久,R1就憑藉其開源的性質、大幅下降的售價和訓練成本獲得了廣泛關注。作爲一款開源模型,R1在數學、代碼、自然語言推理等任務上的性能能夠比肩OpenAI o1模型正式版,並採用MIT許可協議,支持免費商用、任意修改和衍生開發等。

同時,R1的預訓練費用只有557.6萬美元,在2048塊英偉達H800 GPU(針對中國市場的低配版GPU)集羣上運行55天完成。

這是個什麼概念?557.6萬美元,僅是OpenAIGPT-4o模型訓練成本的不到十分之一。因此,這有望引發行業重估大模型成本——有一種分析認爲,大模型和算力這兩個親兄弟,有望從此分道揚鑣。

據統計,2024年1—8月,微軟、Meta、谷歌、亞馬遜總計向AI數據中心投入1250億美元,包括AI資本支出、總數據中心運營成本,現金運營費用、軟件、折舊和電費也納入統計。預計2024年美國四大科技巨頭全年投入約2180億美元。而隨着DeepSeek的發佈,會否引發市場對科技巨頭越來越多AI投入的質疑,值得關注。

量化基金轉型“AI拼多多”

在國內7家頭部的大模型創業公司當中,DeepSeek可以說是最不顯山不露水的一家。另一方面,雖然市場是從最近纔開始突然關注DeepSeek,但是它卻是中國AI界的老面孔。

最受關注的事件之一,就是去年引爆的“大模型價格戰”。

去年5月,字節跳動宣佈旗下豆包主力模型,輸入價格爲0.0008元/千Tokens。6天后,阿里巴巴宣佈通義千問主力模型大幅降價,主力模型Qwen-Long,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降97%。此後,百度跳過降價,直接宣佈,旗下大模型文心一言的兩款入門級產品ERNIE Speed和ERNIE Lite免費。大模型價格戰戰火點燃。

雖然市場普遍關注大廠,但實際上,DeepSeek與智譜AI的入門級大模型降價得更早。去年5月7日DeepSeek就曾宣佈將旗下大模型DeepSeek-V2的價格降到了每百萬token輸入1元、輸出2元(32K上下文)。

對此,幻方創始人樑文鋒曾迴應稱,“大廠的模型成本比DeepSeek高很多,所以DeepSeek沒想到會有人虧錢做這件事,最後就變成了互聯網時代的燒錢補貼的邏輯。”

再往前回溯,DeepSeek被視爲量化基金轉型人工智能的典型代表。

在DeepSeek背後是量化私募巨頭幻方,也是大廠外唯一一家儲備上萬張英偉達 A100芯片的公司。幻方總部位於杭州,專注於利用數學、統計學和計算機技術進行金融市場的量化分析和交易。相當一段時間內,還曾受到負面輿情的困擾。

此後,DeepSeek-V2發佈,主流判斷認爲,幻方量化轉型爲人工智能先驅,其超低價格甚至引發了國內大模型的價格戰,DeepSeek也被迅速冠以“AI界拼多多”之稱。

無論是DeepSeek的橫空出世,還是後來的價格戰戰火點燃,AI界人士普遍認爲,這反映出百度和阿里巴巴等科技巨頭,儘管在生成式人工智能領域已處於領先地位,但仍需要面對着來自新玩家的激烈競爭。

從目前來看,這種轉型不僅仍在推進,而且在這一年多時間裡,DeepSeek進展迅速。

更多故事或啓幕

“投身於探索 AGI 的本質,不做中庸的事,帶着好奇心,用最長期的眼光去回答最大的問題”,這是DeepSeek官方微信號寫下的簡介。

對於DeepSeek大火,e公司記者嘗試聯繫通義千問、文心一言、騰訊等大廠,均表示“未有迴應。”有些則對記者回復,會及時關注。

出圈後的DeepSeek,目前依然低調。

從產業生態來看,不少大模型廠商都已開啓投放買量,以期早日實現商業化變化。不過,記者的通過多種方式試圖聯繫DeepSeek,但都未成功。多信源透露,其至今尚未有公關團隊。

不過這反而增加了市場討論的熱情。從昨天開始,各科技羣中,關於DeepSeek的討論不絕於耳。有人問:“今年春晚,(DeepSeek)會不會露下臉?

業內普遍認爲,DeepSeek的進展顯示出,美國的領先優勢正在縮小,各國應該採取合作方式建設先進AI,而不是在AI領域進行“軍備競賽”。

不過也有觀點認爲,客觀來看,雖然DeepSeek勢頭驚人,但其技術目前仍落後於OpenAI和谷歌。爆火出圈後,DeepSeek未來可能將面臨更多的壓力和挑戰。

但不可否認的是,衍生影響仍將蔓延。有AI界人士接受e公司記者採訪時預判,不止是中國,世界上很多AI公司本來因爲大模型訓練的高昂成本,已經放棄了自研大模型。現在看到DeepSeek的成功,未來有望繼續研究起來。

從這個意義來看,DeepSeek的爆火,不僅是中國AI技術的里程碑,更是全球AI行業的一次“範式革命”。

從更廣闊的視野來看,DeepSeek代表了中國“硬核技術創新”的一種敘事。而除了DeepSeek之外,市場還在關注更多類似的中國科技硬核力量。隨着DeepSeek的爆火,包括人形機器人公司宇樹科技等,也都在被市場寄予更多期待。