賽道Hyper | DeepSeek:算力需求的潛在邏輯
作者:周源/華爾街見聞
1月27日,英偉達美股盤前深度下跌,幅度超過12%(截至北京時間1月27日20:24),跌破了2024年12月17盤中的126.86美元低點。
黃仁勳恐怕做夢也沒想到,撼動英偉達產業邏輯的,居然是一家中國私募。
1月20日,管理基金規模超過1000億元的中國頂級私募——幻方量化,旗下公司“深度求索”(DeepSeek)推出的推理大模型DeepSeek-R1(以下簡稱DS-R1),以超越行業認知的超低訓練成本和不亞於OpenAI o1正式版的性能(數學、代碼、自然語言推理等),震撼了美國硅谷。
這個GenAI推理大模型的問世,實際上相當於中國技術問鼎全球第一梯隊的宣言。從此,中國在尖端技術領域,將從追趕者,轉變爲有範式制定的實力。
這是GenAI時代真正的開始,而揭幕者,第一次是中國技術公司。
但就未來而言,英偉達產業邏輯,未必如眼下的英偉達巨幅滑落的股價那樣,反而很可能會得以進一步強化。
此話如何理解?
DS-R1“秒破”英偉達價值鏈
1月24日,在大模型排名Arena上,DS-R1基準測試升至全類別大模型第三。
其中,在風格控制類模型(StyleCtrl)分類中,DS-R1與OpenAI o1並列第一,競技場得分達到1357分,略超OpenAI o1的1352分。
OpenAI o1是OpenAI在2024年9月12日正式對外發布的一款新模型,是OpenAI下一代 “推理”模型中的首個產品。
DS-R1實現與OpenAI o1幾乎無差別的性能表現(部分開源小模型性能甚至超越了o1),成本竟只有後者的3%-5%(約550萬美元)。
這顛覆了人們對實現尖端AI性能所需條件的既有認知,順帶把英偉達價值鏈條在瞬間幹成了碎片。
目前,OpenAI o1推出的ChatGPT Pro計劃,月費高達200美元(約合人民幣1440元,合計年費17280元人民幣),對ChatGPT Plus或Team帳戶每週有50次的訪問限制。
若通過API使用o1預覽版,則輸入每百萬token收費15美元(約合人民幣108元),輸出每百萬收費60美元(約合人民幣432元)。
花費約1.7萬元人民幣,每年只能問約2600次?
這種應用成本,非一般人能承受。
再看看ChatGPT-4o,個人版月費約20美元(約合人民幣145元,合計年費1740元人民幣),也有提問次數限制。
相比之下,DS-R1個人版使用免費;另據官方消息披露,DS-R1 API服務定價爲輸入每百萬token收費人民幣1元(緩存命中)或4元(緩存未命中),輸出每百萬token收費人民幣16元。
全世界人民幣都愛低成本但性能優異的應用,看着如此懸殊的價格差,美國人民也做出了自己的選擇:目前,DS-R1已飆升至HuggingFace上下載量最高的熱門GenAI模型。
DS-R1在蘋果商店(AppStor)美區免費榜排名第四,超越Google Gemini和Microsoft Copilot等美國GenAI應用。
在技術迭代方面,DS-R1爲全開源模式,因而開發者和研究人員能更廣泛地參與其中,集合全球的科技力量,推動生態技術創新和促進市場良性競爭;OpenAI o1則是閉源模式,只能依靠OpenAI團隊努力,並在此基礎上,形成對英偉達產業邏輯的超強支撐。
可以預見,沒有達到DS-R1性能的閉源模型公司,將大批量倒閉(若不想倒閉,那就加入DS-R1開源生態,這就叫“打不過,就加入”);即使是OpenAI,其閉源API的價值,也將重構。
現在,DS-R1的強悍性能、低成本特性和開源模式,讓全球有志於參與GenAI生態的商業組織和個人,能大規模推動生態應用的廣度和深度。
可以說,DS-R1將成爲GenAI生態應用的催化劑,真正讓世界進入GenAI應用時代。只不過這次,全新的GenAI時代的市場推動力,首次有了中國公司的身影。
在既有的認知中,中國公司雖能大幅降低產品成本,但技術卻做不到領先全球,這次深度求索推出的DS-R1,打破了“雖然便宜但技術含量不足”的舊模式,首次取得全新技術時代核心推力俱樂部門票。
中國技術力量在GenAI技術浪潮中,表現靚麗。深度求索,不是一個人在戰鬥。
此前,火遍業界的豆包大模型,也推出迭代版。
據豆包微信公衆號消息,1月22日,豆包大模型1.5Pro版本正式發佈。
這款大模型在知識、代碼、推理和中文等多項公開測評基準上成績領先全球,綜合得分優於GPT-4o、Claude3.5和Sonnet等硅谷一流模型。
英偉達邏輯結束了?
DS-R1的出品公司深度求索,爲創業型公司,並沒有上市。
但在1月27日,參與深度求索天使輪和Pre-A輪融資機構背後的上市公司,開盤即“一字板”漲停。
公開資料顯示,杭州東方嘉富基金參與深度求索天使輪投資。杭州東方嘉富基金隸屬“浙江東方”旗下;而參與深度求索Pre-A輪融資的華金領越基金,背後上市公司是“華金資本”。
這兩個公司,在1月27日A股開盤即告漲停。
但爲深度求索提供基礎算力支持和基礎設施的浪潮信息和中科曙光,以及與深度求索有產品技術合作的像拓爾思,因市場仍在構建邏輯過程中,漲跌就有了分化。
簡單說下浪潮信息和中科曙光與深度求索的合作方向,前者爲深度求索提供AI服務器集羣(英偉達H800),後者承建深度求索杭州訓練中心液冷系統。
與DS-R1概念有關的A股公司,此次卻不是映射,而是直接有實際相關性。
有映射關係的,這次是英偉達產業邏輯。
DS-R1低成本實現強悍性能的本質在於提高了算力利用率,而非從此不需要算力或者對算力的需求減弱。
深度求索(DeepSeek)推出性能如此強悍的DS-R1,會讓業界看到,提升算力效率是現實的,能實現的;在吸收深度求索提升算力效率的思想和方法後,業界會加碼算力規模,以實現更大利益的達成。
因此,DS-R1並沒有敲響英偉達產業邏輯的喪鐘,相反,這實際進一步夯實了“達鏈”在二級市場統治力的基礎。
可以用一個公式概括:
DeepSeek提升算力效率的方法+更大規模的算力=沒有天花板限制的利益
低成本、強性能的DS-R1,會高度促進GenAI應用生態的繁榮速度。
從這個角度上看,海量開發者和應用方(包括B端商業組織和C端個體)的參與,會更進一步提升對算力供應商的需求。
這就像智能手機開源系統安卓加入手機應用生態後,對手機的移動SoC芯片和存儲芯片的性能需求大幅度提升一樣。
在2024年12月,深度求索推出DS-V3時,有評論認爲:DeepSeek-V3將支持私有部署和自主微調,爲下游應用提供遠大於閉源模型時代的發展空間。未來一兩年,大概率將見證更豐富的推理芯片產品、更繁榮的LLM應用生態。
在人類發展史上,無論是哪個技術時代,最終都爲了一個目標,或者說,只有實現這個目標,技術時代纔有真正的推動力。
這個目標,就是利益。
商業價值,就本質而言,只是爲了到達利益彼岸的橋樑。
GenAI技術也不例外。
硅谷在過去的兩年中(以2022年11月30日OpenAI推出ChatGPT-3.5爲時間基準),投入的上千億美元資本開支,也不是爲了實現“利他”理想,而是爲了利益——共贏不是否認利益,而是利益均沾。
從2007年史蒂夫·喬布斯推出初代iPhone至今,當真正催生繁榮的應用生態後,超越想象的巨大利益,才能滾滾而來。
因此,DS-R1,真正的價值,在於讓全球GenAI的參與方,先看到、再學會如何用更低成本提升算力利用效率。
在DS-R1或DS-V3推出之前,原本花上1元錢得到的算力,形成的性能,達成了1.5元的收益,現在只要花0.1元,就能得到與之前投入1元相同的性能,實現相同的收益。
這時,你會怎麼做?
是決定停止投入,還是選擇加大力度?
如何選擇,不言而喻。
因此,英偉達和A股“達鏈”(比如銅纜連接)板塊股價這次大幅下挫,若是巨“坑”,也閃耀着某種稀有金屬的色澤。