大模型“六小虎”的生存懸念

歲末年初,大模型“六小虎”暗自較勁起來。

最先出牌的是智譜AI和階躍星辰,先後宣佈拿到了“過冬錢”,前者完成新一輪30億元人民幣融資,後者則完成B輪數億美元融資。緊接着百川發佈增強大模型Baichuan4-Finance、Minimax的海螺AI上線主體參考新功能……

1月6日晚,一則阿里雲正在洽談零一萬物預訓練團隊的消息,讓零一萬物陷入可能被收購的輿論旋渦,“逼”得創始人李開復立馬發朋友圈澄清。與此同時,關於大模型“六小虎”的生存問題再度被拉出來討論。

在“六小虎”中,智譜AI的To B定位依然明確,根據智能超參數統計,2024年智譜AI中標項目數爲32個,在通用大模型廠商中排名第三,遠超於其他“五虎”。但值得注意的是,智譜AI的中標項目主要集中在上半年,下半年開始數量明顯減少。

階躍星辰則一直延續低調風格,據統計過去一年發佈超10個自研基座模型。此前業內有消息稱兩家大模型公司將會放棄預訓練,階躍星辰和智譜AI兩家則明確會繼續投入基座大模型研發,因此業內也流傳着“南階躍、北智譜”的說法。

聯創或高管的出走則加劇了業內對創業公司的生存擔憂,12月上旬百川智能聯創、商業化負責人洪濤已確認離職。往前追溯,零一萬物聯創黃文灝和李先剛雙雙離職、MiniMax“星野”產品負責人張千川離職、月之暗面幾位出海產品負責人也被爆離職。

C端產品相對出圈的月之暗面和MiniMax還面臨着來自明星創投機構或大廠的訴訟,前者則是被循環智能時期投資人在香港提起仲裁,稱已委託律師處理,後者則是被愛奇藝指控在AI模型訓練及內容生成流程中涉嫌侵犯其版權。

在智源研究院行業研究組負責人倪賢豪看來,“相較於互聯網時代不一樣,現在的AI時代,大廠不容易傾覆,大廠會繼續留下來,但創業公司在這個階段就必須想好,我做的公司最後是怎麼退出的,如果想做成巨頭,一開始就做最難的。”

昂貴的投入、務實的選擇

大模型預訓練燒錢是公認的事實,李開復曾透露,一次預訓練成本約三四百萬美元,即便是成本更低的Yi-Lightning,在訓練時也用了2000張GPU,耗時一個半月,花費三百多萬美元。

早在2023年8月硅谷明星AI企業Character.AI,宣佈放棄預訓練,轉向與第三方模型合作。他們在官方博客中寫道:這使我們能夠投入更多資源進行後訓練,併爲不斷增長的用戶羣體創造新的產品體驗。

再到2024年10月,據《智能涌現》報道被稱爲“AI六小虎”的6家中國大模型獨角獸中,已經有兩家逐步放棄預訓練模型,縮減了預訓練算法團隊人數,業務重心轉向AI應用。當時業內的猜測指向了零一萬物和百川智能,但很快這兩家公司都向媒體進行了闢謠。

直到2025年1月6日,零一萬物被曝要將團隊整體打包賣給阿里。儘管李開復連夜在朋友圈闢謠否認出售。但是,這家公司退出基礎大模型的競爭已經成爲事實。

次日,在接受媒體採訪時,李開復迴應了零一萬物的變動:主要聚焦在預訓練團隊及Infra團隊,其中大部分預訓練算法團隊加入通義團隊,Infra團隊加入阿里雲,成爲阿里員工。這之後零一萬物將不再追求訓練超級大模型,但會繼續訓練參數適中的更快、更便宜的模型,基於後者打造可以賺錢的應用。

假設Scaling Law一直有效的情況下,加拿大工程院外籍院士、智象未來創始人兼CEO梅濤對5年後大模型研發資源進行了預判:模型計算量增加10000倍、算力規模增加10000倍、預訓練費用增加250倍、數據增加1000倍、能源需求增加200倍。

倪賢豪分析道創業公司如果必須做大,理論上Scaling Law效果是最好的,海外很多廠商還在10萬卡集羣上做預訓練,但是對於創業公司來說搭建一個10萬卡集羣需要耗費幾百億元,幾乎不可能。“誰家有10萬卡集羣?或許只有大廠有。”

因而將預訓練團隊和Infra團隊“打包”給阿里,有業內人士給出了另外一個角度的評估:務實的選擇。在這之後,也有消息傳出月之暗面也正在尋求與阿里的合作,截至發稿月之暗面未迴應此消息。

激烈的競爭、生存的懸念

行業普遍不太相信“六小虎”最後都能作爲獨立“大模型公司”生存下來的。“六小虎”中幾位創始人也在公開場合表達過類似的觀點,比如MiniMax創始人閆俊傑認爲未來全球只會剩下5家大模型企業,百川智能創始人王小川則稱百模大戰第一梯隊最後可能不超過5家,其中有3家大廠。

經過2年的探索,“六小虎”的路線已經相對明晰:百川智能轉型醫療這一垂直領域;階躍星辰的“超級模型+超級應用”戰略;月之暗面和MiniMax專注To C;智譜AI和階躍星辰相似,在B端和C端均有佈局,並在去年12月通過AutoGL亮明瞭與終端廠商的合作定位。

在進入2025年不到一個月時間裡,智譜AI、MiniMax、階躍星辰都在接二連三地發佈自家的新產品或者新功能,另外智譜AI和階躍星辰還公佈了最新一輪的融資。但有意思的是,這兩家融資消息的公佈都有諸多隱藏信息,比如智譜AI沒有公開具體的參投方,階躍星辰則未公開具體的融資金額和估值。

“美元基金退出後,能拿到的錢基本大家都拿了個遍,2025年能看到的融資消息會更少。這幾家創業公司賬上的錢應該還能撐個1-3年,但要活得更久要有持續造血的能力。”一位投了近10家AI創業公司的投資人表示。

在李開復闢謠被阿里收購的朋友圈裡,其也表示2025年是中國大模型考驗年,應用爆發年,商業化淘汰年。然而在這場競爭中,不只是“六小虎”的競爭,而是所有大模型公司的battle,尤其是大廠,2024年最具代表性的就是字節跳動。

崑崙萬維創始人周亞輝今年11月28日在朋友圈點評道:“年初說字節23年的AI戰略不及格,但這完全不影響字節24年AI戰略的滿分表現。”他提到兩點,第一點是快速把上萬人的組織黃金比例分割整合成AI大軍,第二點是字節大模型API一定會猛猛幹。

在人才上字節毫不掩飾的大手筆招兵買馬,不少創業公司的高管和聯創加入了字節。2024年8月底,據接近字節跳動的知情人士稱,原零一萬物聯創黃文灝確已加入字節,負責技術項目管理和規劃,彙報給朱文佳。另外也有消息稱面壁智能核心成員秦禹嘉已加入字節大模型團隊。

大模型的價格戰始於2024年5月,率先開啓的是幻方量化旗下的DeepSeek,其發佈了DeepSeek-V2,號稱能力對標GPT-4,價格卻僅爲GPT-4的近1%,低廉的價格讓DeepSeek被譽爲“大模型界拼多多”。而後智譜AI調整了其入門級大模型GLM-3 Turbo模型調用價格。

緊接着字節跟上了節奏,火山引擎總裁譚待當場宣佈“大模型從此以釐計價”,阿里通義千問、百度文心一言、騰訊混元、科大訊飛星火降價的降價、免費的免費。對創業公司來說,可謂是夾擊。

在C端產品上,大廠的投放也相對“激進”。前段時間,一張體現國產AI產品廣告投放金額的圖片在圈內廣泛流傳——去年Q3豆包投放2億、夸克投放1.9億、Kimi投放1.5億。雖然這一數字沒有得到最終證實,但是圈內普遍認爲豆包、夸克的投放優勢更明顯,一是背靠集團有渠道優勢,二是有資金優勢。

在招投標市場,根據智能超參數2024年TOP 6通用大模型廠商中標排行榜顯示,“六小虎”僅一家上班,即智譜AI。

朱嘯虎此前在接受媒體採訪時指出“六小虎”最好的結果是賣給大廠。但在併購這件事上,創業公司很難證明自己有一種能力是大廠完全不能有的,“尤其技術人才,沒有人會認爲自己比別人不行。”

“大廠+小虎”的合作模式下,零一萬物選擇了一條更小而美的道路,消息釋放出來後,網絡上充斥着各種“笑話”的聲音,也有一些不同的聲音存在,其中有一個網友:不必冷嘲熱諷,能及時退出的未必是壞事。

2025年,商業化速度的加快伴隨着競爭的加劇,“六小虎”的生存仍是一個懸念。

綜合自大模型廠商、界面新聞、晚點LatePost等