☰

大模型“六小虎”的生存懸念

歲末年初，大模型“六小虎”暗自較勁起來。

最先出牌的是智譜AI和階躍星辰，先後宣佈拿到了“過冬錢”，前者完成新一輪30億元人民幣融資，後者則完成B輪數億美元融資。緊接着百川發佈增強大模型Baichuan4-Finance、Minimax的海螺AI上線主體參考新功能……

1月6日晚，一則阿里雲正在洽談零一萬物預訓練團隊的消息，讓零一萬物陷入可能被收購的輿論旋渦，“逼”得創始人李開復立馬發朋友圈澄清。與此同時，關於大模型“六小虎”的生存問題再度被拉出來討論。

在“六小虎”中，智譜AI的To B定位依然明確，根據智能超參數統計，2024年智譜AI中標項目數爲32個，在通用大模型廠商中排名第三，遠超於其他“五虎”。但值得注意的是，智譜AI的中標項目主要集中在上半年，下半年開始數量明顯減少。

階躍星辰則一直延續低調風格，據統計過去一年發佈超10個自研基座模型。此前業內有消息稱兩家大模型公司將會放棄預訓練，階躍星辰和智譜AI兩家則明確會繼續投入基座大模型研發，因此業內也流傳着“南階躍、北智譜”的說法。

聯創或高管的出走則加劇了業內對創業公司的生存擔憂，12月上旬百川智能聯創、商業化負責人洪濤已確認離職。往前追溯，零一萬物聯創黃文灝和李先剛雙雙離職、MiniMax“星野”產品負責人張千川離職、月之暗面幾位出海產品負責人也被爆離職。

C端產品相對出圈的月之暗面和MiniMax還面臨着來自明星創投機構或大廠的訴訟，前者則是被循環智能時期投資人在香港提起仲裁，稱已委託律師處理，後者則是被愛奇藝指控在AI模型訓練及內容生成流程中涉嫌侵犯其版權。

在智源研究院行業研究組負責人倪賢豪看來，“相較於互聯網時代不一樣，現在的AI時代，大廠不容易傾覆，大廠會繼續留下來，但創業公司在這個階段就必須想好，我做的公司最後是怎麼退出的，如果想做成巨頭，一開始就做最難的。”

昂貴的投入、務實的選擇

大模型預訓練燒錢是公認的事實，李開復曾透露，一次預訓練成本約三四百萬美元，即便是成本更低的Yi-Lightning，在訓練時也用了2000張GPU，耗時一個半月，花費三百多萬美元。

早在2023年8月硅谷明星AI企業Character.AI，宣佈放棄預訓練，轉向與第三方模型合作。他們在官方博客中寫道：這使我們能夠投入更多資源進行後訓練，併爲不斷增長的用戶羣體創造新的產品體驗。

再到2024年10月，據《智能涌現》報道被稱爲“AI六小虎”的6家中國大模型獨角獸中，已經有兩家逐步放棄預訓練模型，縮減了預訓練算法團隊人數，業務重心轉向AI應用。當時業內的猜測指向了零一萬物和百川智能，但很快這兩家公司都向媒體進行了闢謠。

直到2025年1月6日，零一萬物被曝要將團隊整體打包賣給阿里。儘管李開復連夜在朋友圈闢謠否認出售。但是，這家公司退出基礎大模型的競爭已經成爲事實。

次日，在接受媒體採訪時，李開復迴應了零一萬物的變動：主要聚焦在預訓練團隊及Infra團隊，其中大部分預訓練算法團隊加入通義團隊，Infra團隊加入阿里雲，成爲阿里員工。這之後零一萬物將不再追求訓練超級大模型，但會繼續訓練參數適中的更快、更便宜的模型，基於後者打造可以賺錢的應用。

假設Scaling Law一直有效的情況下，加拿大工程院外籍院士、智象未來創始人兼CEO梅濤對5年後大模型研發資源進行了預判：模型計算量增加10000倍、算力規模增加10000倍、預訓練費用增加250倍、數據增加1000倍、能源需求增加200倍。

倪賢豪分析道創業公司如果必須做大，理論上Scaling Law效果是最好的，海外很多廠商還在10萬卡集羣上做預訓練，但是對於創業公司來說搭建一個10萬卡集羣需要耗費幾百億元，幾乎不可能。“誰家有10萬卡集羣？或許只有大廠有。”

因而將預訓練團隊和Infra團隊“打包”給阿里，有業內人士給出了另外一個角度的評估：務實的選擇。在這之後，也有消息傳出月之暗面也正在尋求與阿里的合作，截至發稿月之暗面未迴應此消息。

激烈的競爭、生存的懸念

行業普遍不太相信“六小虎”最後都能作爲獨立“大模型公司”生存下來的。“六小虎”中幾位創始人也在公開場合表達過類似的觀點，比如MiniMax創始人閆俊傑認爲未來全球只會剩下5家大模型企業，百川智能創始人王小川則稱百模大戰第一梯隊最後可能不超過5家，其中有3家大廠。

經過2年的探索，“六小虎”的路線已經相對明晰：百川智能轉型醫療這一垂直領域；階躍星辰的“超級模型+超級應用”戰略；月之暗面和MiniMax專注To C；智譜AI和階躍星辰相似，在B端和C端均有佈局，並在去年12月通過AutoGL亮明瞭與終端廠商的合作定位。

在進入2025年不到一個月時間裡，智譜AI、MiniMax、階躍星辰都在接二連三地發佈自家的新產品或者新功能，另外智譜AI和階躍星辰還公佈了最新一輪的融資。但有意思的是，這兩家融資消息的公佈都有諸多隱藏信息，比如智譜AI沒有公開具體的參投方，階躍星辰則未公開具體的融資金額和估值。

“美元基金退出後，能拿到的錢基本大家都拿了個遍，2025年能看到的融資消息會更少。這幾家創業公司賬上的錢應該還能撐個1-3年，但要活得更久要有持續造血的能力。”一位投了近10家AI創業公司的投資人表示。

在李開復闢謠被阿里收購的朋友圈裡，其也表示2025年是中國大模型考驗年，應用爆發年，商業化淘汰年。然而在這場競爭中，不只是“六小虎”的競爭，而是所有大模型公司的battle，尤其是大廠，2024年最具代表性的就是字節跳動。

崑崙萬維創始人周亞輝今年11月28日在朋友圈點評道：“年初說字節23年的AI戰略不及格，但這完全不影響字節24年AI戰略的滿分表現。”他提到兩點，第一點是快速把上萬人的組織黃金比例分割整合成AI大軍，第二點是字節大模型API一定會猛猛幹。

在人才上字節毫不掩飾的大手筆招兵買馬，不少創業公司的高管和聯創加入了字節。2024年8月底，據接近字節跳動的知情人士稱，原零一萬物聯創黃文灝確已加入字節，負責技術項目管理和規劃，彙報給朱文佳。另外也有消息稱面壁智能核心成員秦禹嘉已加入字節大模型團隊。

大模型的價格戰始於2024年5月，率先開啓的是幻方量化旗下的DeepSeek，其發佈了DeepSeek-V2，號稱能力對標GPT-4，價格卻僅爲GPT-4的近1%，低廉的價格讓DeepSeek被譽爲“大模型界拼多多”。而後智譜AI調整了其入門級大模型GLM-3 Turbo模型調用價格。

緊接着字節跟上了節奏，火山引擎總裁譚待當場宣佈“大模型從此以釐計價”，阿里通義千問、百度文心一言、騰訊混元、科大訊飛星火降價的降價、免費的免費。對創業公司來說，可謂是夾擊。

在C端產品上，大廠的投放也相對“激進”。前段時間，一張體現國產AI產品廣告投放金額的圖片在圈內廣泛流傳——去年Q3豆包投放2億、夸克投放1.9億、Kimi投放1.5億。雖然這一數字沒有得到最終證實，但是圈內普遍認爲豆包、夸克的投放優勢更明顯，一是背靠集團有渠道優勢，二是有資金優勢。

在招投標市場，根據智能超參數2024年TOP 6通用大模型廠商中標排行榜顯示，“六小虎”僅一家上班，即智譜AI。

朱嘯虎此前在接受媒體採訪時指出“六小虎”最好的結果是賣給大廠。但在併購這件事上，創業公司很難證明自己有一種能力是大廠完全不能有的，“尤其技術人才，沒有人會認爲自己比別人不行。”

“大廠+小虎”的合作模式下，零一萬物選擇了一條更小而美的道路，消息釋放出來後，網絡上充斥着各種“笑話”的聲音，也有一些不同的聲音存在，其中有一個網友：不必冷嘲熱諷，能及時退出的未必是壞事。

2025年，商業化速度的加快伴隨着競爭的加劇，“六小虎”的生存仍是一個懸念。

綜合自大模型廠商、界面新聞、晚點LatePost等

大模型“六小虎”的生存懸念

相關資訊