你光看見豆包火了,卻沒見豆包背後的大模型有多卷
用“AI一天、人間一年”來形容,2024年AI大模型的進展情況絲毫不爲過。在過去的一年中,一些關於AI的預言陸續得到驗證:在智算大潮之下,英偉達順利進入3萬億市值俱樂部;中國開源勢力崛起,通義大模型DeepSeek硬槓Llama;國內AI視頻生成模型能力飆升,與Sora掰手腕;手機和PC大廠掀起硬件狂歡……
而在一衆大模型廠商中,一直略顯“沉默”的字節跳動,憑藉着一款豆包大模型橫空出世,迅速橫掃國內外一衆選手,一舉拿下了全球第二、中國第一的桂冠,這成績屬實讓衆多友商汗顏。畢竟,無論是起步時間還是儲備過程,字節跳動在押注AI方面,特別是大模型方面都慢了友商好幾拍。然而僅僅一年多時間,豆包就一騎絕塵,將衆多對手甩到了身後,這成績放誰也沒話說。
“後來者”豆包何以後來居上?
在今年11月的AI大模型月活躍排行榜上,豆包App以5998萬MAU的成績,穩居全球第二,僅次於OpenAI的ChatGPT,在國內排名第一。而它的海外版Cici的MAU也有1267萬,排在第22位。而在年初,豆包的月活躍用戶數也才僅有173萬。那麼,作爲“後起之秀”的豆包,到底是怎麼起來的呢?
首先,字節跳動內部迅速統一共識,在資源、人才、機制等方面,給豆包大模型研發提供了全方位的支持。爲了趕上這場AI技術革命,字節跳動迅速調整戰略佈局,採取一系列措施,包括大規模招募AI人才、成立專門的AI部門Flow、整合內部資源、實施賽馬機制等,以加速豆包大模型的研發進程。
在一番“大力出奇跡”的操作之下,到今年3月份,豆包的下載量和月活躍用戶雙雙登頂。到去年11月份這種趨勢繼續得到了延續。儘管ChatGPT仍以超3億月活遙遙領先(APP+web用戶),但豆包的崛起速度仍遠超其競爭對手。國內的Kimi、文小言、通義千問等應用,在用戶規模上也被豆包甩在身後,豆包甚至超過後面三者月活用戶的總和。不難發現,在做豆包這件事上,字節跳動很善於把握時間窗口(善用開源資源),全方位地調動一切有利因素,將新技術迅速轉變爲最終成果。
其次,在具體策略上,全方位貼着對手打,核心突出一個“卷”字。隨着國內百模大戰的展開,圍繞技術與產品的迭代速度,以及商業化效率的比拼已經全面展開。爲了彌補在時間差上的不足,字節內部不惜血本,從各個方面全面開“卷”。其具體體現爲,C端卷用戶,B端卷價格,與對手卷算力。
比如,爲了推動豆包用戶的增長,字節跳動累計在C端投入不下10億元的投流費用。這種高強度的市場投放,讓豆包迅速在社交媒體、搜索引擎和短視頻平臺上,佔據了用戶的注意力,形成了強品牌記憶點。而在B端戰場,豆包更是祭出了價格大殺器。在今年5月火山引擎FORCE原動力大會上,豆包Pro 32k模型正式定價是1千Tokens 0.8釐,豆包Pro 128k模型正式定價爲是1千Tokens5釐錢,一口氣將國產大模型的tokens定價,帶到了“釐”時代。這一番頗有“氣量”的降價,直接打了對手一個措手不及,逼得他們只能輪番跟進。
此外,大模型之爭也是算力之爭。爲了確保勝出,字節跳動僅在AI上的資本開支,就達到了800億元,這個數值接近BAT三家的總和(約1000億元)。而根據字節最新披露的數據顯示,2025年字節跳動的資本開支,還將增加到1600億元,其中900億元用於購置AI算力集羣,700億元用於IDC基建和網絡設備。不難發現,字節跳動的飽和式攻擊,正是其後來居上的核心原因。
贏家通吃模式再現大模型
隨着國內大模型的持續進步,一大批國內大模型公司正在嶄露頭角。整個2024年,國內大模型圈子,不僅誕生了吸金200億的大模型“六小虎”,就連一些融合AI大模型應用的AI硬件公司,都拿到了不少融資,啥都不缺的大廠表現就更好了。據公開數據顯示,截至2024年11月初,百度文心大模型的日均調用量超15億次,相較一年多前增長約30倍;截至2024年12月中旬,豆包通用模型日均tokens使用量超4萬億,較7個月前首發時增長了33倍…
不過,進入2024年下半年,風向突然驟變,曾經風頭無兩的大模型“六小虎”,也面臨嚴峻的現實考驗,不僅融資受阻、商業化也遭遇嚴峻挑戰。與此同時,一批技術先進的公司快速崛起,大廠攻勢日益兇猛,此消彼長的行業規律開始在AI大模型領域重現。
一方面,主流頭部大廠普遍在用戶、場景與算力方面,具備相對應的比較優勢。比如,百度有自己的超級APP和自己的海量搜索資源,還有百度智能雲等雲支持;阿里有支付寶、淘寶、天貓、菜鳥等一衆超級應用,更有阿里雲從旁輔助;同樣的優勢,在騰訊與字節跳動也是不在話下。自帶衆多豪華資源的大廠,在做大模型過程中,更是如魚得水。
反觀很多初創公司,他們的數據資源都還需要從第三方平臺獲取,不僅需要大量的投流費用,還容易被對方拿捏七寸。據移動營銷平臺AppGrowing數據,2024年以來(截止11月15日),Kimi、豆包、星野等國內十款大模型產品,合計投放超625萬條廣告,投放金額達15億元。但對於佔有流量渠道的大公司而言,他們根本就不需要投入如此多的資金,僅憑自己佔據的流量優勢,就可以直接碾壓對手。
以明星AI大模型公司Kimi爲例,年初它曾在抖音、B站等內容APP上刷屏,並獲取大量用戶,但下半年Kimi就被限制在抖音投放,不得不轉戰快手等平臺。據“AI新榜”公衆號統計,截至10月29日,Kimi在過去三個月內的廣告投放總數已經超過2500條。其中,在快手平臺上投放的內容超過2100條,幾乎佔據總投放量的84%。在B端市場的優勢,就更顯著了。大廠憑藉着比初創公司更低的tokens成本,互聯網大廠可以迅速以極低的價格,讓B端用戶“嚐鮮”,這些優勢是那些小的初創公司所無可比擬的。
另一方面,技術先進的公司和大廠基於自身優勢,在商業模式上持續擠壓初創公司的生存空間。比如,賣API是不少AI大模型公司的重要生意模式。相關數據顯示,OpenAI預計2024年將依靠API賺得5億美元,佔總營收的15%。據CNBC報道,Anthropic對API的依賴更大,預計總營收的60%~75%將來自第三方調用API。
然而,在國內提供大模型API,已經變成了模型廠商搶佔市場的方式,並未被寄予豐厚的利潤預期。2024年5月,DeepSeek推出DeepSeek-V2 ,價格直接“殺”到了每百萬輸入Tokens1元,每百萬輸出Tokens2元。隨後豆包迅速跟進,將價格進一步打到了“釐”時代。面對價格戰,阿里通義千問直接將價格下調了97%,百度直接宣佈兩款模型免費。
這樣的“降價”幅度,直接將一衆初創大模型公司逼到了牆角。比如百川智能創始人王小川,就表示不會跟進價格戰;零一萬物創始人李開復表示,“如果技術不行、單純降價賠錢去做生意,不會有贏家。”而在大B的私有化部署方面,初創公司也不佔優,目前中標的公司除了電信三巨頭,就是百度、騰訊、華爲、訊飛等國企和巨頭,初創公司只有智譜AI的少量中標單。
不難發現,無論是在具體的技術較量還是商業化比拼方面,擁有較強技術實力或者資源的大廠,都已經在全面擠壓初創公司的生存空間。照此發展下去,贏家通吃模式或將在該領域重新上演。
大模型洗牌進入加速期
正如其他新技術演變的趨勢一樣,大模型的上半場都是在拼命“造錘子”,即使因此造成了行業資源的浪費也再所不惜。但隨着各類大模型的出現,整個市場正在快速蛻變,圍繞商業化與先進技術的推廣逐步提速,推動整個市場加速市場出清。
其一,技術研發開支的增大、融資的不順,迫使各路廠商加快大模型商業化的進程。從初創公司來說,由於市場競爭格局的變化,此前在融資上一路綠燈的初創大模型公司,在年中便開始“遇冰”,輸血的不足加速了初創公司的商業化進程。而在大公司方面,動輒幾十上百億的算力以及網絡設施投入,雖說並不會影響其基本盤,但畢竟也是筆不小的開支。
當然,從大模型技術本身的情況來說,隨着大模型推理成本的急速降低,以及輕量級大模型和MOE(混合專家模型)的日益流行,不少大模型已經實現了更低成本、更好效果的能力。
反應到落地一線,以往動輒千萬元級別的單子少了,更多項目下探至兩三百萬元,一些單一場景的大模型應用成本甚至只需數十萬元,這是嚐鮮客戶能接受的價格段。有人預計,到2025年隨着大模型推理成本的進一步下降,大模型的落地速度會進一步加快。
反映到具體的數據上,則體現爲大模型項目數量的快速暴增。根據雲頭條的信息,今年前11個月,大模型中標項目達到728個,是2023 年全年的3.6倍。與此同時,商業化也從粗放的面向全行業,向單一行業深度發掘;服務方式從買單走量,向“應用效果”、陪伴式服務轉變。
其二,基於大模型進化的需要,沒有實質性幫助的大模型將淪爲可有可無的“花瓶”,喪失進化迭代能力,逐漸被用戶所拋棄。經過2024一年的激戰,在基礎大模型層面,國內外的大模型公司已經基本定型。比如美國如今只剩下了OpenAI、Anthropic、Meta、谷歌以及xAI,在中國基礎大模型,則收斂到百度、阿里、智譜、字節、訊飛、騰訊等企業。
基本上,經過一年激戰,基於基礎大模型的套利空間已經消失,未來想要勝出就得靠做出有影響力的AI應用。從行業來看,雖然之前業內也出現了類似AI繪畫、AI作詩、AI書法等應用,但其應用場景相對狹窄,一旦用戶新鮮感消失就會卸載APP,應用很快淪爲“可有可無”的花瓶,喪失迭代能力。
另外,在商業能力方面,也存在預訓練成本高、國外訂閱模式走不通等全新的挑戰。考慮到大廠與初創公司的實際狀況,要應對這樣的外部挑戰,顯然難度係數是完全不同的。如果初創公司犯了戰略錯誤,很可能會因此被淘汰出局。可以預見,在經過了初步的“百模大戰”之後,國內大模型或將迎來新的大洗牌。