大模型不需要眼前的共識
確定性的機會指向的往往是需求場景,需要實幹家,不斷優化體驗;而不確定的機會往往依託於技術創新,需要冒險家,探索出一條通向應用的路徑。這也是爲什麼人們不會驚訝於雷軍下場造車的決心,卻很難完全相信楊植麟在月之暗面創業過程中表現出來的技術理想主義。
在大模型領域,並沒有形成像新能源車一樣的市場共識。企業在確定性和不確定性之間進行的權衡,是引發行業分歧的主要原因。選擇確定性還是擁抱不確定性,決定了企業是優先賺到錢,還是優先做好技術;是堅持做閉源大模型,還是賭開源大模型一定會迎頭趕上;是要依靠通用模型催生引爆行業的超級應用,還是要通過小模型先佔領細分市場。
當前的環境下,企業和投資人都會從更現實的角度去做考量,活下去、掙到錢,比一個不確定的理想願景更能說服人。但人們對大模型的期待是給行業帶來更徹底地改變。從長遠來看,現在很多企業的大模型應用,還是在對原有工具進行小修小補,很難產生引爆技術的應用,也很難抵禦未來大模型技術迭代帶來的洗牌。
氾濫的「智能體」是最明顯的一個例子。國產大模型的落地催生出各種被冠以智能體名號的聊天機器人和「XX助手」。百度文心一言中充斥着大量伏地魔、繁花-爺叔這樣的模擬對話機器人;kimi+上也出現了公文筆桿子、i人嘴替等個人助理;字節豆包在抖音上的推廣也都依靠批改作業、練習英語口語等簡單的功能點來吸引用戶。
很難想象這樣的聊天機器人能有多強大的生命力。如果我們對於大模型的期待僅停留在追求確定性的階段——利用其提升智能客服的對話體驗,提高資料蒐集整理的效率以及擴充某些圖像或生成某些代碼,那麼大模型能夠產生的實際價值或將遠不及我們現在的預期。
大模型殺手級應用的出現一定是要革掉某個現有體驗的命。現在來看,沒有共識就是最好的消息,至少說明這個市場上,不是所有人都只滿足於眼前的利益,還有人在沿着另一條邏輯路線前行,在不確定中尋找更大的可能,去打一場持久戰。
大模型的兩種邏輯
中局和終局是大模型領域目前比較有代表性的兩種發展邏輯。
中局的邏輯以朱嘯虎(金沙江創投主管合夥人)爲代表,包括一部分聚焦應用層的創業者在內,致力於利用開源大模型快速構建服務於細分需求的小模型,然後通過數據積累和模型迭代,建立競爭門檻;終局的邏輯以月之暗面爲代表,傾向繼續投入於大模型能力的提升,等待技術迭代引爆超級應用。
在中局的邏輯裡,大模型的理解、決策能力被融合到既有的場景中,讓這些場景能夠應用大模型的生成能力,提升解決方案的性能,從而產生新的商業化可能性。這種邏輯受到青睞的原因是,有確定性需求,可以迅速見到成效,用戶付費意願更強。
在朱嘯虎的介紹中,一家利用開源大模型做AI視頻面試的企業2023年的收入比2022年翻了一倍;利用開源大模型做AIGC視頻廣告的公司2023年收入做到了5000多萬元,比2022年漲了四五倍。
朱嘯虎追求的機會是,利用LLaMA這種快速提升的開源大模型,結合垂直場景的數據積累和人工微調,在幾個月內提升某一垂直場景的效率,在大模型發展過程中先賺到第一桶金。
朱嘯虎對大模型的發展持悲觀預期,對應用場景的開發保持樂觀,主張從實際出發,把能賺的錢先賺到。
月之暗面的創始人楊植麟的理念則更具技術理想主義色彩,他相信大模型會逐步完成對世界的建模,並在這個過程中自然涌現出殺手級應用。
楊植麟的終局邏輯下,大模型是一種解釋世界的工具,就像人會用語言描述世界、理解世界一樣,大模型用數學爲語言建模,讓AI也能夠理解世界,描述世界。AI依靠這種學習能力,逐步實現像人一樣使用工具,讓AGI成爲幫助人鏈接和管理細分場景的「助理」。
AI能夠使用工具,也就意味着很多場景的運作方式將會迎來巨大改變。可能企業未來並不需要有一個專門的視頻面試工具,也不需要有獨立的AI客服,而是統合到一個大模型主導的企業級智能體中,依靠智能體打通和掌控企業的不同環節。
在即將被OpenAI帶火的AI搜索中,真正的難點不是搜索結果到底要以網頁列表的形式顯示,還是以經過AI整合的一段話來顯示,而是如何利用AI的理解能力,把被APP分解的信息重新鏈接成爲一個整體。在Kimi+中,可以看到什麼值得買、小紅書的相關內容可以藉助個人助理「什麼值得買」和「美好生活指南」來進行喚醒。
但隨着楊植麟2個月套現4000萬美元的消息傳出,市場對他的這種終局邏輯產生了質疑。月之暗面直接面向C端用戶的思路,獲客成本高且營收前景低。在沒有新的變化出現前,月之暗面商業化前景的不明朗被認爲是楊植麟信心不足,急於套現的原因。
聊天機器人發揚不了大模型
從目前來看,國內的大模型應用給到嚐鮮者的總體感覺還處於大而無當階段,提出問題之後獲得的答案很難讓人滿意。這一方面受限於大模型自身的技術能力不足,另一方面則受限於用戶對大模型應用使用經驗的不足。
很多大模型應用推出之初,都僅有一個對話框,用戶可以在對話框中提出任何問題並獲得答案。而利用精準的Prompt充分開發大模型的現有能力,成爲大部分用戶難以在短時間內逾越的門檻。
目前充斥在文心一言、豆包等大模型應用中的智能體,很多都是爲了降低大模型的使用門檻而打包的Prompt,也就是將一些用戶的使用經驗沉澱爲可以被分享的智能體,讓用戶可以按照需求找到不同的智能體,獲得更具針對性、更有效的回答。
Prompt門檻的出現本質上還是大模型在語言理解能力上存在欠缺。用戶即便利用現成的Prompt獲得了有效信息,也依然要面對不成熟的體驗。Prompt或者所謂的智能體,可以解決初次溝通的效率問題,但解決不了複雜對話的效果問題,大模型應用往往都不止一輪對話。
這也是爲什麼智能體面向B端的商業化運作依然停留在客服、營銷領域,並沒有能推進到其他生產生活領域中。因爲客服、營銷領域在大模型應用之前就已經實現了基礎的智能對話體驗,大模型的理解能力可以讓互動變得更加靈活、自然。
從李彥宏(百度創始人)演講中提到的案例可以看到,百度在企業智能體方面的實踐是提供了一套結合大模型的無代碼客服機器人生成工具。企業可以上傳私域知識,自動形成對話語料,也可以過濾不在自己經營範圍內的內容,還能關聯第三方的工具。
被包裝爲智能體的客服機器人,會服務於百度的搜索生態。當用戶在百度APP搜索「什麼時候去新加坡人最少」時,會在最前面顯示新加坡旅遊局AI分身給到的答案,點擊可以進行更多對話。這種智能體本質上和之前的百家號、小程序一樣,是百度爲售賣搜索營銷、雲服務等產品的新切入點。
但無論是to B的客服機器人,還是to C的各種Prompt,都不具備獨特性,很難成爲大模型的引爆應用。現在呈現在用戶面前的智能體、大模型應用,都還是隻停留在優化工具的階段,只不過是讓搜索變得智能了一點。就像王小川(百川智能創始人兼首席執行官)所說,是在聚焦於搜索如何使用大模型,而不是大模型如何學會用好搜索。
理想狀態下,智能體應該能夠調用工具,完成更爲複雜的任務,而不僅僅是聊天。這裡需要提到,無論Rabbit R1是否只是一個安卓App的套殼產品,但其結合大語言模型和所謂大動作模型對APP使用體驗的創造性升級,似乎更接近於一個智能體理想中的狀態——通過不斷學習理解人的複雜意圖,模仿人的動作執行復雜操作。
我會比較贊同楊植麟所說的,技術是這個時代唯一新變量。無論是在to B還是to C場景中,在其他變量都沒有變的情況下,技術對語言的理解越來越精準,對人類意圖、行爲的理解越來越精準,其能夠處理的任務就會越來越複雜,智能體的能力纔會越來越強大。
Kimi的走紅,已經證明大模型應用具備了被引爆的市場基礎。Kimi於2023年10月上線,2024年2月日活訪問量已經在國內排到前三,在3月將無損上下文長度從最初的20多萬字增加到200萬字後,Kimi關注度繼續走高,連續五次擴容,訪問量環比增長321.58%。
沒有共識就是最好的共識
當下還未解決的是,何時會出現一款讓大衆用戶保持高頻使用的超級應用。就大模型的應用現狀來看,國內和國外都還處於工具優化階段,只是取決於大模型不同的性能,效果上會有所不同。比如,Adobe對AI的最新應用仍聚焦於AI圖像編輯功能的創新和改進,文生圖功能的推出,以及視頻內容的換頭、延長和輔助鏡頭的生成。
面向未來,讓大模型學會使用工具,而不依賴人工微調,是技術發展的又一個節點。扎克伯格說,「對於Llama-3,當我們開始進入更多這些類似於智能體的行爲時,我認爲其中一些將是更多手工設計的。我們對Llama-4的目標將是將更多這樣的東西納入模型。」
最終能力的大幅提升,依然有賴於大模型本身的進步。但是,大模型的每一次進步,都需要耗費一筆相當龐大的資金。根據THE DECODER披露,GPT-4一次訓練成本爲6300萬美元。而根據AI Index的估算,OpenAI的GPT-4估計使用了價值7800萬美元的計算資源進行訓練,谷歌的Gemini Ultra 的計算成本則高達1.91億美元。
高昂的訓練成本也是國內在大模型方面沒有形成共識的原因之一。國內大模型的融資額度要低於國外。月之暗面在2月獲得了10億美元A輪投資,Minimax3月被傳獲得6億美元戰略投資。相較於亞馬遜向Anthropic追加的27.5億美元投資,都不算多。而且國內的環境並不利於大模型的進一步融資。
對大模型技術未來發展的差異化預期是另外一個原因。一部分開源大模型的支持者會認爲,開源大模型與閉源大模型的發展會受到大模型技術發展坡度的影響,坡度越陡,閉源的優勢越大,一旦坡度變緩,開源會很快追趕上來。
等待開源大模型追趕上來的人,都預期大模型技術發展的坡度會在短時間內變緩。這樣閉源大模型與開源大模型的差距就會相對縮小。而提前深耕場景,積累了一定數據的企業則能夠利用開源大模型構築不低於閉源大模型企業的場景壁壘。
對於小企業而言,以應用場景爲目標訓練小技能,然後不斷根據技術進步重新「練號」,可以在這個大技術趨勢下不斷抓到小風口,甚至在大風口到來時,以插件的形式參與其中。對於巨頭企業來說,其優勢是多場景的融合,是對核心入口的爭搶,「重開新號」的代價太高,技術的迭代往往意味着一場淘汰賽的開啓。
基於融資能力的不同、對技術應用前景預期的不同、自身體量的不同,企業之間的共識並沒有形成。
這是一個好消息,說明大模型領域還遠未像新能源車一樣進入到市場成熟階段。雖然不確定性會增加失敗的風險,但其中也蘊藏着的機會也更大,足以說服一部分企業冒險前行,追求技術的高峰。
可以理解中局的無奈,卻不應放棄對終局的堅持。