大模型重構百度

新的時代已然開啓。

文丨海克財經 齊介侖

在ChatGPT掀起大模型熱潮後,國內各大科技廠商已爭先恐後步入這一領域。

入場的新玩家日益增多:快手於近日開始內測自研大模型快意,字節也在相近時間上線大模型獨立APP、AI對話產品豆包。

老玩家則紛紛高效迭代,引人注目的有華爲7月發佈的盤古大模型3.0、百度6月推出的文心大模型3.5等。

當下之勢說是“百模大戰”毫不誇張。科技部直屬科研機構中國科學技術信息研究所發佈的《中國人工智能大模型地圖研究報告》顯示,截至2023年5月28日,國內10億級參數規模以上的大模型已經發布了79個,數量位列全球第二,僅次於美國。據公開數據,2023年8月,國內發佈的大模型已超過100款。

在AI領域有着衆所周知深厚積累的百度走在了大模型行業的前列。百度於2019年3月發佈了文心大模型1.0,2023年3月發佈了對標ChatGPT的產品文心一言,2023年6月文心大模型已進展到3.5版本。調研機構IDC發佈的《AI大模型技術能力評估報告2023》顯示,文心大模型3.5在算法、生態、服務能力等12項指標中獲得7項滿分,綜合評分、算法模型、行業覆蓋均爲第一。

發展技術的同時,百度亦在探索大模型的應用場景。2023年8月,文心一言已上線基於文檔交互的覽卷文檔、基於圖片交互的說圖解畫、文字轉視頻的一鏡流影等5個插件,且支持一次同時使用3個插件。這意味着文心一言功能性和場景自由度再次延展。

百度最新發布的財報能夠說明這種成績。財報顯示,2023年第二季度,百度集團營收341億元,同比增長15%;百度核心收入264億元,同比增長14%;歸屬百度的淨利潤(non-GAAP)80億元,同比增長44%,超市場預期。

正在重構百度生態的大模型已成爲百度可持續性和高成長性的根基。無論是從技術本身還是基於技術的業務來看,百度都已來到嶄新階段。

大模型的市場空間有目共睹。

調研機構艾媒諮詢《2023年中國AIGC行業發展研究報告》提到,2020年中國人工智能核心產業規模已達1500億元,預計2025年將達4000億元,中國有望發展爲全球最大的AI市場;2022年後,AIGC(生成式人工智能)高速發展。

AIGC的發展不止在於產業本身,更在於能革新現有生產方式。高盛2023年7月5日發佈的一份研報指出,AIGC的變革潛力已經開始起效,在某些情況下AIGC可以使開發人員的工作效率提升15%-20%。

百度較早投入大模型亦着眼於此。在2019年3月推出1.0版本後,文心大模型歷經4年研發迭代,實現了基礎模型升級、精調技術創新、知識點增強、邏輯推理增強等成果。在文心大模型3.5訓練中,百度採用了飛槳最先進的自適應混合並行訓練技術及混合精度計算策略,採用多種策略優化數據源及數據分佈,極大加快了模型的迭代速度。

如今的文心大模型已建起了從基礎大模型到任務大模型、行業大模型的完整體系。基礎大模型包括NLP(自然語言處理)大模型、CV(計算機視覺)大模型、跨模態大模型;任務大模型包含對話、搜索、信息抽取、生物計算等多個典型任務;行業大模型則與各個行業中的頭部企業、機構聯合研發。

以文心大模型的基礎模型能力,疊加對海量行業數據的挖掘和行業實際業務積累的樣本數據、特有知識,百度才能夠提升大模型對行業應用的適配性。目前百度已聯合行業客戶發佈了涵蓋電力、燃氣、金融、航天、傳媒、城市等領域的11個行業大模型。

文心一言也交出了漂亮的成績單。2023年8月,新華社研究院中國企業發展研究中心發佈了《人工智能大模型體驗報告2.0》,在包括語言能力在內的基礎能力部分,文心一言表現最爲搶眼;以綜合指數計,文心一言更是少有的超過1000分的主流大模型。

將大模型注入全盤商業佈局的不止百度。例如阿里將通義大模型應用到了軟硬件系列產品和教育、智慧醫療、智慧城市等多個領域,華爲的盤古大模型則已與鴻蒙生態密切結合。

相較之下,打磨時間更長的百度,佈局更爲全面。方正證券2023年6月30日發佈的一份研報指出,百度已經實現了從底層芯片崑崙芯到深度學習框架飛槳,再到文心大模型以及搜索、自動駕駛、小度智能家居等應用4個層面的全產業鏈佈局。

從往年財報看,百度2017-2021年研發投入從129億元上升至221億元,2022年爲214億元,6年研發投入已達1100億元;而當下,2023年第一季度,百度研發投入爲54億元,第二季度爲64億元。馬拉松式的真金白銀研發投入使百度在芯片層、框架層、模型層、應用層搭建起了全棧式AI架構,這也是百度在大模型機會中保持領先地位的重要原因。

大模型的訓練底層依託GPU算力資源、高性能的存儲與網絡,其發展與雲計算息息相關。

在雲計算概念IaaS(基礎設施即服務)、PaaS(平臺即服務)、SaaS(軟件即服務)後,大模型又帶來了新概念MaaS(模型即服務)——不同行業、企業由於業務、技術、流程、行業規則等方面的差異,對大模型的需求有所區別,模型本身就可以作爲服務提供給客戶。

大模型平臺的誕生即是MaaS的體現之一。2023年3月,在文心一言正式發佈後不久,百度智能雲就推出了一站式企業級大模型平臺文心千帆大模型平臺。據海克財經瞭解,文心千帆是全球首個一站式企業級大模型平臺,不但提供包括文心一言在內的大模型及第三方大模型服務,還提供大模型開發和應用的整套工具鏈,可幫助企業解決大模型開發和應用過程中的諸多問題。

到了2023年8月,文心千帆已全面接入Llama 2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等33個大模型,成爲國內擁有大模型最多的平臺。而且,接入的模型經過文心千帆的二次性能增強,模型推理成本最高可降低50%。

之所以能夠在短時間內取得如此碩果,是因爲文心千帆擁有來自百度智能雲的澎湃能量。早在2021年,百度就已提出“雲智一體”,希望打造AI原生雲時代。這使百度智能雲面向AI場景開始提供極致彈性的高性能異構算力,打造簡潔、高效的AI應用開發架構。

財報顯示,2023年第一季度,百度智能雲已經實現了季度盈利,收入42億元,同比增長8%;2023年第二季度收入已達45億元,同比增長5%,業務健康度持續提升。

據IDC發佈的《中國AI公有云服務市場份額2022》,2022年中國AI公有云服務市場增速爲80.6%,其中百度智能雲市場份額佔比第一,增速達69.7%。而這也是百度智能雲連續4年獲得第一。

百度智能云爲模型的訓練提供了算力和基礎架構支撐,合作模式吸引了大量同行者。在2023年5月2023百度智能雲合作伙伴大會上,百度簽約了28家生態夥伴,一方面攜手探索大模型平臺在各領域的創新應用,一方面合力打造產業標杆案例,希望能夠在各個行業有標準化、規模化複製。

國信證券2023年7月16日發佈的一份研報提到,依託文心千帆大模型平臺,百度智能雲已與超過300家生態夥伴在400多個場景中取得了相當不錯的測試效果,覆蓋金融、政務、互聯網、教育等多個行業。

大模型平臺及百度智能雲的多行業應用成效已獲認可,來自中國高科集團的合作即爲一例。7月14日,百度智能雲與中國高科集團正式簽署戰略合作協議,雙方將圍繞AIGC、公有云服務、產教融合等方面開展深入合作,由此推動教育領域數智化升級。

高盛也在近日研報中對百度重申了買入評級,且給出了2025年百度生成式AI大模型應用未來收入潛力的預測:C端通過廣告及Plug-in分成,將達到141億元;B端通過公有及私有云部署將達到51億元,佔智能雲收入的15%。

正如高盛研報提到的那樣,在百度智能雲之外,營銷作爲百度業務重要組成部分,同樣受到了AIGC發展的穩健拉動。

財報顯示,2023年第一季度,百度核心收入230億元,其中在線營銷收入166億元,同比增長6%,非在線營銷收入64億元,同比增長11%;2023年第二季度,百度核心收入264億元,其中在線營銷收入196億元,同比增長15%,非在線營銷收入68億元,同比增長12%。

就外部而言,經濟大環境的復甦無疑帶動了廣告業的回暖,促使在線營銷增長;而根本因素來自內部即百度移動生態等多方面的持續拓展。財報顯示,2023年第一季度,百度APP 的MAU(月活躍用戶數)已達6.57億,同比增長4%;2023年第二季度,這兩個數字分別爲6.77億和8%。

生態繁榮體現在多個維度。2022年,百度APP的視頻用戶數增長了38%,直播用戶增幅更是超過了2倍;每天通過平臺發起的諮詢量超過了500萬次,同比增長155%,付費諮詢次數超過2億;百度聯盟搜索流量上漲21%,百度聯盟入口請求量突破千億,變現能力提升30%。

而在已然進入的全新發展階段裡,搜索加推薦和AIGC已成爲百度移動生態繼續着力發展的強勁驅動引擎。在2023年5月2023萬象百度移動生態大會上,百度已宣佈AIGC能力將全面接入百度內容生態產品矩陣;百家號將全新升級爲AI創作經營平臺,通過引入AI筆記、AI成片、AI作畫、AI BOT、AI寫作、AI數字人等6件創作工具擁抱AI革命;同時百度內容生態還推出了AI共創計劃,預計未來1年將扶持10萬創作者收入超30億元。

AIGC能夠直接提升營銷效率。2023年6月,百度推出了AIGC商業創意平臺擎舵。擎舵能夠通過多模態內容生成,輕鬆實現文案生成、圖片生成和數字人視頻製作的生產功能。據海克財經瞭解,該平臺2分鐘就能生成100條創意文案,3分鐘生成一個數字人建模,5分鐘即可製作一條完整的數字人口播視頻。

這樣的提質增效並不僅僅作用於百度內部。2023年618期間,京東聯合百度文心一格將AIGC應用到了電商營銷之中,進行了電商行業首次大規模AI線下廣告嘗試。得益於此,京東營銷團隊通過對人物特性的不同描述,可生成差異化海報效果。據百度測算,常規情況下這樣一組海報,從模特、服裝到設計、排版的整體單張成本接近1萬元,AI則使製作週期縮短了70%,製作成本節省了約80%。

通過堅持科技長期主義,百度已從不同業務線的產品到合作伙伴乃至整個生態鏈路形成了閉環。

以智能駕駛業務爲例,百度自動駕駛及智能化解決方案亦受到了AIGC的顯著推動。

百度自動駕駛出行服務平臺蘿蔔快跑單位經濟效益持續優化,在2023年第二季度提供了71.4萬次乘車服務,同比增長149%。據海克財經瞭解,截至2023年6月底,蘿蔔快跑累計向公衆提供的乘車服務達到了330萬次。

同樣截至2023年6月底,百度Apollo汽車智能化解決方案已在31個汽車品牌、211款車型量產,累計搭載超900萬輛;近期百度Apollo已分別與長城汽車、億咖通科技基於大模型能力圍繞車載交互場景開展探索和實踐。

在智能駕駛上的投入和成效又能推動百度智能雲於汽車行業的落地。在2023年5月22日IDC發佈的《中國汽車雲市場跟蹤研究22H2》中,百度智能雲在自動駕駛研發解決方案市場中以35.9%的市場份額排名第一,相比2022年同期,實現了162%的超高速增長,在國內汽車雲市場中處於龍頭地位。

高盛給出的判斷是,百度的收益將繼續處於向上修正週期,在一系列催化劑的支持下,百度估值倍數將有較大擴張空間。

而我們將時間維度拉遠觀察可見,深耕技術已爲百度夯實了基本面,一切都在指向屬於百度的最好時代正在到來。