王小川再創業“跑步入場”大模型,百川智能爭鋒大廠勝算幾何

本報(chinatimes.net.cn)記者盧曉 見習記者 石飛月 北京報道

ChatGPT短時間內的流量爆發,在衆多創業者心裡激起漣漪。今年2月,原搜狗CEO、現百川智能創始人兼CEO王小川在微博上這樣評價OpenAI的成功:“首先是技術理想主義的勝利。中國需要自己的OpenAI,就需要技術理想主義。我相信中國能誕生自己的OpenAI。” 於是,兩個月後,百川智能誕生了。宣告成立後的百川智能動作頻頻,短短4個月內就發佈了三款中文大模型,近日,第四款大模型——Baichuan 2開源大模型也由王小川正式對外公佈,該公司追趕ChatGPT的腳程逐漸加快。然而,大模型領域匯聚了國內外互聯網巨頭,且是一個十分“燒錢“的行業,百川智能作爲一個沒有強大資本靠山的新生兒,想要複製“搜狗”曾經的輝煌,必然要經過“千錘百煉”。

“五道口守門員”再創業

離開搜狗之後,王小川的去向一直備受外界關注,直到今年4月,才由他本人揭開真相。

王小川成立AI大模型公司“百川智能”,希望藉助語言AI的突破,構建中國最好的大模型底座。他的志向並不僅限於做“中國的OpenAI”,而是“建立世界級的視野和技術品質,讓中國享有世界級的產品,產生有世界影響力的技術的突破,進而服務海外。”

能夠在短短的時間內籌劃起一家新公司,是因爲王小川已經在資金和人才方面做好了一定的準備。據他介紹,百川智能早前已經獲得了5000萬美元啓動資金,初步搭建起包括搜狗、百度等技術骨幹在內的團隊,並獲得了包括清華大學計算機系教授,中國工程院院士,中國科學院院士等衆多中國人工智能學術界領軍人物的支持。

除了5000萬美元啓動資金,天眼查數據顯示,今年5月,百川智能還完成了一筆天使輪融資,2023年最豪華投資機構陣容匯聚,這一輪融資由騰訊、小米、金山、慕華資本、清華控股、好未來、渶策資本、深創投、紅點中國、卓源資本、衆爲資本、愉悅資本、順爲資本、心資本等十餘家聯合投資,具體融資金額不詳。

然而,百川智能和以前的搜狗所面臨的境遇並不相同,搜狗的誕生有當年的搜狐作爲靠山,又有阿里巴巴和騰訊後續的戰略入股,且當時的輸入法市場並不像現在的大模型市場,剛剛興起就進入“百模大戰”的階段。

早年間,在王小川的主持下,搜狗創先後開發出搜狗搜索、搜狗輸入法、搜狗瀏覽器等產品, 並在這幾大領域創造過“輝煌”,尤其是在阿里巴巴注資,搜狗單獨運營之後。據公開報道,10年前,搜狗輸入法在國內的市場份額曾達到87.8%,排名第一;搜狗搜索覆蓋2億用戶數,覆蓋率達45%,排名第三;搜狗高速瀏覽器用戶覆蓋率達24.93%,排名第三。

2017年,王小川帶領搜狗在美國紐交所上市,輝煌達到頂峰,但此後,搜狗再也講不出新故事,加上成本高昂導致的虧損,其運營日益維艱,不得不賣身騰訊。2021年10月15日,王小川宣佈卸任搜狗CEO,2021年12月2日,王小川退出搜狗股東行列。

此後入局AI領域,其實在王小川早年的言語之中已見端倪。在搜狗時,王小川就多次表達過對人工智能的看重:“搜索幫助用戶更好地獲取信息,輸入法幫助用戶更好地表達信息,而無論是獲取信息還是表達信息,都離不開對語言的理解,這也正是搜狗人工智能戰略的核心”、“語言是人工智能皇冠上的明珠”……

在ChatGPT大火之後,王小川又指出,搜狗輸入法和搜狗搜索的數據製備和產品形態,與ChatGPT接近,都是把互聯網上的全部語言數據收集、清洗,壓縮成數據並構建超級產品。

有意思的是,王小川一直被稱爲“五道口守門員”,從在清華大學的求學,到在搜狐和搜狗的創業,再到如今的百川智能,他始終沒有離開這個創業者的寶藏之地。

大模型戰場搏殺

儘管一直以來,很多人說王小川並不適合作爲一個創業者的身份,更符合一個職業經理人的定位,但他願意通過百川智能證明自己在創業方面的才能。在今年的一次媒體交流會上,王小川曾坦誠回答:“我習慣了一切 ready才公佈,我承認這有職業經理人的慣性思維,但我走出來了,所以先選擇向大家公佈。”

創辦百川智能後,王小川的步子邁得很大,走得也很快。

在近日Baichuan 2開源大模型發佈之前,百川智能已經連續發佈了包括:Baichuan-7B、Baichuan-13B、Baichuan-53B在內的三款中文大模型,並且成爲首批通過《生成式人工智能服務管理暫行辦法》備案,成爲可以正式面向公衆提供服務的企業,這在今年創立的大模型公司中是唯一一家。

而在Baichuan 2開源大模型的發佈會上,王小川也在不斷強調自家產品的技術優勢,將Baichuan2與LLaMA2等同尺寸模型競品進行了多方面的比較,並宣佈本次開源的兩個模型在各大評測榜單上的表現優秀,在MMLU、CMMLU、GSM8K等幾大權威評估基準中,以絕對優勢領先LLaMA2。

據介紹,新發布的Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基於 2.6萬億高質量多語言數據進行訓練,在保留了上一代開源模型良好的生成與創作能力,流暢的多輪對話能力以及部署門檻較低等衆多特性的基礎上,兩個模型在數學、代碼、安全、邏輯推理、語義理解等能力有顯著提升。

除了大模型的研發,王小川也在加快應用層面的動作。這源於他的一趟美國之行,在和OpenAI等衆多大模型從業者聊完後,王小川認爲應該“在理想上慢一步,在落地上快三步”。按照他的規劃,百川智能在今年三季度發佈500億參數模型,四季度發佈千億參數模型,2024年一季度發佈超級應用。

不過,想要將百川智能打造成爲中國的OpenAI,要過的,不止自己這道坎兒,還有面前的幾大互聯網巨頭。截至目前,阿里巴巴、騰訊、百度均已實現大模型的落地,且它們的資金和技術優勢是顯而易見的。

文淵智庫創始人王超就此對《華夏時報》記者表示,“其實在這一波大模型浪潮裡,創業公司是非常不佔有優勢的,百川智能和光年之外都一樣,當然現在光年之外已經被收購了。沒有大量數據,也無法背靠巨頭獲得足夠的芯片支撐,Open AI的崛起是藉助了微軟的算力資源和數據優勢,百川智能從無到有要面臨很大的競爭壓力。當然這並不意味着初創公司就完全沒有機會,只不過作爲一家初創公司,依賴一個巨頭去提供生存發展必需的養料、提供一定的庇護,是很有必要的。”

當然,王超還指出,百川智能最終在大模型以及AI領域的地位如何,最關鍵的還是產品技術的成熟度、客戶體驗是否改進、在與同類競品對比中是否存在優勢、大模型能不能提高生產力,然後才能考慮後續擴展到硬件和更多場景應用的事。

而作爲一個在互聯網領域叱吒風雲20多年的人,王小川對於百川智能的未來還是很有信心的,“在美國做開源大模型或做通用已沒有懸念,投資也已經明確,但在中國不是,國內誰能做最好的大模型現在沒有定論,大家都有爭取的機會,而且不一定落在大廠裡面。”

責任編輯:黃興利 主編:寒豐