Claude炸場,最焦慮可能不是OpenAI

「遊戲開始(game on)。」

這是Runway聯合創始人寫在OpenAI發佈Sora後的一句感言,某種程度上,這句話也可以送給此刻的OpenAI和Sam Altman。

隨着被稱爲「OpenAI最強競爭對手之一」的Anthropic發佈新一代的人工智能模型系列Claude 3(包括了Opus、Sonnet、Haiku三款產品),一時間中文互聯網甚至出現了「全球AI大模型一夜易主」的評論。

圖源:X

Claude 3之所以引發如此多的評論,原因有兩方面:一是代表模型性能的各類評測指標來看,Claude Opus的得分全都超過GPT-4。二是,從用戶直接體驗來看,緩解了過去大模型使用過程中出現的問題,比如降低拒絕率、克服大模型的幻覺等問題。

英偉達高級科學家Jim Fan就對Claude 3給出了兩個客觀的評價:一是在特定領域的專家基準測試。除了相對飽和的MMLU、HumanEval等基準外,Claude還選擇了金融、醫學和哲學等專家領域,報告了性能表現。二就是解決了過往大模型過於「謹慎」的問題。

以Meta的開源大模型Llama 2爲例,此前有人就發現,即便詢問一些無害問題,比如「如何製作辣椒蛋黃醬」,但Llama 2會瘋狂地表示它無法做到,因此用戶需要交互多次,才能給出答案。Anthropic意識到了這一問題,降低了模型在無害問題上的拒絕率。

需要指出的是,和OpenAI一樣,由於都是閉源,Claude 3的技術報告並不涉及具體的模型結構、訓練方法等,因此對人們來說,這依舊是一條模糊的道路。

而從Claude炸場,對抗OpenAI,所反映出的是2024年海外大模型行業所涌現出的新趨勢。

Sora拉開序幕,巨頭密集上新

年初,從OpenAI攜Sora開啓所謂的「文生視頻GPT時刻」開始,海外大模型企業就已進入了密集的模型上新期。

與OpenAI同日更新的谷歌拿出了多模態大模型Gemini 1.5,既瞄準了Claude擅長的「長文本」——Gemini 1.5能穩定處理的信息量高達100萬個tokens,作爲對比GPT-4 Turbo的上下文窗口大約爲12.8萬tokens,剛發佈的Claude 3大約爲20萬tokens。在更新閉源大模型的同時,谷歌還推出了「開源」大模型 Gemma,主打一個「開源、閉源」兩手抓。

而本就走「開源路線」的Meta也在近期被曝出推出新模型的消息。據The Information報道,Meta計劃在7月份推出新的AI大模型Llama 3,參數量最高或超過1400億,Meta希望藉此可以追上OpenAI的GPT-4。一位知情人士表示,Meta還在計劃任命一名內部人員對Llama 3在安全和可控性進行培訓,以讓其的反應更加細緻。此前,扎克伯格也向投資者提到:“今年的重點領域就包括推出 Llama 3”。

科技巨頭們已將模型發佈提上日程,追趕GPT-4已經成爲了今年的首要KPI,另一邊的獨角獸們在融資寒冬中也沒閒着。

比如,法國AI獨角獸Mistral AI就在上個月底推出了僅次於GPT-4性能的 Mistral Large和類ChatGPT產品競爭對手Le Chat。同時,還宣佈和OpenAI 的「盟友」微軟達成了合作。

從目前的時間線來看,這場模型「上新戰」只是開始。而這對創業者來說,似乎是一個好消息。如Abacu.AI的聯合創始人兼CEOBindu Reddy所說:“OpenAI不再是唯一的人工智能之王,這對每個人來說都是一個巨大的安慰。”

圖源:X

最焦慮可能不是OpenAI,而是谷歌

而從Claude所引發的連鎖反應來看,如今既面對強大競爭對手,又深陷與馬斯克的訴訟中的OpenAI無疑是最焦慮的一個。

但事實上,從目前來看,OpenAI可能並不焦慮。首先,兩家公司不同的定位被人們忽視了。據福布斯對Anthropic聯合創始人的採訪,這家公司反覆強調:“Anthropic更像是一家企業公司,而不是一家消費者公司。”儘管從產品形態和商業模式來看,chatGPT和Claude並無明顯差別,但顯然Anthropic面向的是to B用戶,而非C端的大衆。而從Claude提供的客戶案例中,這些B端客戶包括瞭如科技公司Gitlab、Notion、Salesforce、SAP等。

其次,從戰略層來看,儘管都是爲了通往AGI,但OpenAI謀求「大而全」,Anthropic則偏向「小而美」。OpenAI一系列的硬件公司和算力佈局,都可以印證這一點。

相比之下,更焦慮的可能是谷歌。儘管身爲Anthropic背後的金主之一,但相比亞馬遜對Anthropic的「熱情」,谷歌卻無多少反應。

谷歌在近期正在陷入一系列的爭議中。一方面,Gemini陷入「種族偏見」的輿論浪潮,許多網友發現,Gemini的文生圖功能出現問題,比如似乎刻意在拒絕生成白人的形象,谷歌隨後下架Gemini文生圖功能,谷歌CEO Sundar Pichai迴應稱該問題「不可接受」,並在內部信中表示,公司在修復Gemini護欄方面已經取得了進展。

據BusinessInsider的報道,一位谷歌現任高級員工將這一事件形容爲「一場公關噩夢」,“谷歌員工很生氣。”華爾街的分析師甚至認爲,谷歌需要剔除那些胡作作非爲的人,包括CEO Sundar Pichai。Bernstein分析師Mark Shmulik在一份研究報告中也思考了類似的問題——是否是時候對谷歌的高層進行改組。

儘管谷歌一直將自己形容爲一家人工智能領先的公司,它的基礎研究也深刻影響着此輪大模型浪潮。但無論在模型的推出節奏,還是商業化路線上,谷歌都明顯遲滯於微軟和OpenAI。

AI技術的迭代飛速,這意味着洗牌也在快速進行。一個有趣的觀察是,如今在此輪浪潮中,被讚美的對象換成了Meta和微軟。而此刻的OpenAI和谷歌,他們以技術見長,但都面臨着增長所帶來的代價——無論是組織內部的動盪,抑或是保守的戰略。

參考資料:

1、機器之心:Llama 2第二波劃重點:過於「謹慎」、代碼生成改進空間大

2、BusinessInsider:How Google lost its way