☰

Claude炸場，最焦慮可能不是OpenAI

「遊戲開始（game on）。」

這是Runway聯合創始人寫在OpenAI發佈Sora後的一句感言，某種程度上，這句話也可以送給此刻的OpenAI和Sam Altman。

隨着被稱爲「OpenAI最強競爭對手之一」的Anthropic發佈新一代的人工智能模型系列Claude 3（包括了Opus、Sonnet、Haiku三款產品），一時間中文互聯網甚至出現了「全球AI大模型一夜易主」的評論。

圖源：X

Claude 3之所以引發如此多的評論，原因有兩方面：一是代表模型性能的各類評測指標來看，Claude Opus的得分全都超過GPT-4。二是，從用戶直接體驗來看，緩解了過去大模型使用過程中出現的問題，比如降低拒絕率、克服大模型的幻覺等問題。

英偉達高級科學家Jim Fan就對Claude 3給出了兩個客觀的評價：一是在特定領域的專家基準測試。除了相對飽和的MMLU、HumanEval等基準外，Claude還選擇了金融、醫學和哲學等專家領域，報告了性能表現。二就是解決了過往大模型過於「謹慎」的問題。

以Meta的開源大模型Llama 2爲例，此前有人就發現，即便詢問一些無害問題，比如「如何製作辣椒蛋黃醬」，但Llama 2會瘋狂地表示它無法做到，因此用戶需要交互多次，才能給出答案。Anthropic意識到了這一問題，降低了模型在無害問題上的拒絕率。

需要指出的是，和OpenAI一樣，由於都是閉源，Claude 3的技術報告並不涉及具體的模型結構、訓練方法等，因此對人們來說，這依舊是一條模糊的道路。

而從Claude炸場，對抗OpenAI，所反映出的是2024年海外大模型行業所涌現出的新趨勢。

Sora拉開序幕，巨頭密集上新

年初，從OpenAI攜Sora開啓所謂的「文生視頻GPT時刻」開始，海外大模型企業就已進入了密集的模型上新期。

與OpenAI同日更新的谷歌拿出了多模態大模型Gemini 1.5，既瞄準了Claude擅長的「長文本」——Gemini 1.5能穩定處理的信息量高達100萬個tokens，作爲對比GPT-4 Turbo的上下文窗口大約爲12.8萬tokens，剛發佈的Claude 3大約爲20萬tokens。在更新閉源大模型的同時，谷歌還推出了「開源」大模型 Gemma，主打一個「開源、閉源」兩手抓。

而本就走「開源路線」的Meta也在近期被曝出推出新模型的消息。據The Information報道，Meta計劃在7月份推出新的AI大模型Llama 3，參數量最高或超過1400億，Meta希望藉此可以追上OpenAI的GPT-4。一位知情人士表示，Meta還在計劃任命一名內部人員對Llama 3在安全和可控性進行培訓，以讓其的反應更加細緻。此前，扎克伯格也向投資者提到：“今年的重點領域就包括推出 Llama 3”。

科技巨頭們已將模型發佈提上日程，追趕GPT-4已經成爲了今年的首要KPI，另一邊的獨角獸們在融資寒冬中也沒閒着。

比如，法國AI獨角獸Mistral AI就在上個月底推出了僅次於GPT-4性能的 Mistral Large和類ChatGPT產品競爭對手Le Chat。同時，還宣佈和OpenAI 的「盟友」微軟達成了合作。

從目前的時間線來看，這場模型「上新戰」只是開始。而這對創業者來說，似乎是一個好消息。如Abacu.AI的聯合創始人兼CEOBindu Reddy所說：“OpenAI不再是唯一的人工智能之王，這對每個人來說都是一個巨大的安慰。”

圖源：X

最焦慮可能不是OpenAI，而是谷歌

而從Claude所引發的連鎖反應來看，如今既面對強大競爭對手，又深陷與馬斯克的訴訟中的OpenAI無疑是最焦慮的一個。

但事實上，從目前來看，OpenAI可能並不焦慮。首先，兩家公司不同的定位被人們忽視了。據福布斯對Anthropic聯合創始人的採訪，這家公司反覆強調：“Anthropic更像是一家企業公司，而不是一家消費者公司。”儘管從產品形態和商業模式來看，chatGPT和Claude並無明顯差別，但顯然Anthropic面向的是to B用戶，而非C端的大衆。而從Claude提供的客戶案例中，這些B端客戶包括瞭如科技公司Gitlab、Notion、Salesforce、SAP等。

其次，從戰略層來看，儘管都是爲了通往AGI，但OpenAI謀求「大而全」，Anthropic則偏向「小而美」。OpenAI一系列的硬件公司和算力佈局，都可以印證這一點。

相比之下，更焦慮的可能是谷歌。儘管身爲Anthropic背後的金主之一，但相比亞馬遜對Anthropic的「熱情」，谷歌卻無多少反應。

谷歌在近期正在陷入一系列的爭議中。一方面，Gemini陷入「種族偏見」的輿論浪潮，許多網友發現，Gemini的文生圖功能出現問題，比如似乎刻意在拒絕生成白人的形象，谷歌隨後下架Gemini文生圖功能，谷歌CEO Sundar Pichai迴應稱該問題「不可接受」，並在內部信中表示，公司在修復Gemini護欄方面已經取得了進展。

據BusinessInsider的報道，一位谷歌現任高級員工將這一事件形容爲「一場公關噩夢」，“谷歌員工很生氣。”華爾街的分析師甚至認爲，谷歌需要剔除那些胡作作非爲的人，包括CEO Sundar Pichai。Bernstein分析師Mark Shmulik在一份研究報告中也思考了類似的問題——是否是時候對谷歌的高層進行改組。

儘管谷歌一直將自己形容爲一家人工智能領先的公司，它的基礎研究也深刻影響着此輪大模型浪潮。但無論在模型的推出節奏，還是商業化路線上，谷歌都明顯遲滯於微軟和OpenAI。

AI技術的迭代飛速，這意味着洗牌也在快速進行。一個有趣的觀察是，如今在此輪浪潮中，被讚美的對象換成了Meta和微軟。而此刻的OpenAI和谷歌，他們以技術見長，但都面臨着增長所帶來的代價——無論是組織內部的動盪，抑或是保守的戰略。

參考資料：

1、機器之心：Llama 2第二波劃重點：過於「謹慎」、代碼生成改進空間大

2、BusinessInsider：How Google lost its way

Claude炸場，最焦慮可能不是OpenAI

相關資訊