馬斯克的Grok-3來了!和OpenAI、DeepSeek正面對決

21世紀經濟報道記者倪雨晴 深圳報道

在AI的牌桌上,埃隆·馬斯克(Elon Musk)從不缺席。

太平洋時間2月17日,馬斯克旗下人工智能初創公司xAI的大模型Grok-3正式面世。發佈會上,xAI展示了一系列家族,包括Grok-3(Beta)、Grok-3 mini、首個推理模型Grok-3 Reasoning(Beta)、Grok-3 mini Reasoning。

同時,xAI還推出了名爲Deepsearch的智能搜索引擎Agent工具。從大模型到AI搜索應用,xAI緊跟競品步伐通通上線。時常“一線衝鋒”的馬斯克,正加速在AI賽場上奔跑。

在預告中,馬斯克將Grok-3標榜爲“地球上最聰明的人工智能”。根據xAI展示的數據,Grok-3在多項基準測試中超越了DeepSeek-V3、Gemini-2 Pro、GPT-4o,刷新最新成績。

在大模型的你追我趕中,AI的細分賽道上,最聰明的AI不斷易主。這場“不進則退”的殘酷競賽中,馬斯克也着急了。上週他還表示,爲了提供最好的用戶體驗,xAI還在打磨產品,還需要一兩週的時間。

但是面對新貴DeepSeek和勁敵OpenAI,馬斯克快馬加鞭急於讓Grok-3亮相。一週後,xAI將會陸續上線完整功能,不過當前付費用戶才能使用,Grok-3也未開源。新王不斷涌現,AI界的技術狂人們還將繼續過招。

誰是“最聰明的AI”

本次直播發布的時間並不長,只有半小時左右,馬斯克和xAI團隊基本上都在用數據和實操展現Grok-3的“智力”。

和很多模型一樣,Grok-3在數學推理、科學邏輯推理和代碼編寫等方面表現出色。多項基準測試成績顯示,Grok-3在數學(AIME 2024)、科學問答(GPQA)、編碼(LCB)上刷新SOTA(State of the Art,描述在某一特定領域內當前最佳的技術、方法或模型),擊敗了谷歌的Gemini-2 Pro、DeepSeek的V3模型、OpenAI的GPT-4o。

按照xAI提供的數據,在多個AI領域內,Grok-3已經登頂。馬斯克表示,Grok-3的計算能力是前一代的“10 倍以上”,並於1月初完成了預訓練,“我們每天都在不斷改進模型,實際上在24小時內,你就會看到改進。”

AI,正在以每分每秒的速度不分晝夜地進化着,大模型廠商之間的火藥味更加濃烈。在Grok-3發佈不久前,OpenAI的CEO Sam Altman還在社交媒體上發佈了GPT-4.5的相關訊息,表示測試者們嘗試GPT-4.5後,有比預期更多的“感受到AGI”的時刻。

在鋪天蓋地的Grok-3報道中,Sam Altman穿插新品預告,吸引了不少關注。Sam Altman和馬斯克的“針鋒相對”,也將顯示在產品的PK中。

xAI工程師介紹,雖然Grok起步較晚,但在MMLU得分上以超的速度追上了ChatGPT。Grok-3和Grok-3 mini在多方面性能上都超過或媲美Gemini、DeepSeek和ChatGPT等對手。

與此同時,Grok-3也很明顯在對標競品,比如,馬斯克還特別提到了推理性能,而推理是DeepSeek-R1的強項。

馬斯克表示,Grok-3接受了合成數據的訓練,可以通過反覆檢查數據來審查所犯的錯誤,以達到邏輯上的一致性,“因此,如果它得到了錯誤的數據,它會反思並刪除錯誤的數據。它的基本推理非常好。”

而對於OpenAI,從Grok-3目前的數據看,其似乎領先於OpenAI最新的ChatGPT。隨着Grok-3即將上線,xAI和OpenAI之間的競爭將日益激烈。“最聰明的AI”,將會是一場持續的排位賽。

大模型競速

近年來快速崛起的AI明星着實不少,xAI當屬其一。技術狂熱又多金的馬斯克,在和OpenAI“決裂”後,轉而成立自己的AI公司。

2023年,馬斯克的xAI公司成立,時隔半年便發佈了Grok和Grok-1.5模型,可謂進展迅速。2024年8月,xAI又發佈了Grok-2大模型;12月,xAI宣佈開始向X平臺上的所有用戶免費推出新版Grok-2模型,而此前該模式只向訂閱了Premium Plus的用戶開放。

在算力基礎上,馬斯克也迅速囤卡。xAI團隊自建Colossus超級計算集羣,集羣規模已經從10萬塊英偉達GPU擴展到20萬塊,基於自家集羣訓練出的Grok-3的性能也得到了增強。

在xAI一日千里之時,AI圈的同行也在飈速。2025年,大洋彼岸的DeepSeek-V3和R1掀起新浪潮,尤其是R1爲業內稱道。R1大模型的一個特點是採用了MOE架構(混合專家,Mixture-of-Experts),事實上Grok初代版本也使用了MOE架構。在開源世界中,如何練出絕世武功,還得看各家功力。

DeepSeek-R1模型的衝擊下,在AI領域有大動作可不止xAI一家,不少公司都陸續放出大招。

2月6日,OpenAI宣佈擴大ChatGPT搜索功能的用戶範圍,任何人無需註冊,就可以使用ChatGPT的搜索功能;同一天,谷歌正式推出Gemini 2.0系列模型,包括Flash、Pro及Flash-Lite版本,繼續提升AI能力,並提供更具性價比的解決方案。

2月13日,Sam Altman宣佈,將很快發佈GPT-5,並且免費無限使用;同日,文心一言官宣將於4月1日0時起全面免費,並且即日起上線深度搜索功能。

AI的第一梯隊玩家都感受到“危機感”,不由得加快了迭代腳步,直接開啓新一輪價格戰,並探索更多應用場景形成商業閉環。有AI資深人士向21世紀經濟報道記者表示,目前Grok-3需要付費使用,馬斯克也在探索解決算力商業模式問題。

在技術、Agent應用競速的同時,大模型廠商的融資也在競速。有報道稱,xAI正在接洽潛在的投資者,計劃籌集約100億美元資金,此輪融資可能使該公司估值達到約750億美元;還有報道稱OpenAI正在進行談判,希望在新一輪融資中籌集高達400億美元,這將使其估值達到3000億美元。

在這場資金、技術、智力的金字塔遊戲中,大模型競速已從單純的技術迭代演變爲全維度的生態博弈。算力軍備競賽與開源策略並行,價格戰倒逼商業閉環重構。有云計算高管向記者表示,目前AI產業已經過了炒作階段,開始出現一些真正規模化的應用,大家會看到更多實用價值。

而這場以硅基智能爲燃料的競逐,能否加速構建通向AGI之路,大家都在拭目以待。