DeepSeek直衝下載榜首 Meta焦慮火速成立四個戰情室應敵
隨着大陸AI新創公司DeepSeek以較低成本推出高性能AI模型震撼矽谷,臉書母公司Meta的AI研究人員陷入恐慌模式,據傳Meta生成式AI團隊的主管和工程師已經成立四個「戰情室」研究DeepSeek的運作方式。
根據科技新聞網站The Information報導,Meta的AI團隊一些主管近日對DeepSeek推出的新型的對話式AI公開表達擔憂,擔心Meta在AI競賽中落後了。兩名員工透露,包括AI基礎設施總監歐德漢(Mathew Oldham)在內的主管擔心,自家旗艦AI模型Llama的下一版本表現可能無法DeepSeek匹敵。
DeepSeek去年底推出大型語言模型「DeepSeek V3」,根據多份美國公司發表的評估和使用者評價,這款模型在完成多種任務方面表現,符合或甚至超越三大AI公司Meta、OpenAI和Anthropic的模型;該公司接着在本月20日推出另一個模型「DeepSeek-R1」,可能媲美OpenAI的o1推理模型,這引發外界質疑美國一些AI公司是否運作效率低,或耗費太多資金卻取得較差的成果。
應用程式(App)的開發商能夠自由下載DeepSeek或透過基於雲端的應用程式介面購買使用權。一些規模較小的App開發商表示,他們已改用DeepSeek,原因是成本遠低於OpenAI或Anthropic模型。
消費者則可透過一款聊天機器人App使用DeepSeek,這會與ChatGPT競爭。現在,DeepSeek的App在蘋果 App Store免費應用程式下載排行榜已經衝上第一名,ChatGPT則落居第三。
The Information報導指出,OpenAI、Meta和其他頂尖開發商的研究人員正仔細分析DeepSeek模型,以尋找可借鑑之處,包括它如何以比一些美國AI模型能以更低成本、更具效率的方式運作。
其中,Meta已爲此籌組四個「戰情室」。一名員工透露,兩個小組聚焦於研究如何降低訓練和運作DeepSeek 的成本。雖然Meta的模型是免費的,但運作成本比OpenAI的模型更高,部分原因是OpenAI能夠透過批次處理消費者數百萬次的查詢來降低價格;相較下,使用Llama的小型開發者,則欠缺足夠的查詢量來以同樣的方式降低成本。
員工透露,第三個研究小組正在試圖釐清DeepSeek使用了哪些數據來訓練其模型;第四個戰情室則是考慮基於DeepSeek模型歸納出的特質,重新建構Meta的模型。據稱,Meta正考慮推出一個類似DeepSeek的Llama版本,包含多個AI模型,每個模型專門訓練處理不同的任務。藉此,當消費者要求Llama處理某個任務時,只要讓模型的一部分進行運作,這可能讓整體模型的運作速度更快,並減少所需的運算資源。
Meta 發言人卡維爾在聲明中表示:「我們在開發過程中會定期評估所有競爭模型,而且是從本公司生成式AI團隊 成立以來一直如此。」
Meta傳出已火速成立四個戰情室,因應來勢洶洶的大陸新創公司DeepSeek在AI模型方面的競爭。路透