☰

DeepSeek直衝下載榜首 Meta焦慮火速成立四個戰情室應敵

隨着大陸AI新創公司DeepSeek以較低成本推出高性能AI模型震撼矽谷，臉書母公司Meta的AI研究人員陷入恐慌模式，據傳Meta生成式AI團隊的主管和工程師已經成立四個「戰情室」研究DeepSeek的運作方式。

根據科技新聞網站The Information報導，Meta的AI團隊一些主管近日對DeepSeek推出的新型的對話式AI公開表達擔憂，擔心Meta在AI競賽中落後了。兩名員工透露，包括AI基礎設施總監歐德漢（Mathew Oldham）在內的主管擔心，自家旗艦AI模型Llama的下一版本表現可能無法DeepSeek匹敵。

DeepSeek去年底推出大型語言模型「DeepSeek V3」，根據多份美國公司發表的評估和使用者評價，這款模型在完成多種任務方面表現，符合或甚至超越三大AI公司Meta、OpenAI和Anthropic的模型；該公司接着在本月20日推出另一個模型「DeepSeek-R1」，可能媲美OpenAI的o1推理模型，這引發外界質疑美國一些AI公司是否運作效率低，或耗費太多資金卻取得較差的成果。

應用程式（App）的開發商能夠自由下載DeepSeek或透過基於雲端的應用程式介面購買使用權。一些規模較小的App開發商表示，他們已改用DeepSeek，原因是成本遠低於OpenAI或Anthropic模型。

消費者則可透過一款聊天機器人App使用DeepSeek，這會與ChatGPT競爭。現在，DeepSeek的App在蘋果 App Store免費應用程式下載排行榜已經衝上第一名，ChatGPT則落居第三。

The Information報導指出，OpenAI、Meta和其他頂尖開發商的研究人員正仔細分析DeepSeek模型，以尋找可借鑑之處，包括它如何以比一些美國AI模型能以更低成本、更具效率的方式運作。

其中，Meta已爲此籌組四個「戰情室」。一名員工透露，兩個小組聚焦於研究如何降低訓練和運作DeepSeek 的成本。雖然Meta的模型是免費的，但運作成本比OpenAI的模型更高，部分原因是OpenAI能夠透過批次處理消費者數百萬次的查詢來降低價格；相較下，使用Llama的小型開發者，則欠缺足夠的查詢量來以同樣的方式降低成本。

員工透露，第三個研究小組正在試圖釐清DeepSeek使用了哪些數據來訓練其模型；第四個戰情室則是考慮基於DeepSeek模型歸納出的特質，重新建構Meta的模型。據稱，Meta正考慮推出一個類似DeepSeek的Llama版本，包含多個AI模型，每個模型專門訓練處理不同的任務。藉此，當消費者要求Llama處理某個任務時，只要讓模型的一部分進行運作，這可能讓整體模型的運作速度更快，並減少所需的運算資源。

Meta 發言人卡維爾在聲明中表示：「我們在開發過程中會定期評估所有競爭模型，而且是從本公司生成式AI團隊成立以來一直如此。」

Meta傳出已火速成立四個戰情室，因應來勢洶洶的大陸新創公司DeepSeek在AI模型方面的競爭。路透

相關資訊

DMCA | PRIVACY | s@bg3.co