☰

DeepSeek AI模型震撼矽谷 Meta應戰設四組戰情室

據傳Meta生成式AI團隊的主管和工程師成立四個「戰情室」，專門研究DeepSeek-R1的運作方式。（路透）

中國大陸人工智慧（AI）新創公司DeepSeek（深度求索）以低成本推出高性能AI模型DeepSeek-R1震撼矽谷，讓臉書母公司Meta的AI研究人員陷入恐慌。據傳Meta生成式AI團隊的主管和工程師成立四個「戰情室」，專門研究DeepSeek-R1的運作方式。

DeepSeek掀起的大模型旋風愈演愈烈，在蘋果App Store大陸區和美國區免費榜均站上冠軍位置，超越ChatGPT及Meta旗下Threads，以及谷歌的Gemini、微軟的Copilot等知名應用。

DeepSeek受到廣泛關注，引起美國科技巨頭的警覺，開始啓動因應舉措。科技新聞網站The Information報導，Meta的AI團隊主管近日對DeepSeek推出的新模型公開表達擔憂，擔心Meta在AI競賽中落後。員工透露，包括AI基礎設施總監歐德漢等主管擔心，自家旗艦AI模型Llama的新版本表現可能無法與DeepSeek匹敵。

DeepSeek去年底推出大型語言模型「DeepSeek V3」，根據多份美國公司發表的評估和使用者評價，這款模型在完成多種任務上，符合或甚至超越三大AI公司Meta、OpenAI和Anthropic的模型；本月20日推出「DeepSeek-R1」，媲美OpenAI的o1推理模型，引發外界質疑美國部分AI公司是否運作效率低，或耗費太多資金，成果卻較差。

開發商能夠自由下載DeepSeek的開源模型，或是透過雲端購買使用權。一些規模較小的App開發商表示已改用DeepSeek的模型，原因是成本遠低於OpenAI或Anthropic模型。

The Information報導指出，OpenAI、Meta和其他頂尖開發商的研究人員正仔細分析DeepSeek模型，尋找可借鏡之處，包括如何以更低成本、更具效率的方式運作。

Meta已爲此籌組四個「戰情室」。一名員工透露，兩個小組聚焦如何降低訓練和運作DeepSeek的成本。雖然Meta的模型是免費的，運作成本卻比OpenAI的模型更高，因OpenAI能夠透過批次處理數百萬次的查詢降低價格。第三個研究小組試圖釐清DeepSeek使用哪些數據訓練模型；第四個戰情室則是基於DeepSeek模型歸納出的特質，重新建構Meta的模型。

據稱，Meta正考慮推出一個類似DeepSeek的Llama版本，包含多個AI模型，各自訓練處理不同任務。

延伸閱讀

天才少女助攻「AI界拼多多」羅福莉躍熱門人物

DeepSeek 震撼引 AI 股恐慌美學者： AI 爭霸中美打成平手

相關資訊

DMCA | PRIVACY | s@bg3.co