DeepSeek橫空出世!Meta陷恐慌狂分析:訓練成本「比高層薪水還低」

▲中國橫空出世的AI模型DeepSeek震撼矽谷,也讓Meta陷入恐慌。(圖/翻攝自DeepSeek)

記者葉睿涵/綜合報導

中國AI新創企業DeepSeek(深度求索)近2個月接連推出新模型DeepSeek-V3與DeepSick-R1,令其APP在蘋果App Store的下載排行榜中衝上第一名,將ChatGPT遠拋在後。這款低成本高性能的AI模型表現與OpenAI的ChatGPT-4等全球頂尖AI語言模型不相上下,令整個矽谷爲之震撼,更讓美國科技巨頭Meta的生成式AI部門陷入危機。

一位自稱是Meta員工的網友,日前在美國匿名職場論壇TeamBlind上發文,表示DeepSeek橫空出世後,技術水準就直接超越了Meta旗下的Llama 4,讓Meta全公司上下陷入恐慌。更令Meta難堪的是,這家中國企業只用了550萬美元(約新臺幣1.8億元)來訓練DeepSeek,成本只有Meta的十一分之一。

這名員工坦言,DeepSeek以超低成本完成大規模模型訓練,顛覆了行業對高昂成本的傳統認知,因爲「單隻Meta生成式AI部門裡的主管薪資就已超過了DeepSeek訓練AI的成本,而且我們這裡有幾十位領着高薪的主管,我根本無法想像他們該如何向公司證明部門目前高額成本的合理性。」

外媒The Information指出,OpenAI、Meta和其他頂尖AI公司的工程師正瘋狂地研究DeepSeek模型,試圖解讀其技術秘密,複製其成功模式,但暫時還不得其解。Meta更爲此籌組了4個「戰情室」,2個聚焦研究如何降低訓練和運作DeepSeek的成本,另2個則負責釐清DeepSeek使用了哪些數據來訓練其模型,及基於DeepSeek模型歸納出的特質,重新建構Meta的模型。