☰

DeepSeek嚇壞硅谷 Meta連夜專門破解

科技1月27日消息，近一週，來自中國的深度求索（DeepSeek）全球爆紅，尤其讓美國硅谷極爲震撼和恐慌。

其最新發布的R1大模型不僅在性能上比肩甚至超越了OpenAI的o1，並完全開源，且以對手3%的超低成本實現了這一突破。

近日，一篇在匿名平臺teamblind上發佈的文章遭瘋傳，有一位自稱是Meta員工稱公司內部因DeepSeek模型而進入恐慌模式，並提到DeepSeek-V3在基準測試中，已經讓（Meta推出的）Llama 4相形見絀，而更讓人難堪的是一家“僅用550萬美元訓練預算的中國公司”就做到這一點。

該文稱，Meta工程師正爭分奪秒分析DeepSeek，試圖複製其中的一切可能技術，而DeepSeek-R1的出現，也讓情況更加嚴峻。

另據The Information爆料，Meta生成AI小組和基礎設施團隊的經理和工程師已開設了四個作戰室來學習DeepSeek的工作原理。

其中兩個動員起來的小組正在試圖瞭解High-Flyer如何降低訓練和運行DeepSeek的成本。第三個Meta研究小組正在試圖弄清楚High-Flyer可能使用哪些數據來訓練其模型。第四作戰室正在考慮基於DeepSeek模型屬性重構Meta模型的新技術。

AI科技初創公司Scale AI創始人亞歷山大·王（Alexandr Wang）接受電視媒體公開採訪時表示，中國人工智能公司DeepSeek的AI大模型性能大致與美國最好的模型相當。過去十年來，美國可能一直在人工智能競賽中領先於中國，但DeepSeek的AI大模型發佈可能會“改變一切”。

Meta創始人兼CEO扎克伯格表示，DeepSeek非常先進，並認爲中美之間的AI差距非常小。

扎克伯格還表示，中國正在全力衝刺，如果將來有一個開源模型能被全世界廣泛使用，我們希望它是一個美國模型。

相關資訊