DeepSeek嚇壞硅谷 Meta連夜專門破解
科技1月27日消息,近一週,來自中國的深度求索(DeepSeek)全球爆紅,尤其讓美國硅谷極爲震撼和恐慌。
其最新發布的R1大模型不僅在性能上比肩甚至超越了OpenAI的o1,並完全開源,且以對手3%的超低成本實現了這一突破。
近日,一篇在匿名平臺teamblind上發佈的文章遭瘋傳,有一位自稱是Meta員工稱公司內部因DeepSeek模型而進入恐慌模式,並提到DeepSeek-V3在基準測試中,已經讓(Meta推出的)Llama 4相形見絀,而更讓人難堪的是一家“僅用550萬美元訓練預算的中國公司”就做到這一點。
該文稱,Meta工程師正爭分奪秒分析DeepSeek,試圖複製其中的一切可能技術,而DeepSeek-R1的出現,也讓情況更加嚴峻。
另據The Information爆料,Meta生成AI小組和基礎設施團隊的經理和工程師已開設了四個作戰室來學習DeepSeek的工作原理。
其中兩個動員起來的小組正在試圖瞭解High-Flyer如何降低訓練和運行DeepSeek的成本。第三個Meta研究小組正在試圖弄清楚High-Flyer可能使用哪些數據來訓練其模型。第四作戰室正在考慮基於DeepSeek模型屬性重構Meta模型的新技術。
AI科技初創公司Scale AI創始人亞歷山大·王(Alexandr Wang)接受電視媒體公開採訪時表示,中國人工智能公司DeepSeek的AI大模型性能大致與美國最好的模型相當。過去十年來,美國可能一直在人工智能競賽中領先於中國,但DeepSeek的AI大模型發佈可能會“改變一切”。
Meta創始人兼CEO扎克伯格表示,DeepSeek非常先進,並認爲中美之間的AI差距非常小。
扎克伯格還表示,中國正在全力衝刺,如果將來有一個開源模型能被全世界廣泛使用,我們希望它是一個美國模型。