陸企 DeepSeek 接連推出大模型 陸媒:引發 Meta 內部焦慮
總部位於杭州的大陸AI新創公司「深度求索」(DeepSeek),去年底、1月20日先後發佈了「DeepSeek-V3」和「DeepSeek-R1」兩款大模型,由於成本低廉,性能與OpenAI相當,陸媒指此舉引發矽谷震驚,甚至引發Meta內部焦慮。(取自DeepSeek官網)
總部位於杭州的大陸AI新創公司「深度求索」(DeepSeek),去年底、1月20日先後發佈了「DeepSeek-V3」和「DeepSeek-R1」兩款大模型,由於成本低廉,性能與OpenAI相當,陸媒指此舉引發矽谷震驚,甚至引發Meta內部焦慮,工程師開始連夜嘗試複製DeepSeek的成果。
陸媒「每日經濟新聞」26日報導,在美國總統川普宣佈5000億美元的「星際之門」(Stargate)發展人工智慧基礎建設計劃之際,DeepSeek以極低的價格建立了突破性的AI模型,且未使用尖端晶片,讓人們質疑,AI行業數千億美元資本的鉅額投入,是否真爲最有效的方法?
報導回顧,去年12月27日,DeepSeek推出開源模型「DeepSeek-V3」。AI系統排名網站「聊天機器人競技場」(Chatbot Arena)顯示,「DeepSeek-V3」在所有模型中排名第7,在開源模型排第1。且「DeepSeek-V3」是全球前十中,性價比最高的模型。
不到1個月,今年1月20日,DeepSeek再推出「DeepSeek-R1」,24日,「DeepSeek-R1」在聊天機器人競技場綜合榜單上排名第3,與頂尖推理模型、OpenAI推出的o1並列。同時,測評機構「Artificial-Analysis」對「DeepSeek-R1」的初始基準測試結果也顯示,「DeepSeek-R1」在AI分析質量指數中取得第2高分,價格則是o1的約30之1。
「每日經濟新聞」稱,24日,一篇發佈在匿名平臺teamblind上的文章瘋傳,一位自稱是Meta員工稱,Meta內部因爲DeepSeek模型進入恐慌模式,該文員工寫道,「DeepSeek-V3」在基準測試中,已經讓(Meta推出的)Llama 4相形見絀,而更讓人難堪的是,一家「僅用550萬美元訓練預算的中國公司」就做到了這一點。
該匿名文指,工程師正爭分奪秒分析DeepSeek,試圖複製其中的一切可能技術。另外,「DeepSeek-R1」的出現,也讓情況更加嚴峻。
《金融時報》25日稱,中國的小型AI新創公司DeepSeek震驚矽谷,加州大學柏克萊分校AI政策研究員古普塔(Ritwik Gupta)表示,DeepSeek最近發佈的模型,表明「AI能力沒有護城河」。古普塔也提到,中國的系統工程師人才庫比美國大得多,懂得如何充分利用計算資源,來更便宜地訓練、運行模型。
延伸閱讀
AI 模型功能佳價格卻超佛 陸新創公司 DeepSeek 有何來頭?