一文看懂DeepSeek! 橫空出世「AI黑馬」衝擊美股
▲中國AI黑馬DeepSeek震撼晶片市場。(圖/路透)
記者張靖榕/綜合報導
中國AI新創公司DeepSeek(深度求索)以低成本訓練出高效能AI模型,顛覆業界對於AI訓練必須依賴昂貴晶片的既定印象。此舉不僅震撼全球AI產業,也對美國科技類股造成衝擊,美國總統川普(Donald Trump)金主兼矽谷創投家安德森(Marc Andreessen)認爲,這是人工智慧領域「最令人驚歎、最令人印象深刻的突破之一」。
美國科技股慘遭血洗
《中央社》、《華爾街日報》報導,與科技類股相關的那斯達克指數下跌3.1%,標普500指數下跌1.5%,結束上週創下的歷史新高。多家科技企業遭遇雙位數跌幅,博通(Broadcom)單日重挫17%,甲骨文(Oracle)也下跌14%,美超微(Super Micro Computer)跌幅也達到13%。整體來看,美股市值單日蒸發約1兆美元(約新臺幣32兆元)。
DeepSeek的背景與帶來的衝擊
DeepSeek是由中國量化基金公司幻方量化(High-Flyer Quantitative)創立的AI新創公司,去年12月26日推出其核心產品DeepSeek-V3語言模型,效能可媲美OpenAI的ChatGPT和Google的Gemini。其在一份說明技術構建的研究論文中聲稱訓練成本僅約560萬美元,所需晶片數量更遠少於業界普遍標準的1.6萬片輝達晶片,僅使用約2000片,頓時讓全球業界爲之震撼。
若照DeepSeek所稱,他們以僅花費560萬美元和相對原始的運算能力訓練自家系統,花費便是Meta打造旗下最新AI所花資金的僅10分之1,這個驚人對比,再度引發業界對於研究AI是否動輒得花天文數字的資金的疑慮。
這項技術突破的關鍵在於數據處理方式的創新。DeepSeek將數據分析工作分配給多個專精不同領域的小模型,以提升效率並降低運算需求。這種方法雖然非首創,但DeepSeek成功以更少的運算資源實現了過去難以企及的效果。
業界質疑DeepSeek的低成本並非全貌
儘管DeepSeek的技術成果令人驚豔,但也引發了一些質疑。例如,伯恩斯坦(Bernstein)分析師Stacy Rasgon表示,DeepSeek所宣稱的低成本存在疑點,可能未完整披露背後的語言模型成本。此外,有觀點認爲,DeepSeek的成果部分依賴於中東及其他地區的算力租用,以及中國從新加坡和中東進口晶片的操作。
美國更加警覺,晶片嚴格恐再收緊
美國政府過去爲遏制中國AI發展,對高階晶片出口實施了嚴格限制。然而,DeepSeek的成就表明,中國研究人員正在透過創新手段突破限制。美國國會部分議員已呼籲川普新政府進一步強化出口管制,包括禁止銷售輝達降階版H20晶片。
DeepSeek鼓舞其他國家
DeepSeek的成功不僅對中國AI生態具有指標意義,也對全球產生深遠影響。例如,法國政府認爲DeepSeek證明了有限資源下仍可實現AI創新,爲歐洲及其他地區追趕矽谷提供了信心。
引發企業對於AI成本的反思
雖然部分專家認爲,DeepSeek的技術並不會立即顛覆全球AI產業,但其低成本訓練方法無疑將引發行業內部的深刻反思。隨着美國科技巨頭和政府進一步應對這一挑戰,未來AI領域的競爭將更加白熱化。