DeepSeek是什麼?如何顛覆美國、矽谷AI佈局
中國AI新星震撼矽谷,DeepSeek重塑AI發展格局。(示意圖:shutterstock/達志)
中國大陸AI新創公司DeepSeek推出的最新模型DeepSeek-R1,以突破性的性能比擬知名模型如OpenAI的ChatGPT和Meta的Llama模型,在一些應用領域中,性能甚至已經超越業界所謂的領先系統,而成本卻不到2億新臺幣,遠低於動輒數億美元的傳統AI模型訓成本成爲矽谷和全球熱議焦點。
DeepSeek-R1在數學、程式設計與複雜問題解決等任務中的推理表現,已與OpenAI的o1等領先模型匹敵,甚至在部分指標上超越,而模型開發成本僅約600萬美元(約新臺幣1.97億元),模型的開發僅耗時兩個月,而且使用的是輝達(Nvidia)相對較舊的H800 GPU晶片進行訓練,相較於Meta和OpenAI等美國科技巨頭動輒數億美元的訓練開支,顯得格外高效。
這一突破引發了對AI產業競爭格局的廣泛討論。分析人士認爲,DeepSeek-R1可能促使業界從一味追求超大模型的競賽,轉向更重視效率與設計的策略。
DeepSeek採用開放原始碼的做法,完全開源使得DeepSeek-R1可以讓全世界的開發人員都能使用,挑戰了當前以封閉爲主的AI產業現狀,不僅提升了技術透明度和降低門檻,還爲研究人員和開發者提供了深入參與的機會,有望掀起新一波的開源AI發展浪潮。
DeepSeek的AI助手應用最近快速登上手機應用商店排行榜首,顯示出廣大用戶對這項技術的興趣與支持。DeepSeek-R1的中國背景爲這一技術突破增添了地緣政治色彩。在美中科技競爭日益激烈的背景下,這一進展既引發對技術領先地位的關注,也彰顯全球創新的多樣性。
路透社報導指出,受到中國大陸DeepSeek-R1 AI模型快速崛起影響,納斯達克指數期貨週一(27日)大幅下挫,AI相關股賣壓涌現,其中輝達(Nvidia)跌幅最大,DeepSeek的App已經超越ChatGPT,成爲美國蘋果App Store下載量最高的免費應用程式。
使用低成本晶片與更少的資料訓練,衝擊了原先市場對於AI需求,將推動晶片製造與數據中心產業增長的預期,輝達股價在盤前交易中暴跌6.9%,超微與美光分別下跌3.7%與6.4%。微軟與Meta跌幅均爲3.3%,Google母公司Alphabet下跌3.2%,蘋果跌1.4%。AI伺服器製造商戴爾與美超微(Super Micro Computer)則各下跌約8%。