☰

歷史性一刻！ DeepSeek超越ChatGPT 登頂美區蘋果應用榜

歷史性一刻，DeepSeek超越ChatGPT，登頂美區蘋果應用榜。（圖：shutterstock）

據觀察者網報導，由陸企研發的DeepSeek-V3模型發佈後，在美國熱度持續飆升。截至臺北時間今早，DeepSeek在美區蘋果App Store免費榜上已經排在第一位，力壓此前霸榜的ChatGPT，而排在第三的則是Meta旗下的Threads。

而就在昨天早上，DeepSeek還沒有擠進榜單前五，顯示出過去24小時發酵速度之快。對於一款中國大模型來說，能夠在美國力壓ChatGPT，也是歷史性一刻。

除了C端用戶的喜愛，DeepSeek也持續引發行業內的高度重視。

1月25日，超微半導體（AMD）在其X帳號上宣佈，已將中國人工智能公司深度求索的DeepSeek-V3模型集成到AMD Instinct MI300X GPU上，以在SGLang技術支持下，實現極致性能。選擇將DeepSeek大模型集成至自家AI晶片產品上，AMD或重塑全球AI晶片競爭格局。

AMD表示，DeepSeek-V3作爲強大的混合專家（MoE）語言模型。爲實現高效推理與經濟性訓練，該模型延續了前代產品DeepSeek-V2的核心架構——多頭潛在注意力機制（MLA）和DeepSeekMoE架構。在多數基準測試中，特別是數學與代碼任務領域，DeepSeek-V3均展現出業界領先性能。

在通常情況下，像DeepSeek-V3這種語言大模型推理過程中，普遍都需要大量的計算資源和記憶體頻寬來處理文本和視覺數據，AMD則認爲自家Instinct GPU系列AI晶片可以爲運行此類大模型，提供出色性能。

公開信息顯示，MI300X是 AMD於2023 年底推出的旗艦級AI晶片，專爲大語言模型和高性能計算設計，旨在挑戰競爭對手輝達（Nvidia）在AI計算領域的主導地位。其基於CDNA 3架構，採用混合5奈米和6奈米制程工藝，集成1530億晶體管，配備192GB記憶體，擁有5300GB／s的頻寬。在不考慮軟體層面問題，僅從硬體規格上看，MI300X遠超輝達的H100甚至H200。

AMD稱，深度求索團隊在DeepSeek-V3的開發過程的關鍵階段，採用了AMD ROCm 軟體和AMD Instinct GPU加速器。ROCm對FP8格式的廣泛支持，能顯著提升AI模型的運行效率，特別是在推理環節。該技術可以解決內存瓶頸及高讀寫格式相關的高延遲問題，而FP8低精度計算還能減少數據傳輸與計算過程中的延遲。因此，通過與深度求索的合作，AMD也爲用戶提供了更豐富的GPU硬體選擇。

另一方面，隨着AI浪潮對高算力晶片的需求，輝達的股價水漲船高，如今已超越蘋果公司登頂全球市值最高寶座，而同期的AMD不論市佔率和產品性能，相對於輝達都全面處於明顯劣勢。受此影響，雖然AMD也享受了AI爆發帶來的紅利，但股價自去年10月的172.8美元以來已下跌近30％，與同年3月創下的211.38美元最高點相比更是跌幅超40％。

不過，轉機或已出現。2024年底，深度求索發佈DeepSeek-v3時，技術報告中稱正式訓練成本僅爲550萬美元成本，使用的也是輝達H800晶片（美出口管制下，針對中國市場特供版H100），這和美國OpenAI以及Meta公司動輒上億美元的大模型相比，便宜到令美國人自我懷疑。前幾天，深度求索又發佈了DeepSeek-R1模型，作爲開源軟體直接比肩閉源的OpenAI的o1大模型，一度引發市場關注。

越來越多的投資者開始反思，AI計算對輝達GPU的需求是否被資本人爲誇大了？因爲深度求索團隊已經展示瞭如何通過超低成本，以及使用「不那麼先進的晶片」，同樣可以構建出高品質AI模型。倘若如此，這意味着訓練大模型也不用一味去追求輝達那「一卡難求」的旗艦晶片，這時「不那麼能打」但在硬體方面性價比更高的AMD產品，則看上去更「Yes」了。

目前，華爾街分析師普遍看好AMD。包括花旗集團、路通資本等近30名分析師都給出了「買入」意見，這些預測將AMD未來一年平均目標價推上了182.7美元，出現了48.73％的上漲空間。還有更激進的預測認爲，若AMD的PEG比率迴歸行業中樞（科技行業在3倍上下），其估值可能進一步提升130％以上，達到265美元。

與此同時，輝達股價則出現下跌。1月24日，輝達收報142.62點，跌幅3.12％，盤後又下跌0.42％，反映出投資者對其市場主導地位的擔憂。

歷史性一刻！ DeepSeek超越ChatGPT 登頂美區蘋果應用榜

相關資訊