歷史性一刻! DeepSeek超越ChatGPT 登頂美區蘋果應用榜
歷史性一刻,DeepSeek超越ChatGPT,登頂美區蘋果應用榜。(圖:shutterstock)
據觀察者網報導,由陸企研發的DeepSeek-V3模型發佈後,在美國熱度持續飆升。截至臺北時間今早,DeepSeek在美區蘋果App Store免費榜上已經排在第一位,力壓此前霸榜的ChatGPT,而排在第三的則是Meta旗下的Threads。
而就在昨天早上,DeepSeek還沒有擠進榜單前五,顯示出過去24小時發酵速度之快。對於一款中國大模型來說,能夠在美國力壓ChatGPT,也是歷史性一刻。
除了C端用戶的喜愛,DeepSeek也持續引發行業內的高度重視。
1月25日,超微半導體(AMD)在其X帳號上宣佈,已將中國人工智能公司深度求索的DeepSeek-V3模型集成到AMD Instinct MI300X GPU上,以在SGLang技術支持下,實現極致性能。選擇將DeepSeek大模型集成至自家AI晶片產品上,AMD或重塑全球AI晶片競爭格局。
AMD表示,DeepSeek-V3作爲強大的混合專家(MoE)語言模型。爲實現高效推理與經濟性訓練,該模型延續了前代產品DeepSeek-V2的核心架構——多頭潛在注意力機制(MLA)和DeepSeekMoE架構。在多數基準測試中,特別是數學與代碼任務領域,DeepSeek-V3均展現出業界領先性能。
在通常情況下,像DeepSeek-V3這種語言大模型推理過程中,普遍都需要大量的計算資源和記憶體頻寬來處理文本和視覺數據,AMD則認爲自家Instinct GPU系列AI晶片可以爲運行此類大模型,提供出色性能。
公開信息顯示,MI300X是 AMD於2023 年底推出的旗艦級AI晶片,專爲大語言模型和高性能計算設計,旨在挑戰競爭對手輝達(Nvidia)在AI計算領域的主導地位。其基於CDNA 3架構,採用混合5奈米和6奈米制程工藝,集成1530億晶體管,配備192GB記憶體,擁有5300GB/s的頻寬。在不考慮軟體層面問題,僅從硬體規格上看,MI300X遠超輝達的H100甚至H200。
AMD稱,深度求索團隊在DeepSeek-V3的開發過程的關鍵階段,採用了AMD ROCm 軟體和AMD Instinct GPU加速器。ROCm對FP8格式的廣泛支持,能顯著提升AI模型的運行效率,特別是在推理環節。該技術可以解決內存瓶頸及高讀寫格式相關的高延遲問題,而FP8低精度計算還能減少數據傳輸與計算過程中的延遲。因此,通過與深度求索的合作,AMD也爲用戶提供了更豐富的GPU硬體選擇。
另一方面,隨着AI浪潮對高算力晶片的需求,輝達的股價水漲船高,如今已超越蘋果公司登頂全球市值最高寶座,而同期的AMD不論市佔率和產品性能,相對於輝達都全面處於明顯劣勢。受此影響,雖然AMD也享受了AI爆發帶來的紅利,但股價自去年10月的172.8美元以來已下跌近30%,與同年3月創下的211.38美元最高點相比更是跌幅超40%。
不過,轉機或已出現。2024年底,深度求索發佈DeepSeek-v3時,技術報告中稱正式訓練成本僅爲550萬美元成本,使用的也是輝達H800晶片(美出口管制下,針對中國市場特供版H100),這和美國OpenAI以及Meta公司動輒上億美元的大模型相比,便宜到令美國人自我懷疑。前幾天,深度求索又發佈了DeepSeek-R1模型,作爲開源軟體直接比肩閉源的OpenAI的o1大模型,一度引發市場關注。
越來越多的投資者開始反思,AI計算對輝達GPU的需求是否被資本人爲誇大了?因爲深度求索團隊已經展示瞭如何通過超低成本,以及使用「不那麼先進的晶片」,同樣可以構建出高品質AI模型。倘若如此,這意味着訓練大模型也不用一味去追求輝達那「一卡難求」的旗艦晶片,這時「不那麼能打」但在硬體方面性價比更高的AMD產品,則看上去更「Yes」了。
目前,華爾街分析師普遍看好AMD。包括花旗集團、路通資本等近30名分析師都給出了「買入」意見,這些預測將AMD未來一年平均目標價推上了182.7美元,出現了48.73%的上漲空間。還有更激進的預測認爲,若AMD的PEG比率迴歸行業中樞(科技行業在3倍上下),其估值可能進一步提升130%以上,達到265美元。
與此同時,輝達股價則出現下跌。1月24日,輝達收報142.62點,跌幅3.12%,盤後又下跌0.42%,反映出投資者對其市場主導地位的擔憂。