陸DeepSeek符合美國出口限制 輝達推論需要更多GPU

針對DeepSeek推出性價比高的AI模型,輝達指出符合美國的出口限制,但AI推理仍需要更多GPU。(圖/柳名耕攝)

DeepSeek以遠低大型AI模型公司硬體的成本,發展出類似效能的模型,引起市場對高算力需高投資說法的疑慮。AI晶片龍頭輝達股價重挫近17%,市值蒸發5888億美元,輝達發出聲明,指出DeepSeek的運算符合美國出口限制,且推論仍需要大量輝達的GPU。

大陸AI模型公司DeepSeek最新的AI模型訓練成本僅560萬美元,反觀AI模型龍頭OpenAI的GPT模型訓練成本卻超過1億美元,雖然DeepSeek的模型是由既有模型重新訓練而成,但也讓市場認爲AI模型是否不需要設置太多的硬體,以降低資本支出。

輝達隨即發表聲明,表示DeepSeek展現出的成果,顯示出如何用廣泛可利用的模型,去建立新的模型,其運算也完全符合美國的出口管制,但仍強調,模型的推論仍需要大量輝達的GPU以及高效能的網路。

DeepSeek的論文指出,最新模型DeepSeek-R1僅使用約2000張輝達的H800的GPU,該晶片算力符合美國在2022年的出口管制措施,因此市場傳出即使限制晶片算力,仍擋不住大陸AI在軟體的發展。