英偉達就DeepSeek發表聲明:R1模型是一項出色的AI進步

鞭牛士報道,1月28日消息,據CNBC報道,英偉達稱 DeepSeek 的 R1 模型是一項出色的人工智能進步,儘管這家中國初創公司的崛起導致這家芯片製造商的股價在週一暴跌 17%。

Nvidia 發言人週一向 CNBC 表示:DeepSeek 是一項出色的 AI 進步,也是測試時間擴展的完美範例。DeepSeek 的工作展示瞭如何使用該技術創建新模型,利用廣泛使用的模型和完全符合出口管制的計算。

上週,DeepSeek 發佈了 R1,這是一個開源推理模型,據報道,其表現優於 OpenAI 等美國公司的最佳模型。R1 自報的培訓成本不到 600 萬美元,這只是硅谷公司爲構建人工智能模型所花費的數十億美元的一小部分。

Nvidia 的聲明表明,它認爲 DeepSeek 的突破將爲這家美國芯片製造商的圖形處理單元 (GPU) 創造更多的工作。

該發言人補充道:推理需要大量 NVIDIA GPU 和高性能網絡。我們現在有三條擴展法則:繼續進行預訓練和後訓練,以及新的測試時間擴展。

Nvidia 還表示,DeepSeek 使用的 GPU 完全符合出口要求。這與 Scale AI 首席執行官 Alexandr Wang上週在 CNBC 上發表的評論相矛盾,後者認爲 DeepSeek 使用的是中國禁止使用的 Nvidia GPU 型號。

DeepSeek 表示,它使用的是專爲中國市場設計的 Nvidia GPU 的特殊版本。

分析師們現在正在問,微軟,谷歌和Meta等公司數十億美元的資本投資是否基於 Nvidia 的 AI 基礎設施被浪費了,因爲相同的結果可以更便宜地實現。

本月早些時候,微軟表示,僅在 2025 年,它就會在人工智能基礎設施上投入 800 億美元,而 Meta 首席執行官馬克·扎克伯格上週表示,作爲其人工智能戰略的一部分,這家社交媒體公司計劃在 2025 年投資 600 億至 650 億美元資本支出。

美國銀行證券分析師賈斯汀·波斯特 (Justin Post) 在週一的一份報告中寫道:如果模型訓練成本被證明可以大幅降低,我們預計,使用雲 AI 服務的廣告、旅遊和其他消費應用公司將在短期內獲得成本效益,而長期來看,超大規模 AI 相關的收入和成本可能會更低。

Nvidia 的評論也反映了 Nvidia 首席執行官黃仁勳 (Jensen Huang)、OpenAI 首席執行官 Sam Altman 和微軟首席執行官薩蒂亞·納德拉 (Satya Nadella) 近幾個月來討論的一個新主題。

人工智能的熱潮和對 Nvidia GPU 的需求很大程度上是由“縮放定律”推動的,這是 OpenAI 研究人員在 2020 年提出的人工智能開發概念。該概念表明,可以通過大大擴展構建新模型所需的計算量和數據量來開發更好的人工智能系統,從而需要越來越多的芯片。