時代雜誌:DeepSeek恐慌是否被誇大了?

鞭牛士報道,1月31日消息,據時代雜誌報道,本週,硅谷、華盛頓特區、華爾街等地的領導人因中國人工智能公司DeepSeek的意外崛起而陷入混亂。

DeepSeek 最近發佈的人工智能模型可與 OpenAI 相媲美,而且價格似乎只是後者的一小部分,儘管美國出臺了旨在減緩中國進步的政策。

因此,許多分析師認爲 DeepSeek 的成功破壞了推動美國人工智能行業發展的核心信念,而 Nvidia 和 Microsoft 等引領這一變革的公司並不像之前認爲的那樣有價值或技術領先。科技股在幾天內下跌了數千億美元。

但人工智能科學家反駁說,許多擔憂都是誇大其詞。他們表示,儘管 DeepSeek 確實代表了人工智能效率的真正進步,但它並不是一項重大的技術突破——而且美國人工智能行業仍然比中國具有關鍵優勢。

蘭德公司人工智能研究員倫納特·海姆表示:這並不是人工智能前沿能力的飛躍。我認爲市場只是搞錯了。

以下是關於 DeepSeek 的含義的幾種廣爲流傳的說法,以及科學家認爲它們不完整或完全錯誤的原因。

聲明:DeepSeek 比其他模型便宜得多。

去年 12 月,DeepSeek 報告稱其 V3 模型的訓練成本僅爲 600 萬美元。與 OpenAI 聲稱的訓練GPT-4 所花費的1 億多美元,以及 Anthropic 訓練其最新版本的 Claude 模型所花費的幾千萬美元相比,這個數字似乎低得驚人。

DeepSeek 的較低價格得益於一些巨大的效率提升,公司研究人員在發佈模型時發表的論文中描述了這一點。但這些提升是否出乎意料?海姆認爲並非如此:機器學習算法隨着時間的推移一直在變得更便宜。

人工智能公司 Anthropic 的首席執行官達里奧·阿莫迪 (Dario Amodei)在 1 月 28 日發表的一篇文章中表達了同樣的觀點,他寫道,雖然 DeepSeek 研究人員的效率提升令人印象深刻,但它們並不是獨特的突破或從根本上改變法學碩士經濟效益的東西。

他寫道:這是持續成本降低曲線上的一個預期點。這次的不同之處在於,第一個展示預期成本降低的公司是中國公司。

更讓人難以理解的是,DeepSeek 可能也沒有完全誠實地說明其開支情況。在有關其模型訓練成本低廉的傳言出現後,科技公司首席執行官援引報道稱,DeepSeek 實際上擁有 50,000 塊 Nvidia 芯片,但由於美國出口管制,該公司無法透露這些芯片的價格。這些芯片的價格約爲 10 億美元。

然而,DeepSeek 的新 R1 模型確實比其競爭對手 OpenAI o1 模型便宜得多,其模型訪問費用大約低 30 倍(每百萬代幣或輸出的單詞片段 2.19 美元,而 OpenAI o1 爲 60 美元)。這引發了一些投資者對美國人工智能行業即將爆發價格戰的擔憂,這可能會降低預期的投資回報,並使美國公司更難籌集建設新數據中心以支持其人工智能模型所需的資金。

美國科學家聯合會人工智能和新興技術政策副主任奧利弗·斯蒂芬森 (Oliver Stephenson) 表示,人們不應該根據這個價格點得出結論。

「雖然 DeepSeek 確實提高了效率,但他們的定價可能是一種吸引眼球的策略。」他說。「他們可能會在推理上虧本。」(推理是已經形成的人工智能系統的運行。)

1 月 27 日星期一,DeepSeek表示其遭受網絡攻擊,並限制中國以外用戶的新註冊。

聲明:DeepSeek 表明出口管制不起作用。

2022 年,當人工智能軍備競賽升溫時,拜登政府採取行動切斷中國獲取尖端芯片的渠道,其中最著名的是英偉達的 H100。結果,英偉達製造了一款劣質芯片 H800,合法出售給中國公司。拜登政府後來還選擇禁止向中國出售這些芯片。但一年後,當這些額外的管制措施生效時,中國公司已經囤積了數千臺 H800,爲英偉達帶來了鉅額意外之財。

DeepSeek 表示,其 V3 模型是使用 H800 構建的,對於該公司正在創建的模型類型而言,其性能已經足夠。但儘管取得了這一成功,專家們認爲芯片控制可能阻止了中國進一步發展。

卡內基國際和平基金會技術與國際事務項目訪問學者斯科特·辛格 (Scott Singer) 表示:在中國擁有更多計算能力的環境中,我們預計會取得更多突破。出口管制可能正在發揮作用,但這並不意味着中國將無法構建越來越強大的模型。

展望未來,由於芯片的限制,DeepSeek 和其他中國公司可能越來越難以跟上前沿模型的步伐。OpenAI 的 GP4 訓練了大約 10,000 個 H100,而下一代模型可能需要十倍或一百倍的數量。即使中國能夠通過提高效率來構建強大的模型,出口管制也可能限制他們將模型部署到廣泛用戶羣的能力。

「如果我們認爲未來人工智能代理會代替某人工作,那麼你有多少數字工作者取決於你有多少計算能力。」Heim 說。「如果人工智能模型不能得到如此廣泛的使用,這將限制它對世界的影響。」

觀點:Deepseek 表明高端芯片並不像人們想象的那麼有價值。

隨着本週 DeepSeek 的炒作不斷升溫,許多投資者認爲,該公司的成就威脅到了英偉達在人工智能領域的主導地位,因此拋售了這家今年 1 月全球市值最高的公司的股票。結果,英偉達股價週一下跌 17%,市值縮水近 6000 億美元,原因是投資者認爲,在這種新模式下,英偉達的芯片價值會降低。

但許多人工智能專家認爲,英偉達股價下跌是市場不理性的表現。他們中的許多人急於逢低買入,導致股價收復部分失地。

他們指出,從歷史上看,計算能力效率的提高導致對芯片的需求增加,而不是減少。隨着科技股下跌,微軟首席執行官薩蒂亞·納德拉 (Satya Nadella)在 X 上發佈了傑文斯悖論維基百科頁面的鏈接。

傑文斯悖論最早出現在 19 世紀,以一位經濟學家的名字命名,他指出,隨着煤炭燃燒效率的提高,人們實際上使用了更多的煤炭,因爲煤炭變得更便宜,也更廣泛地可用。

專家認爲,在開發先進人工智能的競爭中也會出現類似的情況。「我們看到的是建立在 Nvidia 產品基礎上的令人印象深刻的技術突破,隨着你使用 Nvidia 產品的次數增加,它會變得更好。」斯蒂芬森說。「這似乎不是一種 Nvidia 產品需求減少的情況。」

就職兩天後,唐納德·特朗普總統宣佈成立一家價值 5000 億美元的公私合資企業,建設人工智能數據中心,其理念是規模對於構建最強大的人工智能系統至關重要。然而,DeepSeek 的崛起讓許多人認爲這種方法是錯誤的或浪費的。

但一些人工智能科學家不同意這種觀點。

「DeepSeek 表明人工智能正在不斷進步,而且不會停止。」海姆說。「如果人工智能得到使用,它將對經濟產生巨大影響,因此此類投資是有意義的。」

美國領導層已表示,DeepSeek 讓他們更加渴望建立 AI 基礎設施,以保持該國的領先地位。特朗普在週一的新聞發佈會上表示,DeepSeek應該爲我們行業敲響警鐘,我們需要全神貫注於競爭才能取勝。

然而,斯蒂芬森警告稱,數據中心的建設將帶來大量的外部負面因素。數據中心通常使用大量電力,同時伴隨着當地電費的大幅上漲,並威脅到供水,他補充道:在進行這些基礎設施建設時,我們將面臨很多問題。