美學者看新模型…限制條件、資源匱乏 激發陸創新
中國AI新創公司DeepSeek推出與ChatGPT功能不相上下的新模型,引發許多討論。(圖/取材自微博)
中國新創公司深度求索(DeepSeek)訓練成本低廉,表現不亞於美國最優秀的大型AI語言模型,對於美國晶片管制是否有效限制中國AI發展,科技業界議論紛紛。
路透等媒體報導,自DeepSeek-V3推出以來,這款AI應用程式在美國用戶中人氣激增。從編寫複雜的程式到解決困難的計算,DeepSeek的能力不遜於競爭對手,令業內人士感到驚訝。
分析師長期以來認爲,美國在生產高功率晶片方面的關鍵優勢,以及限制中國取得相關技術的能力,將確保美國在AI競賽中佔據優勢地位。
然而,DeepSeek表示,訓練一款新模型的成本爲五百六十萬美元,相比之下,美國AI開發商Anthropic執行長阿莫戴去年曾表示,打造一個AI模型需要花費一億至十億美元。DeepSeek在一份技術報告中表示,他們僅用兩千多顆輝達晶片來訓練其V3模型。相比之下,訓練類似規模的模型通常需要數萬顆晶片。
美國政府試圖阻止最先進輝達產品進入中國,儘管DeepSeek上述花費遭質疑,但據悉其使用的晶片性能不及最先進輝達產品,加上相對低廉的訓練成本,已引發美科技業高層質疑科技出口管制有效性。
美國加州大學柏克萊分校電腦科學教授伊恩.斯托伊卡指出,限制條件和資源匱乏往往會激發創新,目前的情況似乎就是如此。美國總統川普的親密顧問、創投家安德立森形容這是「AI的史普尼克時刻」。史普尼克時刻意指蘇聯搶先美國發射「史普尼克一號」人造衛星的事件,象徵冷戰時期太空競賽的起點。