美中研發AI競爭 DeepSeek智取美國 竟是靠一羣菜鳥工程師

中國人工智慧(AI)新創公司DeepSeek靠着一羣初生之犢的年輕工程師,加上美國對於先進晶片出口管制存有漏洞,在研發人工智慧的競爭當中智取美國。(歐新社)

華爾街日報(WSJ)28日報導,中國人工智慧(AI)新創公司DeepSeek靠着一羣初生之犢的年輕工程師,加上美國對於先進晶片出口管制存有漏洞,在研發人工智慧的競爭當中智取美國。川普總統便說,DeepSeek給美國AI一記當頭棒喝。

DeepSeek共同創辦人樑文鋒(Liang Wenfeng)選擇在杭州成立公司,杭州也是中國電商巨頭阿里巴巴(Alibaba)所在地。樑文鋒2023年接受中國科技媒體「36氪」採訪時說,DeepSeek核心技術崗位大多由應屆畢業生或具有一、兩年工作經驗者擔任。

樑文鋒說,工作經驗反而可能變成潛在障礙。他表示,做某件事情的時候,有經驗的人毫不猶豫便說該怎麼做,沒經驗的人則要反覆摸索、認真思考怎麼做,才能爲眼前狀況找出解決對策。

DeepSeek策略是減少訓練AI模型時需要的數據處理,改用自行研發的計劃,並且採用其他中國AI公司使用的技術,訓練AI的成本只須競爭對手花費的一小部分。

另外一點是美國當初推出出口管制時不順,讓DeepSeek有時間買到高效能的美國晶片。拜登政府2022年開始管制對中國出口的晶片,規定賣到中國的晶片需要取消某一功能。AI晶片主要廠家輝達設計出一個給中國的產品,既能符合規定 ,又以其他方式保持晶片的高效能,結果一些分析員說,成品幾乎和當時最好的輝達晶片一樣強大 。

政府官員抱怨輝達雖未違法,卻違背規定的精神。管制出口一年後,政府收緊規定。不過,這仍讓DeepSeek有一年的時間買到輝達爲中國市場生產、名爲H800的晶片。在去年12月公佈的研究論文中,DeepSeek說它用了2048片這種晶片來訓練其中一個AI模型 。

科技股受到DeepSeek震撼27日全面走跌,28日止跌回升,史坦普500(S&P 500)小漲0.92%,爲6067.70點。那斯達克綜合指數上漲2.03%,爲19733.59點。