☰

缺先進晶片卻靠技術超車中國追趕西方AI模型速度驚人

雖然無法獲得最先進晶片，中國的AI新創公司追趕美國領先的人工智慧模型的速度極快，已超出許多業內人士的預期。（圖／Shutterstock)

儘管中國在購買先進晶片方面受限，但愈來愈多的有跡象表明，中國的AI新創公司追趕美國領先的人工智慧模型的速度極快，已超出許多業內人士的預期。雖然有些模型仍未正式發表與測試，但據看過這些模型運作的專家表示，這些人工智慧模型的進展「令人印象深刻」。

據《華爾街日報》報導，以中國最成功的避險基金經理人之一投資的新創公司 DeepSeek爲例，該公司於11月發佈其最新大型語言模型的預覽版。該公司表示，這款大型語言模型能力與OpenAI名爲o1的推理模型相比毫不遜色。

與此同時，最近幾周其他中國公司也發表類似的聲明。由中國網路巨擘阿里巴巴和騰訊投資的新創公司月之暗面 (Moonshot AI) 表示，其開發一個專門研究數學的模型，其能力接近 OpenAI 的 o1。另一方面，阿里巴巴表示自家的一個實驗研究模型在數學上優於 OpenAI 的 o1 預覽版本。

報導指出，雖然這些公司尚未發表描述其模型內容的論文，但許多專家表示，對這些模型印象深刻。OpenAI前研究員、現任人工智慧企業家卡爾 (Andrew Carr)表示，中國「正在更快地迎頭趕上」。卡爾認爲，試圖複製OpenAI推理模型的DeepSeek研究人員「在幾個月內就弄清楚了」，他坦言許多同事對此感到驚訝。

DeepSeek 稱其模型在美國國際數學邀請賽 (AIME) 上擊敗了 OpenAI。但《華爾街日報》利用今年 AIME 的 15 個問題進行的一項實驗發現，OpenAI 的 o1 預覽模型比 DeepSeek、Moonshot 和阿里巴巴的實驗模型更快找到了答案。

報導指出，自去年年底以來，AI 開發人員越來越多使用一種名爲「混合專家模型」(Mixture of Experts, MoE) 的技術，這種技術能降低對晶片的需求。

AI 新創公司 Anthropic 的聯合創始人克拉克（Jack Clark）在他的部落格中寫道：「中國繞過出口管制的一種方法是，利用它可以訪問的硬體建立非常好的軟體和硬體培訓。」他稱：「中國製造將成爲 AI 模型的一部分，就像電動車、無人機和其他技術一樣。」儘管如此，據中國高層稱，缺乏尖端晶片對中國新創企業來說是痛苦的，而且差距還會擴大。

缺先進晶片卻靠技術超車 中國追趕西方AI模型速度驚人

相關資訊

缺先進晶片卻靠技術超車中國追趕西方AI模型速度驚人