缺先進晶片卻靠技術超車 中國追趕西方AI模型速度驚人
雖然無法獲得最先進晶片,中國的AI新創公司追趕美國領先的人工智慧模型的速度極快,已超出許多業內人士的預期。(圖/Shutterstock)
儘管中國在購買先進晶片方面受限,但愈來愈多的有跡象表明,中國的AI新創公司追趕美國領先的人工智慧模型的速度極快,已超出許多業內人士的預期。雖然有些模型仍未正式發表與測試,但據看過這些模型運作的專家表示,這些人工智慧模型的進展「令人印象深刻」。
據《華爾街日報》 報導,以中國最成功的避險基金經理人之一投資的新創公司 DeepSeek爲例,該公司於11月發佈其最新大型語言模型的預覽版。該公司表示,這款大型語言模型能力與OpenAI名爲o1的推理模型相比毫不遜色。
與此同時,最近幾周其他中國公司也發表類似的聲明。由中國網路巨擘阿里巴巴 和騰訊投資的新創公司月之暗面 (Moonshot AI) 表示,其開發一個專門研究數學的模型,其能力接近 OpenAI 的 o1。另一方面,阿里巴巴表示自家的一個實驗研究模型在數學上優於 OpenAI 的 o1 預覽版本。
報導指出,雖然這些公司尚未發表描述其模型內容的論文,但許多專家表示,對這些模型印象深刻。OpenAI前研究員、現任人工智慧企業家卡爾 (Andrew Carr)表示,中國「正在更快地迎頭趕上」。卡爾認爲,試圖複製OpenAI推理模型的DeepSeek研究人員「在幾個月內就弄清楚了」,他坦言許多同事對此感到驚訝。
DeepSeek 稱其模型在美國國際數學邀請賽 (AIME) 上擊敗了 OpenAI。但《華爾街日報》利用今年 AIME 的 15 個問題進行的一項實驗發現,OpenAI 的 o1 預覽模型比 DeepSeek、Moonshot 和阿里巴巴的實驗模型更快找到了答案。
報導指出,自去年年底以來,AI 開發人員越來越多使用一種名爲「混合專家模型」(Mixture of Experts, MoE) 的技術,這種技術能降低對晶片的需求。
AI 新創公司 Anthropic 的聯合創始人克拉克(Jack Clark)在他的部落格中寫道:「中國繞過出口管制的一種方法是,利用它可以訪問的硬體建立非常好的軟體和硬體培訓。」他稱:「中國製造將成爲 AI 模型的一部分,就像電動車、無人機和其他技術一樣。」儘管如此,據中國高層稱,缺乏尖端晶片對中國新創企業來說是痛苦的,而且差距還會擴大。