美科技管制…反激發陸AI創新 DeepSeek帶來極致性價比
中國大陸人工智慧新創公司深度求索(DeepSeek)上週發佈推理大模型DeepSeek-R1,因其比肩OpenAI o1的性能、極低的服務價格,以及程式碼完全採開源模型架構,震驚業界。(DeepSeek官網)
中國大陸人工智慧新創公司深度求索(DeepSeek)上週發佈推理大模型DeepSeek-R1,因其比肩OpenAI o1的性能、極低的服務價格,以及程式碼完全採開源模型架構,震驚業界。
外界普遍認爲,美國尖端晶片出口管制等限制沒有削弱中國的AI能力,反而似乎讓DeepSeek等初創公司以優先考慮效率、資源池和協作的方式進行創新。
上海第一財經引述美國AI新創公司Scale AI的創始人Alexandr Wang說法,過去十年來,美國可能一直在人工智慧競賽中領先中國,但DeepSeek的AI大模型可能會「改變一切」。
美國科技管制管不住大陸創新
美國加州大學柏克萊分校電腦科學教授伊恩.斯托伊卡(Ion Stoica)指出,DeepSeek-R1和DeepSeek-V3已表明,只需花費訓練GPT、Gemini和Claude等現有大模型的一小部分成本,即可獲得最先進結果。在該校的大模型排行榜中,DeepSeek-R1在包括開源模型和專有模型的所有模型中排名第三。
美國對大陸晶片出口管制加強,但斯托伊卡認爲,限制條件和資源匱乏往往激發創新,目前的情況似乎就是如此。
卡內基國際和平基金會的人工智慧研究員馬特·希恩(Matt Sheehan)表示,美國的出口管制實際上將大陸企業逼入了絕境,學會利用有限的計算資源提高效率。未來可能會看到大量與計算資源匱乏相關的整合。
中歐國際工商學院決策科學與執行資訊系統教授譚寅亮對第一財經表示,因爲對大陸的晶片管制從未停止,但大陸企業創新也沒有因此停滯,DeepSeek團隊的成功就是證明。
除了極致性價比,DeepSeek的大模型脫穎而出的是代碼和訓練方法的完全開源。
開源模型將原始程式碼和技術細節公開,允許使用者根據自身需要對模型進行任意使用和修改,被認爲有提高技術透明度,讓用戶更容易、更便宜地使用,讓開發者降低反覆運算成本,防止壟斷等好處。
DeepSeek-R1已經成爲開源社區Hugging Face下載量最高的大模型,下載量達10.9萬次,意味着全球的開發人員正在試圖瞭解這一模型以輔助自己的AI開發,DeepSeek的伺服器在26日出現了局部服務波動,可能正因新模型訪問量激增。