OpenAI掌握DeepSeek盜用模型證據 業界:搭便車很常見

DeepSeek推出最新AI模型,直接衝擊業界巨頭OpenAI。圖爲北京一名手機用戶使用2種聊天機器人App的畫面。(美聯社)

中國大陸AI新創公司「深度求索」(DeepSeek)本週發佈最新模型DeepSeek-R1,衝擊目前世界領頭羊OpenAI旗艦產品GPT-4,震撼全球AI圈,美國矽谷如臨大敵,股價擺盪。英國《金融時報》週三(29日)報導,OpenAI聲稱有證據顯示,DeepSeek在違反OpenAI服務條款的情況下,利用業界「蒸餾」技巧讓ChatGPT模型訓練DeepSeek-R1。業界人士指出,美國、中國的小公司爲省成本「搭便車」情況很常見,難以完全杜絕。

美國財經媒體彭博社(Bloomberg)先前報導,OpenAI與微軟(Microsoft)正在調查DeepSeek是否使用OpenAI的應用程式介面(API),把OpenAI的AI模型整合到DeepSeek自有模型。消息人士說,微軟資安研究人員去(2024)年底偵測到大量數據資料經由多個OpenAI開發者帳號外泄,而且微軟認爲這些帳號與DeepSeek有關。

總部位於美國舊金山的OpenAI向《金融時報》表示,已找到證據顯示DeepSeek涉及業界常用來訓練AI模型的「蒸餾」(distillation)技術,亦即從更大、更強的模型之中抓取數據輸出成果。這種技術用來訓練小型模型非常有效,如此操作,API開發成本可能只佔1億美元打造的GPT-4的一小部分。不過,OpenAI尚未向外界說明證據詳情。微軟拒絕置評此事,DeepSeek也尚未迴應。

開發人員可以使用OpenAI的API把OpenAI的人工智慧與自家開發應用程式相結合,但由此建立的競爭模型違反了OpenAI服務條款。條款規定,OpenAI的用戶不能「複製」平臺任何服務或以蒸餾方式開發與OpenAI競爭的模型。美國科技新聞網站The Verge報導此事時以「滿滿諷刺」(rich with irony)形容,因爲OpenAI就是在未經同意的情況下吸收整個網際網路的書面資料,讓ChatGPT取得驚人飛越進展。

OpenAI向彭博社表示,該公司明白中國與其他國家的業者正不斷嘗試借鏡美國AI領先業者的模型:「身爲人工智慧的領導業者,我們設法採取保護自家智慧財展的因應措施,包括謹慎處理先端技能以納入已發佈的模型,我們也相信,在自身持續前進的過程中,與美國政府緊密合作以針對最強大模組提供最佳保護是極爲重要的,以防對手與競爭者竊走美國開發的技術」。

外號「AI沙皇」的白宮AI與加密貨幣負責人塞克斯(David Sacks)週二(28日)向福斯新聞(Fox News)表示,有大量證據顯示DeepSeek從OpenAI模型中提取知識,「我認爲OpenAI很不樂見這種情況」。然而業界不少人士表示,中、美兩國的AI實驗室常用OpenAI等大公司的開發成果,這些公司花錢請人指導自家模型如何取得進展。模型開發成本高昂且勞力密集,小公司往往會「搭便車」。

加州大學柏克萊分校正在攻讀人工智慧博士的古普達(Ritwik Gupta)說,新創公司與學界使用鎖定人類感官思緒的大型語言模型(LLM,例如ChatGPT)去訓練新的模型,這種情形很常見,等於省下人工回饋步驟成本,「若說DeepSeek會這麼做,我不覺得有什麼奇怪的,倘若真是如此,要徹底杜絕這種手段恐怕很難」。