☰

OpenAI掌握DeepSeek盜用模型證據業界：搭便車很常見

DeepSeek推出最新AI模型，直接衝擊業界巨頭OpenAI。圖爲北京一名手機用戶使用2種聊天機器人App的畫面。（美聯社）

中國大陸AI新創公司「深度求索」（DeepSeek）本週發佈最新模型DeepSeek-R1，衝擊目前世界領頭羊OpenAI旗艦產品GPT-4，震撼全球AI圈，美國矽谷如臨大敵，股價擺盪。英國《金融時報》週三（29日）報導，OpenAI聲稱有證據顯示，DeepSeek在違反OpenAI服務條款的情況下，利用業界「蒸餾」技巧讓ChatGPT模型訓練DeepSeek-R1。業界人士指出，美國、中國的小公司爲省成本「搭便車」情況很常見，難以完全杜絕。

美國財經媒體彭博社（Bloomberg）先前報導，OpenAI與微軟（Microsoft）正在調查DeepSeek是否使用OpenAI的應用程式介面（API），把OpenAI的AI模型整合到DeepSeek自有模型。消息人士說，微軟資安研究人員去（2024）年底偵測到大量數據資料經由多個OpenAI開發者帳號外泄，而且微軟認爲這些帳號與DeepSeek有關。

總部位於美國舊金山的OpenAI向《金融時報》表示，已找到證據顯示DeepSeek涉及業界常用來訓練AI模型的「蒸餾」（distillation）技術，亦即從更大、更強的模型之中抓取數據輸出成果。這種技術用來訓練小型模型非常有效，如此操作，API開發成本可能只佔1億美元打造的GPT-4的一小部分。不過，OpenAI尚未向外界說明證據詳情。微軟拒絕置評此事，DeepSeek也尚未迴應。

開發人員可以使用OpenAI的API把OpenAI的人工智慧與自家開發應用程式相結合，但由此建立的競爭模型違反了OpenAI服務條款。條款規定，OpenAI的用戶不能「複製」平臺任何服務或以蒸餾方式開發與OpenAI競爭的模型。美國科技新聞網站The Verge報導此事時以「滿滿諷刺」（rich with irony）形容，因爲OpenAI就是在未經同意的情況下吸收整個網際網路的書面資料，讓ChatGPT取得驚人飛越進展。

OpenAI向彭博社表示，該公司明白中國與其他國家的業者正不斷嘗試借鏡美國AI領先業者的模型：「身爲人工智慧的領導業者，我們設法採取保護自家智慧財展的因應措施，包括謹慎處理先端技能以納入已發佈的模型，我們也相信，在自身持續前進的過程中，與美國政府緊密合作以針對最強大模組提供最佳保護是極爲重要的，以防對手與競爭者竊走美國開發的技術」。

外號「AI沙皇」的白宮AI與加密貨幣負責人塞克斯（David Sacks）週二（28日）向福斯新聞（Fox News）表示，有大量證據顯示DeepSeek從OpenAI模型中提取知識，「我認爲OpenAI很不樂見這種情況」。然而業界不少人士表示，中、美兩國的AI實驗室常用OpenAI等大公司的開發成果，這些公司花錢請人指導自家模型如何取得進展。模型開發成本高昂且勞力密集，小公司往往會「搭便車」。

加州大學柏克萊分校正在攻讀人工智慧博士的古普達（Ritwik Gupta）說，新創公司與學界使用鎖定人類感官思緒的大型語言模型（LLM，例如ChatGPT）去訓練新的模型，這種情形很常見，等於省下人工回饋步驟成本，「若說DeepSeek會這麼做，我不覺得有什麼奇怪的，倘若真是如此，要徹底杜絕這種手段恐怕很難」。

相關資訊

DMCA | PRIVACY | s@bg3.co