斯坦福AI項目作者對抄襲中國大模型致歉 承諾撤下相關模型
近日,斯坦福大學AI團隊主導的 Llama3-V 開源模型被證實套殼抄襲國內清華與面壁智能的開源模型“小鋼炮”MiniCPM-Llama3-V 2.5一事,在網絡上引發熱議。
在最新的進展中,斯坦福Llama3-V團隊的兩位作者Siddharth Sharma(森德哈斯·沙瑪)和 Aksh Garg(阿克沙·加格)在社交平臺上就這一學術不端行爲向面壁MiniCPM團隊正式道歉,並表示會將Llama3-V模型悉數撤下。
Aksh Garg(阿克沙·加格)表示,“首先,我們要向MiniCPM原作者道歉。我、Siddharth Sharma,以及Mustafa(穆斯塔法)一起發佈了Llama3-V,Mustafa爲這個項目編寫了代碼,但從昨天起就無法聯繫他。我與Siddharth Sharma主要負責幫助Mustafa進行模型推廣。我們倆查看了最新的論文,以驗證這項工作的新穎性,但並未被告知或意識到OpenBMB(清華團隊支持發起的大規模預訓練語言模型庫與相關工具)之前的任何工作。我們向作者道歉,並對自己沒有努力驗證這項工作的原創性感到失望。我們對所發生的事情承擔全部責任,並已撤下Llama3-V,再次致歉。”
另外,斯坦福人工智能實驗室主任Christopher David Manning也發文譴責這一抄襲行爲,並對MiniCPM這一中國開源模型表示讚揚。
事件起源於5月29日,一個斯坦福AI 團隊在網絡上宣傳只需500美元就可訓練出一個超越GPT-4V的SOTA多模態大模型。隨後,網友發現,該團隊的Llama3-V模型使用的模型結構和代碼與面壁智能不久前發佈的MiniCPM-Llama3-V2.5極爲相似,僅修改了部分變量名。Llama3-V也具有與MiniCPM-Llama3-V 2.5相同的分詞器,包括後者新定義的特殊符號。
6月2日深夜,面壁智能團隊證實,斯坦福大模型項目Llama3-V與MiniCPM一樣,可以識別出“清華簡”戰國古文字,“不僅對得一模一樣、連錯得都一模一樣”。這一古文字數據爲研究團隊花費數月從清華簡上逐字掃描並人工標註得來,並未對外公開,證實抄襲事實。
面壁智能CEO李大海表示,“我們對這件事深表遺憾。一方面感慨這也是一種受到國際團隊認可的方式,另一方面呼籲大家共建開放、合作、有信任的社區環境。”“我們希望團隊的好工作被更多人關注與認可,但不是以這種方式。”
面壁智能首席科學家、清華大學長聘副教授劉知遠表示,人工智能的飛速發展離不開全球算法、數據與模型的開源共享,讓人們始終可以站在SOTA的肩上持續前進。面壁開源的 MiniCPM-Llama3-V 2.5 就用了最新的Llama3 作爲語言模型基座。而開源共享的基石是對開源協議的遵守,對其他貢獻者的信任,對前人成果的尊重和致敬,Llama3-V團隊無疑嚴重破壞了這一點。他們在受到質疑後已在Huggingface刪庫,該團隊三人中的兩位也只是斯坦福大學本科生,未來還有很長的路,如果知錯能改,善莫大焉。
北京面壁智能科技有限責任公司成立於2022年8月,今年4月,面壁智能完成新一輪數億元融資,由華爲哈勃領投,春華創投、北京市人工智能產業投資基金等跟投,知乎作爲戰略股東持續跟投支持。今年2月,面壁智能發佈開源模型MiniCPM後,又推出MiniCPM 2系列端側模型。李大海表示,推動大模型在端側的落地是面壁目前的重點工作之一。