AI訓練資料集侵犯了著作權?LAION在德國獲得勝訴
攝影:北美智權/唐銘偉
※如欲轉載本文,請與北美智權報聯絡
袁如陵╱臺灣專利師
人工智慧(AI)的日益普及,爲創意產業帶來了許多新的可能性,但各式各樣的法律風險也隨之而來,特別是在著作權方面;在德國漢堡地方法院的一起訴訟就凸顯了這些挑戰。此訴訟案是一名攝影師起訴 LAION未經他的同意,在人工智慧訓練資料集中使用他拍攝的照片。而引起廣泛關注的原因,是因爲此案是目前世界先進國家中,少數已經針對人工智慧技術做出判決的著作權案件。
LAION e.V. (Large-scale Artificial Intelligence Open Network,大型人工智慧開放網路)是一家德國非營利組織,致力於開源人工智慧模型和資料集的建置,主要的工作是將網路上的公開圖片製作成資料集,並提供給AI開發商訓練人工智慧模型使用,例如Google Brain就曾經使用過其製作的LAION-400M資料集,知名AI圖片生成引擎Midjourney、Stable Diffusion也是利用LAION-5B資料集訓練其AI系統。本案的主角就是此LAION-5B資料集,其中包含超過50億張從網路上搜集的圖片和文字描述[1]。
案件背景
原告Robert Kneschke則是一位德國攝影師,他於Have I Been Trained網站發現自己拍攝的照片出現在 LAION-5B 資料集中。這些照片原本收錄於圖庫網站 bigstock.com 供大衆免費瀏覽,但帶有浮水印,並附註說明未經許可不得複製。
當 Robert Kneschke 要求停止侵權行爲時,LAION 並未配合,甚至在收到警告信後,還寄了一張 887 歐元的律師費帳單給原告[2]。Robert Kneschke 因此憤而提起訴訟,指控 LAION 未經他同意就下載照片使用。被告LAION 承認自己下載了照片,但認爲自己的行爲受到德國《著作權法》(Urheberrechtsgesetz, UrhG)中例外條款的保護,包括:
● 第 44a 條的「暫時性重製」(Temporary acts of reproduction):如果複製行爲是「技術過程所必要」(an integral and essential part of a technical process)的,並且「沒有獨立的經濟價值」(have no independent economic significance),就允許對作品進行臨時、短暫的複製。舉例來說,瀏覽器會暫時儲存網頁的內容,這是顯示網頁所必要的,也沒有獨立的經濟價值,就可能被認定爲「暫時性重製」。另外,複製的目的必須是爲了「傳輸」或「合法使用作品」。
● 第 44b 條的「文字和資料探勘」(Text and data mining):允許個人或機構爲了進行資料探勘(從資料中萃取出有價值的資訊而進行的自動化分析)而複製作品的行爲。不過著作權人也可以選擇保留自己的權利,主動以「機器可讀」的形式(machine-readable format)「選擇退出」(opt-out),此時第三方就不能任意使用作品。例如內容提供商可以在網頁上使用 robot.txt,讓自動化的第三方爬蟲快速判斷內容是不可主動抓取的。
● 第 60d 條的「爲科學研究目的之文字和資料探勘」(Text and data mining for scientific research purposes):例如大學、科學研究院等研究機構,只要不是追求商業利益、或是爲了公益,就可以使用他人的作品。另外,文化遺產機構如圖書館、博物館,或是不追求商業利益的個人使用者也同樣可受到豁免。與第 44b 條不同的是,著作權人無法選擇退出。
以上條款中,第44a條是源自於歐盟《資訊社會著作權指令》(InfoSoc Directive)中第5條第1項;而44b條及60d條則分別源自於歐盟《數位單一市場著作權指令》(DSM Directive)第4條及第3條。
這起訴訟於2024年7月11日在德國漢堡地區法院首次開庭審理,而法院於2024年9月27日做出對LAION有利於的判決。[3]
不適用44a條的「暫時性重製」
法院認爲,LAION 對圖片的複製行爲並非「暫時性重製」,原因如下:
● 並非「暫時性或附帶性」: 法院指出,暫時性重製的持續時間僅限於技術過程正常運作所需的時間,且應在達成目的後自動刪除。雖然LAION在分析完成後會自動刪除圖片,但下載圖片是LAION出於分析目的而進行的有意識且積極控制的獲取過程,而非僅僅是分析過程的附帶結果。
● 未構成「技術過程的必要組成部分」: 法院認爲,LAION的下載行爲是爲了將圖片用於其資料集中,並非網路傳輸的必要步驟。
因此,LAION的行爲無法受到第44a條的豁免。
是否適用44b條的「文字和資料探勘」?
地院對此條款的適用性表達了意見,但並未作出最終決定。是否適用「文字和資料探勘」的關鍵點在於,圖庫bigstock.com是否有以「機器可讀」的形式保留自己的權利?
判決中指出,bigstock.com是以一般的文字在網頁上顯示聲明:「您不得對:(...)爲任何目的使用自動程式、小程式、機器人或類似工具訪問XXX.com網站或網站上的任何內容,包括(僅舉例說明)下載內容、編制索引、或快取網站上的任何內容」。對此,法院傾向認爲,就算圖庫網站bigstock.com沒有使用robot.txt,而是用此「自然語言」進行聲明,只要當時的技術水準能夠讓機器理解其內容,就可以被視爲「機器可讀」。
有趣的是,在判決前的聽證會中,雙方就是在第44b條脣槍舌戰,但法院最後的判決,卻是仰賴接下來的第60d條,而一般資料探勘的判斷標準仍然懸而未決。[4]
適用60d條的「爲科學研究目的之文字和資料探勘」
法院裁定,LAION下載原告Kneschke照片的行爲適用60d條款的豁免,因此並未侵權。
● LAION屬於研究機構:法院認爲LAION是專注於人工智慧研究的非營利組織,其建立資料集的目的是爲了促進科學研究,符合60d條款中「研究機構」的要求。
● LAION-5B本身不具商業性:法院指出,LAION將其資料集免費提供給公衆使用,沒有從中獲取商業利益,因此符合60d條款中「非商業性」的要求。
● LAION-5B有商業用途,但仍然適用60d條:法院認爲,LAION無法預測資料集會被如何使用,所以即使有商業公司使用LAION的資料集,也不會影響LAION本身的非商業性質。
判決能成爲製作資料集的避風港,但未必有利AI開發商
LAION之所以能夠勝訴,要歸功於能讓法官相信,LAION是一個非商業性的研究機構,並將自己的行爲包裝在德國著作權法第60d條的例外條款之下:
● LAION本身沒有儲存圖片,研究人員必須利用LAION所提供的工具「img2dataset」來下載感興趣的子集以取得圖片資料。而LAION-5B資料集事實上是一個「表格」,只包含圖片的網址以及文字描述。
● 法院認爲LAION的資料集是用於科學研究目的。
● LAION將資料集「免費公開」,符合「非商業性」的要求。
雖然原告指出LAION與Stability AI等商業公司關係密切,而Stability AI就是使用LAION-5B資料集來訓練其商業AI模型Stable Diffusion;除此之外,LAION 曾接受商業公司的資金支持,甚至LAION的部分成員就任職於這些商業公司,明顯存在利益關係。然而,法院認爲重點是LAION自身的行爲是否具有商業目的,並非資金來源,而也沒有證據指出資金被LAION用於開發自己的商業產品。
不過客觀上來說,似乎難以否認Stability AI與LAION有某種程度的依存關係(沒有LAION-5B,就難以打造Stable Diffusion),只是在訴訟中原告無法成功舉證Stability AI對LAION有實質的控制力。若原告選擇上訴,這應該仍會是攻防的關鍵點。[5]
雖然LAION可以稍微鬆一口氣。但反過來說,這個判決只有利於專門建立資料集的機構,而其他實際用LAION-5B資料集訓練AI模型的廠商,如Midjourney、Stability AI等明顯更商業導向的公司,幾乎不可能獲得第60d條的豁免,只能冀望其他條款的適用。
「建立」與「使用」資料集是兩種不同的行爲
判決書中,法院刻意區分「建立資料集」和「訓練AI」這兩種行爲,並指出LAION僅負責建立資料集,並未參與AI模型的訓練或使用,是否也是在暗示其他使用LAION資料集的廠商在法庭上會有不同的結果?另外,法院認爲LAION的複製行爲不是「暫時性重製」,且網站只要以一般文字標註就可以符合「機器可讀」的選擇退出,對AI開發商是明顯不利的。
話雖如此,那OpenAI、Meta等生成式AI的開發商,在德國就會陷入極大風險嗎?倒也未必。在判決理由中,德國法院多次提及歐盟的《DSM Directive》以及《AI Act》,而在《AI Act》中歐盟似乎已經表態,訓練AI模型應該也屬於《DSM Directive》所規定的一種資料探勘,因此若商業公司尊重著作權人的選擇退出聲明,應可降低部分風險。
本案較爲可惜的是,由於LAION的行爲已經被判定屬於第60d條的豁免,地院就沒有對商業公司能夠主張的44b條豁免做判斷。
整體來說,本次判決僅涉及LAION行爲的具體事實,不宜擴張解釋。未來其他商業公司若進行資料探勘而被提起訴訟時,很可能會有不同的判決結果。 因此,AI開發商仍需謹慎評估其資料收集方式,並積極尋求與著作權人合作,才能在合法的基礎上發展AI技術。
備註:
責任編輯:李淑蓮
【本文僅反映專家作者意見,不代表本報立場。】
英國 Visiongain 產業分析師
鴻海精密 專利工程師
英國倫敦大學皇后瑪麗學院 智慧財產權管理碩士
無形資產評價管理師初級
英國專利/商標代理人初試通過
中國專利代理人考試通過
延伸閱讀&電子報訂閱連結:
【詳細內容請見《北美智權報》366期;歡迎訂閱《北美智權報》電子報】