加州聯邦法官裁定 Anthropic 使用購買圖書進行 AI 訓練屬於「轉化」合理使用,但下載盜版圖書不符合法規。
美國加州北區地方法院針對人工智慧模型訓練是否可使用受版權保護內容一案做出重大裁決,法院首次認定此類使用行為屬「合理使用」 (Fair Use)範疇,為人工智慧業者如Anthropic等公司提供一道合法防線。此一判決不僅引發產業關注,也讓長期憂慮作品遭人工智慧未經授權取用的創作者群體大感失望。
本案由多位作家如Andrea Bartz、Charles Graeber與Kirk Wallace Johnson於2024年提出訴訟,指控人工智慧公司Anthropic在未經授權情況下抓取,並且使用其出版書籍內容訓練大型語言模型 (LLM),構成著作權侵害。
不過,負責審理此案件的法官William Alsup在審理後指出,儘管Anthropic使用的內容可能來自未授權的來源,但用於訓練人工智慧模型的目的和性質,符合合理使用原則,並且此類用途在法律上具轉化性,因此不構成直接侵權。
判決中提到,即便Anthropic最初使用的是所謂的「盜版電子書」,後續補足了購買行為,雖不完全排除其責任,但對應的法定賠償金額可能會因此調整。換言之,法院在肯定人工智慧開發過程中對版權內容的使用,具有一定合理性的同時,也未完全放棄追究違法取得內容的可能性。
此裁決成為美國法院系統首次針對生成式人工智慧訓練資料來源做出實質性裁定,也可能為其他人工智慧技術開發商帶來一定程度的參考依據,特別是在生成式人工智慧模型高度依賴大規模資料集進行訓練的發展階段。
值得注意的是,法院雖未全面否定創作者的權益,但整體趨勢對人工智慧產業相對有利。
此一結果預期將引發更多關於創作與科技倫理的討論,隨著生成式人工智慧的應用範圍日益擴大,從文本到圖像、音樂等皆可透過模型快速生成,創作者面臨商業挑戰與作品價值的風險將日漸加劇。
未來類似訴訟案件可能持續增加,並且有望進一步推動立法機構針對人工智慧資料來源、授權機制與補償制度建立更清晰的規範。