23日晚間,一項美國加州北區聯邦法院的判決,或許會改變未來AI公司與出版社、作家的智財權之爭,甚至對人工智慧發展造成影響——法官William Alsup判定Anthropic「自行購入」書籍,用來訓練AI模型Claude屬於「合理使用」,儘管並未獲得作者跟出版社的同意。
然則,法官也指出Anthropic其他的行為,例如從盜版網站「影子圖書館」(shadow libraries)下載了超過700萬本書籍訓練AI,仍屬「侵犯版權」。這判決之所以重要,在於第一次有了法律上的明確分界:「訓練AI」本身是合理使用,「獲取盜版書籍」的行為才是侵犯版權。
究竟這兩者的差別是什麼?又為什麼可能對AI產業造成影響呢?

法官見解:訓練AI就跟教小孩寫文章一樣?
怎樣屬於合理使用?法官給出的理由是,訓練AI是「典型的轉化性使用」(quintessentially transformative),並且給出一個生動的比喻,「就像任何想成為作家的讀者一樣,Anthropic的大語言模型訓練這些作品不是為了複製或取代它們,而是要轉個彎、創造出不同的東西。」
也就是說,因為創造出的東西跟用來訓練的有極大差異,所以可被視為合理使用。
法官還用了一個很直白的說法:「『作者抱怨AI公司拿他們作品來訓練AI』這件事和抱怨『因為老師把學生教得太好,導致市場上競爭作品增加』並無不同。」並重申著作權法是為了促進原創作品,而不是保護作者免受競爭。
然而法官的類比或許會引發不少質疑,例如這是否暗示AI生成結果等於人類創作?再者,把AI大規模吸收、轉換語料跟人類學習寫文章比,是否適切?
值得對比的是,早在2015年就有類似判決先例——Google Books案。當時Google並未購買書籍,而是與史丹佛大學(Stanford University)、哈佛大學(Harvard University)等大學圖書館合作掃描館藏,同樣被判「合理使用」且用了轉化性使用為理由。
細微但關鍵的差異是,法院認定Google Books不僅沒有傷害書籍銷售,反而可能促進銷售,因為搜尋結果提供購買連結,幫助讀者發現新書。這顯示「對市場影響」在合理使用判定中的重要性。
相較之下,Anthropic案的爭議點更在於AI生成內容可能與原作競爭,而非單純提供搜尋功能。
川普為AI公司放行之外,還有多起訴訟進行中
無論如何,AI公司顯然樂意看到法院開此先例。因為除了此案的作家Andrea Bartz、Charles Graeber及Kirk Wallace Johnson控訴Anthropic侵權之外,還有許多進行中的法律拉鋸戰。
例如2023年底《紐約時報》(The New York Times)起訴OpenAI盜用其新聞,目前正圍繞在「證據保存」和「用戶數據隱私」的法律攻防;2024年6月三大唱片公司(Universal、Sony、Warner)透過RIAA起訴AI音樂生成器Suno和Udio,正在進行授權談判,但因為有獨立音樂家提起新訴訟使得案件更複雜。
此外,還有集結17知名作家包括《冰與火之歌》(A Song of Ice and Fire)作者喬治・馬丁(George R.R. Martin),針對OpenAI的訴訟也還在紐約法院進行中,其後被告方更多了微軟(Microsoft)。雖然該案件仍在處理程序性問題,但因涉及重量級作家和大AI公司,所以備受矚目。
由於美國採用「判例法」(Case Law)制度,Anthropic的勝利更有可能成為重要先例,將影響其他正在進行中的AI版權訴訟。

馬丁爺是目前與AI公司拉鋸中的創作者之一。想想如果他不再創作,我們就真的無法看到《冰與火之歌》結局了⋯⋯儘管他常常食言,小說一直延期。(來源:Wiki of Thrones)
另一個對創意產業雪上加霜的現況是,今年5月川普解僱了美國版權辦公室(U.S. Copyright Office)主任Shira Perlmutter。解僱前一天,該單位才發布「AI版權報告」,旨在規範AI訓練的侵權標準,例如使用有版權作品訓練AI,在哪些情況下算作合理使用,哪些情況則否。
相較於這次的判決,美國版權辦公室的標準更嚴格。因為承認AI訓練過程中涉及複製權,構成「表面侵權」。外界普遍認為川普的這個決定,是因為AI公司如OpenAI和Google的遊說,也等同為這些科技公司開綠燈放行,更容易獲取訓練素材。
目前使用版權作品訓練AI,仍是法律灰色地帶,要形成法律或行業共識或許還要一段時間。然而換個方向想,人類藝術家、作者的權益該如何受到保障,對AI公司來說其實也很重要。因為沒人願意創作的話,將來最快枯竭的,恐怕正是AI公司拿來訓練AI的材料——人類透過生命經驗產出的作品。