人工智慧系統可以根據訓練資料創建近乎逐字的敘述版本

23 2 月 2026

美國法院去年裁定，Anthropic 對法學碩士持有者進行的某些受版權保護內容的培訓可以被視為合理使用，因為它被認為是「變革性的」。

但它認定儲存盜版作品是“固有且不可挽回的侵權行為”，促使AI集團支付15億美元來和解訴訟。

在德國，去年 11 月的裁決發現 OpenAI 侵犯了版權，因為它的模型可以記憶歌詞。該案件由代表作曲家、詞曲作者和出版商的協會 GEMA 提起，被認為是歐盟里程碑式的裁決。

Hoch Blackwell 律師事務所合夥人 Rudi Telcher 表示，在不越獄的情況下複製整本書是「明顯的版權侵權」。「但問題是，這種情況是否發生得足夠多，以至於（人工智慧模型）可能對此次洩漏負有間接責任，」他補充道。

Anthropic 表示，史丹佛大學和耶魯大學研究中使用的越獄技術對於普通用戶來說是不切實際的，並且需要付出更多的努力來提取文本，而不是簡單地購買內容。

該公司還補充說，其模型不儲存特定資料集的副本，而是從訓練資料中的單字和字串之間的模式和關係中學習。

xAI、OpenAI 和Google都沒有回應置評請求。

帝國學院的 de Montjoy 表示，人工智慧實驗室已經採取了保護措施來防止訓練資料被提取，這意味著他們已經意識到了這個問題。

芝加哥大學電腦科學教授本·趙質疑人工智慧實驗室是否真的需要在訓練資料中使用受版權保護的內容來創建複雜的模型。

「藝術效果到底能不能達到，問題還是要不要去做？」趙說。 “法律方面最終必須堅持自己的立場，並成為整個過程的仲裁者。”

發布日期: 2026-02-23 15:38:00

來源連結: arstechnica.com