Smith 告訴 Ars,這兩個用例都可能會讓版權所有者感到沮喪,這取決於模型輸出的內容。
史密斯說:“我認為反流和同人小說的創作可能會涉及版權問題,因為同人小說通常必須採用表達元素、受版權保護的角色、足夠著名且受版權法保護的角色,或者故事或情節序列。” “如果對這些東西進行複製和轉載,其輸出結果很可能會構成侵權。”
但這仍然是一個灰色地帶。 “我會擔心,”史密斯一邊瀏覽博客一邊說,但“我不會說這是自動違規。”
史密斯告訴 Ars,鑑於法院通常只表示在受版權保護的書籍上訓練人工智慧屬於合理使用,微軟撤下該部落格「可能是明智的」。但法院仍在持續調查與盜版人工智慧培訓材料相關的問題。
在已刪除的 Kaggle 數據集頁面上,Mendola 先前解釋說,為了獲取數據,他「下載了電子書,然後將其轉換為 .txt 檔案」。
微軟可能侵犯版權
史密斯說,如果微軟面臨公司是否故意使用盜版書籍來訓練模型的問題,合理使用「可能是一個困難的論點」。
《駭客新聞》的評論者認為該部落格可以被視為合理使用,因為培訓手冊是用於“教育目的”,史密斯表示微軟可以在其辯護中提出一些“好的論點”。
然而,它也表明,微軟在離開該部落格一年後,可能會在某些方面因造成某種程度的洩漏而承擔責任。在刪除之前,Kaggle 資料集的下載次數已超過 10,000 次。
「最終的結果是創造出一些侵權的東西,說『嘿,來吧,去獲取那些侵權的東西並在我們的系統中使用它,』」史密斯說。 “他們可能會對版權侵權承擔某種次要責任,下載它,並利用它來鼓勵其他人將其用於培訓目的。”
發布日期: 2026-02-20 12:11:00
來源連結: arstechnica.com










