信用:生成的AI圖像
視覺藝術家希望保護自己的作品免於使用人工智能的生成工具(例如Chatgpt)不同意使用。但是,他們中的大多數人都沒有技術知識或對此所需的工具的控制。
保護藝術家創意作品的最佳方法之一是防止它何時看到“ AI的關鍵” – 在Internet上收集數據以進行培訓生成模型的程序。但是,大多數藝術家無法訪問可以使他們採取此類行動的工具。當他們有訪問權限時,他們不知道如何使用它們。
以下是加州大學聖地亞哥大學和芝加哥大學的一群研究人員的研究的一些結論,這將在 2025年互聯網測量會議 十月在威斯康星州麥迪遜。
有一項研究 出版 在 arxiv 預印服務器。
“本文中的衝突基於以下想法:內容的創建者現在想控制其內容的使用方式,而不僅僅是是否可用。儘管在版權法中通常很清楚這些權利,但不容易表達它們,更不用說在當今的互聯網上執行執行。
“取而代之的是,一系列特殊控制基於現有網絡 – 納米人的重新授課和防火牆的功能,它們都不對應於研究人員所寫的特殊性,易用性或執法水平。
研究小組對200多位視覺藝術家採訪了有關阻止工具的需求以及對藝術家的技術考試的需求。研究人員還檢查了1,100多個專業藝術家網站,以查看由於AI阻止工具而導致的控製藝術家。最後,團隊讚賞哪些過程最有效地阻止了Clawlers AI。

該簡歷研究了AI和關聯公司的用戶代理商。研究人員注意到,該公司是否發布了與特定用戶代理一起爬行時使用的IP地址的使用,他們的文檔是否批准尊重robots.txt,以及他們在實踐中是否尊重robots.txt。學分:聖地亞哥加利福尼亞大學
目前,藝術家可以輕鬆地使用一些掩蓋AI爬行者原始藝術品的工具,從而將藝術變成其他工具。芝加哥大學的研究公司的作者開發了其中一種工具,稱為釉料。
但是理想情況下,藝術家將能夠從全部數據收集中防止其數據。為此,視覺藝術家必須保護自己免受三類爪子的侵害。一種類型的數據收集用於教授大型語言模型的數據,以聊天機器人,另一種數據,以增加AI支持的助手的知識,而另一種則是為了支持AI支持的搜索引擎。
藝術家是一項調查
媒體上有廣泛的照明,涉及生成性AI如何強烈侵犯許多藝術家的存在。結果,在由研究人員調查的203位視覺藝術家中,約有80%試圖採取積極的步驟,以便在教育數據中沒有用於生成AI的工具的工作。三分之二報告了釉的使用。此外,有60%的藝術家減少了他們在互聯網上分裂的作品的數量,其中有51%的藝術家只有其作品分辨率較低的圖像。
此外,有96%的藝術家表示,他們希望訪問可能干擾組裝數據的工具。但是,超過60%的人不熟悉可以做到這一點的最簡單工具之一:robots.txt。
包含AI噴霧的工具
Robots.txt是位於網站根目錄中的一個簡單文本文件,該文件指示哪些頁面允許訪問此網站。文本文件還可以指示哪些縮放器一般無法訪問該網站。但是,不需要縮放者遵循這些限制。

在此示例中,robots.txt,Googlebot文件允許您填寫網站上的所有URL,禁止使用catgpt-user和gptbot爬行任何URL地址,並且禁止所有其他Scaleers crawing for / necret / catalogs crawing url。學分:聖地亞哥加利福尼亞大學
研究人員在互聯網上採訪了100,000個最受歡迎的網站,發現超過10%的人清楚地禁止在其robots.txt文件中噴灑AI。但是,包括Vox Media和Atlantic在內的某些網站在與人工智能公司簽訂了許可協議後刪除了該禁令。
實際上,允許稀釋AI的站點數量正在增長,包括流行的權利虛假信息站點。研究人員認為,這些站點可以努力在LLM中分發錯誤信息。
藝術家的問題之一是他們無法訪問或控制相應的機器人.txt文件。這是由於以下事實:在對1100個藝術家網站的調查中,研究人員發現,將超過四分之三放在第三方服務平台上,其中大多數不允許修改Robots.txt。
這些內容管理藝術家中的許多人實際上也沒有給他們關於哪種類型的爬行被阻塞的信息。 Squarespace是唯一提供用於阻止AI工具的簡單接口的公司。但是研究人員發現,只有17%的使用SquareSpace的藝術家允許此選項。這可能是因為藝術家常常不知道這項服務可用。
但是,爬行者是否尊重robots.txt中列出的禁令,即使不是強制性的?
答案混合在一起。大型公司的極點通常尊重機器人。研究人員可以清楚地定義的唯一密集的不是Bypessader,這是Tiktok bytedance的詳細所有者。此外,許多掃描儀聲稱他們尊重機器人。 TXT限制,但研究人員無法確保這是真的。
研究人員寫道:“通常由大公司管理的大多數爪子尊重robots.txt,而大多數助手不是人工智能”。

顯然可以在其機器人中允許至少一個毛毛蟲的地點數量。垂直線表示大型發布者(控制40多個域)和OpenAI之間的公開數據。學分:聖地亞哥加利福尼亞大學
最近,CloudFlare網絡提供商啟動了AIB AI機器人功能。在此階段,使用CloudFlare的站點中只有5.7%打開此選項。但是研究人員希望這會隨著時間的流逝而變得越來越流行。
“儘管這是一個“令人鼓舞的新版本”,但我們希望供應商通過其工具的工作和覆蓋範圍變得更加透明(例如,提供機器人封鎖機器人的列表),”哲學博士和博士學位的作者之一Eliza Luo說。研究小組野蠻的學生。
立法和法律不確定性
斗篷周圍的全球景觀正在不斷從各種法律變更和廣泛的立法提案中變化。
在美國,AI公司面臨著與從互聯網跳躍的數據中訓練的模型應用於培訓的模型以及其義務可能是該內容的創建者的法律問題。在歐盟中,最近採用的人工智能法要求AI模型的供應商獲得版權所有者的許可以使用其數據。
研究人員寫道:“有理由相信,關於法律保護的法律手段的混亂只會集中在訪問的技術控制上。” “在任何美國法院都發現對人工智能模型的創建者“合理使用”的肯定保護範圍內,這是對法律保護的削弱,當不可避免地會產生更高的需求,以確保確保遵守訪問控制。”
更多信息:
Enze Liu等。我用一些用於爬行:意識,代理和有效性來保護內容創建者免受障礙的侵害, arxiv (2024)。 doi:10.48550/arxiv.2411.15091
引用:防止AI爬行者避開視覺藝術家的保護,儘管有可用的工具,但仍顯示了研究(2025年8月5日)。於2025年8月5日收到
該文檔具有版權。除了出於私人研究或研究目的的一些公平交易外,如果沒有書面解決方案,就無法再現。內容僅用於信息目的。