Reddit在發現AI公司從數字時間膠囊中喚醒其數據後,從最多網站的索引中阻止了Internet文件的Wayback機器。

流量隨著Reddit收緊用戶數據的手柄而出現。該公司不介意AI公司以Reddit職位培訓其模型,但必須先付款。雷迪特(Reddit)過去曾表示,他不會限制諸如互聯網檔案館之類的“誠信行為者”,但現在他認為有些幫助AI公司避免了許可費。 Reddit態度的突然變化強調了數據許可如何成為AI時代收入的重要來源。

Internet檔案是一個非營利組織,致力於構建龐大的數字網庫和其他在線內容。到目前為止,它已經歸檔了數十億個網站,以及數百萬本書,視頻和軟件程序。它的簽名工具《 Wayback Machine》允許用戶存儲Web快照並稍後查看它們,以查看特定日期的外觀。

Reddit說,它有證據表明,一些AI公司正在利用Wayback機器在未經許可的情況下繞過其策略和刮擦用戶內容。

Reddit發言人在一份在線聲明中告訴Gizmodo:“檔案互聯網提供了開放的組織服務,但我們已經了解到AI公司違反政治平台的情況,包括我們自己的Wayback機器中的刮擦數據。” “除非他們能夠為自己的網站辯護並遵守政治平台(例如,尊重用戶的隱私,回复:刪除內容),我們限制了他們對Reddit數據的一些訪問權限來保護Redditors。”

雷迪特說 Wayback Machine將不再能夠檢測頁面,評論或配置文件。取而代之的是,只能找到Reddit主頁。今天的限制開始“增長”,雷迪特(Reddit)表示,它提前使互聯網文件提前了。

Internet文件未立即響應Gizmodo的評論請求。

近年來,Reddit嚴格控制了對其數據的訪問。當公司開放獲得數據的許可證時,它拒絕了他們尚未支付的公司。該公司已經使用Google和Openai筆公司已經觸及了數百萬美元。在Google協議中,Reddit曾與Google合作以獲得AI,AI培訓數據, 阻止其他搜索引擎 從最近的Reddit帖子的表面到搜索結果。

6月,Reddit起訴AI初創公司人為擬人化,指責他未經授權的磨損。

來源連結