許多人懷疑這些機器人是人工智慧公司從網站收集訓練資料的一部分。到 2025 年,人工智慧機器人將佔所有網路流量的很大一部分,在互聯網上爬行以獲取文字和其他信息,為需要大量數據的語言模型提供數據。
但這些中國機器人與其他人工智慧機器人之間存在一些關鍵差異。首先,它們的數量實在太多了。 King 在他的網站上表示,來自中國和新加坡的流量佔總流量的 22%,而所有其他人工智慧機器人的總流量佔不到 10%。
大多數領先的人工智慧公司都會向網站營運商清楚地識別他們的機器人,這也使得它們更容易被阻止。網路基礎設施公司 Akamai 的技術和安全策略高級總監 Brent Maynard 表示,邊緣人工智慧實驗室「對逃避」機器人攔截規則並不感興趣。他說,人工智慧公司通常只有在網站關閉前門後才開始嘗試偽裝他們的機器人。然而,幾位網站所有者告訴《連線》雜誌,這波中國機器人從一開始就偽裝成普通人類用戶,甚至規避了常見的機器人攔截規則。
除了人工智慧公司之外,還有其他企業有動機「破壞」互聯網,包括搜尋爬蟲和情報公司。
成本上升和數據扭曲
至少目前來說,好消息是機器人似乎沒有明顯的惡意意圖。他們尚未公開與任何網路攻擊相關,並且似乎沒有掃描漏洞。但缺乏明確的動機也加劇了混亂。
一些網站所有者擔心機器人會在未經許可的情況下抓取受版權保護的資料。其他人則表示,由於機器人流量擠出了人類用戶,這種成長迫使他們為頻寬支付更多費用,或投資更複雜的預防工具。點擊率也會影響流量分析,影響有關誰實際造訪其網站的報告。
然而,影響最大的是那些透過吸引廣告點擊其網站來賺取收入的人。 「這破壞了我的 AdSense 策略,」超自然部落格的所有者 Quintero 說,「因為他們說(你的網站)只有機器人訪問,所以你的內容對瀏覽者來說沒有價值。」因此,此類網站可能會被廣告商認為不太受歡迎,並受到 Google 的處罰。
臨時解決方案
過去幾個月,許多人在線上支援管道抱怨中國人工智慧機器人問題,或直接向網站寄存供應商發送有關該問題的訊息。但到目前為止,仍鮮有具體答案。
WordPress 接受《連線》雜誌採訪時承認,近幾個月來有報道稱,其一些網站的流量因可疑的人工智慧機器人或抓取工具而增加。該公司在一封未簽署的電子郵件中表示:「WordPress 網站一直都有一個很好的結構,使搜尋引擎很容易找到它們並為其建立索引。這些相同的功能也使它們很容易被人工智慧抓取。」Google、Cloudflare 和 Squarespace 沒有回應置評請求。










