將一個聊天機器人訓練給另一個聊天機器人可能是一場災難
攝影/蓋蒂圖片社
多位舉報人表示,那些透過提供高品質對話和測試來訓練新人工智慧模型的人是在作弊,而是使用 ChatGPT 等聊天機器人來完成這項工作。 新科學家。這種看似廣泛的做法有可能破壞人工智慧的未來,因為它可能導致更先進模型的「崩潰」。
目前使用的大多數人工智慧模型都是根據來自互聯網的文字和資料進行訓練的。但隨著模型規模的擴大並需要更多的訓練數據,人工智慧公司已經開始僱用員工與人工智慧進行對話和測試,希望由此產生的高品質數據能夠提高未來大型語言模型(LLM)的能力和實用性。
這些工人通常由第三方僱用,而不是直接由人工智慧公司僱用,而且通常沒有全職合同,工資也很低。根據一位名叫 Alice* 的員工表示,這可能會鼓勵他們使用聊天機器人更快完成任務,儘管這違反了公司政策。
「這種現象非常普遍;我工作過的每家公司都對此有明確的指導方針,而且他們顯然是在試圖抓住人們,所以我認為他們很關心。但我認為他們無法阻止它,」愛麗絲說。
愛麗絲說她 對於使用 ChatGPT 執行訓練任務「一點也不」感到內疚,他說,如果你指示聊天機器人避免 AI 輸出的常見跡象,例如大量的破折號,就很容易逃脫懲罰。 「只有最馬虎的用戶才會被抓住,」她說。 “任何對人工智慧特徵稍有了解的人都可以告訴他們的產品不要使用它們,到那時你會做什麼?”
「如果這些公司想要高品質的數據,他們應該提供高品質的合同,」愛麗絲說。 「相反,他們忽視了正在苦苦掙扎的人,在盡可能短的時間內僱用他們,並在項目毫無預警地結束時拋棄他們。”
另一位員工 Bob* 在訓練平台 Outlier 工作。他最初的任務是進行人工智慧培訓,他說自己非法使用人工智慧,然後被提升到管理職位,他的部分工作就是抓住其他人做同樣的事情。
「管理層在輕度容忍和完全禁止之間搖擺不定,」鮑勃說。異常員工將使用名為 Hubstaff 的工具進行跟踪,該工具將隨機間隔截取他們的桌面螢幕截圖,以確保他們確實按照命令完成任務。鮑伯將在這些螢幕截圖中尋找人工智慧模型的證據。
「人們希望它(像 ChatGPT 這樣的 AI 模型)在其他分頁中開啟或最小化,這樣我們就可以在工作列中看到它,」Bob 說。 “甚至桌面上有名字的文件夾之類的東西也暴露了這一點(人工智能的使用)。”
Scale AI 的 Outlier 沒有回應置評請求。 Scale AI 在其網站上聲稱為 Meta 和 Cisco 等科技巨頭提供服務,但兩家公司都沒有回應 新科學家請求評論。鮑伯表示,他親自參與谷歌的項目,谷歌也沒有回應置評要求。
另一位在多個平台上工作的員工卡羅爾*表示,她對人工智慧的使用始於對她的工作進行審查,以查找與詳細任務說明相衝突的任何內容,因為任何違規行為都可能意味著被排除在項目之外並導致收入損失。
「我擔心自己沒有收入來源,但透過法學碩士,我可以更輕鬆地管理一切,」卡羅爾說。 「對於我現在做的很多項目,我正在創建腳本,所以我將使用一個法學碩士來幫助我創建腳本,然後我將使用另一個法學碩士來幫助我創建與腳本相關的文件。我感到內疚,但就像我說的,一開始我嘗試了更多以確保我沒有犯任何錯誤。”
「我擔心我實際上讓(人工智慧)變得更糟。我認為使用模型來自學會否定一些價值,」卡羅爾說。
英國伯明翰大學的馬克李 (Mark Lee) 表示,研究表明,如果對人工智慧生成的內容進行遞歸訓練,人工智慧模型就會「崩潰」。當這種情況發生時,模型的能力就會直線下降並且變得不那麼有用。這個過程有時被稱為人工智慧同類相食或人工智慧近親繁殖。
「這是最壞的情況。現實世界中可能不會發生這種情況,」李說。 “仍然有少數人。如果你擁有大約 10% 的人員數據,就可以緩解這種情況並避免模型崩潰。”
但李表示,這些工人犯下的詐欺行為會帶來後果,並對生產力產生負面影響。 “你會發現人工智慧並不擅長執行類似人類的任務,而不是一場災難。這是一個問題,因為我認為這些模型並沒有達到應有的水平。”
*為了保護身份,姓名已更改。
主題:










