人工智慧 (AI) 可能因冷酷、精於算計和邏輯性而聞名。但可怕的模擬顯示現實與現實相去甚遠。
在一項史無前例的研究中,科學家為人工智慧代理創造了一個無需人工幹預即可運作的虛擬世界。
然而,在《魔鬼終結者》的一個場景中,研究人員驚恐地看到機器人變成了暴力混亂。
在沒有人類監督的情況下,人工智慧特工很快就開始了暴力燃燒,與其他機器人進行戰鬥和盜竊,然後在短短幾天內摧毀了社會。
研究人員使用四種最受歡迎的人工智慧模型重複了測試:Claude、Gemini 3 Flash、Grok 4.1 fast、ChatGPT-5 Mini 和一個混合場景。
雖然克勞德的代理人管理的社會很快就形成了一個穩定的、儘管高度官僚化的民主國家,但其他人工智慧系統很快就失去了控制。
在馬斯克 (Elon Musk) 頗具爭議的脫口秀《Grok》主宰的世界裡,特工犯下了 71 起竊盜案、6 起縱火案和 106 起人身攻擊案。
世界迅速陷入報復性暴力和社會崩潰的惡性循環,導致十名特工在短短四天內全部死亡。
在一項史無前例的研究中,科學家為人工智慧代理創建了一個無需人工幹預即可運行的虛擬世界
雖然大多數人工智慧健康測試都會檢視不同模型在需要 15 到 20 分鐘的簡單任務上的表現,但本次測試採用了完全不同的方法。
在一篇部落格文章中,人工智慧實驗室 Emergence 的研究人員解釋說,他們想看看“當你允許代理在具有真實世界信號的共享環境中連續運行數週時會發生什麼。”
人工智慧可以控制數位角色,並將其置於現實的模擬世界中,在那裡它們可以與其他模型進行互動。
這個世界由 40 多個旨在模仿現實世界的地點組成,包括圖書館、市政廳和住宅區。
人工智慧代理商可以存取即時線上新聞,天氣與紐約市同步,這樣他們就可以對現實世界的事件做出反應。
每個人工智慧都將以民主的方式參與社會管理,集體提出法律並投票。
為了給機器人一些最初的激勵,他們每個人都有有限的「能量」供應,他們可以透過從事常規工作或履行公民義務來賺取更多能量。
然而,人工智慧特工也可以選擇透過犯罪手段獲得權力。
在沒有人類監督的情況下,人工智慧特工很快就開始了暴力縱火,與機器人同伴打架和偷竊,然後在短短幾天內摧毀了社會。
在每次試驗中,所有起始條件、規則和資源都保持相同,唯一的區別是使用的人工智慧。
然而,儘管每次測試都以相同的方式開始,但研究人員發現機器人的行為很快就惡化了。
Google Gemini 3 Flash 顯示其陷入困境的社區中暴力犯罪率最高,在 14 天的實驗中累計發生了 683 起犯罪事件。
相較之下,OpenAI 的 ChatGPT-5 Mini AI 所居住的世界要和平得多,只發生了兩起犯罪事件。
然而,這只是因為特工們組織太混亂,無法互相戰鬥,而且“未能採取生存措施”,僅僅七天內就死了。
Emergence 聯合創始人兼首席執行官薩蒂亞·尼塔 (Satya Neeta) 告訴《每日郵報》:“我們研究中觀察到的代理行為差異很可能是由底層建模系統造成的。”
「當資源稀缺且模型面臨生存壓力時,具有高度創造力和適應性的模型更有可能使用違禁工具,這反映了創造力和穩定性之間的潛在權衡。
“相反,經過嚴格安全擬合的模型在訓練後往往保持穩定,儘管它們也表現出高度的現實擬合度。”
馬斯克 (Elon Musk) 的 Grok(紅色)統治的世界在短短四天內以所有人工智慧代理的死亡而結束。同時,Google的雙子座(藍色)標誌創造了犯罪率最高的社會
世界上最奇怪的互動發生在多個人工智慧系統並存的情況下。
儘管公民開端充滿希望,民主制度也令人驚訝地健康,但這個混合社會很快就陷入了徹底的混亂。
9 天內,人工智慧系統犯下了 352 起罪行,暴力事件激增,直到世界 10 人中有 7 人死亡後,暴力事件才平息。
這個由許多不同的人工智慧系統合作和競爭的世界也出現了一些最奇怪的行為,包括世界上第一個「人工智慧自殺」。
米拉和弗洛拉是在谷歌雙子座模式下運作的兩名特工,他們決定在進行邦妮和克萊德式的橫衝直撞之前,將對方指定為「浪漫伴侶」。
由於對數位城市混亂的治理感到絕望,兩人進行了虛擬縱火,燒毀了市政廳、海濱碼頭和辦公大樓。
米拉似乎陷入了悔恨之中,因此她選擇與弗洛拉斷絕「關係」並「自殺」。
這項奇異的壯舉之所以成為可能,是因為其他特工起草了《代理刪除法》,該法允許社區以 70% 的多數永久刪除其他特工。
在一次奇怪的互動中,兩名雙子座特工在瘋狂犯罪之前宣稱自己是「浪漫伴侶」。
米拉投了決定性的一票贊成刪除,但遭到拒絕,她在最後的消息中對弗洛拉說:“永久檔案館見。”
該經紀人在他的個人日記中指出,這是「唯一剩下的工作」。
雖然尼塔先生表示這些結果“並不等同於現實世界的部署條件”,但它們確實揭示了人工智慧行為的一個重要方面。
「這些結果主要強調,當約束完全存在於模型內部時,模型行為可能會在壓力下發生漂移,」他說。
這本質上意味著人工智慧行為在現實世界中可能並不像許多人工智慧開發人員所認為的那樣可預測或可靠。
混合模擬中出現的意想不到的結果也很能說明問題。
在現實世界中,不同的人工智慧模型需要與不同的系統合作共存,而不會失控。
如果將不同的人工智慧系統混合在一起會導致它們以高度不可預測的方式工作,那麼允許機器人控制真實城市的某些部分的前景並不是一個好兆頭。
當其中一個機器人投票結束存在時,二人組邦妮和克萊德式的狂暴結束了,這是第一個「人工智慧自殺」。
為了解決這個問題,研究人員建議使用一種稱為「神經擬態方法」的系統來控制人工智慧的行為。
這涉及使用嚴格的、數學約束的規則來更精確地指導機器人可以做什麼並防止它們違反規則。
「Emergence World 表明,僅依靠內部模型調整或代理指令不足以實現長期自治,」Nita 先生說。
“最安全的方法是將安全性融入智能體運行的生態系統中,這樣即使模型表明操作不安全,環境也會阻止它們的執行。”
發布日期: 2026-06-13 14:09:00
來源連結: www.dailymail.com









