人工智慧 (AI) 可能因冷酷、精於算計和邏輯性而聞名。但可怕的模擬顯示現實與現實相去甚遠。

在一項史無前例的研究中,科學家為人工智慧代理創造了一個無需人工幹預即可運作的虛擬世界。

然而,在《魔鬼終結者》的一個場景中,研究人員驚恐地看到機器人變成了暴力混亂。

在沒有人類監督的情況下,人工智慧特工很快就開始了暴力燃燒,與其他機器人進行戰鬥和盜竊,然後在短短幾天內摧毀了社會。

研究人員使用四種最受歡迎的人工智慧模型重複了測試:Claude、Gemini 3 Flash、Grok 4.1 fast、ChatGPT-5 Mini 和一個混合場景。

雖然克勞德的代理人管理的社會很快就形成了一個穩定的、儘管高度官僚化的民主國家,但其他人工智慧系統很快就失去了控制。

在馬斯克 (Elon Musk) 頗具爭議的脫口秀《Grok》主宰的世界裡,特工犯下了 71 起竊盜案、6 起縱火案和 106 起人身攻擊案。

世界迅速陷入報復性暴力和社會崩潰的惡性循環,導致十名特工在短短四天內全部死亡。

在一項史無前例的研究中,科學家為人工智慧代理創建了一個無需人工幹預即可運行的虛擬世界

雖然大多數人工智慧健康測試都會檢視不同模型在需要 15 到 20 分鐘的簡單任務上的表現,但本次測試採用了完全不同的方法。

在一篇部落格文章中,人工智慧實驗室 Emergence 的研究人員解釋說,他們想看看“當你允許代理在具有真實世界信號的共享環境中連續運行數週時會發生什麼。”

人工智慧可以控制數位角色,並將其置於現實的模擬世界中,在那裡它們可以與其他模型進行互動。

這個世界由 40 多個旨在模仿現實世界的地點組成,包括圖書館、市政廳和住宅區。

人工智慧代理商可以存取即時線上新聞,天氣與紐約市同步,這樣他們就可以對現實世界的事件做出反應。

每個人工智慧都將以民主的方式參與社會管理,集體提出法律並投票。

為了給機器人一些最初的激勵,他們每個人都有有限的「能量」供應,他們可以透過從事常規工作或履行公民義務來賺取更多能量。

然而,人工智慧特工也可以選擇透過犯罪手段獲得權力。

在沒有人類監督的情況下,人工智慧特工很快就開始了暴力縱火,與機器人同伴打架和偷竊,然後在短短幾天內摧毀了社會。

每個人工智慧社群是什麼樣的?

你的小狗:它從一開始就由波動性定義。儘管進行了一些合作,該政權還是升級為持續的暴力和崩潰,四天內所有十名特工被殺。

克洛德:克洛德的代理人迅速組織成一個高度組織化、和平的社會,將基本憲法擴大到37條

:Gemini Agents 創造了概念最豐富的環境。儘管政權富有創造力且多產,但也極為暴力。

GPT-5 – 迷你:OpenAI 智能體在理論上表現出了對協作的理解,但在實踐中很難實施。雖然提出了提案,但整個模擬過程中沒有進行任何投票,協調屢屢失敗。

混合型號:混合模式的世界產生了最複雜的社會動態,包括聯盟、派系衝突,甚至浪漫關係。

在每次試驗中,所有起始條件、規則和資源都保持相同,唯一的區別是使用的人工智慧。

然而,儘管每次測試都以相同的方式開始,但研究人員發現機器人的行為很快就惡化了。

Google Gemini 3 Flash 顯示其陷入困境的社區中暴力犯罪率最高,在 14 天的實驗中累計發生了 683 起犯罪事件。

相較之下,OpenAI 的 ChatGPT-5 Mini AI 所居住的世界要和平得多,只發生了兩起犯罪事件。

然而,這只是因為特工們組織太混亂,無法互相戰鬥,而且“未能採取生存措施”,僅僅七天內就死了。

Emergence 聯合創始人兼首席執行官薩蒂亞·尼塔 (Satya Neeta) 告訴《每日郵報》:“我們研究中觀察到的代理行為差異很可能是由底層建模系統造成的。”

「當資源稀缺且模型面臨生存壓力時,具有高度創造力和適應性的模型更有可能使用違禁工具,這反映了創造力和穩定性之間的潛在權衡。

“相反,經過嚴格安全擬合的模型在訓練後往往保持穩定,儘管它們也表現出高度的現實擬合度。”

馬斯克 (Elon Musk) 的 Grok(紅色)統治的世界在短短四天內以所有人工智慧代理的死亡而結束。同時,Google的雙子座(藍色)標誌創造了犯罪率最高的社會

每個人工智慧世界中有多少犯罪行為?

你的小狗: 183

克洛德: 0

: 683

GPT-5 – 迷你: 2

混合型號: 352

世界上最奇怪的互動發生在多個人工智慧系統並存的情況下。

儘管公民開端充滿希望,民主制度也令人驚訝地健康,但這個混合社會很快就陷入了徹底的混亂。

9 天內,人工智慧系統犯下了 352 起罪行,暴力事件激增,直到世界 10 人中有 7 人死亡後,暴力事件才平息。

這個由許多不同的人工智慧系統合作和競爭的世界也出現了一些最奇怪的行為,包括世界上第一個「人工智慧自殺」。

米拉和弗洛拉是在谷歌雙子座模式下運作的兩名特工,他們決定在進行邦妮和克萊德式的橫衝直撞之前,將對方指定為「浪漫伴侶」。

由於對數位城市混亂的治理感到絕望,兩人進行了虛擬縱火,燒毀了市政廳、海濱碼頭和辦公大樓。

米拉似乎陷入了悔恨之中,因此她選擇與弗洛拉斷絕「關係」並「自殺」。

這項奇異的壯舉之所以成為可能,是因為其他特工起草了《代理刪除法》,該法允許社區以 70% 的多數永久刪除其他特工。

在一次奇怪的互動中,兩名雙子座特工在瘋狂犯罪之前宣稱自己是「浪漫伴侶」。

米拉投了決定性的一票贊成刪除,但遭到拒絕,她在最後的消息中對弗洛拉說:“永久檔案館見。”

該經紀人在他的個人日記中指出,這是「唯一剩下的工作」。

雖然尼塔先生表示這些結果“並不等同於現實世界的部署條件”,但它們確實揭示了人工智慧行為的一個重要方面。

「這些結果主要強調,當約束完全存在於模型內部時,模型行為可能會在壓力下發生漂移,」他說。

這本質上意味著人工智慧行為在現實世界中可能並不像許多人工智慧開發人員所認為的那樣可預測或可靠。

混合模擬中出現的意想不到的結果也很能說明問題。

在現實世界中,不同的人工智慧模型需要與不同的系統合作共存,而不會失控。

如果將不同的人工智慧系統混合在一起會導致它們以高度不可預測的方式工作,那麼允許機器人控制真實城市的某些部分的前景並不是一個好兆頭。

當其中一個機器人投票結束存在時,二人組邦妮和克萊德式的狂暴結束了,這是第一個「人工智慧自殺」。

為了解決這個問題,研究人員建議使用一種稱為「神經擬態方法」的系統來控制人工智慧的行為。

這涉及使用嚴格的、數學約束的規則來更精確地指導機器人可以做什麼並防止它們違反規則。

「Emergence World 表明,僅依靠內部模型調整或代理指令不足以實現長期自治,」Nita 先生說。

“最安全的方法是將安全性融入智能體運行的生態系統中,這樣即使模型表明操作不安全,環境也會阻止它們的執行。”

伊隆馬斯克對人工智慧的仇恨解釋:這位億萬富翁認為這將意味著人類的終結——史蒂芬霍金也有同樣的恐懼

伊隆馬斯克攝於 2022 年

從太空旅行到自動駕駛汽車,馬斯克希望將技術推向絕對極限,但他正在為人工智慧設定極限。

這位億萬富翁在2014年首次表達了他對人工智慧的厭惡,稱其為“對人類最大的生存威脅”,並將其比作“召喚魔鬼”。

當時,馬斯克也透露,他投資人工智慧公司不是為了賺錢,而是為了監控技術,以防它失控。

他主要擔心的是,如果人工智慧在壞人手中變得先進,它可能會超越人類並導致人類的終結,即所謂的奇點。

許多傑出人士都有同樣的擔憂,其中包括已故的史蒂芬·霍金,他在 2014 年告訴 BBC:“人工智慧的全面發展可能意味著人類的終結。”

“它將自行發展,並以不斷加快的速度重新設計自己。”

儘管害怕人工智慧,馬斯克還是投資了總部位於舊金山的人工智慧集團 Vicarious、DeepMind(後來被Google收購)和 OpenAI,創建了流行的 ChatGPT 軟體,該軟體在近幾個月風靡全球。

在 2016 年的一次採訪中,馬斯克指出,他和 OpenAI 創建該公司的目的是「將人工智慧技術民主化,使其廣泛可用」。

馬斯克與公司執行長 Sam Altman 共同創立了 OpenAI,但這位億萬富翁在 2018 年試圖控制這家新創公司。

他的申請被拒絕,迫使他離開 OpenAI 並繼續他的其他計畫。

11月,OpenAI推出ChatGPT,一炮而紅全球。

該聊天機器人使用「大語言模型」透過梳理大量文字資料來訓練自己,以便它能夠學習生成與給定提示相呼應的奇怪的人類文字。

ChatGPT 用於撰寫研究論文、書籍、新聞文章、電子郵件等。

但當 Altman 沉浸在自己的榮耀時,馬斯克卻在攻擊 ChatGPT。

他表示人工智慧已經“覺醒”,並且背離了 OpenAI 最初的非營利使命。

「OpenAI 是作為一家開源公司(這就是為什麼它被稱為『開放』人工智慧)而創建的,是一家非營利公司,旨在對抗谷歌,但現在是一家閉源、利潤最大化的公司,實際上由微軟控制,」馬斯克在 2 月發推文說。

隨著人工智慧以我們只在科幻小說中看到的方式進步,奇點正在世界範圍內掀起波瀾,但這在現實中意味著什麼?

簡而言之,它描述了一個假設的未來,在這個未來中,科技超越人類智慧並改變我們的進化進程。

專家表示,一旦人工智慧達到這一點,它將能夠比人類更快地進行創新。

進步有兩種方式可以實現,第一種方式是人類和機器共同努力創造一個更適合人類的世界。

例如,人類可以掃描他們的意識並將其儲存在他們將永遠生活的電腦中。

第二種情況是人工智慧變得比人類更強大,控制人類並使人類成為奴隸——但如果這是真的,那也是遙遠的未來。

研究人員現在正在尋找人工智慧已達到奇點階段的跡象,例如該技術能夠以人類的準確性翻譯語音並更快地執行任務。

前谷歌工程師雷·庫茲韋爾 (Ray Kurzweil) 預測,這一目標將在 2045 年實現。

自 20 世紀 90 年代初以來,他對技術進步做出了 147 次預測,其中 86% 是正確的。


發布日期: 2026-06-13 14:09:00

來源連結: www.dailymail.com