權衡:《神鬼寓言 5》可能會妨礙日常程式設計任務
6 月 12 日,美國商務部命令 Anthropic 阻止美國以外的任何人訪問其最先進的模型。這是因為擔心中國、俄羅斯或其他相關國家可能利用這些模型攻擊美國的基礎設施,例如電網或銀行系統。作為回應,Anthropic 關閉了所有訪問,因為它無法按國家/地區阻止用戶。
特別是,根據 Anthropic 部落格報道,Mythos 被視為「對那些希望在網路攻擊中濫用它的惡意行為者俱有獨特的吸引力」。據 Anthropic 稱,該模型“可以比任何其他模型更有效地發現和利用軟體漏洞——除了最熟練的人類安全專家之外”,而且其“巨大的網路安全能力”可以用來對付美國。
Anthropic 表示,《神鬼寓言 5》具有“相同的基本模型”,但與《神話 5》不同的是,它“不提供如此獨特的進攻能力”。 《神鬼寓言 5》專為普通大眾設計,已經擁有 Anthropic 有史以來應用於該模型的最強大的保護措施,Anthropic 表示,在重新發布之前,這些保護措施現在更加強大。
經過數週的測試,《神鬼寓言 5》不再容易受到亞馬遜研究人員發現的繞過方法的影響,該方法發現了多個軟體漏洞並導致出口限制。 Anthropic 表示,更令人擔憂的是模型被操縱以產生解釋如何利用漏洞的程式碼。
據 Anthropic 稱,測試證實,市場上不太先進的競爭模型,例如 GPT-5.5 和 Kimi K2.7,“可以識別《神鬼寓言 5》在報告中發現的相同漏洞。” Anthropic 表示,這證實了“所報道的技術並未揭示任何獨特的神話級網絡能力”,並且“僅涉及常規的防禦性網絡工作”。
「不過,我們迅速採取行動解決了報道中的超支問題,」Anthropic 寫道。 Anthropic 表示,目前這種越獄方法在 99% 以上的情況下都被阻止。然而,該公司承認,加強保護措施會帶來“權衡”,可能會導致“在日常編碼和調試任務期間”阻止一些無害的提示。
發布日期: 2026-07-01 17:44:00
來源連結: arstechnica.com








