從某種意義上說,Anthropic 執行長 Dario Amodei 正在得到他想要的東西。
阿莫代長期以來一直認為,人工智慧正變得非常強大,因此,迫切需要對該技術進行監管限制。阿莫迪在上週發表的一篇文章中寫道,如果尖端人工智慧模型不符合嚴格的安全標準,那麼它們的發布「應該被阻止或逆轉,因為它們對公共安全構成威脅」。
唉,問這個 目前的 美國政府著手建立全面的新監管機構有點像對著猴子的腿許願(或者,對於觀眾中的放大鏡來說,是“一願柳”):阿莫迪的宣言發布幾天后,Anthropic 最新的人工智能模型在山姆大叔的命令下被殺死。
這個模型——其不受限制的形式被稱為“神話”,其嚴格限制的、可公開訪問的形式被稱為“寓言”——代表了一項重大的技術成就。在傳統的人工智慧效能基準測試中,它的表現明顯優於所有前代產品。在其短暫的上市期間,無數用戶驚嘆於它的能力。在我自己對其新聞技巧的測試中,《神鬼寓言》在喚起過時感和存在恐懼感方面比舊模型有效 30%。
Anthropic 最初僅與經過審查的公共和私人組織共享 Mythos,以便他們能夠加強針對其功能的網路防禦。在向公眾發布其新模型之前,Anthropic 為其設置了嚴格的防護欄:《神鬼寓言》將拒絕回答幾乎任何有關網路安全或生物學的問題(以防止其用於駭客攻擊和生物恐怖主義)。
白宮認為這還不夠。週五,在得知《神鬼寓言》包含潛在的安全漏洞後,政府對該模型實施了出口管制——使得 Anthropic 向其提供《神鬼寓言》為非法行為。 每個 外國人,包括自己的移民僱員。實際上,這意味著 Anthropic 必須讓《神鬼寓言》完全離線(人工智慧模型仍然無法掃描使用者的大腦並確認他們的國籍)。
換句話說:我們的政府聲稱有權阻止或刪除威脅公共安全的人工智慧模型。
但阿莫代並沒有慶祝。其他人工智慧安全倡導者可能不應該這樣做。
確實,白宮最初的、自由放任的人工智慧治理方式現在已經化為廢墟。然而,從廢墟中崛起的是最糟糕的監管制度:由行政部門的突發奇想(而不是明確且具有約束力的規則)、非專業官員明顯的技術誤解(而不是領域專家的知識)以及腐敗總統的政治偏見(而不是法律或成本的公正規定)所控制的監管制度。
美國需要一種監管體系,既能降低人工智慧的風險,又能促進其效益,而不是允許總統以可疑的理由讓他最不喜歡的公司屈服。白宮似乎正在建造後者。
禁止《神鬼寓言》的理由
乍一看,管理層的行為似乎是合理的。畢竟,人性本身就被神話的網路犯罪禮物激怒了。即使有護欄,《神鬼寓言》也非常堅固。從表面上看,該模型不太可能帶來獨特的安全挑戰。
此外,其中之一 Anthropic自己的投資者 警告白宮,《神鬼寓言》很容易受到潛在「越獄」的影響,即繞過模型安全控制的方法。
上週四,擁有 Anthropic 130 億美元股份的亞馬遜與政府官員分享了記錄此類越獄的研究報告。白宮的回應是聯繫 Anthropic 並要求其解決問題。這家人工智慧公司堅稱其模型是安全的,管理層誤解了亞馬遜的研究。
因此,管理層得出結論,Anthropic 無法或不願意糾正問題。然後他決定對該模型實施出口管制是確保它不會降低美國網路安全的唯一方法。
Fable 的安全義務可能與 ChatGPT 的大致相同
然而,這個版本的事件並不完整。經過仔細檢查,管理階層的行為似乎更站不住腳。
具體來說,《神鬼寓言》的壓制似乎(至少)有三個問題。
首先,它可以說是源自於技術誤解。現有的人工智慧模式沒有 100% 能防越獄。一些專家表示,亞馬遜發現的具體功能並不是《神鬼寓言》所獨有的。網路安全組織 Luta Security 的負責人凱蒂·穆蘇里斯 (Katie Moussouris) 審閱了亞馬遜調查結果的副本,並向英國《金融時報》表示,這些調查結果並沒有引發新的風險:根據穆蘇里斯的說法,亞馬遜表明,應以某種方式要求,《神鬼寓言》檢測到了軟體漏洞,表面上是為了幫助用戶加強防禦。但許多邊界模型,包括 OpenAI 的 GPT 5.5,將提供相同的服務。
Anthropic 則表示,它已經對《神鬼寓言》進行了數千小時的測試(由獨立組織和美國政府進行),以確保它不包含 全球的 越獄,意思是「一種可以在很大程度上繞過模型保護措施、解鎖廣泛網路功能的方法」。然而,他堅稱亞馬遜發現的這種狹隘越獄是不可能完全阻止的。
如果這是正確的,那麼政府對《神鬼寓言》的攻擊目標將是有選擇性和反覆無常的。
《神鬼寓言》的鎮壓可能是出於政治動機
其次,我們有充分的理由相信,管理階層的高壓行為是因為 Anthropic 拒絕討好。
今年早些時候,在人工智慧公司拒絕批准將其模型用於大規模監視和完全自主武器系統後,Anthropic 與唐納德·川普總統的國防部發生了衝突。五角大廈的回應是宣布 Anthropic 為「供應鏈風險」——這一名稱將限制政府承包商與其開展業務的能力。
這項措施在法律上是可疑的,而且顯然是不誠實的。從本質上講,管理層聲稱 Anthropic 的人工智慧在結構上對於政府工作來說是不安全的,即使 繼續將這種人工智慧用於政府工作。該政策的明確意圖是懲罰一家堅持管理層不喜歡的合約條款的公司。
光是這個先例就足以讓人有理由質疑白宮對《神鬼寓言》實施出口管制的公正性。事實上,管理層與 Anthropic 的兩個頂級競爭對手——OpenAI 和埃隆·馬斯克的 xAI 關係友好——這一事實進一步增加了懷疑的理由。
但管理層不誠實的最好證明來自 他自己的 對他的行為的解釋。一位「熟悉政府思路的消息人士」在接受 Axios 採訪時表示,Anthropic 的困難部分反映了其無法與白宮「有效溝通」或「欣賞意識形態差異」。
可以說,如果這場爭議只是關於安全漏洞,那麼川普政府和人類自由派領導層之間的「意識形態差異」將產生怎樣的影響還不清楚。但 Axios 繼續報道稱,Anthropic 要求 Luta Security 的穆蘇裡(政府認為穆蘇裡是「激進民主黨人」)對亞馬遜的研究進行審查,這加劇了自身的困難。
同樣,如果出口管制只是出於網路安全問題,那麼穆蘇裡的意識形態傾向似乎無關緊要。
在這種背景下,很難不把政府對 Anthropic 未能「溝通」的抱怨解讀為要求該公司屈服於川普的要求。
也就是說,亞馬遜的研究目前無法接受公眾審查。我們不知道《神鬼寓言》到底有什麼漏洞,也不知道管理員在禁止該模型時到底在想什麼。
然而可以肯定的是,《神鬼寓言》的禁令背後的過程有嚴重缺陷。政府尚未就人工智慧模型的安全制定任何客觀且具有約束力的標準,更不用說讓國會制定此類要求了。
在單方面將《神鬼寓言》從市場上剔除之前,它也沒有進行任何徹底或透明的成本效益分析,而監管機構在實施全面的政策變化之前通常必須這樣做。而打擊《神鬼寓言》的潛在成本也不容忽視:例如,如果外國企業知道美國總統可以(並且將會)隨心所欲地撤銷他們對美國人工智慧模型的訪問權限,那麼他們就會有動力用非美國替代品取代 Claude 和 ChatGPT。
也許亞馬遜已經確定了一項嚴重到足以消除這些擔憂的責任。但政府並沒有做出太多努力來確定這一點。
我們需要一個更好的機器人啟示替代方案
人工智慧模型正在迅速變得更加強大,因此也更加危險。人工智慧的進步可能會對網路安全產生積極或中性的影響:先進的模型最終可能會在加強防禦和破壞防禦方面發揮同樣甚至更多的作用。
但這並不能保證。
為了減輕前沿人工智慧系統帶來的風險,政府可能有理由建立許可流程,使新模型的發布以符合安全標準為條件。
然而,國會制定公正、受規則約束的監管程序與行政部門隨意禁止人工智慧系統之間存在差異。如果科技公司的執行長不應該對推出哪些模型擁有完全的自由裁量權,那麼總統也不應該對阻止哪些模型擁有不受限制的權力。無意識、過度人工智慧的替代方案 必須 這並不是一場異想天開的競爭——但就目前而言,似乎確實如此。










