人為靜修 一項政策將暗中限制競爭對手使用其新的人工智慧模型 Claude Fable 5 來開發其他人工智慧模型。在此舉遭到人工智慧研究界的強烈反對後,該公司改變了方向。
Anthropic 在給 WIRED 的聲明中表示:“我們正在改變《神鬼寓言 5》對 LLM 邊境部署的保障措施,使其可見。” “我們做出了錯誤的妥協,我們為沒有達到正確的平衡而道歉。”
Anthropic 在本週稍早發布了 Claude Fable 5,這是其最新人工智慧模型的一個版本,增加了旨在防止誤操作的護欄。 Anthropic 決定採取的一些保障措施並不令人意外:該公司表示,它將把提出有關網路安全、生物學或化學問題的用戶重定向到功能較弱的人工智慧模型,以減少有人使用先進人工智慧進行網路攻擊或製造生物武器的機會。
但對於試圖使用 Claude Fable 5 開發前沿人工智慧的研究人員來說,Anthropic 概述了一種不同的方法。該公司會以用戶看不見的方式刻意降低模型的效能。此舉將有效地削弱研究人員試圖利用 Claude 來訓練競爭性人工智慧模型的能力,而 Anthropic 在其服務條款中明確禁止這樣做。
Anthropic 現在表示正在改變方向,《克勞德寓言 5》對人工智慧開發的保障措施將對使用者可見。如果該公司懷疑用戶試圖使用 Claude 創建功能強大的人工智慧,則會提醒他們拒絕該請求或將用戶重定向到功能較弱的模型。
Anthropic 在受到人工智慧研究界的強烈反對後撤銷了這項政策。 Anthropic 已經採取措施限制競爭對手使用 Claude 來建立封閉和開源人工智慧模型,但批評者表示,悄悄降低模型對某些用戶的效能有點太過分了。 Claude 的編碼代理程式已成為開發人員(包括從事開源人工智慧研究專案的開發人員)最喜歡的工具,研究人員告訴《連線》雜誌,該公司的最新政策可能會導致一個令人不安的未來,即只有少數頂級人工智慧實驗室可以進行先進的人工智慧研究。
美國創新基金會高級研究員、前白宮人工智慧顧問 Dean Ball 在 X 上的一篇貼文中寫道,「在不告訴用戶的情況下貶低機器學習研究的表現,是令人震驚的敵意和可怕的表現。」他在另一篇文章中繼續表示,「隱形破壞」政策破壞了 Anthropic 的整體立場,因為它限制了人工智慧安全方面的人工智慧。
開源人工智慧新創公司 Prime Intellect 的研究主管 Will Brown 表示:“感覺就像 Anthropic 對公眾說,‘我們不相信其他人會進行人工智能研究。我們是唯一應該進行人工智能研究的人。’” “感覺有點像他們開始把梯子拉到身後。”
布朗表示,這項政策還會讓開發商對自己是否違反了 Anthropic 的規則一無所知,因為該公司不會在其安全措施被觸發時通知他們。他補充說,這些限制可能會產生深遠的影響。作為一個例子,他指出第三方評估公司的生態系統不斷發展,這些公司測試最先進模型的安全性、性能和可靠性——如果 Anthropic 秘密降低其模型的級別,這些工作可能會受到阻礙。








