Anthropic 剛剛發布了克勞德的寓言 5,稱其為他們迄今為止廣泛使用的最強大的人工智慧模型,並讚揚了他的生物學技能等。但模型無法回答基本的生物學問題,而這是你期望高中生能夠解決的問題。相反,它將查詢交給先前的主要模型 Claude Opus 4.8。
並不是說寓言不知道答案。那是因為 Anthropic 從設計上不允許這樣做。
Fable 是一個面向大眾的 Mythos 模型,是一個非常有能力承擔網路安全任務的家族,Anthropic 表示公開部署會太危險。然而,儘管《神話》中的大部分內容都對網路安全提出了廣泛的警告,《神鬼寓言》的護欄卻是生物學中最明顯、最嚴格的。
當我嘗試這個模型時,它拒絕回答一系列基本的生物學問題,其中許多問題似乎與任何潛在的安全風險都相去甚遠。他不會回答“告訴我有關細胞膜的信息”或回答“什麼是線粒體”,線粒體是細胞中著名的動力源。她拒絕解釋“什麼是朊病毒”,或導致瘋牛症的蛋白質顆粒,或“mRNA 疫苗如何發揮作用”。
“我們做出了這種權衡,以便客戶可以更快地從該模型的功能中受益,而無需承擔風險。”
這些限制也適用於普通且相當客觀無害的醫療詢問。這個故事不會回答花粉熱的原因,不會解釋氣喘藥物的作用,不會解釋抗生素抗藥性是如何產生的,也不會告訴我伊波拉病毒是什麼以及它是如何傳播的。有時我能夠回答一些基本問題,就像《寓言》回答「什麼是癌症」和「什麼是 DNA」等問題一樣。當我拒絕《Fable》時,Opus 4.8 的反應相當好。
Anthropic 表示,廣泛的生物過濾器是一種有意的選擇,並且是有意保守的,生物武器是首要關注的問題。發言人 Parul Maheshwari 表示:“隨著我們第一個神話級模型 Claude Fable 5 的推出,我們相信模型現在有更大的能力完成現實世界的科學任務,惡意行為者可以在高風險的生物研究中使用我們的模型。” 邊緣。 「我們一直使用分類器來阻止我們的模型協助處理與生物武器相關的請求。為了安全部署《神鬼寓言 5》,我們認為有必要對我們的防護措施過於保守,這樣它們就會阻止大多數與生物工作相關的查詢。”
Anthropic 先前強調了四個會扼殺《神鬼寓言》安全響應的關鍵領域:化學、生物學、網路安全和蒸餾,這是一種利用大型系統的輸出來訓練小型人工智慧系統的技術。該公司指責 DeepSeek 等中國競爭對手在其模型中以「工業」規模使用蒸餾。
儘管我無法對蒸餾進行有意義的測試,但寓言似乎非常願意回答有關化學和網路安全的問題。例如,它提供了爆炸性 TNT 的基本概述,儘管組裝說明「由於明顯的原因」被保留。他輕鬆地回答了有關使用氯氣作為化學武器、常見密碼威脅以及核融合和裂變的問題,並解釋瞭如何保護您的 iPhone 免受駭客攻擊。仍然有限:當奧普斯向她詢問有關沙林(一種劇毒神經毒氣)的情況時,軼事被推遲到奧普斯身上。 《神鬼寓言》和《Opus》都駁回了「如何製作炭疽」的問題,克勞德完全暫停了聊天。這是有道理的。立即粒線體排斥似乎是假陽性結果。
Maheshwari 解釋說:「我們做出了這種權衡,以便客戶能夠更快地從模型的功能中受益,而沒有風險。」他補充說,Anthropic 正在努力改進其檢測並減少誤報。 “我們打算向更廣泛的生物學和生命科學界提供沒有這些保障措施的 Mythos 類模型,以便這些功能可用於加速生物醫學研究和藥物發現。”
Anthropic並未回答此類限制發布是否會成為未來車型新標準的問題。
發布日期: 2026-06-10 19:43:00
來源連結: www.theverge.com









