Nguyen 警告說,一旦確定了涵蓋的模型,安全測試的有效性可能取決於人工智慧公司是否完全透明並將該過程視為「真正的合作」。
「定義問題的背後隱藏著可觀察性的問題,」阮寫道。 “政府無法評估它看不到的東西,前沿能力只有製造它們的實驗室才能看到。”
Vereen 表示,“為新的人工智慧模型建立足夠的網路防禦的窗口也可能很快就會關閉”,即使是精心設計的政府計劃也可能難以在如此短的時間內正確審查前沿模型。 Vereen 表示:“即使做得很好,部署前測試也有局限性。”他指出,谷歌的威脅情報團隊已經發現與國家相關的參與者使用參數模型來自動化網絡攻擊,並且“研究人員已經表明,神話式的漏洞邏輯可以使用開放權重系統來重現。”
因此,雖然人工智慧可能會自願接受測試,但他們可能出於經濟動機而獲得橡皮圖章批准,而不是與政府合作以最大程度地測試已知的前沿能力。
Vereen 說:“開發無法惡意駭客攻擊但仍具有商業吸引力的模型可能會很困難。”
他的結論是,該組織“可能在短期內產生網路安全效益”,但“長期影響”仍然“不清楚”。
阮建議道德辦公室採取措施創建“國家安全界需要數十年的分類網絡計量、自願部署前評估和協調的漏洞掃描”,以“持續評估概率性而非確定性、自主性而非定向性的系統,其功能會隨著每次更新而變化。”
但安全測試必須與技術一樣快速發展,否則我們將面臨根據「昨天的風險」評估新興模型的風險,Nguyen 說。
因此,該過程的核心將取決於具有深厚技術專長和機密國家安全見解的利益相關者之間的誠實交流。阮寫道,這是確保美國集中精力保護公眾免受最可信和最重大的人工智慧風險的唯一途徑,而不是簡單地提供「績效保證」。
發布日期: 2026-06-03 19:11:00
來源連結: arstechnica.com









