在 WWDC26 主題演講中,Apple 宣布了第三代 Apple Foundation Models (AFM),其中包括五種模型,其中一些模型是本地模型,一些模型是基於雲端的模型,其中一個模型駐留在運行 Nvidia 晶片的 Google 伺服器上。以下是其工作原理的描述。

一點背景

當蘋果在 2024 年首次宣布其基本模型時,該產品陣容包括一個具有大約 30 億個參數的設備上語言模型和一個“可通過私有云計算訪問並在蘋果芯片伺服器上運行的更大的伺服器端語言模型”,正如該公司當時所說。

私有雲運算是一項雄心勃勃的事業,因為它旨在提供基於雲端的人工智慧功能,同時保持用戶期望從設備上處理獲得的相同隱私保證。

因此,將所有東西都放在裡面很重要。私有雲運算在 Apple 資料中心的由 Apple 處理器驅動的伺服器上運作。儘管如此,其隱私保證可能會由第三方安全研究人員獨立驗證。

然而,隨著蘋果努力實現其人工智慧雄心,該公司與Google合作,使用 Gemini 作為其新人工智慧工作的核心,並在本週早些時候的 WWDC26 主題演講中宣布了其結果。

新的蘋果基礎型號

第三代AFM包括五種型號: AFM 3 核AFM 3 擴充代碼代表設備上的型號,以及 原子力顯微鏡雲, 雲 ADM 3(圖)AFM 3 雲端專業版它們是基於伺服器的。 ADM 3 Cloud(圖像)中的 D 代表擴散,這是我們之前介紹過的技術。

除 AFM 3 Cloud Pro 外,所有其他型號均設計為在 Apple 晶片裝置上運作。同時,AFM 3 Cloud Pro 在 Google Cloud 託管的 NVIDIA GPU 上運作。

據該公司稱,這是蘋果首次將其私有雲運算架構擴展到第三方基礎設施,「同時保持蘋果強大的安全和隱私保護」。

至於型號本身,以下是每個型號的詳細信息,正如蘋果所解釋的那樣:

  • AFM 3 Core 是我們的下一代密集 30 億參數模型,帶來了新的品質水準。
  • AFM 3 Core Advanced,我們最強大的行動裝置型號。它本質上是多模式的,並提供有用的功能,例如富有表現力的語音和高度準確的聽寫。這個包含 200 億個參數的模型基於 Apple 的前沿研究而構建,採用稀疏架構,可根據請求同時啟動 1 到 40 億個參數。 AFM 3 Core Advanced 已針對我們最強大的 Apple 晶片系統進行解鎖和優化。
  • AFM 3 Cloud,我們的伺服器主力,針對速度、效率和效能進行了最佳化。
  • Cloud ADM 3(影像)用於影像建立和編輯,可解鎖進階照片編輯工具、全新影像遊樂場等。
  • AFM 3 Cloud Pro 是我們最強大的伺服器模型,支援最苛刻的用例,例如基於代理的工具和複雜推理。

這裡的亮點包括 AFM 3 Core Advanced 和 AFM 3 Cloud Pro。

從 AFM 3 Core Advanced 開始,它將 200 億個參數整合到裝置上模型中,這是一個不小的壯舉。面向公眾的設備上的大多數模型往往保持在數十億個參數範圍內。

為了使 AFM 3 Core Advanced 正常運作,Apple 使用了稀疏架構,可以根據請求一次啟動多達 40 億個參數,而不是使用密集架構,後者必須為每個請求保持所有 200 億個參數處於活動狀態。

儘管這種選擇性活化在概念上類似於 Expert Blend 方法,但它基於 Apple 發明的一種方法,並在一年前發表的一項有趣的研究「針對大型語言模型的修剪遵循指令」中進行了詳細描述。

至於AFM 3 Cloud Pro,它是在外部基礎設施上運行的。您可以在本週早些時候 Apple 安全部落格上發布的這篇文章中閱讀此擴充功能的一些技術細節,但這是最重要的部分:

在此基礎上,蘋果和谷歌合作創造了遠遠超出傳統機密運算部署的功能:

  • 我們不僅僅依靠機密運算技術來防止利用機密虛擬機器外部特權存取的攻擊,包括側通道攻擊。我們認為每個元件——從韌體到主機和來賓作業系統堆疊再到應用程式程式碼——都是我們可信任運算基礎的一部分,並受到我們可驗證的透明度和非特權存取保證的約束。
  • 為了降低供應鏈攻擊的風險,我們對 PCC 佇列中包含的所有 Google Cloud 硬體維護一個可加密驗證、僅新增的註冊表。對於如果受到損害可能被用來竊取使用者資料的元件,我們的軟體認證是基於至少兩個獨立的第三方供應商信任來源。
  • 我們相信,即使使用機密運算進行部署,推理堆疊的設計也必須從一開始就考慮到隱私和安全性。 Google Cloud 上的 PCC 使用許多與 Apple 處理器上的 PCC 相同的架構安全模式來實現這些分層保護:每個請求的網路資料的初始分析發生在其自己命名空間中的專用進程中,共享推理軟體的處理生命週期很短,經過驗證的密鑰存儲在與外部輸入隔離的單獨、專用、機密虛擬機中。

蘋果在其機器學習研究部落格中表示,所有五個模型“在專門研究各自的架構和用例之前,都共享一個共同的初始基礎,並添加了音頻、圖像理解、長上下文推理和高品質視覺圖像生成等多模式功能。”

該公司補充說,為了訓練這些模型,它使用了「多種數據,包括公開資訊、從第三方許可或購買的數據、開源數據、來自臨時研究的數據以及合成數據。」蘋果還強調,訓練過程不包括用戶數據或交互,網路發布商可以選擇退出基本模型訓練。

結果

蘋果表示,它對其第三代基礎模型進行了廣泛的人工評估,內部評審員對遵守說明、真實性、演示和圖像理解等類別的反應進行評分。

將這些模型與其前身(如果適用)進行比較,您可以看到下面的一些結果:

將 AFM 3 Core 和 AFM 3 Cloud 與上一代模型進行比較時,在人類對整體文字功能的平行評分中首選回應的份額。結果在四個不同的語言組中呈現,以證明跨國際變體的一致性能。 「English」代表我們的全球英語語言評估集,「PFIGSCJK」、「DNNSTV」和「AFIHHMPRTU」代表其餘支援的全球語言。

同時人們對英語圖片理解能力的評分中首選反應的比例。結果將 AFM 3 Core 和 AFM 3 Cloud 與其 2025 年的前輩進行了比較。

人類對聽寫任務的同時評分中首選回應的比例。結果將 AFM 3 Core Advanced 與 Apple 現有的生產聽寫系統的七個品質參數進行了比較。 AFM 3 Core Advanced 在整體品質方面表現出積極的勝率,偏好​​始終延伸到所有個人格式和理解維度。

若想更深入了解第三代 Apple Foundation 型號,請點擊此連結。

值得在亞馬遜上查看

FTC:我們使用自動會員連結來產生收入。 更多的。

來源連結