Gemma 4 12B 的容量與 260 億參數版本大致相同。
信用:Google
Gemma 4 12B 的容量與 260 億參數版本大致相同。
信用:Google
谷歌表示,新模型能夠進行複雜的多步驟推理和代理工作流程,而以前需要更大的 Gemma 變體。儘管參數數量較少,但 Gemma 4 12B 配備了新設計的多令牌預測 (MTP) 公式工具,該工具利用未使用的處理週期來計算潛在的未來令牌。結果是更快的速度和效率。 Google已經發布了其他 Gemma 4 型號的可選 MTP 版本,但這是第一個開箱即用的 MTP 版本。
由於採用了新的多媒體方法,Gemma 4 12B 的效率也更高。 Gemma 4 系列本質上是多媒體,接受文字、音訊或圖像作為輸入。大多數通用 AI 模型(包括其他 Gemma 4 變體)使用自訂編碼器來處理非文字輸入並將該資料傳遞給 LLM。這工作得很好,但會增加訪問時間和記憶體使用量。
透過新的平均加權模型,Google實現了一個簡化的視覺化嵌入模組,具有單矩陣乘法和位置嵌入,允許資料以適當的空間意識傳遞到LLM。這消除了對笨重的中間編碼器的需求。對於音訊來說,根本沒有加密。開發人員找到了一種方法,可以在用於文字符號的相同向量中顯示原始音訊訊號。
如果您想查看新的 Gemma 4 模型,無需下載即可透過 LM Studio、Google AI Edge Gallery 等工具存取。但 Gemma 4 12B 的整體理念是你可以在本地以自己的方式玩它。如果您有 RAM,則可以在 Kaggle 和 Hugging Face 上立即下載模型權重。距離 18GB 還差一點點。
發布日期: 2026-06-03 20:10:00
來源連結: arstechnica.com










