Google 的新款 Gemma 4 12B 專為在任何具有 16GB RAM 的筆記型電腦上運行而設計

Gemma 4 12B 的容量與 260 億參數版本大致相同。

信用：Google

谷歌表示，新模型能夠進行複雜的多步驟推理和代理工作流程，而以前需要更大的 Gemma 變體。儘管參數數量較少，但 Gemma 4 12B 配備了新設計的多令牌預測 (MTP) 公式工具，該工具利用未使用的處理週期來計算潛在的未來令牌。結果是更快的速度和效率。 Google已經發布了其他 Gemma 4 型號的可選 MTP 版本，但這是第一個開箱即用的 MTP 版本。

由於採用了新的多媒體方法，Gemma 4 12B 的效率也更高。 Gemma 4 系列本質上是多媒體，接受文字、音訊或圖像作為輸入。大多數通用 AI 模型（包括其他 Gemma 4 變體）使用自訂編碼器來處理非文字輸入並將該資料傳遞給 LLM。這工作得很好，但會增加訪問時間和記憶體使用量。

透過新的平均加權模型，Google實現了一個簡化的視覺化嵌入模組，具有單矩陣乘法和位置嵌入，允許資料以適當的空間意識傳遞到LLM。這消除了對笨重的中間編碼器的需求。對於音訊來說，根本沒有加密。開發人員找到了一種方法，可以在用於文字符號的相同向量中顯示原始音訊訊號。

如果您想查看新的 Gemma 4 模型，無需下載即可透過 LM Studio、Google AI Edge Gallery 等工具存取。但 Gemma 4 12B 的整體理念是你可以在本地以自己的方式玩它。如果您有 RAM，則可以在 Kaggle 和 Hugging Face 上立即下載模型權重。距離 18GB 還差一點點。

發布日期: 2026-06-03 20:10:00

來源連結: arstechnica.com