但以 Cerebras 的標準,每秒 1,000 個代幣實際上是適中的。該公司在 Llama 3.1 70B 上測量了每秒 2,100 個代碼,並在 OpenAI 的開放權重 gpt-oss-120B 模型上報告了每秒 3,000 個代碼,這表明 Codex-Spark 相對較低的速度反映了更大或更複雜模型的開銷。
AI 編碼代理迎來了輝煌的一年,OpenAI 的 Codex 和 Anthropic 的 Claude Code 等工具在快速建立原型、介面和模組化程式碼方面達到了新的實用水平。 OpenAI、Google 和 Anthropic 正在競相推出更強大的加密代理,延遲是區分獲勝者的關鍵因素;編碼速度更快的模型可以讓開發人員更快地迭代。
面對來自Anthropic的激烈競爭,OpenAI一直在快速迭代其Codex產品線,在執行長Sam Altman針對來自Google的競爭壓力發佈內部「紅色代碼」備忘錄後,於12月推出了GPT-5.2,然後在幾天前發布了GPT-5.3-Codex。
遠離英偉達的多元化
Spark 更深入的硬體故事可能比其基準測試結果更重要。該模型運行在 Cerebras 的 Wafer Scale Engine 3 上,這是一款餐盤大小的晶片,Cerebras 至少從 2022 年起就圍繞該晶片建立了業務。 OpenAI 和 Cerebras 在 1 月宣布了合作夥伴關係,Codex-Spark 是其中推出的第一個產品。
去年,OpenAI 系統性地減少了對 Nvidia 的依賴。該公司於 2025 年 10 月與 AMD 簽署了一項大規模的多年期協議,於 11 月與亞馬遜達成了價值 380 億美元的雲端運算協議,並正在設計自己的客製化人工智慧晶片,最終由台積電製造。
同時,與 Nvidia 計劃的 1,000 億美元基礎設施交易迄今尚未成功,儘管 Nvidia 此後承諾投資 200 億美元。路透社報導,OpenAI 對某些 Nvidia 晶片在推理任務上的速度感到不滿意,而這正是 OpenAI Codex-Spark 設計的工作負載類型。
無論引擎蓋下使用什麼晶片,速度都很重要,儘管它可能會以犧牲準確性為代價。對於整天在程式碼編輯器中等待 AI 建議的開發人員來說,每秒 1,000 個令牌可能看起來不太像小心翼翼地駕駛拼圖,而更像是操作鋸子。只要注意你切的東西就好了。
發布日期: 2026-02-12 22:56:00
來源連結: arstechnica.com










