Ironwood 是 Google 最新的張量處理器
英偉達作為人工智能芯片主要供應商的地位可能會受到谷歌首創的定制芯片的威脅。 像元 和 人擇的 計劃斥資數十億美元購買谷歌張量處理器。
什麼是TPU?
人工智能行業的成功很大程度上取決於圖形處理單元(GPU),這是一種可以同時執行許多並行計算的計算機芯片,而不是像運行大多數計算機的計算機處理器(CPU)那樣一個接一個地執行計算。
GPU 最初是為計算機圖形學(顧名思義)和遊戲而設計的。 “如果我在空間中有很多像素,並且需要旋轉它們來計算新的相機圖像,則可以針對許多不同的像素並行完成此操作,”說 弗朗西斯科·孔蒂 在意大利博洛尼亞大學。
事實證明,這種並行執行計算的能力對於訓練和運行人工智能模型非常有用,這些模型通常使用涉及同時執行的大型數字網格的計算,稱為矩陣乘法。 “GPU 是一種非常通用的架構,但它們非常適合具有高並行性的應用程序,”Conti 說。
然而,由於 GPU 最初設計時並未考慮到人工智能,因此 GPU 轉換芯片上執行的計算的方式可能效率不高。 Conti 表示,張量處理單元 (TPU) 最初由谷歌於 2016 年開發,專門用於矩陣乘法,這是訓練和運行大型人工智能模型所需的核心計算。
今年谷歌發布了 第七代 TPU 稱為 Ironwood它為該公司的許多人工智能模型提供支持,例如用於蛋白質建模的 Gemini 和 AlphaFold。
對於人工智能來說,TPU 比 GPU 好嗎?
他說,從技術角度來看,TPU 更像是 GPU 的一個子集,而不是完全不同的芯片。 西蒙·麥金托什-史密斯 在英國布里斯託大學。 “它們專注於 GPU 所做的事情,更具體地說是針對人工智能的訓練和推理,但它們實際上在某些方面比您想像的更像 GPU。”但他表示,由於 TPU 的設計考慮了特定的人工智能應用,因此它們可以更高效地完成這些任務,並可能節省數千萬或數億美元。
然而,這種專業化也有其缺點,如果人工智能模型一代又一代發生顯著變化,可能會使 TPU 變得不靈活,Conti 說。 “如果你的 (TPU) 不靈活,你就必須在數據中心的節點處理器上運行(計算),這會顯著減慢你的速度,”Conti 說。
Nvidia GPU 傳統上具有的優勢之一是提供簡單的軟件,可以幫助人工智能開發人員在 Nvidia 芯片上運行代碼。 Conti 表示,TPU 首次問世時情況並非如此,但這些芯片現在已經變得更易於使用。 “現在你可以用 TPU(用 GPU)做同樣的事情,”他說。 “既然你已經把它包括在內,很明顯,負擔能力成為一個主要因素。”
交通樞紐是誰建的?
雖然谷歌是第一個推出 TPU 的公司,但許多最大的人工智能公司(稱為超大規模企業)以及小型初創公司現在已經開始開發自己的定制 TPU,其中包括亞馬遜,該公司使用自己的 Trainium 芯片來訓練其 AI 模型。
“大多數超大規模企業都有自己的內部程序,部分原因是 GPU 變得如此昂貴,因為供不應求,而設計和構建自己的程序可能會更便宜,”McIntosh-Smith 說。
TPU將如何影響人工智能行業?
谷歌十多年來一直在開發 TPU,但主要將這些芯片用於自己的人工智能模型。現在發生的變化是,Meta 和 Anthropic 等其他大公司正在從谷歌的 TPU 中大量購買計算能力。 “我們還沒有聽說大客戶會繼續前進,也許這就是現在開始發生的情況,”麥金托什-史密斯說。 “他們已經夠老了,也夠了。”
他說,除了為大公司創造更多選擇之外,多元化還可以為他們帶來良好的財務意義。 “這甚至可能意味著你將來會從 Nvidia 獲得更好的交易,”他說。
主題:










