Google剛剛升級了AI映像模型,似乎是一個相當重要的進步。該公司今天放棄了Flash 2.5圖像,這是一個重要的續訂,承諾更聰明,更靈活的圖像製作。
升級的模型允許用戶發出自然語言消息,不僅可以創建圖像,還可以合併現有照片,並在不產生奇怪的扭曲的情況下進行更準確的編輯。他還提出了雙子座的“全球知識”,以更好地了解他的創作。
當Google試圖縮小與行業領導者Openai的差距時,此升級是進行的。過去,圖像的創建一直是AI的重要指南。 3月,當公司開始使用GPT-4O出生髮電機時,Chatgpt的使用增加。該模型創建的病毒工作室吉卜力的模仿導致公司 型號GPU月根據Openai Sam Altman的首席執行官的說法。 Chatgpt現在已經過去了 每週7億用戶。 相比之下,Google Sundar Pichai的首席執行官透露了公司收益的呼籲 每月4.5億用戶仍然跟隨Chatgpt。
https://www.youtube.com/watch?v=bi-wi2q_xog
Google表示,谷歌表示已解決了AI最大的頭痛之一。到目前為止,維護多個過程中一致的字符或對像是AI圖像發生器的主要挑戰。
“現在,您可以將相同的角色放在不同的環境中,從多個角度到新設置出現單個產品,或者在維持主題的同時創建一致的品牌資產” 該公司在 部落格。
Google說,用戶現在只需一個問題就可以做到非常具體的叮咬。例如,用戶可以模糊圖像的背景,從t襯衫中去除污漬,改變主題的態度,甚至為黑白照片添加顏色。
甚至在正式發布之前,新車型都將眾包LMARENA評級平台上的頭部轉向,該平台以“ Nano-Banana”的名稱匿名出現。一個 x用戶 他們分享瞭如何使用Nano-Banana將Altman的襯衫變成照片。結果非常好。今天,Google挺身而出,聲稱該模型的所有權表明Nano-Banana實際上是Flash 2.5 Gemini Image。
除了在Gemini應用程序中可用外,開發人員現在可以通過Gemini API,Google AI Studio和Vertex AI訪問新模型。 Google已經創建了各種標準應用程序,這些應用程序使用Google AI Studio上的新模型,AI AI助手,這些用戶可以在其上看到代碼。
該公司還表示,一些開發人員已經嘗試了該應用程序,以了解它在現實世界中如何有用,例如創建房地產註冊卡,統一的工人的徽章和產品。