Google 推出了 Gemini Omni,這是一個新的創意模型系列,旨在“創造任何東西”,您現在就可以使用它來創建令人驚嘆的逼真影片。
過去幾年,谷歌一直在致力於建立一個“世界模型”,讓世界保持凝聚力和基礎。該公司透過 Genie 模型探索了這個想法,該模型根據用戶推薦創建類似互動式視訊遊戲的體驗。谷歌長期以來一直提供 Veo 和 Nano Banana 型號,它們能夠透過文字和圖像輸入創建/編輯影片和圖像。
作為 I/O 2026 的一部分,Google 推出了 Gemini Omni,這是一種利用類似水平的基於現實的多模式理解的新模型。雖然 Omni 目前僅設計用於創建視訊內容,但它旨在「根據任何輸入創建任何內容」。這意味著結合文字、圖像、視訊和音訊(最初僅限於語音樣本)來創建統一的輸出視訊。生成後,您可以在後續回合中進一步增強影片。
Google Omni 的早期演示非常令人印象深刻,展示了 Gemini 對最新影片中每個元素的理解程度。 Rolling Marbles 影片就是一個很好的例子,它具有可信的球物理原理以及每次彈跳和鈴聲的可信聲音效果。
另一個演示採用黏土動畫風格的影片來解釋蛋白質折疊的工作原理。
與 Genie 型號不同的是,Genie 型號仍然只提供給那些付費購買 AI Ultra 訂閱的用戶,而Google將 Gemini Omni 系列定位為廣泛使用。該系列的第一款型號 Gemini Omni Flash 現已向所有 AI Plus 及以上訂閱者推出。或者,如果您想與全世界分享您的創作,Gemini Omni 將於本週晚些時候在 YouTube Shorts 和 YouTube Create 上免費提供。更高階的型號“Omni Pro”也被曝光,詳細資訊即將公佈。
鑑於所呈現的非凡現實感,該公司正在採取各種措施來確保影片的製作是負責任的。 Gemini Omni 源自 OpenAI 的 Sora 應用程序,可讓您創建自己的自訂“頭像”,並出現在您創建的影片中。否則,Omni 最初將無法編輯影片中的音訊和語音,直到 Google「負責任地向用戶提供此功能」。作為一項安全措施,Gemini Omni 生成的所有影片都將帶有 SynthID 標籤,以便輕鬆識別 AI 生成的影片。
FTC:我們使用附屬連結來賺取收入。 更多的










