去年,我假裝了我孩子的毛絨動物,讓它看起來像是他的毛絨鹿在度假。

這是一個實驗,看看我是否可以重現谷歌運行的雙子座廣告中描述的事件,而且我從未向我四歲的孩子展示馴鹿巴迪的冒險視頻。但這是一次發人深省的練習,讓我思考了一些無害的基因人工智慧樂趣和全面的廢話之間的差異。也許這個維恩圖是一個完美的圓!也許不是。但我確實知道的是,創建逼真影片的工具出奇地好,只需要很少的努力和專業知識。在 Gemini 的 Omni 時代,這種趨勢依然火熱。

Omni 是一個新的高效模型系列,據報道有一天能夠將任何類型的輸入(照片、影片、文字)轉換為其他任何內容。但對於初學者來說,這只是製作影片。 Omni Flash 是 Google 發布的第一個模型,現已在該公司的 AI 影片製作和編輯平台 Flow 上提供。如果你願意,你仍然可以使用之前的型號 Veo,但 Omni 在 Veo 的基礎上做了一些改進。

透過 Omni,您可以上傳影片並將其與文字提示一起用作 AI 生成創作的起點。谷歌還聲稱,Omni 在影片製作過程中融入了更多現實世界的知識,因此可以更好地保持整個影片中角色的一致性。只有一種方法可以真正找出這些說法是否屬實:我帶著 AI Buddy 回來,收拾他的 AI 生成的小袋子,準備另一次冒險。

結果如此複雜以至於令人困惑。有些非常好——比五個月前測試 Veo 時更加一致和忠實於我的提示。但即使是 Omni 為我製作的最好的剪輯,仍然有一些人為的跳躍,例如巴迪在跳傘時突然改變方向。

在另一個影片中,我給了 Omni 一些藝術自由。 「製作巴迪收拾行李去度假並登上遊輪去熱帶度假的蒙太奇。氣氛可愛又有趣。巴迪在他的手提箱裡裝了一些有趣的東西,這些東西在剪輯中稍後出現。」他讓巴迪裝了一罐蜂蜜。在影片的後面,他像抓住一瓶防曬霜一樣抓住了它。 「哦,哦,」角色邊說邊把蜂蜜倒進他的蹄子裡。

老實說,一點也不差。除了蜂蜜瓶在整個影片中不斷變化,從罐子到裝滿水的透明噴霧瓶,再到裝滿蜂蜜的擠壓瓶。我甚至無法開始描述模特兒是如何想出影片的最後一幀的——幾乎就像她製作了剛剛製作的系列中的一堆元素一樣。

您可以使用基於文字的提示來建議對影片進行編輯,我將把功勞歸功於 Google:與我嘗試 Veo 3 時相比,這在 Omni 上效果更好。但結果是 壞的 與 Veo — 太糟糕了,以至於我發現每次我想要改變一些東西時,從頭開始索取新視頻要容易得多。 Omni 基本上會接受您的編輯,但結果並不總是令人滿意。

我讓它在巴迪的假期剪輯中突出顯示他的面部反應,結果看起來很奇怪。他偶爾也會給巴迪喇叭,但他沒有。這位朋友是一個 嬰兒非常感謝。當我要求他去掉一個場景中出現的角落時,他答應了,然後在所有其他場景中都添加了角落。

問題是,這些都不是免費的。創建影片需要花費積分,根據場景的長度和開始時的“成分”,費用從 15 到 40 積分不等。一輪編輯需要 40 個學分。我有每月 20 美元的 AI Pro 計劃,每月附帶 1,000 個單位。在創建了大約 20 個剪輯並對其進行了一些編輯後,我的剪輯數量減少到了 145 個。如果您對希望 Omni 創建的影片有具體的想法,您可能需要與模型進行大量昂貴的來回比較,以獲得接近您的願景的影片。

我可以誠實地說,我對所看到的一切沒有做好準備

Omni 的優點之一是它可以將人工智慧生成的內容添加到真實影片中,所以我給了巴迪一個休息時間,自己做了一個深度偽造。從一段表情中性的自拍影片開始,我敦促 Omni 製作我吃一盤義大利麵、坐在飛機座位上、站在艾菲爾鐵塔前啃著法國麵包的影片。我可以誠實地說,我對所看到的一切沒有做好準備。

我的 Deepfake 影片中有 AI 旁白。叉子敲擊義大利麵碗的聲音有點太做作了。飛機影片出現兩次,背景中有一名女性。但除了這些小故障和一種隱約奇怪的感覺之外,它們還是令人信服的。

我給我丈夫看了意大利麵剪輯。他知道我正在測試人工智慧視訊工具,但我沒有告訴他場景中的內容是人工智慧生成的。由於不知道人工智慧會產生什麼結果,他認為我坐在鏡頭前吃義大利麵,並說他唯一的線索是那個碗看起來很陌生。吃麵食本身就足以令人信服 我的丈夫。一個基本上在現實生活中看過我的男人 過去十年的每一天

我的其他深度偽造品都具有不同程度的「足以在社群媒體上愚弄人們」的程度。艾菲爾鐵塔的一些片段看起來有點卡通化,但其中一個足夠令人信服,你可能需要看幾次才能看出它是人工智慧。 當我轉過頭,露出她綁成馬尾的頭髮時,你就知道那不是我了。但我不確定其他人會知道其中的區別,這讓我感覺很奇怪。

我們絕對是在恐怖谷深處

老實說,我對這一切有點厭倦了。當我測試 Veo 3 的真實感時,我感到非常震驚。在過去的幾年裡,一次又一次地用假照片來偽造人物是多麼容易,這讓我感到震驚。我可能也應該對 Omni 感到震驚,我想我確實如此,但優勢已經消失了。

製作人工智慧生成的電影傑作仍然不像谷歌讓你相信的那麼容易。但 Omni 在一些明顯的方面對 Veo 進行了改進。如果您有 Google 帳戶和信用卡,那麼您可以拍攝自己坐在家裡的視頻,並輕鬆地讓自己看起來像是在飛往毛伊島的航班上。我認為我們還沒有完全到達“奇點的山麓”,但我們肯定已經深陷恐怖谷了。

這個故事中的所有圖像和影片均由 Google Gemini 創建。

關注主題和作者 從這個故事中可以在您的個人化主頁來源上查看更多類似內容並接收電子郵件更新。


來源連結