不出所料,Adobe 本週發布的大部分新聞和產品更新都是: 以生成人工智能為中心。儘管今年大部分時間圖像和視頻創作都取得了巨大飛躍,但 Adob​​​​e 正專注於提升另一個領域的 AI 產品:AI 音頻。

配樂創作和語音製作這兩個新功能正如其名稱所暗示的那樣。您可以為視頻創建背景音樂並錄製腳本。但每款產品都配備了手動控制功能,使音頻 AI 不再是一場機會遊戲,而更像是對所有技能水平的創作者來說都是一個有用的工具。它們現在已推出測試版。

Adobe 還發布了最新的第五代 Firefly 圖像模型的測試版。它有望更好地生成逼真的圖像,現在您可以使用基於提示的編輯。還有一個新的 Firefly beta 視頻編輯器,帶有多軌時間線,旨在幫助您收集人工智能生成的剪輯。 Adobe 還擴大了與兩家新的人工智能公司 ElevenLabs 和 Topaz Labs 的合作夥伴關係。如需了解更多 AI 新聞,您可以了解 Photoshop 和 Express 中即將推出的 AI 助手。

創建音軌

以下是如何提示您使用 AI 編寫音樂描述的示例。

土坯

創作音樂和配樂

音樂許可很複雜,尤其是商業用途。因此,讓我從最重要的部分開始:任何使用 Firefly 配樂創作的音樂都是普遍許可的,這意味著您可以無限期地將其用於任何目的。 Adobe 使用獲得許可用於 AI 培訓的內容(在本例中為音頻)構建其 AI 工具。因此從理論上講,您不應該將 Firefly AI 音頻從 YouTube 或其他平台上刪除,也不應該收到可怕的版權警告。

Adobe 音頻 AI 主管傑伊·勒博夫 (Jay LeBoeuf) 在接受采訪時表示:“這是世界上一個獨特的時期,音樂授權成為每個人最關心的問題,創作者要么因為試圖將自己的內容做到最好而感到沮喪,要么感到困惑。” “所以我們只是希望能夠消除混亂。”

在一個演示中,Firefly 拒絕了帶有藝術家姓名的提示,因為出於版權問題,它違反了使用準則。例如,因為該模型沒有接受過泰勒·斯威夫特的音樂訓練,所以它無法創作與她類似的音樂。

現在,有趣的是:生成音軌是 Adob​​​​e 的第一個 AI 音樂工具,它旨在消除您想要的內容的猜測。您上傳視頻,人工智能對其進行分析。根據評估,Firefly 會編寫一條它認為可能適合您的視頻的消息。這是一個 Mad Libs 風格的提示,您可以根據需要更改描述符。提示由三部分組成:描述總體氛圍、風格(思維風格)和目的(商業、實驗等)。您還可以調整節奏和能量水平。

一旦您對提示感到滿意,請單擊“創建”,不到兩分鐘後,四個純樂器變體就可以演奏了。您的音頻將與視頻一樣長,但您可以根據需要對其進行編輯。您可以上傳最長五分鐘的視頻。

如何用 Firefly 創作音樂

您現在可以嘗試為您的視頻創作人工智能器樂。配樂創作和語音創作都可以通過 Firefly 進行,並且處於測試階段。檢查您的 Adob​​​​e 程序是否包含對 Firefly 的訪問,如果不包含,您可以獲取一個 每月 10 美元起

  1. 在網絡上打開 Firefly。
  2. 單擊左側菜單中的“創建”。
  3. 單擊從聊天窗口下方的可用卡創建配樂。
  4. 使用左側菜單上傳您的視頻。
  5. 然後 Firefly 將分析您的視頻並在左側菜單中寫入適當的消息。
  6. 如果您不喜歡 Firefly 發現的內容,可以單擊“X”並輸入您喜歡的提示。您還可以從左側菜單中選擇推薦的氛圍、風格和用途。
  7. 向下滾動並根據需要調整能量、節奏和持續時間。
  8. 單擊創建。

獲得喜歡的配樂後,您可以將整個視頻(或僅配樂)下載到您的計算機上。

Adobe Firefly 創建配樂截圖

這是我為一些人在海灘上聚會製作的 AI 視頻製作的 Firefly 的四首音樂曲目的示例。

攝影:Katelyn Chedraoui/CNET

創建演講

在 Firefly 中創建語音非常簡單,並且包含許多功能,使其幾乎適用於任何項目。這是一個簡單的窗口,您可以在其中輸入您想要人工智能語音朗讀的單詞。您還可以上傳最多 7,500 個字符的腳本——大約 15 到 20 分鐘的視頻。上傳後,您可以從 50 種聲音中進行選擇,每種聲音都標有大致年齡和性別,包括非二元選項。您可以用 20 種不同的語言創建語音。但有趣的部分是你可以做些什麼來完善你的提示。

口語不僅僅是閱讀紙面上的文字。當我們閱讀長篇文章或與他人交談時,我們會自然地在講話中添加重點、情感和節奏。使用新程序,您可以做同樣的事情,在您希望人工智能休息的地方添加暫停,並突出顯示音調應該改變的部分。

如果您像我一樣,第一次嘗試時沒有人立即念出您的名字,您可以使用“正確發音”工具來確保沒有打嗝。選擇正確的名字或名詞,然後添加語音分析,AI將用它來平滑發音。

這些工具以及您自定義特定部分的動手能力旨在為您提供其他文本轉語音程序並不總是提供的更多控制。

“這是我們為創作者、小企業主、教育工作者以及任何真正有故事可講但可能感覺不像我們拿出麥克風說話那麼舒服的人提供現場演講的一種方式,”勒博夫說。

螢火蟲音頻是一種全新的人工智能模式。但這不是您唯一的選擇。 Adobe 今年一直在穩步增加其第三方 AI 模型列表,包括視頻和圖像 AI。它通過將 ElevenLab 的多語言 V2 模型作為語音生成選項,再次擴展了這些選項。

想了解更多,請看一下 Adobe 的 Project Indigo 相機應用程序如何工作,現已支持 iPhone 17



來源連結