據使用人工智能圖像和視頻模型的創作者稱,人工智能圖像和視頻模型不是人類,但具有獨特的“個性”。這一新現像是對快速發展的人工智能製作行業的反應,凸顯了創作者如何管理令人眼花繚亂的選擇。
基因人工智能近年來發展迅猛,但要到 2025 年 人工智能圖像, 影片 和其他媒體製作模式佔據了中心舞台。就像聊天機器人重新定義文本創建一樣,這些創造性的人工智能模型正在改變內容創建和創造性工作,無論好壞。
谷歌和OpenAI長期以來一直是人工智能競賽的領導者。今年之前,他們因 雙子座 和 聊天GPT 聊天機器人。現在, 我看到 3, 納米香蕉 和 索拉2 使科技巨頭在創意人工智能模型中穩居領先地位。新的人工智能創新 土坯 以及創意人工智能初創公司,例如 機場跑道Pika 和 Luma 今年也加強了這一領域。
為了讓人工智能公司在擁擠的市場中保持競爭力,生產工具已經從利基產品發展成為必需品。公司正專注於升級其人工智能模型,以保持優勢並吸引新用戶。增強功能通常包括創建更高分辨率的詳細內容,對於視頻,包括音頻並延長剪輯的長度。每次模型更新時,幻想或錯誤都會消失,這就是它變得越來越難的部分原因 識別人工智能生成的內容。
總體而言,創建人工智能內容的選擇從未如此之多。當創作者必須選擇要使用的模型時,哪個模型將產生可行的結果就不再重要了。現在,爭論的焦點是哪一個最適合特定的項目或任務。因此,每個人工智能模型現在都有自己的個性。
不要錯過我們任何公正的技術內容和基於實驗室的評論。 添加 CNET 作為首選 Google 來源。
讓人工智能工具人性化、個性化
創作者通俗地使用了“個性”這個術語——人工智能模型不是人類,因此沒有個性。該術語實際上指的是模型處理特定任務的能力以及他們在特定領域表現出色的聲譽。它還指的是底座中每個模型的獨特風格。
“創作者正在將這些工具人性化。他們稱它們為‘創意’或‘細節’,因為他們正在與人工智能建立真正的關係。它不再只是軟件,”Tiffany Kyazze 說(@TechTiff),其創始人 人工智能流俱樂部它教人們如何使用人工智能工具。 “這些人物角色幫助創作者建立對他們的工具的信心,克服創意障礙,並在他們的工作流程中找到舒適感。”
對於每天使用人工智能工具的創作者來說,選擇正確的模型已經成為創作過程中不可或缺的一部分,就像選擇正確的相機鏡頭或畫筆一樣。
“每個模特對世界的詮釋都不同;有些略帶電影感,有些則更超現實或夢幻,”他說 戴夫·克拉克總監兼創意總監 人工智能前景廣闊一個人工智能製作工作室。 “對我來說,關鍵是知道如何將我的創意願景轉化為視覺語言提示,使我能夠實現我想要的藝術。”
發現每個模特的個性有一個學習曲線。有時,創建它的公司甚至沒有指定它。圖像和視頻之間以及同一模型的不同代之間都存在差異。部分原因在於模型的創建方式。
Adobe 生成人工智能副總裁 Alexandru Costin 表示:“我們在訓練自己的模型時學到的部分內容是在訓練過程結束時,你可以向模型展示某種風格,模型將在某種程度上匹配或適應該風格並基本上呈現出個性。” “所以我們看到非常固執己見的模特這樣做。其他人則試圖變得更加中立。”
用於構建和完善模型的訓練數據也在開發每個模型的基本風格中發揮著作用。例如,Adobe 的 Firefly 模型是使用獲得許可的 Adobe Stock 圖像進行訓練的,這就是為什麼 Firefly 生成的內容通常具有類似 Stock 的外觀。 (科斯汀表示,公司正在努力解決這個問題,以創造更現實的結果。)
每個AI圖像和視頻模型的個性是什麼?
我在這些人工智能模型上花了很多時間,與我交談過的創作者在每個模型的個性方面與我有相似的想法和經驗。以下是一些最受歡迎的模特人物。
- 我看到谷歌3了 (視頻):電影般、自然運動、高品質
- 流動 (視頻):區分現實主義,尤其是人類特徵
- 機場跑道 (視頻):完整的創意工作室,非常適合需要親自控制的人
- 索拉 (視頻):有利於構思和探索,模因 Sora 社交網絡應用程序
- 中途旅行 (圖像和視頻):最具創意的模型,最適合藝術或風格化工作
- 谷歌的納米香蕉 (圖片):非常適合字符一致性,適合電子商務和社交媒體工作
- Adobe 螢火蟲圖像模型 5 (圖片):專業工作的商業安全結果
您還會注意到聊天機器人之間的獨特個性。 ChatGPT 以其充滿愛心、友善的語氣而聞名(有時 令人煩惱的是),而 Claude 是一個有用的研究工具,Gemini 對於 Google 用戶來說是一個方便的選擇。然而,人工智能圖像和視頻模型的不同個性——風格、美學、先天偏好等——更加明顯。
雖然您可以使用人工智能圖像和視頻生成器創建幾乎任何場景,但它們並不是聊天機器人那樣的萬事通。使用創意人工智能工具進行專業工作的創作者通常需要將特定的內容留給他們。了解每個模特的個性至關重要。
使用多個模型的好處
在人工智能模型和程序之間切換的想法乍一看似乎並不吸引人,但擴展人工智能目錄是有好處的。
克拉克和他的團隊使用了多種人工智能模型來開發新的 短片 以“我的朋友,Zeph”的名義執導。 Clark 稱之為混合電影製作方法,團隊使用 Adobe Firefly、Google 的 Veo 3.1 和 Luma 的 Ray3 等人工智能工具,以及傳統的 Adobe 軟件(包括 Photoshop 和 Premiere Pro)。
“通過混合多個模型,你可以獲得創造性的範圍和精度,幾乎就像擁有一個專家團隊一樣,”克拉克說。 “我們可以在開始拍攝之前更早地設想故事的世界,更快地迭代並做出更有創意的選擇。”
一些創作者忠於特定的人工智能工具和平台,可能不願意拓展業務。 Kyazze 表示,這種致力於人工智能的想法有點誤導。獲得最佳結果的創作者是“工具性的、目標導向的”。
“多模型工作流程的真正好處在於,您不必強迫一種工具完成所有工作。您可以利用每個模型的真正優勢。這不僅提高了效率,還為您提供了更好的結果,因為您為項目的每個特定部分使用了正確的工具,”Kyazze 說。
不斷發展的個性
由於最近可供創作者使用的模型不斷增加,具有個性的人工智能模型的想法相對較新。但它們不是靜態標籤。模特的聲譽和個性會隨著時間而改變。隨著新更新的發布,曾經在特定任務上表現不佳的模型可能會得到改進。
這一趨勢是人工智能在創造性工作中發揮越來越大作用的又一個跡象。並非所有創作者都是如此,因為有很多人反對人工智能並且不想使用它。但對於那些有興趣的人來說,沒有更多的選擇。
為人工智能圖像和視頻模型創建獨特的角色是一種方法或解決方案,可以幫助他們選擇正確的工具來獲得更好的結果,而無需在不適合的人工智能工具上浪費太多時間和金錢。
儘管遺傳媒體模型已經有了很大的改進,但仍然不完美。 Kyazze 表示,適應每個模型的優點和缺點是一種智能的工作流程設計。克拉克說,記住人工智能模型只是工具也很重要。
“藝術家的人類表達——我們的個性和我們的創意觀點——才是真正推動結果的因素,”克拉克說。 “這並不是要取代傳統工藝,而是要擴展可能性,讓想像力比以往更接近屏幕。”
(披露:CNET 母公司 Ziff Davis 在 4 月份對 OpenAI 提起訴訟,指控其在訓練和運營其人工智能係統時侵犯了 Ziff Davis 的版權。)







