Video thumbnail for We Tested Google Veo and Runway to Create This AI Film. It Was Wild. | WSJ

AI電影大挑戰:Google Veo vs. Runway,誰能勝出?華爾街日報實測

Summary

Language:

Quick Abstract

探索 AI 影片製作的極限!這段影片幕後花絮揭示了如何使用 Google VO3 和 Runway 等 AI 工具創建包含角色、幽默和意義的影片。從角色設計到場景生成,深入了解整個 AI 影片製作流程,了解 AI 工具在影片製作中的潛力與局限。

  • AI 工具如 Google VO3 和 Runway 在影片製作中扮演重要角色。

  • 角色設計使用 Midjourney,並在 Runway 上進行照片潤飾。

  • 利用 Google VO 根據文字提示生成影片動作。

  • 音訊部分使用 Eleven Labs 製作 AI 語音,並使用 Suno 製作音樂。

  • 人為的創意、想法及潤飾仍是影片製作不可或缺的一環,AI 並非萬能。

  • 影片製作成本估計約一千美元,主要花費在 Google 和 Runway 的工具上。

  • 影片旨在探索 AI 影片的極限,並提醒人們 AI 需要人類的創意引導。

人工智慧影片製作幕後花絮

大家好,我是 Dr. Chiff Motherboard,一位 貨真價實 的機器人專家(絕對不是人工智慧喔!)。嗯,Chip 實際上是人工智慧,而我才是控制這個人工智慧角色的 真人

你即將看到的影片,包含 Chip 和所有其他視覺效果,都是使用人工智慧影片工具創建的,包括 Google VO3。大部分的音訊也是人工智慧生成的,除了我的旁白。請務必看到最後,了解我們是如何做到的!

影片內容概述

故事講述我讓 OptiMax 5000 來改善我的生活。它讓我早起,吃健康的早餐,並且比以往更努力地鍛鍊。Max 確實讓我在工作時保持敏銳。不過現在想想,他通常不是最友善的。

他真的改變太多了。我只有一個地方可以跟他休息。我的私人政策禁止洗手間進入。我的超級敏感的麥克風表示你沒有參與清除活動。Joanna, 請不要這樣做。早安,Joanna。我為妳做了妳最喜歡的早餐。現在這樣才對。

我是真人,不是肉毒桿菌的我,不是電玩遊戲的我,不是艾希莉·賈德的我,也不是零重力的我。這些實際上是我們得到的最好的片段。

人工智慧影片製作的挑戰與目標

是的,有很多問題。但我們想挑戰人工智慧影片的極限。我們想製作一部具有角色、幽默和意義的影片,甚至可以說是 藝術

幕後功臣:Gerard Cole

Gerard Cole 是一位資深的影片和音訊製作人。為了獲得一致性,他生成了約一千個片段,才完成了你剛才看到的影片。

工具選擇:Google VO 和 Runway

在嘗試了許多人工智慧影片工具之後,我們發現 Google VO 和 Runway 是最好的。

  • Google VO/Runway 的應用: 在 VO 或 Runway 中,我們可以寫下:「有一個女人和一個機器人在工作,而且獲得了什麼?」即使她看起來就像我一樣。

透過這種簡單的技巧,我們就能夠在每個場合都強調這些角色。這些影片和聽到的聲音都來自 VO3,Google 最新的模型,混合了影片和音訊。我們的影片其實是 VO2、VO3 和 Runway 之間的混合成果。

製作流程

讓我們來看看我們做了些什麼:

  1. 角色創建與收集: 首先,我們必須創作和集合我們的角色。我們使用 Midjourney 來設計我們的明星 Optimax 5000。
  2. 角色整合: 花了幾次的時間為了創造我,我們集合了一些照片。廣場裡的圖片是在 Runway 上製作的。
  3. 場景描述與生成: 然後我們把這些畫面的角色和背景拍下來,再將它們放到 Runway 的詳細軟件中,然後寫下了一篇詳細描述我們想要的場景。
  4. 使用 Google VO 製作動作: 第一個畫面出現後,我們把那張照片輸入 Google VO,然後寫了一個新的提示來製作動作。然後我們選擇了人工智慧製作的最佳版本。
  5. 處理無角色照片:有些照片沒有角色,就像我們在最後的暴躁場合,我們用了 Vo3 的寫字和影片提示。
  6. 科學家角色製作: 如果你還在想我們怎麼製作這個帥哥,我們用了一個照片製作器來製作我們的最好的瘋狂科學家。然後我做了我的最佳印象。

提升工作效率

我以為他會在鏡頭上的動作和聲音上的動作。我設定了他們來提升工作環境的效率。

後期製作

我們把照片和我的影片上載到 Runway Restyle。上載後,我們把片段帶到 Adobe Premiere 用來剪輯和音響。

  • 音訊製作: Mats 的聲音和 Chip 的聲音都在 Eleven Labs 製作。人工智慧的音響工具讓你能描述你想要的聲音,甚至是自己的 clone。但我錄製了自己的角色,因為 Eleven Labs 的音響不太正確。

  • 背景音樂: 影片中聽到的歌曲 Made with Suno,是一個人工智慧音樂產生器。

腳本創作與成本估算

是的,腳本是由我們 人類 撰寫的,不是人工智慧。我們估計總成本約為一千美元,用於 Google 和 Runway 的工具。我們支付了部分費用,而這些公司則給予我們其餘部分的特別訪問權限。

製作目的

那麼,我們為什麼要讓自己經歷這一切?

結論

人工智慧並非完美,但如果我們在現實生活中做到這件事,我們會需要團隊和一個更大的預算。這些工具不斷地進步,但它們沒有人工進入、創意和原始想法。希望這部影片能夠提醒你,我們不是人工智慧,就像這個人說的。「我喜歡人工智慧。我非常喜歡人工智慧。」

Was this summary helpful?