測試 AI 圖像生成工具:Twitch 直播主模擬
我花了大約一百塊錢訂閱了一個新的 AI 圖像生成工具,想看看它的能力。這個工具標榜能根據文字描述生成圖像,我想測試它是否能準確描繪出 Twitch 直播主。
初步測試:房間裡的直播主
首先,我輸入了描述:「Twitch 直播主坐在他們的房間裡直播遊戲」。我想看看如果把描述放進去會發生什麼事。如果它能快速生成 3-5 分鐘的影片,也許代表 AI 的運算能力比我們想像的更強大。
-
實際上,它可能只需要 3-5 秒,但為了效果,他們可能會讓過程看起來更久。
-
工具生成了一段影片,裡面出現了一把武器。
我試圖放大畫面,但似乎只能維持現狀。影片甚至有一個玩家的座位。
觀察細節與不確定性
在影片開始時,有一些點擊的聲音,效果不是很好。但之後,這些聲音就消失了,只剩下尋找武器的畫面。滑鼠手(滑鼠操作者)的操作很棒。
然而,這個影片中最不確定的事情是,我發現這個 Twitch 直播主似乎已婚,因為他戴著婚戒。不過,戒指戴在錯誤的手上,我不確定這代表什麼。
更多描述與指令
我接著輸入了更詳細的描述:
-
中年男子,大部分頭髮都掉光了,留著長髮
-
他是個 Twitch 直播主,坐在他的房間裡
-
他的房間 堆滿了垃圾,看起來像 派對後的學院公寓
-
他有 鬍子
-
房間裡有 蟑螂,只有一兩隻
-
他 身材瘦弱,掉了幾顆牙
-
周圍堆滿了 汽水罐 和 加油站的飲料杯
我沒有特別提到白色 T 恤,想看看 AI 是否會自動生成。
生成結果與觀察
我希望這次能成功。生成的結果是白皮膚,但我想知道它與真實情況有多接近。會像我嗎?還是會變成貓女?(我可以要求它生成貓女嗎?)。
-
製作這類東西需要時間。
-
好的版本通常會被大肆宣傳。
-
一段時間後,技術會變得更成熟,人們就能做到。
錯誤與意外
結果竟然出現了「raid」這個詞,我不明白為什麼。
接下來,我嘗試了相同的描述,但要求這個男人穿白色 T 恤,並且臉色呈現藍色。我還將年齡設定為 34 歲。
測試泛用性
我想看看如果只給出最泛用的直播主描述,AI 會生成什麼樣的圖像。
-
這是一個好主意。
-
Gemini(可能是指 AI 模型)實際上遵循其服務條款。
-
直到你說服它不要這麼做。
影片準備好了。
生成的結果非常瘋狂,出現了 KakarotXQC(一個 Twitch 直播主的名字)。
年齡與細節調整
我嘗試了較年輕的年齡,想看看是否更符合 34 歲的外貌。接著,我加入了「金牙」的描述。
我決定再做一次,描述是「同一個人,但他是個 Twitch 直播主,而且只掉了三顆牙」。
測試特定人物:Hasan 與 XQC
我想要嘗試更精確地模擬特定的 Twitch 直播主,例如 Hasan 和 XQC。
- 首先,我嘗試了一個簡單的描述:e-girl Twitch 直播主,有 惱人的聲音,要求捐款,並且戴著 貓耳耳機。
我想知道它最接近哪個直播主。我知道我在玩火。
-
接下來,我嘗試了一個 滋擾型直播主,他 在公共場合四處走動製造麻煩,讓人們生氣。
-
最後,我嘗試了一個 左翼 Twitch 直播主,他 整天抱怨唐納川普,並且討厭...(此處省略不雅詞彙)。
如果我把影片倒回最開始,它看起來非常接近我的樣子,非常非常接近。但後來有點搞砸了。
其他嘗試與描述
-
同樣的人,但戴著耳機。
-
加拿大籍 Twitch 直播主,非常瘦,白人,金髮,房間雜亂,法裔加拿大人,講話速度非常快,所以你聽不懂他在說什麼,但他正在嘗試解釋非常重要的事情,並且說英語。
我想看看是否有任何其他的改變,我應該加進去看看他們能否成為一名 Hasan。
- 並且熱愛極端主義。
我不想加入土耳其元素,因為我想看看 AI 會怎麼做。我的想法是,我想給它一個通用的提示,看看它最符合誰。
- 頭很小
我覺得「掉了三顆牙」這個描述可能不太好,它可能搞砸了。
結論與挫折
我認為這次嘗試中最好的是某個特定的視角,尤其是從側面看。
我喜歡《魔獸世界》,這個描述其實很棒。
我嘗試複製貼上其中一個描述,但結果卻顯示我達到了影片生成限制。我必須等到明天才能繼續。