Video thumbnail for 4個AI工具的升級,真的要搶你飯碗了!|Freepik|Argil|Nari|Krea

AI工具大升級!4款神器Freepik/Argil/Nari/Krea實測,小心飯碗不保?

Summary

Language:

Quick Abstract

想知道最新的AI工具嗎?這段影片將帶你探索三款超酷的AI應用,讓你大開眼界!從Freepik的AI圖像生成工具,到Argil AI的虛擬人物產品展示,再到Krea AI的3D場景生成,內容精彩豐富,絕對不容錯過!

Quick Takeaways:

  • Freepik: 顛覆傳統的AI圖像生成方式,讓你用滑鼠就能繪製草圖,並結合文字描述,生成獨一無二的圖片,激发你的无限创意!

  • Argil AI: 告別昂貴的模特兒費用!利用AI創建虛擬人物,展示產品的各種特性和使用方式,打造更生動的產品宣傳影片。

  • Krea AI: 一鍵生成3D場景,還能自由編輯和移動物件,即使是普通圖片也能瞬間變成3D物件,體驗未來的內容創作方式!

影片中還介紹了Nari Labs的Dia-1.6B文字轉語音模型,它能模仿咳嗽、清喉嚨等真實生活中的非語言表達,讓AI對話更自然。立即點擊觀看,掌握最新的AI趨勢!

Freepik:創新的 AI 圖像生成工具

上週我發現了一個非常有趣的工具叫做 Freepik。大多數人現在使用的 AI 圖像生成器都有控制構圖的功能,但它們通常是通過上傳參考圖像然後結合提示來生成新圖片。然而,新工具 Freepik 與眾不同,它是一種構圖參考工具。

你的滑鼠變成了一支「電子鉛筆」,你可以塗鴉並添加註釋,比如頭髮是長是短、臉是年輕還是年老、西裝是什麼顏色、手的方向等等。它能將粗略的草圖與你添加的註釋結合起來,生成一幅不錯的圖片。

你一定要試試。只需點擊「創建」來創建或點擊相應位置來生成圖片。它的新構圖功能在特定位置點擊,然後在這裡打開草圖。我來畫一個火柴人,先到底部點擊畫筆,你可以在這裡調整畫筆大小。我畫一個人坐在這裡,不用擔心你的繪畫技巧。比如我畫的人坐在一塊石頭上,它稍後就能識別出這塊石頭。

如果你真的不會畫,也可以導入圖片。點擊「添加」並上傳本地照片。例如,我把這張貓的圖片放入整個場景中,然後調整到合適的大小和位置,這樣我就能和貓同框了。

如果你有想法但找不到合適的圖片,也沒關係。你可以直接生成一張參考圖片並放入草圖中。同樣,點擊「添加」,然後點擊「創建圖片」稍微縮小一點。在這裡輸入你想要生成的圖片類型,也就是提示詞。比如我想要一個像這樣陽光明媚的郊區公園,點擊「生成」並調整場景大小。然後點擊頂部的選項使用構圖功能。

這個構圖功能的好處在於,它不會在你畫完後立即生成圖片,而是先識別提示詞。AI 會嘗試理解我的畫作,這非常方便我們檢查和補充。不過,可能是我畫的人太大了,所以它識別成我在騎馬,旁邊還有一隻貓,這個場景真的很難想象。

那我們就生成看看是否可行。向下滾動確認沒有問題,然後點擊「生成圖片」。哇,它生成了四張有馬、人、旁邊的貓和草地的圖片。我在草圖中指定的所有元素都包含在內,因為我打開了 AI 完美提示詞功能,所以還有冬天的雪和滿地的秋葉。

AI 非常聰明,我提供的場景是公園的草地,畢竟讓馬踐踏公園的草地不太合適,AI 就把它替換成了更合適的雪地或樹林地面。過路人與馬是我畫的,貓是導入的圖片,草地是文生圖生成的背景。這個構圖功能可以把所有狂野和富有想象力的東西都提供給 AI,AI 能整合所有這些素材,真是太神奇了。它很容易上手,你會上癮的。

Argil AI:AI 賣貨新利器

再告訴大家一個好消息。你還記得兩週前我發布了一個關於 AI 賣貨的視頻,評論區好評如潮。AI 賣貨這個領域可以直接賺錢,它能讓我們創建虛擬人物,讓虛擬人物拿起我們的產品自然擺 pose,然後進行口頭推廣。

現在又有一家公司想分這杯羹,它叫 Argil AI。我看到官方宣傳視頻時非常震驚,不僅有產品的口頭推廣,還展示了產品的性能,比如洗面奶擠出的泡沫、虛擬 AI 貨架展示,甚至直接將產品塗抹在臉上。你能想象這個視頻完全是從一張產品圖片生成的嗎?

「你想要完美肌膚,我剛發現了這款很棒的洗面奶。這是凱莉皮膚,我已經用了 Argil.ai 的泡沫洗面奶一個星期了。它能深層滋潤和清潔你的臉。我在商店裡到處找新的好產品,然後發現了這個。你只需要早晚使用,就會看起來神清氣爽。看看我的臉,它聞起來很香。現在就試試吧。Argil.ai。」

不過,它的費用相當高,基本會員每月 39 美元。有需要的朋友可以免費試用 3 天,我會把鏈接放在視頻下方的描述欄中。

成功登錄後,點擊左邊的頭像。下面的「Public」是公共模板庫,裡面的資源比較少,但我們也可以克隆自己。到頂部點擊相應位置來創建我的頭像。除了上傳一段 2 分鐘不停說話的視頻,你還可以添加你的肢體語言,讓你的頭像形象更具表現力。

如果你不想自己上鏡,那就創建一個 AI 影響者。性別可以選擇男性或女性,地區有亞洲等選項,年齡有 20、30、40、50 等多種選擇,然後還有體型,如苗條、中等、運動型、肌肉型和肥胖。

其實我一開始不知道這些白色區域是選項,我也向 Argil 的後台反饋了,希望他們能盡快修復網站的細節。左邊還有臉型,我不是很擅長,不太清楚為什麼臉型有心形和三角形。這裡的面部特徵也很有趣,臉上有雀斑、疤痕,甚至還有紋身,我選擇了「none」,也就是臉上沒有其他特徵。

眼睛選擇棕色,然後髮型選擇較亮的顏色,接下來是長度,有短髮、中髮和長髮,還有很多髮型款式可供選擇,可以選擇長直髮和捲髮,這個表示禿頭,沒想到還能創建一個禿頭的虛擬人物,然後是馬尾辮。如果你不想要馬尾辮但想把頭髮紮起來,就選擇這個辮子。

下面的設置很厲害,它可以直接上傳你的產品圖片,然後生成的虛擬人物會直接拿著你的產品。但我想測試一下,如果我的產品是一個大沙發,結果會是虛擬人物躺在我的沙發產品上還是站在旁邊解釋呢?

虛擬人物的衣服也可以設置,選擇日常款。下一個也很有趣,如果我們有品牌名稱,你可以打開這個選項,然後這裡是我們的品牌名稱。這個品牌名稱可以出現在人物的襯衫和帽子上。

配件也可以設置,比如戴眼鏡或背個包、太陽鏡、帽子甚至圍巾。你還可以設置相機,這是拍攝距離,中距離或近距離拍攝。我會選擇遠距離拍攝,因為我想展示我的沙發。

相機角度有幾個選項,一個是相機直接在前面,也就是自拍。三分之四相機角度大約是 45 度,你可以想象脫口秀就是用這樣的鏡頭取景的。你還可以設置拍攝時間,白天和晚上。黃金時間是日出或日落時段,還有雨天。

然後是背景設置,背景設置應盡可能與我們的產品一致。比如我的產品是沙發,那我可以選擇客廳、咖啡廳、公園、工作室、健身房、教室或廚房作為背景。

好的,那就點擊生成。還不錯,品牌「fafa」非常明顯,因為我剛剛要求在這裡寫上品牌名稱「fafa」,然後是我們的產品,大家可以對比一下。沙發的款式是一樣的,沙發上的三個枕頭也是一樣的,還有這裡的毯子。然後是髮型,我讓她紮辮子。

我們來看看相機設置,我剛才提到三分之四視角就像脫口秀的視角,主體,也就是我們的虛擬人物,被拍攝在 45 度的位置。在這個拍攝角度可以看到整個臉,但一側的臉會看得更多,另一側會看得更少,也非常適合介紹產品。

然後是拍攝時間,黃金時段感覺就像太陽落山的時候。想象一下,如果這個功能被使用,電商會變得多麼瘋狂。你不需要雇傭網紅,不用擔心失敗,也不用擔心崩塌。你可以直接創建一個 AI 品牌代言人,你可以 24 小時在線拿著你的產品,更換場景或動作來試用你的產品,一切都可以一鍵完成。你可以展示一個固定的產品,或者在不同的場景和鏡頭中推廣代表品牌的吉祥物。很快,廣告行業和電商行業將被顛覆。

Dia-1.6B:自帶非語言效果的文本轉對話模型

下面要介紹的文本轉語音生成模型非常厲害。Nari Labs 推出的新模型叫做 Dia-1.6B,正如其名,1.6B 意味著 16 億個參數。為什麼說它厲害呢?因為在 Nari 發布的官方 Demo 中,多個角色的對話中包含咳嗽、打哈欠、清嗓子和笑聲等語音效果。

我用過很多文本轉語音工具,當你讓配音員笑的時候,他很可能只是說「哈哈」。所以我們先來聽聽 Dia 生成的效果。這裡有幾個他們發布的例子,還會和 elevenlabs 以及 sesame 進行比較。向下滾動,挑幾個來聽。

你可以看到這是輸入的文本,S1 是一個角色,S2 是另一個角色。這裡的括號是非語言效果,比如這裡,當他說這句話的時候,他會笑。我們來聽聽 Dia-1.6B 的效果:「Dia 是一個開放的文本轉對話模型。你可以完全控制腳本和聲音。哇,太棒了。現在就去 GitHub 或 Huggingface 試試吧。」

這是同樣的輸入文本在 elevenlabs 和 sesame 中的結果:「Dia 是一個開放的文本轉對話模型。你對腳本和聲音有完全的控制權。哇,太棒了。現在就去 GitHub 或 Huggingface 試試吧。Dia 是一個開放的文本 - 轉對話模型。你對腳本和聲音有完全的控制權。哇,太棒了。現在就去 GitHub 或 Huggingface 試試吧。」

很明顯,Dia-1.6B 表現得非常好。他的笑聲融入了上下文,還有咳嗽和清嗓子,都是非常日常的非語言表達。比如在這個對話中,每句話的末尾都有括號,「你剛才為什麼抽鼻子?你剛才為什麼清嗓子?你剛才為什麼笑?做得好。」非常有趣的真實生活對話,沒有任何機械聲音。

當然,這些都是他們自己選的演示,結果肯定是最好的。那我們自己來測試一下。使用 Huggingface 非常方便,你可以免費試用。在這裡輸入文本,我也來試點有趣的,每句話都有一些非語言表達,我來試試打噴嚏、嘆氣和打嗝。

下面是如果你想克隆一個聲音,你需要導入你想要克隆的聲音。如果文本包含 S1 和 S2 的對話,你需要上傳一個包含 S1 和 S2 兩種聲音的音頻片段。我這次不會導入音頻,讓它自由發揮。向下滾動,點擊「生成語音」。

等待右邊生成語音,感覺有點奇怪,它只生成了 4 秒的語音,但我這裡有好幾句話。好吧,它不支持中文,那我換成英文再試試。我又生成了一個 16 秒的語音。你聽到音頻了嗎?「你為什麼咳嗽?你為什麼打噴嚏?你為什麼嘆氣?等等,你剛才打嗝了嗎?我忍不住。太有趣了。」

哇,在自然的 AI 對話方面,它確實比 ElevenLabs 的電子合成播音腔更舒服。如果你只是想讓 AI 讀一些文本,做一個虛擬主播,那它可以用。它完全開源,可以在 GitHub 上下載並在本地運行,建議顯存大於 10GB,基本上沒有什麼限制,唯一的缺點是目前只支持英文,但未來很有前途,這個模型絕對值得關注。

Krea:AI 圖像編輯與 3D 場景生成

下一個更新的是我的老朋友 Krea,我經常提到它。這家 AI 公司在聊天界面推出了 ChatGPT 的圖像生成模型用於圖像編輯。該平台支持越來越多的模型,有些是免費的,有些需要基本會員資格。不過,付一次費能有多重體驗感覺不錯。

但今天我對一個叫做 Stage 的新功能感興趣,字面意思是舞台。它可以一鍵從圖像或文本提示生成 3D 場景。在創建的場景中,有一堆你可以更改和移動的東西。你甚至可以把一張普通的圖片拖進舞台,它會立即把它變成一個 3D 對象。你還可以給它「綁骨」讓它移動。

我們打開 Krea AI 來測試一下。向下滾動找到這裡的 Stage,點擊 3D 場景,在提示輸入框中,我們需要輸入我們想要生成什麼樣的 3D 場景,比如臥室。我想生成一些獨特的東西,比如 20 世紀 60 年代的音樂家工作室。到右邊點擊「生成」。

好的,它為我生成了一堆 20 世紀 60 年代音樂家工作室的東西。你可以看到這是一個非常復古和經典的房間,牆上覆蓋著深色的木板,還有很多可以隨意移動的樂器。你可以點擊你想編輯的對象,把它移到合適的位置。哦,原來這是一把吉他。

雖然現在說「AI 建造世界」還為時過早,Krea 的舞台功能仍然像一個半成品,但這絕對是未來內容創作的方向。想想看,過去要製作 3D 場景,你必須知道如何建模、貼圖和調整燈光,一個項目可能需要幾天時間,但未來 AI 可能只需要一個提示就能幫助建模師完成工作。

這個新功能現在有 7 天的免費試用,你可以去玩玩。我已經把相關鏈接放在視頻下方的描述欄中。非常歡迎你在評論區分享你的看法。

未來,我會繼續為你搜索 AI 領域的最新功能和玩法。如果這個視頻對你有幫助,記得給視頻點贊,訂閱我的頻道,並打開旁邊的小鈴鐺,這樣你就不會錯過最新消息了。我們下個視頻再見。再見。

Was this summary helpful?

Quick Actions

Watch on YouTube

Related Summaries

No related summaries found.

Summarize a New YouTube Video

Enter a YouTube video URL below to get a quick summary and key takeaways.