小發學姐: AI工具大升級！4款神器Freepik/Argil/Nari/Krea實測，小心飯碗不保？

想知道最新的AI工具嗎？這段影片將帶你探索三款超酷的AI應用，讓你大開眼界！從Freepik的AI圖像生成工具，到Argil AI的虛擬人物產品展示，再到Krea AI的3D場景生成，內容精彩豐富，絕對不容錯過！

Quick Takeaways:

Freepik： 顛覆傳統的AI圖像生成方式，讓你用滑鼠就能繪製草圖，並結合文字描述，生成獨一無二的圖片，激发你的无限创意！
Argil AI： 告別昂貴的模特兒費用！利用AI創建虛擬人物，展示產品的各種特性和使用方式，打造更生動的產品宣傳影片。
Krea AI： 一鍵生成3D場景，還能自由編輯和移動物件，即使是普通圖片也能瞬間變成3D物件，體驗未來的內容創作方式！

影片中還介紹了Nari Labs的Dia-1.6B文字轉語音模型，它能模仿咳嗽、清喉嚨等真實生活中的非語言表達，讓AI對話更自然。立即點擊觀看，掌握最新的AI趨勢！

Freepik：創新的 AI 圖像生成工具

上週我發現了一個非常有趣的工具叫做 Freepik。大多數人現在使用的 AI 圖像生成器都有控制構圖的功能，但它們通常是通過上傳參考圖像然後結合提示來生成新圖片。然而，新工具 Freepik 與眾不同，它是一種構圖參考工具。

你的滑鼠變成了一支「電子鉛筆」，你可以塗鴉並添加註釋，比如頭髮是長是短、臉是年輕還是年老、西裝是什麼顏色、手的方向等等。它能將粗略的草圖與你添加的註釋結合起來，生成一幅不錯的圖片。

你一定要試試。只需點擊「創建」來創建或點擊相應位置來生成圖片。它的新構圖功能在特定位置點擊，然後在這裡打開草圖。我來畫一個火柴人，先到底部點擊畫筆，你可以在這裡調整畫筆大小。我畫一個人坐在這裡，不用擔心你的繪畫技巧。比如我畫的人坐在一塊石頭上，它稍後就能識別出這塊石頭。

如果你真的不會畫，也可以導入圖片。點擊「添加」並上傳本地照片。例如，我把這張貓的圖片放入整個場景中，然後調整到合適的大小和位置，這樣我就能和貓同框了。

如果你有想法但找不到合適的圖片，也沒關係。你可以直接生成一張參考圖片並放入草圖中。同樣，點擊「添加」，然後點擊「創建圖片」稍微縮小一點。在這裡輸入你想要生成的圖片類型，也就是提示詞。比如我想要一個像這樣陽光明媚的郊區公園，點擊「生成」並調整場景大小。然後點擊頂部的選項使用構圖功能。

這個構圖功能的好處在於，它不會在你畫完後立即生成圖片，而是先識別提示詞。AI 會嘗試理解我的畫作，這非常方便我們檢查和補充。不過，可能是我畫的人太大了，所以它識別成我在騎馬，旁邊還有一隻貓，這個場景真的很難想象。

那我們就生成看看是否可行。向下滾動確認沒有問題，然後點擊「生成圖片」。哇，它生成了四張有馬、人、旁邊的貓和草地的圖片。我在草圖中指定的所有元素都包含在內，因為我打開了 AI 完美提示詞功能，所以還有冬天的雪和滿地的秋葉。

AI 非常聰明，我提供的場景是公園的草地，畢竟讓馬踐踏公園的草地不太合適，AI 就把它替換成了更合適的雪地或樹林地面。過路人與馬是我畫的，貓是導入的圖片，草地是文生圖生成的背景。這個構圖功能可以把所有狂野和富有想象力的東西都提供給 AI，AI 能整合所有這些素材，真是太神奇了。它很容易上手，你會上癮的。

Argil AI：AI 賣貨新利器

再告訴大家一個好消息。你還記得兩週前我發布了一個關於 AI 賣貨的視頻，評論區好評如潮。AI 賣貨這個領域可以直接賺錢，它能讓我們創建虛擬人物，讓虛擬人物拿起我們的產品自然擺 pose，然後進行口頭推廣。

現在又有一家公司想分這杯羹，它叫 Argil AI。我看到官方宣傳視頻時非常震驚，不僅有產品的口頭推廣，還展示了產品的性能，比如洗面奶擠出的泡沫、虛擬 AI 貨架展示，甚至直接將產品塗抹在臉上。你能想象這個視頻完全是從一張產品圖片生成的嗎？

「你想要完美肌膚，我剛發現了這款很棒的洗面奶。這是凱莉皮膚，我已經用了 Argil.ai 的泡沫洗面奶一個星期了。它能深層滋潤和清潔你的臉。我在商店裡到處找新的好產品，然後發現了這個。你只需要早晚使用，就會看起來神清氣爽。看看我的臉，它聞起來很香。現在就試試吧。Argil.ai。」

不過，它的費用相當高，基本會員每月 39 美元。有需要的朋友可以免費試用 3 天，我會把鏈接放在視頻下方的描述欄中。

成功登錄後，點擊左邊的頭像。下面的「Public」是公共模板庫，裡面的資源比較少，但我們也可以克隆自己。到頂部點擊相應位置來創建我的頭像。除了上傳一段 2 分鐘不停說話的視頻，你還可以添加你的肢體語言，讓你的頭像形象更具表現力。

如果你不想自己上鏡，那就創建一個 AI 影響者。性別可以選擇男性或女性，地區有亞洲等選項，年齡有 20、30、40、50 等多種選擇，然後還有體型，如苗條、中等、運動型、肌肉型和肥胖。

其實我一開始不知道這些白色區域是選項，我也向 Argil 的後台反饋了，希望他們能盡快修復網站的細節。左邊還有臉型，我不是很擅長，不太清楚為什麼臉型有心形和三角形。這裡的面部特徵也很有趣，臉上有雀斑、疤痕，甚至還有紋身，我選擇了「none」，也就是臉上沒有其他特徵。

眼睛選擇棕色，然後髮型選擇較亮的顏色，接下來是長度，有短髮、中髮和長髮，還有很多髮型款式可供選擇，可以選擇長直髮和捲髮，這個表示禿頭，沒想到還能創建一個禿頭的虛擬人物，然後是馬尾辮。如果你不想要馬尾辮但想把頭髮紮起來，就選擇這個辮子。

下面的設置很厲害，它可以直接上傳你的產品圖片，然後生成的虛擬人物會直接拿著你的產品。但我想測試一下，如果我的產品是一個大沙發，結果會是虛擬人物躺在我的沙發產品上還是站在旁邊解釋呢？

虛擬人物的衣服也可以設置，選擇日常款。下一個也很有趣，如果我們有品牌名稱，你可以打開這個選項，然後這裡是我們的品牌名稱。這個品牌名稱可以出現在人物的襯衫和帽子上。

配件也可以設置，比如戴眼鏡或背個包、太陽鏡、帽子甚至圍巾。你還可以設置相機，這是拍攝距離，中距離或近距離拍攝。我會選擇遠距離拍攝，因為我想展示我的沙發。

相機角度有幾個選項，一個是相機直接在前面，也就是自拍。三分之四相機角度大約是 45 度，你可以想象脫口秀就是用這樣的鏡頭取景的。你還可以設置拍攝時間，白天和晚上。黃金時間是日出或日落時段，還有雨天。

然後是背景設置，背景設置應盡可能與我們的產品一致。比如我的產品是沙發，那我可以選擇客廳、咖啡廳、公園、工作室、健身房、教室或廚房作為背景。

好的，那就點擊生成。還不錯，品牌「fafa」非常明顯，因為我剛剛要求在這裡寫上品牌名稱「fafa」，然後是我們的產品，大家可以對比一下。沙發的款式是一樣的，沙發上的三個枕頭也是一樣的，還有這裡的毯子。然後是髮型，我讓她紮辮子。

我們來看看相機設置，我剛才提到三分之四視角就像脫口秀的視角，主體，也就是我們的虛擬人物，被拍攝在 45 度的位置。在這個拍攝角度可以看到整個臉，但一側的臉會看得更多，另一側會看得更少，也非常適合介紹產品。

然後是拍攝時間，黃金時段感覺就像太陽落山的時候。想象一下，如果這個功能被使用，電商會變得多麼瘋狂。你不需要雇傭網紅，不用擔心失敗，也不用擔心崩塌。你可以直接創建一個 AI 品牌代言人，你可以 24 小時在線拿著你的產品，更換場景或動作來試用你的產品，一切都可以一鍵完成。你可以展示一個固定的產品，或者在不同的場景和鏡頭中推廣代表品牌的吉祥物。很快，廣告行業和電商行業將被顛覆。

Dia-1.6B：自帶非語言效果的文本轉對話模型

下面要介紹的文本轉語音生成模型非常厲害。Nari Labs 推出的新模型叫做 Dia-1.6B，正如其名，1.6B 意味著 16 億個參數。為什麼說它厲害呢？因為在 Nari 發布的官方 Demo 中，多個角色的對話中包含咳嗽、打哈欠、清嗓子和笑聲等語音效果。

我用過很多文本轉語音工具，當你讓配音員笑的時候，他很可能只是說「哈哈」。所以我們先來聽聽 Dia 生成的效果。這裡有幾個他們發布的例子，還會和 elevenlabs 以及 sesame 進行比較。向下滾動，挑幾個來聽。

你可以看到這是輸入的文本，S1 是一個角色，S2 是另一個角色。這裡的括號是非語言效果，比如這裡，當他說這句話的時候，他會笑。我們來聽聽 Dia-1.6B 的效果：「Dia 是一個開放的文本轉對話模型。你可以完全控制腳本和聲音。哇，太棒了。現在就去 GitHub 或 Huggingface 試試吧。」

這是同樣的輸入文本在 elevenlabs 和 sesame 中的結果：「Dia 是一個開放的文本轉對話模型。你對腳本和聲音有完全的控制權。哇，太棒了。現在就去 GitHub 或 Huggingface 試試吧。Dia 是一個開放的文本 - 轉對話模型。你對腳本和聲音有完全的控制權。哇，太棒了。現在就去 GitHub 或 Huggingface 試試吧。」

很明顯，Dia-1.6B 表現得非常好。他的笑聲融入了上下文，還有咳嗽和清嗓子，都是非常日常的非語言表達。比如在這個對話中，每句話的末尾都有括號，「你剛才為什麼抽鼻子？你剛才為什麼清嗓子？你剛才為什麼笑？做得好。」非常有趣的真實生活對話，沒有任何機械聲音。

當然，這些都是他們自己選的演示，結果肯定是最好的。那我們自己來測試一下。使用 Huggingface 非常方便，你可以免費試用。在這裡輸入文本，我也來試點有趣的，每句話都有一些非語言表達，我來試試打噴嚏、嘆氣和打嗝。

下面是如果你想克隆一個聲音，你需要導入你想要克隆的聲音。如果文本包含 S1 和 S2 的對話，你需要上傳一個包含 S1 和 S2 兩種聲音的音頻片段。我這次不會導入音頻，讓它自由發揮。向下滾動，點擊「生成語音」。

等待右邊生成語音，感覺有點奇怪，它只生成了 4 秒的語音，但我這裡有好幾句話。好吧，它不支持中文，那我換成英文再試試。我又生成了一個 16 秒的語音。你聽到音頻了嗎？「你為什麼咳嗽？你為什麼打噴嚏？你為什麼嘆氣？等等，你剛才打嗝了嗎？我忍不住。太有趣了。」

哇，在自然的 AI 對話方面，它確實比 ElevenLabs 的電子合成播音腔更舒服。如果你只是想讓 AI 讀一些文本，做一個虛擬主播，那它可以用。它完全開源，可以在 GitHub 上下載並在本地運行，建議顯存大於 10GB，基本上沒有什麼限制，唯一的缺點是目前只支持英文，但未來很有前途，這個模型絕對值得關注。

Krea：AI 圖像編輯與 3D 場景生成

下一個更新的是我的老朋友 Krea，我經常提到它。這家 AI 公司在聊天界面推出了 ChatGPT 的圖像生成模型用於圖像編輯。該平台支持越來越多的模型，有些是免費的，有些需要基本會員資格。不過，付一次費能有多重體驗感覺不錯。

但今天我對一個叫做 Stage 的新功能感興趣，字面意思是舞台。它可以一鍵從圖像或文本提示生成 3D 場景。在創建的場景中，有一堆你可以更改和移動的東西。你甚至可以把一張普通的圖片拖進舞台，它會立即把它變成一個 3D 對象。你還可以給它「綁骨」讓它移動。

我們打開 Krea AI 來測試一下。向下滾動找到這裡的 Stage，點擊 3D 場景，在提示輸入框中，我們需要輸入我們想要生成什麼樣的 3D 場景，比如臥室。我想生成一些獨特的東西，比如 20 世紀 60 年代的音樂家工作室。到右邊點擊「生成」。

好的，它為我生成了一堆 20 世紀 60 年代音樂家工作室的東西。你可以看到這是一個非常復古和經典的房間，牆上覆蓋著深色的木板，還有很多可以隨意移動的樂器。你可以點擊你想編輯的對象，把它移到合適的位置。哦，原來這是一把吉他。

雖然現在說「AI 建造世界」還為時過早，Krea 的舞台功能仍然像一個半成品，但這絕對是未來內容創作的方向。想想看，過去要製作 3D 場景，你必須知道如何建模、貼圖和調整燈光，一個項目可能需要幾天時間，但未來 AI 可能只需要一個提示就能幫助建模師完成工作。

這個新功能現在有 7 天的免費試用，你可以去玩玩。我已經把相關鏈接放在視頻下方的描述欄中。非常歡迎你在評論區分享你的看法。

未來，我會繼續為你搜索 AI 領域的最新功能和玩法。如果這個視頻對你有幫助，記得給視頻點贊，訂閱我的頻道，並打開旁邊的小鈴鐺，這樣你就不會錯過最新消息了。我們下個視頻再見。再見。

AI工具大升級！4款神器Freepik/Argil/Nari/Krea實測，小心飯碗不保？

Summary

Quick Abstract

Freepik：創新的 AI 圖像生成工具

Argil AI：AI 賣貨新利器

Dia-1.6B：自帶非語言效果的文本轉對話模型

Krea：AI 圖像編輯與 3D 場景生成

Quick Actions

Related Summaries

Summarize a New YouTube Video