Video thumbnail for E195|从工具到伙伴:七位AI Agent深度使用者的思考

AI Agent深度解析:七位使用者分享從工具到夥伴的轉變

Summary

Language:

Quick Abstract

想了解AI Agent的最新發展嗎?這份摘要帶你快速掌握人工智慧體的現況與未來!我們邀請了多位來自不同領域的專家,包括AI應用科學家、數據策略總監與投資人,從使用者、開發者和商業角度,拼湊出關於AI Agent的全方位圖像。

Quick Takeaways:

  • AI Agent需具備工具調用自主決策多輪迭代三大要素。

  • AI Agent能擔任教練秘書夥伴等多重角色,協助完成研究、寫作故事、程式開發等任務。

  • AI Agent在音頻剪輯、文案生成等方面展現驚人能力,甚至能模仿聲音進行創作。

  • AI Agent的槽點包括指令理解不足、為了用AI而用AI,以及缺乏人類社會中的「暗信息」。

  • AI Agent的發展趨勢是多Agent協作,透過AI CEO來領導,解決單一Agent無法完成的複雜問題。

  • AI Agent創業公司應避免與大模型公司正面競爭,專注於特定領域、提供客製化解決方案,並建立與用戶的默契。

  • AI Agent的普及將重塑人機關係,人類需學習管理AI,而非僅是使用工具,並在價值判斷上發揮不可替代的作用。

什麼是AI Agent

極客觀點:三個必要條件

AI Agent需要滿足三個必要條件。鴨哥,大型物流軟件公司Samsara的AI應用科學家,認為第一個條件是能使用工具,例如調用搜索引擎搜索或調用編程語言編程。第二個是能自主做決策,即知道如何分解任務,按順序和參數調用工具以完成目標。第三個是多步且自我迭代的決策,不能像靜態工作流程一樣固定,而是要根據前一步結果動態決定下一步,比如根據搜索結果決定是否停止或更換關鍵字繼續搜索。

非技術背景觀點:合作關係

在世界500強公司擔任數據策略總監的新琦,從合作視角定義AI Agent。她認為真正的甲方和乙方關係中,好的乙方是端到端承接整個流程的系統,在關鍵節點主動介入並提供決策建議,在得到高層指令後自動執行,最終交付成品而非半成品。

用戶的Agent使用體驗

鴨哥:三類Agent的幫助

鴨哥經常使用的AI Agent分為三類:教練型、秘書型和搭檔型。教練型如OpenAI的deep research或ChatGPT型的o3,用於獲取調研信息和深度思考。秘書型如Manus和Devin,適合相對簡單的工作。例如哄娃睡覺時,讓Manus基於白雪公主寫故事並夾帶私貨教育孩子,再轉換成語音。而在正經的軟件開發工作中,鴨哥更傾向於使用cursor windsurf之類允許頻繁交互和手把手指導的工具。

新琦:Agent輔助節目後期

新琦在使用CreateWise進行節目後期工作時體驗深刻。上傳音軌後,它能直接呈現剪輯完的音頻,甚至能模仿聲音修正語句結構。最初整段輸出,新琦建議提供逐句剪輯空間後,該功能已上線。此外,CreateWise還能針對不同平台生成文案。

Kolento:通用型Agent產品

紐約大學心理學大三學生Kolento對Manus和Genspark的super Agent模式印象深刻,它們能幫助完成一些原本不想做的事情。在編程層面,他喜歡用Replit,覺得它能做更多決策。在學術層面,他使用Elicit,但認為它未達到心中的Agent定義。Manus和Genspark在用戶體驗、任務規劃拆解、工具調用和功能上各有特點,Genspark還能幫忙打電話預約酒店。

AI Agent的槽點與洞察

鴨哥:槽點的進化

鴨哥發現隨著Agent產品不斷發布,很多以前的槽點如複雜任務工具調用能力不足、寫作AI味太重、上下文窗口不夠長等,在新版本中得到改善。但仍存在一些問題,如AI模型的instruction following能力不足,為了用AI而用AI,以及AI難以獲取人類社會的暗信息。

新琦:缺乏人情味

新琦指出很多Agent或AI產品缺乏真實性,例如在處理多人播客時,會剪掉笑場和集體沉默,而這些往往是節目的有趣之處。此外,不同AI產品對中文和英文的處理能力不同,多人播客的音頻處理也比單人播客複雜得多,目前的Agent在多軌處理和搶話環節的處理上存在不足。

課代表立正:吐槽吐槽本身

Statsig數據科學家課代表立正認為吐槽Agent的做法本身有誤。一是理解錯誤,Agent是基於過去的大語言模型和現有工具一點點構建的,不能指望它今天就完美。二是使用錯誤,AI不是魔法,需要學會如何用好它,不能以用戶心態對待,而要用創建者心態。

搭建者的視角

曲曉音:工作方式的變化

HeyBoss AI創始人曲曉音認為AI Agent存在LM本身不夠智能的情況,但更多是工作方式的變化。就像初入職場的小天才,缺乏工作經驗導致表現不如預期。AI也需要更多工作經驗和用戶反饋,同時use case要有一定聚焦,才能有大量重複性數據來判斷好壞。

俞舟:技術層面的應對策略

哥倫比亞大學計算機副教授俞舟從技術層面提出,Agent不是簡單的工具,需要做Guardrail防止不好的事情發生,還要教用戶最佳實踐並進行測試和評估。在工作流方面,她認為可以用Agent的workflow來處理問題。

產品設計的解決方案

曉音從產品設計角度提出,提供多種工具讓用戶像改PPT一樣操作,以滿足用戶對可控結果的需求。在AI的不可控和可控但有限制的功能之間,兩者都需要。

對“AI缺乏人類暗信息”的看法

曉音認為不同行業情況不同,像她所在的線上行業,AI與人類的溝通差距不大,而一些線下服務行業和大企業銷售,AI在輸入數據方面存在不足。

Agent搭建者的突破方向

俞舟:前沿技術探索

俞舟教授和團隊正在探索backtracking(自我糾正)和self learning等新能力。

曉音:多Agent合作

曉音透露,他們賣的是解決方案,需要多個Agent合作,未來可能會有AI CEO或AI leader Agent來領導其他Agent,以解決單技能無法解決的問題。

技術挑戰

俞舟提醒,多Agent同時工作會帶來分佈式系統、併發、安全等一系列技術挑戰,如數據庫的權限管理、Agent之間的記憶分享等。

產品設計的重要性

曉音強調,大模型的變化不代表技能更懂,產品設計需要了解行業know how、用戶需求和最新玩法,同時AI要具備一定品位,符合用戶品牌預期。

市場培育的關鍵挑戰

俞舟提出,雖然AI炒得很火,但在大企業中部署很少,主要是因為大企業推進速度慢,重構工作流程和生產關係困難,需要企業自上而下的方式來解決。

商業視角:長期商業模式

高寧:打破傳統SaaS壁壘

AI產品出海社區Linkloud創始人高寧認為,新數據掌握在新創公司手中,這些數據更準確豐富,能打破傳統SaaS壟斷。此外,陪伴高速增長的客戶發展,能掌握新的渠道和客戶關係。在一些外包或服務驅動領域,Agent能更好地處理輸入數據,輸出高價值結果,是新創公司挑戰現有企業的好路徑。

鴨哥:“默契”的護城河

鴨哥提出“默契”這一護城河概念,通過積累用戶對Agent的糾正數據,形成默契,讓用戶覺得好用,即使競爭對手再厲害,也難以取代。

曉音:深入垂直領域

曉音指出,Agent最終目的是幫助用戶掙錢,需要了解更多後續數據,在垂直領域做深做透,提供端到端的解決方案,才能增強不可取代性。

大模型公司與創業公司的競合關係

高寧:辯證的看法

高寧認為,通用型Agent與大模型公司存在競合關係,但中短期內問題不大,長期來看,應用型產品可以選擇不同模型組合,降低成本提高效率。

俞舟:應用層中立性的價值

俞舟教授強調,中立的第三方平台更容易快速推進,因為企業不想與任何一家公司深度綁定,需要備份方案。

避免正面競爭的建議

高寧建議Agent創業公司與垂直應用合作,深入了解用戶工作流和系統,往workflow base的SaaS工具或定制化解決方案方向發展。

Agent的成本壓力

HeyBoss AI創始人曉音認為,用戶以結果為導向,只要能交付結果,價格和速度都能讓用戶驚豔,因此不太擔心token本身的成本問題。

Agent時代的哲學思考與未來展望

Kolento:交互方式的演變

Kolento認為傳統AI交互方式有兩個審核點,未來的Agent應該先與人對齊價值觀、記憶和偏好,在出現高危或極端情況時才找人確認。

鴨哥:AI friendly的環境

鴨哥認為AI在人類社會和日常工作中的作用,取決於問題的AI friendly程度。數字世界中很多東西不是AI native的,AI friendly的庫或軟件在未來競爭優勢會很大。

人在AI時代的角色與價值

Kolento擔心人與機器交互變薄,人類價值受到威脅。新琦認為人依然是形成想法、提供指令、精雕細琢和保障成品的核心,AI是合伙人。鴨哥提出人類的核心競爭力從會用工具變成會管理AI。

Kolento:人類價值判斷的不可替代性

Kolento強調AI無法代替人做價值判斷,人本身的個性化不能被放棄,需要有屬於個人的大模型。

曉音:AI社會的新型關係

曉音從社會學角度思考,AI可能像人一樣組織大量AI Agent,迸發更強能力,但也可能存在利益不一致和打架的問題,需要處理類似人類社會架構的問題。

今天的討論豐富多彩,我們需要學習管理AI,創造AI友好的系統,找到自己在AI時代的定位。感謝各位嘉賓的精彩分享,也謝謝大家的收聽。如果有任何想法或反饋,歡迎在評論區留言或通過社交媒體聯繫我們。

Was this summary helpful?