Video thumbnail for E195|从工具到伙伴:七位AI Agent深度使用者的思考

AI Agents: From Tools to Partners - 7 Expert Insights

Summary

Quick Abstract

Dive into the world of AI Agents with insights from users, builders, and investors! This summary dissects the definition of an AI Agent, exploring its capabilities and potential impact. Learn about real-world applications, from coding assistants to podcast editors, and discover the surprising ways AI is changing workflows.

Quick Takeaways:

  • AI Agents require tool use, autonomous decision-making, and multi-step iteration.

  • They offer "coaching," "secretarial," and "partner" assistance across various tasks.

  • Current limitations include instruction following weaknesses, lack of "human touch," and access to tacit knowledge.

  • Success hinges on understanding user pain points, designing intuitive interfaces, and developing reliable, safe, and effective architectures.

  • AI Agents need to adapt to unique users, data, and organizational cultures, fostering a working relationship between AI and humans.

  • The market emphasizes industry expertise, workflow integration, and the ability to help users succeed in their market.

什么是AI Agent

鸭哥的观点

AI Agent需要满足三个必要条件: 1. 能使用工具,如调用搜索引擎搜索或调用编程语言编程。 2. 能够自主做决策,知道如何分解任务、按顺序和参数调用工具以完成目标。 3. 决策是多步且自我迭代的,能根据前一步结果动态决定下一步行动,而非像静态工作流那样固定。

新琦的观点

重点在于人与AI的合作关系,是真正的甲方和乙方关系。好的乙方能端到端承接流程,在关键节点主动介入并提供决策建议,在得到高层指令后自动执行,交付成品而非半成品。

用户使用AI Agent的惊喜时刻

鸭哥的使用体验

他经常使用三类Agent: 1. 教练型:如OpenAI的deep research或ChatGPT型的o3,用于获取调研信息和深度思考,了解不熟悉领域。 2. 秘书型:像Manus和Devin,适合相对简单的工作。例如,让Manus基于白雪公主写故事并夹带教育小孩好好吃饭的私货,再调用TTS生成音频哄娃睡觉。 3. 搭档型:做复杂软件开发任务时,倾向于使用cursor windsurf等允许频繁交互和手把手指导的工具,自己作为架构师与Agent讨论设计、组合模块并审计结果。

新琦的使用体验

内测的CreateWise软件,一键上传音轨就能呈现完全剪辑完的音频,甚至能模仿声音拟合结构混乱的语句,还能针对不同平台生成文案,包括shownotes、金句、标题建议等。

Kolento的使用体验

在通用层面,Manus和Genspark的super Agent模式能帮他完成之前不想做的事;在coding层面,喜欢用Replit,它能帮自己做更多决策;在学术层面,Elicit未达到心中Agent定义。

AI Agent的槽点

鸭哥的槽点

  1. instruction following问题:例如让GPT 4.1按特定要求写提纲章节,它总添加多余内容,最后通过逆向思维解决。
  2. 为用AI而用AI:很多产品未针对用户痛点,如订机票,用户痛点在于确定行程时间和综合考虑酒店机票价格,而非填信用卡号等操作。
  3. 人类社会信息获取限制:人类社会很多重要决策在非正式场合做出,AI无法获取这些未付诸文字的信息。

新琦的槽点

  1. 缺乏人情味:很多Agent产品会剪掉多人播客中的笑场和集体沉默,而这些往往是节目有趣的部分。
  2. 语言和播客类型差异:不同AI产品对中文和英文的识别、转译及剪辑建议能力有很大差别,多人播客的音频处理比单人播客复杂得多,现有Agent产品在多轨处理和抢话环节剪辑上存在不足。

课代表立正的观点

吐槽AI Agent的做法本身存在错误,一是理解上的错误,Agent是基于大语言模型和现有工具逐步构建的,不能指望它一开始就完美;二是使用上的错误,AI不是魔法,用户需要学会如何用好它,不能以普通用户心态对待,而要用构建者心态。

从开发者角度看问题

曲晓音的看法

  1. AI Agent的LM本身不够智能,更多是工作方式变化:如同初入职场的实习生,缺乏工作经验。AI需要更多工作经验和用户反馈来提高准确性。
  2. 数据掌握和预期设定:AI application公司掌握用户反馈数据,可判断预期是否满足,但预期需用户设定。
  3. use case的聚拢:聚焦的use case能有大量重复性数据来判断产品好坏,而过于宽泛的use case难以建立有效的评判体系。

俞舟教授的看法

  1. 技术层面应对策略:Agent不是单一工具,需要做Guardrail防止不良情况出现,要教用户最佳实践并进行测试和评估,根据评测结果做调整,可用Agent的workflow处理问题。
  2. 产品设计层面解决方案:提供多种工具,满足用户对结果可控性的需求,平衡AI的强大能力和用户对可控性的要求。
  3. 对“AI缺乏人类暗信息”的看法:不同行业情况不同,像线上工作性质的行业更适合AI超越人类,而线下服务和大企业销售等行业,AI在获取输入数据上存在不足。

Agent搭建者的突破方向

俞舟教授的探索

  1. backtracking和self correction能力:让Agent能根据自身表现选择自我纠正。
  2. self learning能力:通过自身方式学习。

曲晓音的透露

  1. 多个Agent的合作:卖的是解决方案,需要多个Agent合作,可能会出现AI CEO或AI leader Agent来领导其他Agent。
  2. 解决单技能无法解决的问题:通过多个Agent的合作,取代整个团队甚至公司。

技术挑战

  1. 多Agent工作问题:多个Agent在同一台或分布式系统的机器上工作会出现并发等问题,需要高效、低成本地处理。
  2. 安全问题:如数据库操作,多个Agent同时修改数据库可能导致数据不一致,需要解决数据库存储和与Agent连接的高效性问题,以及Agent之间的记忆分享、权限管理等问题。

产品设计重点

  1. 行业know how和用户理解:除了大模型的智商水平,还需要了解行业最新玩法和用户具体需求,确保产品能为用户带来商业价值。
  2. AI的品位:AI产品的设计要有一定调性和个性,符合用户品牌预期,这需要训练、设计者品位和对客户行业品位的理解。
  3. 用户洞察:理解用户的模糊需求,透过现象看本质。

市场培育挑战

  1. 真实ROI问题:大企业中部署Agent的真实投资回报率不高,推进速度慢。
  2. 生产关系重构:重构企业工作流程和生产关系困难,需要从上到下的方式来教育员工,让他们更好地利用AI。

商业视角:打破传统SaaS壁垒

高宁的看法

  1. 新数据的价值:新的数据不在传统SaaS公司手中,新的startup掌握新数据后能为客户提供真正有价值的服务,打破传统SaaS垄断。
  2. 渠道和客户关系:初创公司陪伴高速增长的客户发展,能掌握新的渠道和客户关系。

鸭哥的看法

  1. 默契护城河:通过数据积累让AI了解用户偏好和使用习惯,产生默契,形成竞争优势。
  2. 数据构建护城河:创业者和产品经理要思考如何通过数据构建护城河,让用户和AI产生默契。

曲晓音的看法

  1. 深入垂直领域:了解用户业务,提供端到端解决方案,帮助用户挣钱,深入垂直领域能增强不可取代性。
  2. 解决最终目的:提供最终能帮助用户实现挣钱等最终目的的服务,而非只是中间步骤,能提高产品的护城河。

大模型公司对创业公司的影响

高宁的辩证看法

  1. 竞合关系:通用型Agent与大模型公司存在竞合关系,短期内新增用户多,问题不大;长期来看,当模型产品用户增多且差异化不明显时,可能会有替代。
  2. 应用层优势:应用型产品可选择多种模型组合,在成本和效率上更优。

俞舟教授的看法

  1. 中立平台价值:中立的第三方平台更容易快速推进,企业不想与任何一家大模型公司深度绑定,需要备份,中立平台能提供这种方式。

避免与大模型公司正面竞争的建议

  1. 与垂直应用合作:大模型公司不太可能拥有每家公司的私有数据,也不太会去做与工作流磨合打通等脏活、苦活,初创公司可与垂直应用合作。
  2. 专注核心用户:偏通用型产品存在隐患,应用型产品应更专注核心用户,做成基于工作流的SaaS工具或与大客户合作定制解决方案。

成本压力问题

曲晓音的回答

用户以结果为导向,只要能交付结果,价格和速度足够惊艳,就不会太在意token本身的成本。用户更关注效果,要求产品至少达到与人工一样的水平。

哲学思考与未来展望

Kolento的思考

  1. 交互方式演变:传统AI交互需要人类多次审核,未来Agent应先与用户对齐价值观、记忆和偏好,在出现高危或极端情况时才找用户确认。
  2. 个人价值担忧:随着人与机器交互变“薄”,人类只是给出高层引导,担心个人价值被替代。

新琦的理解

人类依然是形成想法、提供指令、精雕细琢和保障成品的核心,AI是合伙人。人类的价值在于深入领域的洞察、个人身边未结构化的信息以及多人之间观点的差异化张力。

鸭哥的观点

人与AI的关系逐渐变为领导和下属关系,人类的核心竞争力从会用工具变为会管理AI,这需要改变思维方式。

Kolento的强调

AI无法代替人做价值判断,人类的个性化不能被放弃,应有关注个人的大模型,实现AI与人的对齐和负责任的AI。

曲晓音的宏观思考

AI可能像人类一样组织大量AI Agent,迸发出更强大的能力,但也可能存在利益不一致和打架的情况,需要处理类似于人类社会架构的问题,还可能出现AI Agent管人或人管AI Agent的情况。

总结

今天的讨论丰富多样,我们需要学习管理AI,设计AI友好的系统,找到自己在AI时代的定位。感谢各位嘉宾的精彩分享,欢迎大家留言和联系。

Was this summary helpful?