什么是AI Agent
鸭哥的观点
AI Agent需要满足三个必要条件: 1. 能使用工具,如调用搜索引擎搜索或调用编程语言编程。 2. 能够自主做决策,知道如何分解任务、按顺序和参数调用工具以完成目标。 3. 决策是多步且自我迭代的,能根据前一步结果动态决定下一步行动,而非像静态工作流那样固定。
新琦的观点
重点在于人与AI的合作关系,是真正的甲方和乙方关系。好的乙方能端到端承接流程,在关键节点主动介入并提供决策建议,在得到高层指令后自动执行,交付成品而非半成品。
用户使用AI Agent的惊喜时刻
鸭哥的使用体验
他经常使用三类Agent: 1. 教练型:如OpenAI的deep research或ChatGPT型的o3,用于获取调研信息和深度思考,了解不熟悉领域。 2. 秘书型:像Manus和Devin,适合相对简单的工作。例如,让Manus基于白雪公主写故事并夹带教育小孩好好吃饭的私货,再调用TTS生成音频哄娃睡觉。 3. 搭档型:做复杂软件开发任务时,倾向于使用cursor windsurf等允许频繁交互和手把手指导的工具,自己作为架构师与Agent讨论设计、组合模块并审计结果。
新琦的使用体验
内测的CreateWise软件,一键上传音轨就能呈现完全剪辑完的音频,甚至能模仿声音拟合结构混乱的语句,还能针对不同平台生成文案,包括shownotes、金句、标题建议等。
Kolento的使用体验
在通用层面,Manus和Genspark的super Agent模式能帮他完成之前不想做的事;在coding层面,喜欢用Replit,它能帮自己做更多决策;在学术层面,Elicit未达到心中Agent定义。
AI Agent的槽点
鸭哥的槽点
- instruction following问题:例如让GPT 4.1按特定要求写提纲章节,它总添加多余内容,最后通过逆向思维解决。
- 为用AI而用AI:很多产品未针对用户痛点,如订机票,用户痛点在于确定行程时间和综合考虑酒店机票价格,而非填信用卡号等操作。
- 人类社会信息获取限制:人类社会很多重要决策在非正式场合做出,AI无法获取这些未付诸文字的信息。
新琦的槽点
- 缺乏人情味:很多Agent产品会剪掉多人播客中的笑场和集体沉默,而这些往往是节目有趣的部分。
- 语言和播客类型差异:不同AI产品对中文和英文的识别、转译及剪辑建议能力有很大差别,多人播客的音频处理比单人播客复杂得多,现有Agent产品在多轨处理和抢话环节剪辑上存在不足。
课代表立正的观点
吐槽AI Agent的做法本身存在错误,一是理解上的错误,Agent是基于大语言模型和现有工具逐步构建的,不能指望它一开始就完美;二是使用上的错误,AI不是魔法,用户需要学会如何用好它,不能以普通用户心态对待,而要用构建者心态。
从开发者角度看问题
曲晓音的看法
- AI Agent的LM本身不够智能,更多是工作方式变化:如同初入职场的实习生,缺乏工作经验。AI需要更多工作经验和用户反馈来提高准确性。
- 数据掌握和预期设定:AI application公司掌握用户反馈数据,可判断预期是否满足,但预期需用户设定。
- use case的聚拢:聚焦的use case能有大量重复性数据来判断产品好坏,而过于宽泛的use case难以建立有效的评判体系。
俞舟教授的看法
- 技术层面应对策略:Agent不是单一工具,需要做Guardrail防止不良情况出现,要教用户最佳实践并进行测试和评估,根据评测结果做调整,可用Agent的workflow处理问题。
- 产品设计层面解决方案:提供多种工具,满足用户对结果可控性的需求,平衡AI的强大能力和用户对可控性的要求。
- 对“AI缺乏人类暗信息”的看法:不同行业情况不同,像线上工作性质的行业更适合AI超越人类,而线下服务和大企业销售等行业,AI在获取输入数据上存在不足。
Agent搭建者的突破方向
俞舟教授的探索
- backtracking和self correction能力:让Agent能根据自身表现选择自我纠正。
- self learning能力:通过自身方式学习。
曲晓音的透露
- 多个Agent的合作:卖的是解决方案,需要多个Agent合作,可能会出现AI CEO或AI leader Agent来领导其他Agent。
- 解决单技能无法解决的问题:通过多个Agent的合作,取代整个团队甚至公司。
技术挑战
- 多Agent工作问题:多个Agent在同一台或分布式系统的机器上工作会出现并发等问题,需要高效、低成本地处理。
- 安全问题:如数据库操作,多个Agent同时修改数据库可能导致数据不一致,需要解决数据库存储和与Agent连接的高效性问题,以及Agent之间的记忆分享、权限管理等问题。
产品设计重点
- 行业know how和用户理解:除了大模型的智商水平,还需要了解行业最新玩法和用户具体需求,确保产品能为用户带来商业价值。
- AI的品位:AI产品的设计要有一定调性和个性,符合用户品牌预期,这需要训练、设计者品位和对客户行业品位的理解。
- 用户洞察:理解用户的模糊需求,透过现象看本质。
市场培育挑战
- 真实ROI问题:大企业中部署Agent的真实投资回报率不高,推进速度慢。
- 生产关系重构:重构企业工作流程和生产关系困难,需要从上到下的方式来教育员工,让他们更好地利用AI。
商业视角:打破传统SaaS壁垒
高宁的看法
- 新数据的价值:新的数据不在传统SaaS公司手中,新的startup掌握新数据后能为客户提供真正有价值的服务,打破传统SaaS垄断。
- 渠道和客户关系:初创公司陪伴高速增长的客户发展,能掌握新的渠道和客户关系。
鸭哥的看法
- 默契护城河:通过数据积累让AI了解用户偏好和使用习惯,产生默契,形成竞争优势。
- 数据构建护城河:创业者和产品经理要思考如何通过数据构建护城河,让用户和AI产生默契。
曲晓音的看法
- 深入垂直领域:了解用户业务,提供端到端解决方案,帮助用户挣钱,深入垂直领域能增强不可取代性。
- 解决最终目的:提供最终能帮助用户实现挣钱等最终目的的服务,而非只是中间步骤,能提高产品的护城河。
大模型公司对创业公司的影响
高宁的辩证看法
- 竞合关系:通用型Agent与大模型公司存在竞合关系,短期内新增用户多,问题不大;长期来看,当模型产品用户增多且差异化不明显时,可能会有替代。
- 应用层优势:应用型产品可选择多种模型组合,在成本和效率上更优。
俞舟教授的看法
- 中立平台价值:中立的第三方平台更容易快速推进,企业不想与任何一家大模型公司深度绑定,需要备份,中立平台能提供这种方式。
避免与大模型公司正面竞争的建议
- 与垂直应用合作:大模型公司不太可能拥有每家公司的私有数据,也不太会去做与工作流磨合打通等脏活、苦活,初创公司可与垂直应用合作。
- 专注核心用户:偏通用型产品存在隐患,应用型产品应更专注核心用户,做成基于工作流的SaaS工具或与大客户合作定制解决方案。
成本压力问题
曲晓音的回答
用户以结果为导向,只要能交付结果,价格和速度足够惊艳,就不会太在意token本身的成本。用户更关注效果,要求产品至少达到与人工一样的水平。
哲学思考与未来展望
Kolento的思考
- 交互方式演变:传统AI交互需要人类多次审核,未来Agent应先与用户对齐价值观、记忆和偏好,在出现高危或极端情况时才找用户确认。
- 个人价值担忧:随着人与机器交互变“薄”,人类只是给出高层引导,担心个人价值被替代。
新琦的理解
人类依然是形成想法、提供指令、精雕细琢和保障成品的核心,AI是合伙人。人类的价值在于深入领域的洞察、个人身边未结构化的信息以及多人之间观点的差异化张力。
鸭哥的观点
人与AI的关系逐渐变为领导和下属关系,人类的核心竞争力从会用工具变为会管理AI,这需要改变思维方式。
Kolento的强调
AI无法代替人做价值判断,人类的个性化不能被放弃,应有关注个人的大模型,实现AI与人的对齐和负责任的AI。
曲晓音的宏观思考
AI可能像人类一样组织大量AI Agent,迸发出更强大的能力,但也可能存在利益不一致和打架的情况,需要处理类似于人类社会架构的问题,还可能出现AI Agent管人或人管AI Agent的情况。
总结
今天的讨论丰富多样,我们需要学习管理AI,设计AI友好的系统,找到自己在AI时代的定位。感谢各位嘉宾的精彩分享,欢迎大家留言和联系。