认识SanWaBa AI
欢迎收听SanWaBa AI分享的音频广播。我们手头有一些关于它的资料,正好一起深入了解,看看这究竟是什么,对我们开发者或者关注技术的朋友来说有何意义。
简单来说,它实际上是一个云软件工程智能体,或者说是智能助理。资料显示它能做很多事情,例如帮你编写新函数、回答代码库中的相关问题,甚至能帮你修复bug。它不仅能修复bug,还能提交拉取请求,然后让你进行审核。关键在于,它能在独立的云环境中同时处理多个任务,并且还能预加载你的代码库。这种并行处理和预加载代码库的功能,比我们之前使用的简单代码补充要强大得多。
Codex-1模型:核心驱动力
那驱动它的核心是什么呢?资料显示是Codex-1模型。这是OpenAI专门为软件工程优化的第三代模型,是O3系列里的一个版本。
它的训练方式也很有意思,采用了强化学习。就像人类学习一样,在真实的编程任务中不断尝试,做得好就给予奖励,做得不好就进行调整。目标是让它写的代码更符合人类习惯,对指令的理解更准确。它甚至会自己反复跑测试,直到测试通过为止。这相比我们之前聊过的GPT 4.1,在智能体概念上似乎又前进了一步,自主性更强。
谁能使用以及用户反馈
哪些人现在能用上呢?从2025年5月17号开始,ChatGPT的Pro、Team和Enterprise用户就能率先使用。之后Plus和Addo用户应该也快了。
早期一些用户反馈反响热烈。有人直接用“震撼”来形容,也有评论说感觉软件开始大规模自己写自己了。AI工具评估师Petro Serrano也提到,Codex非常擅长理解代码,尤其擅长对代码运行时间进行建模。
使用流程与时间
它的使用流程是怎样的呢?在Chat GPT的侧边栏找到Codex,然后就可以给它下指令,比如帮我实现某个功能,或者解释一下某段代码的作用。
每个任务都在一个独立隔离的环境里运行,而且你的代码库已经预装在那里,它能在这个环境里读写文件,运行一些命令,比如运行测试框架或代码检查工具。
完成一个任务一般需要几分钟到半小时不等,进度可以实时查看。等它完成后,会把改动提交到独立环境里,并提供证据,比如测试结果,让你看到它做了什么以及为什么这么做。如果不满意,你可以要求它修改,或者直接创建GitHub PR,也可以把代码更改直接拖到本地。
安全性、成本与局限性
OpenAI在设计时强调安全性和透明度,用户可以通过它提供的日常测试结果来检查其工作。
关于成本,符合资格的用户(如Pro用户等)可以先免费使用几周。之后会有带速率限制的访问,即用量可能有限制,也会有按需付费的选项。如果是开发者想通过API调用,Codex Mini Latest模型每百万输入token收1.5美元,输出token收6美元。
当然,目前它还处于早期阶段,存在一些局限性。比如现在还不能处理图像输入,能力不能实时调整,执行速度比起人工直接交互式编辑代码要慢一些。
agents.md文件:项目说明书
资料里提到一个agents.md文件,类似readme,用来指导Codex。你可以把它理解为给Codex的项目说明书或入职引导。
在里面可以写清楚项目的构建方式、测试方法、需要遵守的代码规范等。这样Codex就能更好地理解项目,工作起来更精准高效。理论上,良好的配置,尤其是agents.md能让Codex发挥最佳效能。不过即便没有特别完美的配置,Codex-1模型本身能力也很强,并非不可或缺。
这有点像给新同事做入职引导,前期投入精力,后面协作会更顺畅。长期来看,这种磨合可能比反复手动纠正它的输出更省事。
总结与思考
Codex的推出是AI在软件开发领域从简单辅助工具向更深层次协作者迈出的重要一步。它能自动化部分开发流程,如写代码、跑测试、提交PR等,未来编程可能会变得更简单高效。
OpenAI计划未来推出更灵活、交互性更强的智能体工作流,值得期待。
最后留给听众朋友们一个思考:当AI越来越能干,能更自主地处理复杂编码任务时,人类开发者的角色会发生怎样的变化?我们需要具备哪些核心技能才能保持竞争力?当开始和像Codex这样的AI智能体一起工作时,这种协作的真正含义又是什么?这个问题值得我们每个人深思。