新智元报道
编辑:编辑部
【新智元导读】OpenAI正致力于开发一款高级AI编码助手,以复刻高级工程师的能力,解决复杂的系统编程任务。该工具将支持代码重构、数据跟踪优化及个性化功能集成,有望显著提升企业开发效率并重塑软件行业。
AGI或许就在本周?
刚刚外媒爆料称,OpenAI暗藏的首个智能体项目「Operator」即将发布。
网友发现Operator已登陆ChatGPT,不过可能Pro用户最先用上
这款AI智能体将与ChatGPT深度集成,直接可以接管你的屏幕,自动化完成任务。
不仅如此,OpenAI还在秘密研发一款高级AI编码智能体,而且是能媲美L6级软件工程师的那种!
其中的部分技术,基于的正是全新的o1推理模型。
根据奥特曼此前的博客,这款产品最快今年就可以向公众发布,正式「加入职场」!
L6级,意味着什么?
据levels.fyi统计,谷歌L6级相当于国内大厂——腾讯T13/T14、阿里P8/P9、字节3-1/3-2。
想要达到这个谷歌L6等级,一般需要 积累10年+工作经验,并在某一技术领域有深入的研究和丰富的实践经验,能够解决复杂的技术难题。
谷歌L6级工程师平均薪酬约为524,733美元(约382万人民币),包括了基本工资、奖金和股票期权。
国内就以阿里为例,达到L6级(P8/P9)水平,需要10-15年的经验,被视为公司的技术骨干或项目负责人,粗略估计年薪近400万。
AI编码智能体,直通资深技术大咖
人类工程师等级划分类似,AI智能体助手自然也有初级、高级之分。
不同水平的编码工具对应的将会面向不同的客户群体——从毫无编码能力的新手到有一定经验的程序员,再到经验丰富的资深人士。
ChatGPT和其他大模型对前两类用户尤其有用,它们可以根据用户需求,用多种编程语言为不同类型的应用程序生成代码。
OpenAI之所以这么做,最大的好处在于——
让ChatGPT日活用户从每周3亿,逐步跃迁到10亿,最终完成营收1000亿美元的目标。
另一方面,一些AI编码产品如GitHub Copilot、Cursor,深受广大初级和中级软件工程师的欢迎。
这个市场的潜力,不可估量。
相较之下,OpenAI主打的优势便是,开发新型高级编码智能体,为资深软件工程师量身打造。
它不仅可以通过自行查阅代码库来处理代码重构等复杂任务,而且还可以帮助识别和减少代码库中的重复代码,甚至直接对应用程序代码进行整体优化。
一方面,通过修改代码,提升数据跟踪与更新的便捷性,使应用程序在不改变原有运行逻辑的前提下,能够更加轻松地迁移至成本更低的新型数据存储系统。
另一方面,产品可对代码进行重写,集成全新的个性化功能,依据用户行为精准地为其推荐产品或内容。
高级编程助手
显然,这种新型助手的交互模式,可能会与ChatGPT大相径庭。
ChatGPT以输出代码块为主要方式,程序员只需复制粘贴这些代码,便可融入应用开发。
而OpenAI的高级AI编程助手,很可能会自己用Slack这类工具向人类工程师发送消息,传达更改代码库的意图。
根据OpenAI的内部测试,在这款「L6级智能体」加持下的工具,可以帮助AI研究人员更快地开展工作,比如为AI模型相关的实验生成代码。
对此,OpenAI的员工表示,一款先进的高级编码智能体,再结合能够解决数学问题和开展实验的AI,未来有一天可能会实现批量自动化处理AI研究员和工程师的工作。
而若真是如此,那么将来我们真正需要的就会仅仅是足够精妙的idea,至于实验的实现,完全可以部署给高级编码智能体进行落实。
到那时,无法想象我们会迎来怎样的技术爆炸时代。
开发者兼AI顾问Jason Liu指出,OpenAI将高级工程师或工程经理锚定为新产品的目标客户,是相当明智的策略。
因为这类员工在公司里通常薪资成本高昂,为每位高级工程师配备数十个自主编程助手,极有可能给相关公司带来巨大变革,尤其是在财务方面。
非技术用户可能只是借助ChatGPT尝试开发一些创意应用,而高级工程师的工作成果,往往能直接转化为经济效益。
虽然距离最终发布还有一段时间,OpenAI则一直在准备向部分选定的潜在客户测试这款高级编码智能体的早期版本,以确保该产品既实用又有吸引力。
这一过程被称为寻找产品与市场的契合点。
当然,如果广大的软件公司也能够以极低的使用成本来利用这项技术,广泛开发出适用于内部的办公应用程序,那么就可能会重塑整个企业软件行业。
回到现实
回望过去一年中,代码生成已是大语言模型最具发展潜力的应用领域之一。
亚马逊CEO Andy Jassy于24年8月称,该公司的编程助手已节省了「4500名开发者一年的工作量」。
谷歌CEO Sundar Pichai也在24年10月表示,AI在公司内部生成的新代码量,已超过总量的四分之一。
AI编程能力的发展,引发了对软件工程未来走向的热议,尤其是那些可能受AI冲击的初级职位。
去年10月,Anthropic联合创始人Daniela Amodei在接受采访时表示,虽然当前AI编程还不能完全取代工程师,仍需人为给予一定引导,但Claude 3.5 Sonnet显著提升了开发者的工作效率,Anthropic甚至会据此调整招聘计划。
当前阶段,AI编程技术在应对复杂任务过程中,仍存在着诸多局限性。
像Cognition公司的自主编程助手Devin,时常会出现卡顿,或者遗漏部分任务的情况。并且,审核这类产品生成的代码,往往需要耗费大量时间。
对此,Liu调侃道:「用Devin做任何事情都得花七个小时,最后就像在管理十个笨手笨脚的实习生。」
针对这一评价,Cognition联合创始人Walden Yan在邮件中回应称:「Devin在初级工程任务上表现出色。当前AI编程技术仍处于早期阶段,但发展迅猛。」
参考资料:
https://www.theinformation.com/articles/openai-targets-agi-with-system-that-thinks-like-a-pro-engineer
https://x.com/steph_palazzolo/status/1882196262310855117