文章图片
新智元报道
编辑:桃子 拉燕
【新智元导读】继Copilot之后 , 码农距失业又前进了一步?刚刚 , DeepMind发布了竞赛级代码生成系统AlphaCode , 并声称新的代码生成系统可与人类程序员竞争 。
去年 , OpenAI发布了重磅产品——Codex , 一个能自己编程的AI 。
AI编程这件事似乎也变得不新鲜了 , 像GitHub前不久闹得风风火火的Copilot , 也是其中一个 。
刚刚 , DeepMind发布了一个名为AlphaCode的代码生成系统 , 并声称可与人类相匹敌 。
最新研究成果Competition-Level Code Generation with AlphaCode已于2月2日发表 。
文章图片
https://storage.googleapis.com/deepmind-media/AlphaCode/competition_level_code_generation_with_alphacode.pdf
DeepMind表示 , 「尽管AlphaCode的水平不一定能代表一般编程人员所面临的编程任务 , 但可以说明自主编程向前迈出了重要的一步」 。
码农只能陪跑?
DeepMind使用编程竞赛平台Codeforces上托管的10个现有竞赛来测试AlphaCode , 总体排名位于前 54.3% , 也就是说它击败了 46% 的参赛者。
CodeContests 上的每个问题有100万个样本 , AlphaCode解决了34.2%的问题 。
DeepMind 声称 , 就总体性能而言 , 在过去6个月参加过比赛的用户中 , AlphaCode的数据排到了前28% 。
文章图片
举个栗子:
在AlphaCode测试的一个例子中 , 参赛者需要找到一种方法 , 使用一组有限的输入将一串随机重复的s和t字母转换成另一串相同的字母 。
竞争对手不能只是输入新的字母 , 而必须使用「退格」命令删除原始字符串中的几个字母 。 有关挑战问题的详细描述如下:
文章图片
AlphaCode给出的解决方案如下 ,
文章图片
在 AlphaCode 的案例中 , DeepMind在CodeContests上对系统进行了微调和测试 。
在10项挑战被输入到AlphaCode系统后 , AlphaCode生成大量可能的答案 , 并像人类竞争者那样运行代码和检查输出 , 从中筛选出这些答案 。
论文合著者称 , 整个过程是自动进行的 , 没有人为去选择最好的样本 。
文章图片
AlphaCode如何实现?
AlphaCode包含414亿个参数 , 大约是Codex的4倍 , 训练数据集是715.1 GB 。
据介绍 , 研究者在选定的公共GitHub代码上预先训练模型 , 并在相对较小的竞争性编程数据集上对其进行微调 。
在评估的时候 , 研究人员为每个问题创建了大量的C++和Python程序 , 数量级比以前的工作要大 。
然后对这些解决方案进行筛选、聚类和重新排序 , 并将这些解决方案提交给一个由10个候选程序组成的小集合 , 供外部评估 。
文章图片
这个自动化系统取代了人类竞争对手的调试、编译、通过测试和最终提交的反复试验过程 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
