DeepMind发布媲美普通程序员的AlphaCode,同日OpenAI拿下奥数题

机器之心报道
编辑:张倩、蛋酱

世界本来已经很卷 , 有了 AI 加入之后 , 卷上加卷……
【DeepMind发布媲美普通程序员的AlphaCode,同日OpenAI拿下奥数题】太卷了!
在国内欢度春节之时 , DeepMind 与 OpenAI 两个知名 AI 研究机构分别发布重要研究成果:DeepMind 发布了基于 Transformer 模型的 AlphaCode , 可以编写与人类相媲美的计算机程序;同时 , OpenAI 开发的神经定理证明器成功解出了两道国际奥数题 。
DeepMind发布媲美普通程序员的AlphaCode,同日OpenAI拿下奥数题
文章图片

有没有觉得 AI 攻克的这两个领域很熟悉?没错 , 就在 2021 年 , OpenAI 发布了 AI 代码补全工具 GitHub Copilot, 并公布了背后的技术 CodeX 。 同样 , 在去年下半年 , DeepMind 也公布了他们解决数学难题的 AI 研究成果 , 并登上了 Nature 。
虽然两家研究机构的新成果为 AI 解决老问题提供了新思路 , 但也不得不让网友感叹 , AI 领域太卷了!
DeepMind发布媲美普通程序员的AlphaCode,同日OpenAI拿下奥数题
文章图片

来源:网友微博截图
击败 46% 参赛者的 AlphaCode
在最近的一篇论文中 , DeepMind 的研究者介绍了 AlphaCode 。 AlphaCode 使用基于 Transformer 的语言模型实现大规模的代码生成 , 并且将其编写为程序 。
DeepMind发布媲美普通程序员的AlphaCode,同日OpenAI拿下奥数题
文章图片

论文连接:https://storage.googleapis.com/deepmind-media/AlphaCode/competition_level_code_generation_with_alphacode.pdf
研究者将 AlphaCode 放在 Codeforces 挑战中进行了测试 , Codeforces 是一个具有竞争力的编程平台 , 它类似于国际象棋中使用的 Elo 评级系统 , 每周分享编程挑战和问题排名 。 不同于编程人员在打造商业应用程序时可能面临的任务 , Codeforces 的挑战更加独立 , 需要对计算机科学中的算法和理论概念有更广泛的了解 , 一般是结合逻辑、数学和编码专业知识的非常专业的难题 。
AlphaCode 针对 Codeforces 网站上 5000 名用户解决的 10 项挑战进行了测试 , 总体排名位于前 54.3% , 也就是说它击败了 46% 的参赛者。 DeepMind 估计 , AlphaCode 系统的 Codeforces Elo 为 1238 , 使其过去六个月内在该网站上竞争的用户中排名前 28% 。
DeepMind发布媲美普通程序员的AlphaCode,同日OpenAI拿下奥数题
文章图片

举个例子 , 在测试 AlphaCode 的一项挑战中 , 试题要求参赛者找到一种方法 , 使用一组有限的输入将一个随机、重复的 s 和 t 字母字符串转换为另一个相同字母的字符串 。 例如 , 竞争对手不能只输入新字母 , 而必须使用「backspace」命令删除原始字符串中的几个字母 。 对于 AlphaCode 来说 , 这只是中等难度的挑战:
DeepMind发布媲美普通程序员的AlphaCode,同日OpenAI拿下奥数题
文章图片

其中十个挑战以与人类完全相同的格式输入 AlphaCode 。 然后 , AlphaCode 生成大量可能的答案 , 并通过运行代码和检查输出来筛选这些答案 , 就像人类竞争对手一样 。 AlphaCode 论文的联合负责人 Yujia Li 和 David Choi 表示:「整个过程是自动的 , 无需人工选择最佳样本 。 」
要想在 Codeforces 的挑战中脱颖而出 , 原本不是一件容易的事 。 AlphaCode 项目开展于两年多前 , 随着大规模 Transformer 模型的进步与大规模采样、滤波技术的结合 , DeepMind 的研究者已经在 AI 能够解决的问题数量上取得了重大进展 。
DeepMind发布媲美普通程序员的AlphaCode,同日OpenAI拿下奥数题

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。