DeepMind发布媲美普通程序员的AlphaCode，同日OpenAI拿下奥数题 _排名

机器之心报道
编辑：张倩、蛋酱

世界本来已经很卷，有了 AI 加入之后，卷上加卷……

【DeepMind发布媲美普通程序员的AlphaCode，同日OpenAI拿下奥数题】太卷了！
在国内欢度春节之时， DeepMind 与 OpenAI 两个知名 AI 研究机构分别发布重要研究成果：DeepMind 发布了基于 Transformer 模型的 AlphaCode ，可以编写与人类相媲美的计算机程序；同时， OpenAI 开发的神经定理证明器成功解出了两道国际奥数题。

文章图片

有没有觉得 AI 攻克的这两个领域很熟悉？没错，就在 2021 年， OpenAI 发布了 AI 代码补全工具 GitHub Copilot，并公布了背后的技术 CodeX 。同样，在去年下半年， DeepMind 也公布了他们解决数学难题的 AI 研究成果，并登上了 Nature 。
虽然两家研究机构的新成果为 AI 解决老问题提供了新思路，但也不得不让网友感叹， AI 领域太卷了！

文章图片

来源：网友微博截图
击败 46% 参赛者的 AlphaCode
在最近的一篇论文中， DeepMind 的研究者介绍了 AlphaCode 。 AlphaCode 使用基于 Transformer 的语言模型实现大规模的代码生成，并且将其编写为程序。

文章图片

论文连接：https://storage.googleapis.com/deepmind-media/AlphaCode/competition_level_code_generation_with_alphacode.pdf
研究者将 AlphaCode 放在 Codeforces 挑战中进行了测试， Codeforces 是一个具有竞争力的编程平台，它类似于国际象棋中使用的 Elo 评级系统，每周分享编程挑战和问题排名。不同于编程人员在打造商业应用程序时可能面临的任务， Codeforces 的挑战更加独立，需要对计算机科学中的算法和理论概念有更广泛的了解，一般是结合逻辑、数学和编码专业知识的非常专业的难题。
AlphaCode 针对 Codeforces 网站上 5000 名用户解决的 10 项挑战进行了测试，总体排名位于前 54.3% ，也就是说它击败了 46% 的参赛者。 DeepMind 估计， AlphaCode 系统的 Codeforces Elo 为 1238 ，使其过去六个月内在该网站上竞争的用户中排名前 28% 。

文章图片

举个例子，在测试 AlphaCode 的一项挑战中，试题要求参赛者找到一种方法，使用一组有限的输入将一个随机、重复的 s 和 t 字母字符串转换为另一个相同字母的字符串。例如，竞争对手不能只输入新字母，而必须使用「backspace」命令删除原始字符串中的几个字母。对于 AlphaCode 来说，这只是中等难度的挑战：

文章图片

其中十个挑战以与人类完全相同的格式输入 AlphaCode 。然后， AlphaCode 生成大量可能的答案，并通过运行代码和检查输出来筛选这些答案，就像人类竞争对手一样。 AlphaCode 论文的联合负责人 Yujia Li 和 David Choi 表示：「整个过程是自动的，无需人工选择最佳样本。」
要想在 Codeforces 的挑战中脱颖而出，原本不是一件容易的事。 AlphaCode 项目开展于两年多前，随着大规模 Transformer 模型的进步与大规模采样、滤波技术的结合， DeepMind 的研究者已经在 AI 能够解决的问题数量上取得了重大进展。

特别声明：本站内容均来自网友提供或互联网，仅供参考，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。