击败一半参赛程序员,DeepMind 重磅推出 AlphaCode( 二 )


读书破万卷 , 下笔如有神 , 代码学多了 , 是否能质变?
从 DeepMind 官方博客上看 ,AlphaCode 的训练集还是基于 GitHub 和CodeForce 建立的 , 这与阿尔法狗初始态下也是基于人类棋谱构建训练数据是比较一致的 。
击败一半参赛程序员,DeepMind 重磅推出 AlphaCode
文章图片

我们知道初代的阿尔法狗还没有那么高的统治力 , 在抛弃人类棋谱 , 两只阿尔法狗对局 , 并不断进化之后 , 人类棋手在面对AI时才会显得那么无能为力 。
不过好消息是围棋的规则是长时间不变的 , 但是在编程方面技术的进步却是日新月异 , 也就是 AlphaCode 所面对的数据集是要动态调整的 , 这可能使两个 AlphaCode 相互结对编程 , 并取得质变的可能性并没有想象当中那么大 , 因此 AlphaCode 想达到高级程序员的水平在短期看来不太可能 , 不过随着 AlphaCode 能够普遍达到中级程序员的水平之后 , IT 行业 35 岁即失业的现象恐怕会更加严重 , 因为 AI 程序员不能独立工作 , 而带领 AI 编程团队需要更加精深的技术实力而非管理能力 , 这可能会给很多走上技术管理岗的程序员带来一定压力 。
跨越之前 , 问题不少
虽然 AI 编程的发展已经形成趋势 , 但从 AlphaCode 的工作原理等方面分析 , 在 AlphaCode 升级成为贝塔扣 , 伽马扣之前 , 还有很多坑要老老实实的填平:

  • 错误解答 , 反而拖后腿:据 DeepMind 官方博客显示 Alph aCode 首先要进行的工作是通过 NLP 系统 , 试图理解需求的意思 , 但是与人类的理解不同 ,Alph aCode 的理解的语义虽然大部分时候有效 , 但也存在一定完全理解不了的可能性 , 如果你所给出题目的问题描述完全不符合Codeforce 之前题目文风的话 , 那么也很有可能得到一些完全没有意义的代码 , 也就是说在 Alph aCode 能正常给出答案时 , 它的效率可能比人类程序员高得多 , 但一旦 Alph aCode 不能工作 , 那么对不起它错的也会比一般人类程序员离谱 , 因此 Alph aCode 至少要搭建一名初级程序员帮助发现这些显尔易见的错误 , 并递交给高级程序员给出正确答案 。
  • 使用 GitHub 训练 Alph aCode 到底侵不侵权?正如前文所说是基于GitHub 和 Codeforce 两大编程网络上的公开代码进行的模型训练 , 而且无论是微软的 Codplite 还是 Deepmind 的 Alph aCode, 都没有按照不同的开源许可证对于代码进行区分对待 。
  • 那么如果未来 Alph aCode 用于商业用途 , 那么用那些已经明确不允许用于商业用途的代码来训练 Alph aCode 的AI模型是否涉嫌侵权?针对这个问题网上争论的声音很大 , 笔者认为如果 AI 最终给出的建议代码与原先训练集中的代码一模一样的话 , 那么这种情况肯定会涉嫌侵权 , 但建议代码与原训练代码的相似度如何判断才是关键所在 , 当然截止目前这还依旧是个开放性问题 , 业界尚未形成共识 。
  • 引用老旧类库代码 , 增加安全风险:正如前文所言 ,Alph aCode 的训练集是 GitHub和 Codeforce 上已经存在的代码 , 从实操来讲 , Deepmind 很难对如此大量的代码进行有效标注 , 因此 Alph aCode 生成的代码 , 即使有效且能够正常运行 , 也不能代表这些代码没有安全漏洞 , 这样的特性就使得开发人员去全面检查 AI 生成的代码变得非常重要 。
但无论如何未来都将到来 , 面对会编程的 AI 程序员 , 我们人类程序员们只有顺势而为 , 快速找到属于自己的生态位才能力于不败之地 。
作者简介:马超 , 金融科技专家 , 人民大学高礼金融研究院校外双聘导师 , 阿里云MVP , 华为2020年十大开发者之星 , CSDN约稿专栏作者 , 著名的金融科技的布道者 。 众多国产开源项目的推动者及贡献人 。

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。