机器之心报道
编辑:杜伟、陈萍
在《GT 赛车》中战胜数位全球顶级电子竞技赛车手 , 索尼 AI 开发了一个超强大的赛车 AI 智能体 。
文章图片
从国际象棋到围棋再到扑克 , AI 智能体在许多游戏中都胜过人类 。 现在 , 这些智能体可以在《GT 赛车》(Gran Turismo)刷新最高分 。
《GT 赛车》由 SCEJ 旗下的著名制作人山内一典领衔研发的一款赛车游戏 。 始创于 1997 年 , 此游戏是由 POLYPHONY DIGITAL 开发的赛车游戏 。 无论从游戏画面、操作驾驶时的赛道、赛车数量、真实感 , 系统都做到尽量完善 。 这款游戏收录了超过 50 条赛道 , 超过 1000 款车型 , 可谓汽车博物馆 。
今日索尼宣布 , 其研究人员已经开发出一款名为「 GT Sophy」的 AI 驱动程序 , 其能够在 GT 赛车运动中连续几圈击败人类顶级电子竞技赛车手 。 相关论文登上 Nature 封面 。
文章图片
论文地址:https://www.nature.com/articles/s41586-021-04357-7
这是比赛画面:
文章图片
文章图片
或许有人认为这是一个简单的挑战 , 毕竟 , 赛车不只是速度和反应时间的问题 。 但电子游戏赛车和 AI 领域的专家都表示 , GT Sophy 是一项重大突破 , 这表现出智能体对战术和战略的掌握 。
来自斯坦福大学研究自动驾驶的教授 Chris Gerdes 表示 , 「在赛车比赛中 , 如此熟练地超越顶级车手 , 是 AI 的标志性成就 。 」
GT Sophy 使用一种称为强化学习的方法进行训练:本质上是一种试错形式 , 其中 AI 智能体被扔到一个没有指令的环境中 , 并因达到某些目标而获得奖励 。 在 GT Sophy 的案例中 , 索尼的研究人员表示 , 他们必须非常谨慎地设计这种奖励:例如 , 微调碰撞惩罚 , 以塑造一种足够强悍的驾驶风格 , 从而赢得胜利 , 但这并不会导致 AI 粗暴地将其他赛车赶出道路 。
使用强化学习 , GT Sophy 只需几个小时的训练就能在赛道上行驶 , 并且在一两天的时间内就能超越训练数据集中 95% 的车手比赛 。 经过大约 45,000 小时的全部训练 , GT Sophy 能够在三个赛道上取得超人的表现 。
【弯道极限超车、击败人类顶级玩家,索尼AI赛车手登上Nature封面】在测试 AI 智能体时 , 智能体具有许多天生的优势 , 例如它们可以完美的进行回放、反应时间也非常快 。 索尼的研究人员指出 , 与人类玩家相比 , GT Sophy 确实具有一些优势 , 例如带有赛道边界坐标的精确路线地图和关于每个轮胎的负载、每个轮胎的侧偏角和其他车辆状态的精确信息 。 但是 , 索尼表示智能体占据了动作频率和反应时间这两个特别重要的因素 。
GT Sophy 的输入被限制在 10Hz , 而人类的理论最大输入是 60Hz 。 索尼表示这导致人类驾驶员在高速行驶时表现出更加流畅的动作 。 在反应时间方面 , GT Sophy 能够在 23-30 毫秒内对比赛环境中的事件做出反应 , 这比职业运动员的 200-250 毫秒的最高反应时间要快得多 。 作为补偿 , 研究人员添加了人工延迟 , 以 100 毫秒、200 毫秒和 250 毫秒的反应时间训练 GT Sophy 。 但正如他们发现的那样:所有这三项测试都达到了超越人类水平的单圈时间 。
GT Sophy 与三位顶级电子竞技车手进行了测试:Emily Jones、Valerio Gallo 和 Igor Fraga 。 尽管没有一位车手能够在计时赛中击败 AI , 但比赛让他们发现了新的战术 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
