弯道极限超车、击败人类顶级玩家，索尼AI赛车手登上Nature封面 _玩家

机器之心报道
编辑：杜伟、陈萍

在《GT 赛车》中战胜数位全球顶级电子竞技赛车手，索尼 AI 开发了一个超强大的赛车 AI 智能体。

文章图片

从国际象棋到围棋再到扑克， AI 智能体在许多游戏中都胜过人类。现在，这些智能体可以在《GT 赛车》（Gran Turismo）刷新最高分。
《GT 赛车》由 SCEJ 旗下的著名制作人山内一典领衔研发的一款赛车游戏。始创于 1997 年，此游戏是由 POLYPHONY DIGITAL 开发的赛车游戏。无论从游戏画面、操作驾驶时的赛道、赛车数量、真实感，系统都做到尽量完善。这款游戏收录了超过 50 条赛道，超过 1000 款车型，可谓汽车博物馆。
今日索尼宣布，其研究人员已经开发出一款名为「 GT Sophy」的 AI 驱动程序，其能够在 GT 赛车运动中连续几圈击败人类顶级电子竞技赛车手。相关论文登上 Nature 封面。

文章图片

论文地址：https://www.nature.com/articles/s41586-021-04357-7
这是比赛画面：

文章图片

文章图片

或许有人认为这是一个简单的挑战，毕竟，赛车不只是速度和反应时间的问题。但电子游戏赛车和 AI 领域的专家都表示， GT Sophy 是一项重大突破，这表现出智能体对战术和战略的掌握。
来自斯坦福大学研究自动驾驶的教授 Chris Gerdes 表示，「在赛车比赛中，如此熟练地超越顶级车手，是 AI 的标志性成就。」
GT Sophy 使用一种称为强化学习的方法进行训练：本质上是一种试错形式，其中 AI 智能体被扔到一个没有指令的环境中，并因达到某些目标而获得奖励。在 GT Sophy 的案例中，索尼的研究人员表示，他们必须非常谨慎地设计这种奖励：例如，微调碰撞惩罚，以塑造一种足够强悍的驾驶风格，从而赢得胜利，但这并不会导致 AI 粗暴地将其他赛车赶出道路。
使用强化学习， GT Sophy 只需几个小时的训练就能在赛道上行驶，并且在一两天的时间内就能超越训练数据集中 95% 的车手比赛。经过大约 45,000 小时的全部训练， GT Sophy 能够在三个赛道上取得超人的表现。
【弯道极限超车、击败人类顶级玩家，索尼AI赛车手登上Nature封面】在测试 AI 智能体时，智能体具有许多天生的优势，例如它们可以完美的进行回放、反应时间也非常快。索尼的研究人员指出，与人类玩家相比， GT Sophy 确实具有一些优势，例如带有赛道边界坐标的精确路线地图和关于每个轮胎的负载、每个轮胎的侧偏角和其他车辆状态的精确信息。但是，索尼表示智能体占据了动作频率和反应时间这两个特别重要的因素。
GT Sophy 的输入被限制在 10Hz ，而人类的理论最大输入是 60Hz 。索尼表示这导致人类驾驶员在高速行驶时表现出更加流畅的动作。在反应时间方面， GT Sophy 能够在 23-30 毫秒内对比赛环境中的事件做出反应，这比职业运动员的 200-250 毫秒的最高反应时间要快得多。作为补偿，研究人员添加了人工延迟，以 100 毫秒、200 毫秒和 250 毫秒的反应时间训练 GT Sophy 。但正如他们发现的那样：所有这三项测试都达到了超越人类水平的单圈时间。
GT Sophy 与三位顶级电子竞技车手进行了测试：Emily Jones、Valerio Gallo 和 Igor Fraga 。尽管没有一位车手能够在计时赛中击败 AI ，但比赛让他们发现了新的战术。

特别声明：本站内容均来自网友提供或互联网，仅供参考，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。