机器之心报道
机器之心编辑部
李宏毅、周博磊、李科浇等大咖老师亲笔推荐 , Datawhale 开源的蘑菇书 EasyRL 强化学习教程终于有了第一版纸质书 。作为人工智能里最受关注的领域之一 , 强化学习的热度一直居高不下 , 在游戏、自动驾驶、机器人路线规划等领域得到了广泛的应用 。 但是 , 强化学习的学习难度也同样不低 。
在学习强化学习的过程中 , 想必很多人都遇到过有无数资料却难以入门的问题 。 于是 , 非盈利性开源学习组织 Datawhale 发起了强化学习系列教程 ——easy-rl , 希望自学的同时帮助更多学习者轻松入门 。
该教程也被称为「蘑菇书」 , 主要萃取了强化学习领域经典中文视频之一 —— 李宏毅老师的《深度强化学习》教程、周博磊老师的《强化学习纲要》和李科浇老师的《世界冠军带你从零实践强化学习》等经典课程 。
发布 10 个月以来 , 该教程已经在 GitHub 上获得了 3.6k Star 。
文章图片
GitHub 项目地址:https://github.com/datawhalechina/easy-rl
Datawhale 免费提供了 PDF 版教程 , 目前下载量已经 1 万 。 2022 年 2 月 1 日 , 在人民邮电出版社的支持下 , 《Easy RL 强化学习教程》第一版纸质书终于问世 。
文章图片
本书适合对强化学习感兴趣的读者阅读 , 也可以作为相关课程的配套教材 。
书籍特色及大纲
首先 , 本书结合了强化学习领域公开课的精华 。 比如 , 李宏毅老师的《深度强化学习》通过幽默风趣的上课风格让晦涩难懂的强化学习理论变得轻松易懂 , 他会通过很多有趣的例子来讲解强化学习理论 。
来自中科院大学、清华、北大的三位发起者 —— 王琦、杨毅远和江季 , 通过自学这 3 门公开课 , 根据自身的理解整理优化得来了《Easy RL:强化学习教程》 , 并且获得了三位公开课老师的支持 。
文章图片
其次 , 本书完全根据学习经历编著而成 。 本书完全从读者学习的角度出发 , 既有学霸学长在学习中的重点 ——3 门公开课的精华内容 , 还有学霸凝练的精华和扩展的内容 —— 作者们在大部分章末设置了原创的关键词、习题和面试题 , 提供 Python 代码实现 。 帮助初学者避「坑」 , 用轻松的步伐入门强化学习 。 其实 , 每个人在学习一门新的课程时 , 都会有自己独特的经验和方法 , 这种经验和方法的共享非常难能可贵 。
最后 , 本书得到了李宏毅、周博磊、李科浇、汪军、张伟楠、李升波、胡裕靖等 7 位强化学习领域大咖老师的亲笔认可和推荐 。
具体地 , 本书共 13 章 , 大体上可以分为两个部分 。
第一部分包括第 1~3 章 , 介绍强化学习基础知识以及马尔可夫决策过程、蒙特卡洛方法、时序差分方法、Sarsa、Q 学习传统强化学习算法 。
第二部分包括第 4~13 章 , 介绍策略梯度、近端策略优化、深度 Q 网络、深度确定性策略梯度等深度强化学习算法及其常见问题的解决方法 。 该部分各章节相对独立 , 读者可以根据自己的兴趣和时间选择性阅读 。
此外 , 本书还提供较为全面的习题解答以及 Python 代码实现 , 可以让读者进行端到端、从理论到轻松实践的全生态学习 , 充分掌握强化学习算法的原理并能进行实战 。
部分章节目录如下:
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
