github 教程-github资料：强化学习教程Easy-RL

生活百科 3 月前 0 2

关于本书

《Easy-RL》由开源组织发起，由中科院王琦、清华大学杨毅远、北京大学江季三位组织成员主要负责。本书结合了李宏毅老师的《深度强化学习》、周博磊老师的《强化学习纲要》、李科浇老师的《百度强化学习》等多个强化学习的经典资料，并配有相关的习题、面经以及完全版的代码实战github 教程，适合想入门强化学习的小伙伴。

github 教程_githublinux教程_手机版github使用教程

项目开源地址：

2020 年 11 月 22 日，《Easy-RL》（原《李宏毅深度强化学习笔记》）在中正式发布，截至今日，已收获1.7k个Star，并受到了广大学习者的一致好评github 教程，学习者纷纷表示通过这个教程收获颇多。编写者们也通过读者反馈的建议，对教程进行了实时地更新与补充。

本书细节

时隔半年，《Easy-RL》在原有的基础上进行了充分地迭代和优化，不仅对发布时已有章节进行了完善和纠错，同时还补充了常见的面试题，当然，项目作者还给出了完全版的强化学习实战代码，方便大家深入学习。

1.教程案例

案例1: 对概念的解析

github 教程_githublinux教程_手机版github使用教程

案例2: 利用简单的例子解释强化学习基本概念

手机版github使用教程_github 教程_githublinux教程

案例3: 论文解读

githublinux教程_手机版github使用教程_github 教程

2.教程习题

案例: RL的面试真题

github 教程_手机版github使用教程_githublinux教程

githublinux教程_github 教程_手机版github使用教程

3.实践优化

首先是增加了一些更为高级且研究工程上常用的算法，比如TD3，Soft-Actor-等等，新版所有算法实现如下表：

此外在每个算法目录下会有相关的算法实现说明：

并且代码将更加简洁，结构清晰，具体可以去上细看，此外为了更好地呈现结果，增加了来训练，可以在网页直接查看结果，同时也说明文件夹下生成的结果是童叟无欺的，如下：

githublinux教程_手机版github使用教程_github 教程

以上就是代码相关的主要优化，不止如此，今后除了修缮代码结构注释等等，还会增加各种各样的DQN比如-dqn等代码，以及各种算法对于同一环境的实现对比，敬请期待。

Easy-RL目录

手机版github使用教程_github 教程_githublinux教程

githublinux教程_github 教程_手机版github使用教程

限时特惠:本站持续每日更新海量各大内部创业课程，一年会员仅需要98元，全站资源免费下载
点击查看详情

站长微信:Jiucxh

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

周博磊强化学习李宏毅

相关文章

新90博客-【LSTM之父Schmidhuber总结博客】利用循环世界模型和人工好奇心进行强化学习和规划

新90博客-【LSTM之父Schmidhuber总结博客】利用循环世界模型和人工好奇心进行强化学习和规划

生活百科 1 月前 3

decode函数 decode函数-教ChatGLM4打工：让它自动查天气、跑函数、当助理

decode函数 decode函数-教ChatGLM4打工：让它自动查天气、跑函数、当助理

生活百科 2 月前 5

比斯论坛-阿法狗之父哈萨比斯乌镇发表最新主题演讲，从海马体开始的青年传奇人生

比斯论坛-阿法狗之父哈萨比斯乌镇发表最新主题演讲，从海马体开始的青年传奇人生

生活百科 4 月前 3

真正的美非常脆弱，却不可征服——《厚积落叶听雨声》随笔

真正的美非常脆弱，却不可征服——《厚积落叶听雨声》随笔

生活百科 1 月前 2

发表回复取消回复