深度强化学习:从零到英雄!
欢迎来到最实际的强化学习体验!
这是一个简短而实用的入门课程,介绍了基础和经典的深度强化学习算法。到课程结束时,你将从零开始编写算法如DQN、SAC、PPO,并且在高层次上理解它们背后的理论。
我们将能够训练一个AI来玩Atari游戏并登陆月球!
环境设置
为了确保我们能够专注于学习,环境设置是有主见的😊。这里是设置步骤:
-
安装 Miniconda
为什么选择conda?因为它是一个完整的环境管理器,而且我们可以选择Python的版本。 -
检出这个Git仓库,并进入其文件夹。
-
创建并激活
drlzh
虚拟环境:conda create --name drlzh python=3.11 conda activate drlzh
-
安装 Poetry 并安装依赖项:
依赖项包括用于Atari的gymnasium[accept-rom-license]
。确保在通过Poetry安装项目依赖项时接受许可协议。pip install poetry poetry install
我如何开始?
在Visual Studio Code中打开此仓库文件夹 (确保保留.vscode
文件夹以保持设置的一致性,如果使用Jupyter可能需要对代码和导入进行一些调整)。
在Visual Studio Code中打开第一个00_Intro.ipynb
笔记本,并跟随课程进行!你的目标是在TODO
部分编写代码并尝试算法!你甚至可能会遇到一些单元测试来验证你的实现!继续从一个笔记本移到下一个,如果你卡住了,可以随时检查/solution
文件夹,其中提供了完整的代码。
对于一个深入和循序渐进的编码过程,请关注即将推出的YouTube视频!