Project Icon

pytorch-rl

Pytorch中的深度强化学习算法实现

pytorch-rl项目在Pytorch中实现了多种深度强化学习算法,适用于连续动作空间。用户可以在CPU或GPU上高效训练这些算法,并与OpenAI Gym无缝集成。支持的算法包括DQN、DDPG、PPO等,涵盖环境建模和参数空间噪声探索等功能。

使用 Pytorch 实现深度强化学习

此资源库包含了所有标准的无模型和基于模型(即将推出)的 Pytorch RL 算法。(可能还包含一些我目前正在研究的想法)

C++ 版本的 Pytorch-RL:Pytorch-RL-CPP

它是什么?

pytorch-rl 在 Pytorch 中实现了一些最先进的深度强化学习算法,特别是那些与连续动作空间有关的算法。你可以在 CPU 或 GPU 上高效地训练你的算法。此外,pytorch-rl 可以直接与 OpenAI Gym 一起使用,这意味着评估和尝试不同的算法变得很容易。当然你也可以根据自己的需要扩展 pytorch-rl。 简而言之:pytorch-rl 使运行最先进的深度强化学习算法变得非常容易。

安装

推荐从 Pypi 安装 Pytorch-rl:

pip install pytorch-policy

依赖

  1. Pytorch
  2. Gym (OpenAI)
  3. mujoco-py(用于物理模拟和 gym 中的机器人环境)
  4. Pybullet(即将推出)
  5. MPI(只有在使用 MPI 后端 Pytorch 安装时支持)
  6. Tensorboardx (https://github.com/lanpa/tensorboardX)

RL 算法

  1. DQN(带 Double Q 学习)
  2. DDPG
  3. DDPG 与 HER(用于 OpenAI Fetch 环境)
  4. 层次强化学习
  5. 优先经验回放 + DDPG
  6. 带优先倒回放的 DDPG(研究)
  7. 带 A3C 的神经地图(即将推出)
  8. 彩虹 DQN(即将推出)
  9. PPO (https://github.com/ikostrikov/pytorch-a2c-ppo-acktr)
  10. 带有自注意力机制的 HER 用于目标替换(研究)
  11. A3C(即将推出)
  12. ACER(即将推出)
  13. DARLA
  14. TDM
  15. 世界模型
  16. 软演员-评论家
  17. 赋能驱动的探索(Tensorflow 实现:https://github.com/navneet-nmk/Empowerment-driven-Exploration)

环境

  1. Breakout
  2. Pong(即将推出)
  3. 手动操作机器人任务
  4. Fetch-Reach 机器人任务
  5. 手动到达机器人任务
  6. 积木操作机器人任务
  7. Montezuma's Revenge(当前研究)
  8. Pitfall
  9. Gravitar
  10. 赛道赛车
  11. 超级马里奥兄弟(按照说明安装 gym-retro:https://github.com/openai/retro)
  12. OpenSim Prosthetics Nips Challenge(https://www.crowdai.org/challenges/nips-2018-ai-for-prosthetics-challenge)

环境建模(用于探索和领域适应)

由于训练生成器和判别器的不稳定性,使用了多种 GAN 训练技巧。 请参考 https://github.com/soumith/ganhacks 获取更多信息。

即使在使用技巧之后,训练一个 GAN 收敛仍然非常困难。 然而,在使用 Spectral Normalization(https://arxiv.org/abs/1802.05957)后,infogan 收敛训练。

对于带有 GANs 的图像到图像翻译任务和一般的 VAEs,带有跳跃连接的训练对训练非常有帮助。

  1. beta-VAE
  2. InfoGAN
  3. CVAE-GAN
  4. 基于流的生成模型(研究)
  5. SAGAN
  6. 顺序注意、推理、重复
  7. 好奇心驱动的探索
  8. 探索的参数空间噪声
  9. 噪声网络

参考文献

  1. Playing Atari with Deep Reinforcement Learning, Mnih et al., 2013
  2. Human-level control through deep reinforcement learning, Mnih et al., 2015
  3. Deep Reinforcement Learning with Double Q-learning, van Hasselt et al., 2015
  4. Continuous control with deep reinforcement learning, Lillicrap et al., 2015
  5. CVAE-GAN: Fine-Grained Image Generation through Asymmetric Training, Bao et al., 2017
  6. beta-VAE: Learning Basic Visual Concepts with a Constrained Variational Framework, Higgins et al., 2017
  7. Hindsight Experience Replay, Andrychowicz et al., 2017
  8. InfoGAN: Interpretable Representation Learning by Information Maximizing Generative Adversarial Nets, Chen et al., 2016
  9. World Models, Ha et al., 2018
  10. Spectral Normalization for Generative Adversarial Networks, Miyato et al., 2018
  11. Self-Attention Generative Adversarial Networks, Zhang et al., 2018
  12. Curiosity-driven Exploration by Self-supervised Prediction, Pathak et al., 2017
  13. Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor, Haarnoja et al., 2018
  14. Parameter Space Noise for Exploration, Plappert et al., 2018
  15. Noisy Network for Exploration, Fortunato et al., 2018
  16. Proximal Policy Optimization Algorithms, Schulman et al., 2017
  17. Unsupervised Real-Time Control through Variational Empowerment, Karl et al., 2017
  18. Mutual Information Neural Estimation, Belghazi et al., 2018
  19. Empowerment-driven Exploration using Mutual Information Estimation, Kumar et al., 2018
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号