#PPO算法

cleanrl - 一个深度强化学习库

CleanRL深度强化学习单文件实现云集成PPO算法Github开源项目

CleanRL是一款简洁高效的深度强化学习库，提供单文件实现和广泛的算法支持，包括PPO、DQN等。它支持本地和云端实验、Tensorboard日志记录及Weights and Biases管理，适用于研究与快速原型开发。

rsl_rl - 面向GPU的高效强化学习框架

RSL RL强化学习GPU运行PPO算法开源项目Github

rsl_rl是一个专为GPU运行优化的强化学习框架，目前实现了PPO算法，未来将支持更多算法。框架提供详细的安装指南，集成多种日志工具，并采用严格的代码质量管理。它在Legged-Gym和Orbit等机器人仿真环境中得到应用，为强化学习研究和开发提供了高效工具。

sample-factory - 高效强化学习框架实现快速训练和卓越性能

Sample Factory强化学习PPO算法高吞吐量环境集成Github开源项目

Sample Factory是一个高效的强化学习库，专注于同步和异步策略梯度实现。它提供优化的算法架构、灵活的训练模式和多种环境支持，包括多智能体训练和PBT等功能。该库在VizDoom、IsaacGym和DMLab-30等多个领域展现出优秀性能，同时减少训练时间和硬件需求。Sample Factory支持导入其他项目，并允许自定义环境和模型架构。

相关文章

Article Cover

RSL_RL: 一个快速、简单且完全基于GPU的强化学习算法实现

Article Cover

Sample Factory: 高吞吐量的同步和异步强化学习框架

Article Cover

CleanRL深度强化学习算法库 - 学习资源汇总及入门指南

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号