#PPO算法

CleanRL深度强化学习算法库 - 学习资源汇总及入门指南

2 个月前

CleanRL 深度强化学习单文件实现云集成 PPO算法 Github 开源项目

2 个月前

Sample Factory: 高吞吐量的同步和异步强化学习框架

3 个月前

Sample Factory 强化学习 PPO算法高吞吐量环境集成 Github 开源项目

3 个月前

RSL_RL: 一个快速、简单且完全基于GPU的强化学习算法实现

3 个月前

RSL RL 强化学习 GPU运行 PPO算法开源项目 Github

3 个月前

相关项目

cleanrl

CleanRL是一款简洁高效的深度强化学习库，提供单文件实现和广泛的算法支持，包括PPO、DQN等。它支持本地和云端实验、Tensorboard日志记录及Weights and Biases管理，适用于研究与快速原型开发。

rsl_rl

rsl_rl是一个专为GPU运行优化的强化学习框架，目前实现了PPO算法，未来将支持更多算法。框架提供详细的安装指南，集成多种日志工具，并采用严格的代码质量管理。它在Legged-Gym和Orbit等机器人仿真环境中得到应用，为强化学习研究和开发提供了高效工具。

sample-factory

Sample Factory是一个高效的强化学习库，专注于同步和异步策略梯度实现。它提供优化的算法架构、灵活的训练模式和多种环境支持，包括多智能体训练和PBT等功能。该库在VizDoom、IsaacGym和DMLab-30等多个领域展现出优秀性能，同时减少训练时间和硬件需求。Sample Factory支持导入其他项目，并允许自定义环境和模型架构。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com