rl-baselines3-zoo
RL Baselines3 Zoo提供一个灵活的训练框架支持众多增强学习算法和环境。此框架便于进行算法基准测试、调优以及AI模型的训练和评估。已集成200多个预训练智能体,并配备全面的文档和安装指南,适合科研和开发使用。
stable-baselines3
实现可靠的PyTorch强化学习算法,方便研究和工业用户复制和优化新思路。支持自定义环境与策略,提供统一接口,适合项目开发和性能对比。涵盖A2C、PPO、DQN等算法,包含迁移指南和在线文档,适用于有强化学习基础的用户。