#OpenAI gym

PPO-PyTorch - 使用PyTorch实现的简易PPO算法工具

Github开源项目强化学习超参数调整PPO-PyTorchOpenAI gymProximal Policy Optimization

该项目提供了一个基于PyTorch的简易PPO算法实现，适用于OpenAI Gym环境，帮助初学者理解PPO。更新内容包括整合离散和连续算法，并引入了线性衰减机制。用户可以通过PPO_colab.ipynb在Google Colab中便捷地训练、测试和绘制图表。项目支持单线程执行，并提供日志记录、可视化和动画生成工具。

ma-gym - 基于OpenAI Gym的多智能体强化学习环境库

Github开源项目强化学习多智能体环境Python包OpenAI gymma-gym

ma-gym是一个基于OpenAI Gym构建的多智能体强化学习环境库。它包含多种场景如跳棋、战斗和捕食者与猎物等。研究人员可以方便地使用这些环境来开发和评估多智能体强化学习算法。该项目提供了详细文档和示例代码，便于快速上手。作为多智能体强化学习研究的重要工具，ma-gym已在多篇学术论文中得到引用。

相关文章

Article Cover

PPO-PyTorch: 一个简单而强大的强化学习算法实现

Article Cover

ma-gym：基于OpenAI Gym的多智能体强化学习环境集合

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号