热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#离线策略修正
HandyRL - 高效实用的分布式强化学习框架
HandyRL
强化学习
分布式训练
离线策略修正
PyTorch
Github
开源项目
HandyRL是一个基于Python和PyTorch的分布式强化学习框架,已在Kaggle竞赛中取得优异成绩。它采用离线策略修正的策略梯度算法和学习者-工作者架构,支持自定义环境和大规模训练。HandyRL的高并行能力和实用性使其在竞争性游戏AI开发中表现出色,能够快速训练出强大的AI模型。
1
1
相关文章
HandyRL: 一个简洁而强大的分布式强化学习框架
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号