热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#策略选择
scope-rl
SCOPE-RL是一个用于离线强化学习的开源Python库。它实现了从数据生成到策略学习、评估和选择的完整流程。该库提供了多种离线策略评估(OPE)估计器和策略选择(OPS)方法,兼容OpenAI Gym和Gymnasium接口。SCOPE-RL还包含RTBGym和RecGym环境,用于模拟实际应用场景。它简化了离线强化学习的研究和实践过程,提高了实验的透明度和可靠性。
相关文章
SCOPE-RL: 一个强大的离线强化学习与离线策略评估库
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号