d3rlpy

支持离线和在线深度强化学习的实用算法库

d3rlpy 强化学习离线RL 算法安装 Github 开源项目

d3rlpy是一个为实践者和研究人员打造的深度强化学习库，支持离线和在线强化学习算法。无需掌握深度学习库，即可通过其直观的API使用多种先进算法。d3rlpy提供丰富的文档和教程，首创支持分布式Q函数，适用于机器人和医疗等复杂场景。兼容Linux、macOS和Windows，多种安装方式可供选择，欢迎试用和贡献代码。

访问官网

Github

介绍相关项目

OfflineRL-Kit - 高效易用的PyTorch离线强化学习库

GithubPyTorch实验管理开源项目模型训练离线强化学习算法库

OfflineRL-Kit是基于PyTorch的离线强化学习库，提供清晰的代码结构和最新算法实现。支持CQL、TD3+BC等多种算法，具备高扩展性和强大的日志系统。该库还支持并行调优，便于研究人员进行实验。相比其他离线强化学习库，OfflineRL-Kit在性能和易用性方面都有显著优势，是离线强化学习研究的有力工具。

DRLib - 简洁高效的深度强化学习算法集成库

DRLibGithubHERPER开源项目机器人操作深度强化学习

DRLib是一个集成主流off-policy强化学习算法的开源库,支持HER和PER技术。基于OpenAI Spinning Up开发,提供TensorFlow和PyTorch两个版本。相比原版更易用和调试,适合机器人相关任务研究。提供详细环境配置教程。

HandyRL - 高效实用的分布式强化学习框架

GithubHandyRLPyTorch分布式训练开源项目强化学习离线策略修正

HandyRL是一个基于Python和PyTorch的分布式强化学习框架，已在Kaggle竞赛中取得优异成绩。它采用离线策略修正的策略梯度算法和学习者-工作者架构，支持自定义环境和大规模训练。HandyRL的高并行能力和实用性使其在竞争性游戏AI开发中表现出色，能够快速训练出强大的AI模型。

DRL-Pytorch - PyTorch实现的深度强化学习算法集合

DRL算法GithubPyTorch人工智能开源项目强化学习深度学习

DRL-Pytorch项目提供多种常用深度强化学习算法的PyTorch实现,包括Q-learning、DQN变体、PPO、DDPG、TD3和SAC等。代码结构清晰统一,便于研究人员和开发者比较不同算法。项目还包含详细使用说明、依赖列表和学习资源推荐,有助于快速入门和实践。

DeepRL - PyTorch 中深度强化学习算法的模块化实现

A2CDQNDeepRLGithubPyTorch开源项目深度强化学习

DeepRL项目使用PyTorch实现了一系列流行的深度强化学习算法，提供模块化框架，适用于从简单任务到高难度游戏。支持的算法包括DQN、C51、QR-DQN、A2C、DDPG、PPO等，并具备异步数据生成和传输功能。项目依赖PyTorch v1.5.1，具体依赖请参考Dockerfile和requirements.txt。此外，项目提供代码示例和性能曲线图，适合相关研究参考和使用。

rl - 开源强化学习库TorchRL

TorchRL是专为PyTorch设计的开源强化学习库，提供高效的研究性能。它具备完整Python接口、模块化、定制化及强大扩展性，配备详尽文档和测试，确保用户快速上手且使用可靠。此外，TorchRL包括多种可复用功能，适用于成本、回报处理和数据管理，是开展强化学习研究与应用的理想工具。

scope-rl - 离线强化学习与策略评估的开源Python库

GithubPython库SCOPE-RL开源项目离线强化学习离线策略评估策略选择

SCOPE-RL是一个用于离线强化学习的开源Python库。它实现了从数据生成到策略学习、评估和选择的完整流程。该库提供了多种离线策略评估(OPE)估计器和策略选择(OPS)方法，兼容OpenAI Gym和Gymnasium接口。SCOPE-RL还包含RTBGym和RecGym环境，用于模拟实际应用场景。它简化了离线强化学习的研究和实践过程，提高了实验的透明度和可靠性。

Deep-reinforcement-learning-with-pytorch - 深度强化学习PyTorch实现与代码示例

DQNDeep Reinforcement LearningGithubGymTD3pytorch开源项目

本项目提供经典和前沿的深度强化学习算法PyTorch实现，包括DQN、DDPG、PPO等。项目持续更新并维护，适用于Anaconda虚拟环境管理。详细的安装步骤和测试方法确保用户能顺利运行代码，文档中还提供了相关论文和代码链接，便于深入学习研究。

nnabla-rl - 深度强化学习库，基于Neural Network Libraries构建

GPU加速GithubPythonnnablaRL开源项目深度强化学习神经网络库

nnabla-rl是基于Neural Network Libraries构建的深度强化学习库，适用于研究、开发和生产环境。该库提供简洁的Python API，集成多种经典和前沿强化学习算法，实现在线与离线训练的灵活切换。nnabla-rl支持通过nnabla-browser可视化训练过程，安装便捷，兼容GPU加速，并提供交互式示例便于快速上手。

Practical_RL - 强化学习开源课程：实用技巧与实践

GithubGoogle ColabHSEPractical_RLYSDA开源项目强化学习

Practical_RL是一个专注于强化学习实用性的开源课程，提供HSE和YSDA的课堂教学及线上学习支持，涵盖英语和俄语材料。课程从基础理论到实践应用，包括价值迭代、Q学习、深度学习、探索策略、策略梯度方法、序列模型及部分观察MDP等内容。学生可以通过GitHub改进课程，使用Google Colab或本地环境进行实践。适合希望在实际问题中应用强化学习的学生和研究者。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

问小白

问小白是一个基于 DeepSeek R1 模型的智能对话平台，专为用户提供高效、贴心的对话体验。实时在线，支持深度思考和联网搜索。免费不限次数，帮用户写作、创作、分析和规划，各种任务随时完成！

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能，包括文生视频、动态画面和形象生成等，帮助用户快速上手，创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台，用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品，帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型，为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能，满足事务性工作的高频需求，帮助撰稿人节省精力，提高效率，优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

Trae

Trae是一种自适应的集成开发环境（IDE），通过自动化和多元协作改变开发流程。利用Trae，团队能够更快速、精确地编写和部署代码，从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能，是提升开发效率的理想工具。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号