sheeprl

基于PyTorch的强化学习框架支持多种算法和环境

SheepRL 强化学习 PyTorch Lightning Fabric 算法实现 Github 开源项目

SheepRL是一个基于PyTorch和Lightning Fabric的强化学习框架。它支持PPO、SAC、Dreamer等多种算法，以及Atari、MuJoCo、Minecraft等多种环境。该框架易用可扩展，实现了算法与环境的解耦，适用于广泛的强化学习任务。在部分基准测试中，SheepRL展现出与其他框架相当甚至更优的性能，为强化学习研究和开发提供了高效工具。

访问官网

Github

介绍相关项目

awesome-deep-rl - 全面的深度强化学习资源库

Github基准测试开源库开源项目深度强化学习环境模拟竞赛

该项目汇集了深度强化学习领域的各类资源,包括主流库、基准测试结果、训练环境、竞赛信息和发展时间线。研究人员和开发者可以在此快速了解该领域的全貌,获取有价值的工具和信息。作为一个综合性资源库,它为深度强化学习的学习和研究提供了便利。

PufferLib - 复杂游戏环境强化学习的简化工具

GithubPufferLibPyTorch开源项目强化学习环境包装

PufferLib是一个包装层工具，旨在简化复杂游戏环境中的强化学习开发。它支持原生PyTorch网络和简短的环境绑定，自动处理大部分复杂操作。该工具提供优化的LSTM支持、性能指标、本地仪表板、异步环境采样和检查点等功能，为强化学习研究提供全面解决方案。

PaLM-rlhf-pytorch - 结合PaLM架构的RLHF创新实现

GithubPaLMRLHF人工智能人类反馈开源项目强化学习

本项目实现了基于PaLM架构的强化学习与人类反馈（RLHF），适用于开放环境下的ChatGPT复现。结合了LoRA微调和Flash Attention技术，提供详细的安装和使用指南。加入社区，探索最新的PPO和RL技术进展。

scope-rl - 离线强化学习与策略评估的开源Python库

GithubPython库SCOPE-RL开源项目离线强化学习离线策略评估策略选择

SCOPE-RL是一个用于离线强化学习的开源Python库。它实现了从数据生成到策略学习、评估和选择的完整流程。该库提供了多种离线策略评估(OPE)估计器和策略选择(OPS)方法，兼容OpenAI Gym和Gymnasium接口。SCOPE-RL还包含RTBGym和RecGym环境，用于模拟实际应用场景。它简化了离线强化学习的研究和实践过程，提高了实验的透明度和可靠性。

sample-factory - 高效强化学习框架实现快速训练和卓越性能

GithubPPO算法Sample Factory开源项目强化学习环境集成高吞吐量

Sample Factory是一个高效的强化学习库，专注于同步和异步策略梯度实现。它提供优化的算法架构、灵活的训练模式和多种环境支持，包括多智能体训练和PBT等功能。该库在VizDoom、IsaacGym和DMLab-30等多个领域展现出优秀性能，同时减少训练时间和硬件需求。Sample Factory支持导入其他项目，并允许自定义环境和模型架构。

rl4co - 统一框架助力组合优化问题的强化学习解决方案

GithubPyTorchRL4CO开源框架开源项目强化学习组合优化

RL4CO是一个专注于组合优化问题的开源强化学习框架。基于PyTorch构建，它整合了TorchRL和TensorDict等技术，提供统一接口和灵活实现。框架支持构造型和改进型策略，适配多种环境和模型。其模块化设计和丰富工具集有助于研究人员高效开发和评估新算法，为组合优化研究提供了全面的实验平台。

PettingZoo - Python多智能体强化学习库

APIGithubPettingZooPython库多智能体强化学习开源项目环境模拟

PettingZoo是一个Python库，专为多智能体强化学习研究设计。它采用Agent Environment Cycle (AEC)游戏模型，提供统一的API支持各类多智能体环境。该库包含Atari、Butterfly、Classic等多个环境家族，支持多样化的智能体交互。PettingZoo还提供并行API用于同步行动场景，并通过严格的版本控制确保实验可重现性。

genrl - 强化学习算法库，提供快速基准测试和示例教程

GenRLGithubPyTorch基准测试开源项目强化学习算法实现

GenRL是一个基于PyTorch的强化学习库，提供可重现的算法实现和通用接口。它包含20多个从基础到高级的强化学习教程，并支持模块化和可扩展的Python编程。统一的训练和日志记录功能提高了代码复用性，同时自动超参数调整功能加速了基准测试。GenRL旨在支持新算法的实现，代码少于100行。适用于Python 3.6及以上版本，依赖于PyTorch和OpenAI Gym。

dopamine - 用于快速原型设计的强化学习研究框架

DQNDopamineGithubJAXTensorflow开源项目强化学习

Dopamine是一个用于快速原型设计强化学习算法的研究框架，旨在便于用户进行自由实验。其设计原则包括易于实验、灵活开发、紧凑可靠和结果可重复。支持的算法有DQN、C51、Rainbow、IQN和SAC，主要实现于jax。Dopamine提供了Docker容器及源码安装方法，适用于Atari和Mujoco环境，并推荐使用虚拟环境。更多信息请参阅官方文档。

rlax - JAX驱动的强化学习算法构建库

GithubJAXPython库RLax开源项目强化学习深度学习

RLax是基于JAX的强化学习工具库，提供实现智能体所需的核心模块。支持价值估计、分布式价值函数、通用价值函数和策略梯度等功能，适用于在线和离线学习。借助JAX实现即时编译，RLax能在多种硬件上高效运行，为开发者提供灵活的工具构建强化学习算法。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能，包括文生视频、动态画面和形象生成等，帮助用户快速上手，创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台，用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品，帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型，为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能，满足事务性工作的高频需求，帮助撰稿人节省精力，提高效率，优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号