#深度强化学习

dm_control - 提供物理仿真和强化学习环境的全面工具
Github开源项目深度强化学习物理仿真dm_controlMuJoCoGoogle DeepMind
Google DeepMind的dm_control软件包使用MuJoCo物理引擎,提供物理仿真和强化学习环境的全面工具。核心组件包括Python绑定库、强化学习环境、交互式查看器,以及创建复杂控制任务的附加库。用户可通过pip命令安装,并支持多种OpenGL渲染后端。dm_control为研究人员和开发者提供丰富功能和灵活配置,助力连续控制任务的开发与实验。
mit-deep-learning - MIT深度学习课程教程集合
Github开源项目卷积神经网络深度强化学习生成对抗网络MIT Deep Learning深度学习教程
本项目汇集了MIT深度学习课程的全面教程,涵盖基础知识、场景分割和生成对抗网络(GANs)等主题,适合初学者和进阶用户。项目包括前沿模型如DeepLab和BigGAN,并提供Jupyter Notebook和Google Colab示例,帮助学习者掌握核心技术。另有深度强化学习竞赛DeepTraffic,挑战开发者在复杂交通环境中训练神经网络实现高速驾驶。
DeepLearningFlappyBird - 使用深度Q网络训练AI玩Flappy Bird游戏
Github开源项目Python卷积神经网络深度强化学习Flappy BirdDeep Q-Network
该项目演示了如何使用深度Q学习算法在Flappy Bird游戏中进行应用。项目利用Python、TensorFlow和OpenCV等技术,详细讲解了如何通过卷积神经网络处理游戏画面并优化游戏策略,使AI智能体可以自学并在游戏中取得高分。内容包括游戏画面的预处理、网络结构的设计、训练过程的参数调整以及常见问题的解决方案。此项目适合对深度强化学习有兴趣的开发者和研究人员参考。
cleanrl - 一个深度强化学习库
Github开源项目深度强化学习CleanRL单文件实现云集成PPO算法
CleanRL是一款简洁高效的深度强化学习库,提供单文件实现和广泛的算法支持,包括PPO、DQN等。它支持本地和云端实验、Tensorboard日志记录及Weights and Biases管理,适用于研究与快速原型开发。
AI-Optimizer - 涵盖从无模型到基于模型,从单智能体到多智能体的多种算法的多功能深度强化学习平台
Github开源项目深度强化学习AI-Optimizer多智能体强化学习离线强化学习自监督学习
AI-Optimizer是一款多功能深度强化学习平台,涵盖从无模型到基于模型,从单智能体到多智能体的多种算法。其分布式训练框架高效便捷,支持多智能体强化学习、离线强化学习、迁移和多任务强化学习、自监督表示学习等,解决维度诅咒、非平稳性和探索-利用平衡等难题,广泛应用于无人机、围棋、扑克、机器人控制和自动驾驶等领域。
DouZero - 利用自我对弈深度强化学习技术掌握斗地主游戏
Github开源项目DouZero斗地主深度强化学习DouDizhu快手热门
DouZero是一个基于自我对弈的深度强化学习框架,专注于中国最流行的纸牌游戏斗地主。该项目由快手AI平台开发,通过深度神经网络、动作编码和并行执行者的结合,实现了在斗地主这一具有高度竞争与合作、信息不完全、状态空间巨大以及复杂动作空间的游戏领域中的显著进步。DouZero不仅在轻松应对大量可能动作方面取得了突破,而且在全球范围内的多个AI竞赛中名列前茅。项目代码已在GitHub公开,以期为未来的研究提供动力和启示。
deep-rl-class - Hugging Face深度强化学习课程资源与教程
人工智能Github开源项目深度强化学习Hugging FaceReinforcement Learning课程
本页面提供Hugging Face深度强化学习课程的全部资源,包括mdx文件和教程笔记。学习者可获取课程大纲、注册信息及详细介绍,适合研究AI和机器学习的人员深入了解深度强化学习的核心概念和应用技术。
Reinforcement-Learning - 将深度强化学习与神经网络使用Python和PyTorch实现结合的课程
Github开源项目PythonPyTorch神经网络深度强化学习Q学习
本课程深入分析了神经网络与强化学习的结合,提供了Python和PyTorch实用实现。掌握Q学习、深度Q学习、PPO和演员批评算法,通过在OpenAI Gym的RoboSchool和Atari游戏中实际应用,熟悉深度强化学习的关键技术和应用场景。
gymfc - 专注于姿态控制的飞行控制调优框架
Github开源项目神经网络深度强化学习GymFC飞行控制控制系统调优
GymFC是一款专注于姿态控制的飞行控制调优框架,可以合成性能超越传统PID控制器的神经飞行控制器,也可以调优传统控制器。它是Neuroflight固件开发控制器的主要方法,支持多种飞行器。项目依赖Ubuntu和Gazebo模拟器,支持传感器数据订阅和控制信号发布。用户需要提供飞行控制器、调优器、环境接口和数字孪生来实现个性化调优。框架灵活,适合各种飞行控制系统开发,旨在扩展飞行控制研究领域。
Autonomous-Driving-in-Carla-using-Deep-Reinforcement-Learning - CARLA仿真中的深度强化学习自动驾驶模型
Github开源项目深度强化学习自动驾驶CARLA变分自编码器PPO
该项目在CARLA仿真环境中,使用深度强化学习方法进行自动驾驶训练。通过结合PPO算法和变分自编码器(VAE),加速学习并提高驾驶决策能力。项目采用Python和PyTorch构建,重点在于自动驾驶和障碍物回避的持续学习。对于推动自动驾驶技术和决策效率研究具有显著意义。
cartpole - 强化学习算法DQN在OpenAI Cartpole环境中的应用
Github开源项目OpenAI深度强化学习DQNCartpoleAdam优化器
该项目展示了如何在OpenAI的Cartpole任务中应用DQN(深度Q学习)算法解决问题。通过调整超参数如GAMMA、学习率和记忆大小,目标是防止附有未驱动关节的杆子在无摩擦轨道上的小车倒下,以保持杆子直立并获得高奖励。解决标准是连续100次试验中平均奖励达到195。
ElegantRL - 云原生高效的大规模并行深度强化学习框架,支持弹性扩展
Github开源项目云原生深度强化学习ElegantRL并行计算DRL算法
ElegantRL是一个云原生的大规模并行深度强化学习框架,支持多种DRL算法和多代理环境。其核心代码少于1000行,具备轻量、高效和弹性特点。通过微服务架构和容器化,支持大规模计算节点扩展,并自动分配云端资源。相比Ray RLlib和Stable Baselines 3,ElegantRL在单GPU、多GPU和云平台测试中更稳定高效。广泛应用于RLSolver、FinRL等项目,并支持Isaac Gym等模拟器。
allenact - 支持多环境与算法的Embodied AI研究框架
Github开源项目深度强化学习AI2Embodied AIAllenAct模仿学习
AllenAct是一个专为Embodied AI研究设计的开源框架,提供模块化和灵活的学习架构,支持多种环境和算法。其主要特点包括任务抽象、训练序列试验、PyTorch支持和多智能体功能。由Allen Institute for AI开发,提供详尽的文档、教程及预训练模型,为Embodied AI研究提供有效支持。
DeepRL - PyTorch 中深度强化学习算法的模块化实现
Github开源项目PyTorch深度强化学习DQNDeepRLA2C
DeepRL项目使用PyTorch实现了一系列流行的深度强化学习算法,提供模块化框架,适用于从简单任务到高难度游戏。支持的算法包括DQN、C51、QR-DQN、A2C、DDPG、PPO等,并具备异步数据生成和传输功能。项目依赖PyTorch v1.5.1,具体依赖请参考Dockerfile和requirements.txt。此外,项目提供代码示例和性能曲线图,适合相关研究参考和使用。
tensorforce - 适用于研究与实操的模块化深度强化学习 TensorFlow 框架
Github开源项目PythonTensorFlow开源框架深度强化学习Tensorforce
Tensorforce 是一个开源的深度强化学习框架,基于TensorFlow构建,具有模块化设计,支持多种算法和环境适配,确保模型移植与编程语言无关。
PhySO - 优化物理规律发现的符号回归工具
Github开源项目深度强化学习$\\Phi$-SO符号优化物理单位约束物理定律
PhySO是一个利用深度强化学习的符号优化包,通过维度分析减少搜索空间,在噪声环境中实现优异性能。该工具适用于多个数据集的单一解析功能搜索和物理单位约束优化,支持Linux、OSX和Windows平台。PhiSO在Feynman基准测试中表现出色,并提供详细的安装和使用指南,便于用户执行符号回归任务。
QuantResearch - 定量分析、策略和回测
Github开源项目机器学习深度强化学习时间序列预测QuantResearch投资组合优化
该项目提供丰富的量化研究资源,涵盖策略回测、机器学习和深度强化学习应用,以及实盘交易演示。资源内容包括投资组合优化、风险值评估、线性回归(经典、贝叶斯、MCMC、卡尔曼滤波、Tensorflow)、均值回归、协整对冲交易、隐马尔科夫链、RNN股票预测、主成分分析、ARIMA和GARCH模型、Fama-French三因子模型等。此外,项目还提供在线资源和教程,帮助用户深入理解和应用量化研究技术。
DI-1024 - 将1024游戏与深度强化学习相结合的开源项目
Github开源项目深度强化学习DI-10241024游戏MuZeroStochasticMuZero
DI-1024是一个将深度强化学习技术应用于1024(又称2048)数字游戏的开源项目。它提供在线试玩体验和完整的强化学习训练示例,采用MuZero和StochasticMuZero等算法来开发高水平的游戏AI。该项目为研究人员和游戏爱好者创造了一个探索人机交互的平台,展示了AI在策略游戏中的应用。
DRL-robot-navigation - 移动机器人深度强化学习自主导航方案
Github开源项目深度强化学习TD3ROS机器人导航Gazebo
项目集成了ROS、Gazebo和PyTorch,构建了一个移动机器人深度强化学习导航框架。系统利用TD3算法训练机器人应对复杂环境,实现障碍物识别和目标导航。该方案为自主移动机器人研究提供了一个开源的实验平台。
nnabla-rl - 深度强化学习库,基于Neural Network Libraries构建
Github开源项目Python深度强化学习GPU加速神经网络库nnablaRL
nnabla-rl是基于Neural Network Libraries构建的深度强化学习库,适用于研究、开发和生产环境。该库提供简洁的Python API,集成多种经典和前沿强化学习算法,实现在线与离线训练的灵活切换。nnabla-rl支持通过nnabla-browser可视化训练过程,安装便捷,兼容GPU加速,并提供交互式示例便于快速上手。
DRLib - 简洁高效的深度强化学习算法集成库
Github开源项目深度强化学习机器人操作DRLibHERPER
DRLib是一个集成主流off-policy强化学习算法的开源库,支持HER和PER技术。基于OpenAI Spinning Up开发,提供TensorFlow和PyTorch两个版本。相比原版更易用和调试,适合机器人相关任务研究。提供详细环境配置教程。
Mortal - 开源日本麻将AI,深度强化学习驱动
Github开源项目AI开源软件深度强化学习Mortal日本麻将
作为一款开源日本麻将AI,Mortal采用深度强化学习技术,为日本麻将AI领域贡献了宝贵资源。项目提供详尽文档,使用AGPL-3.0-or-later许可证,支持自由使用和修改。项目logo和资产采用CC BY-SA 4.0许可。Mortal还提供模型权重获取指南,为麻将AI研究与应用提供强有力的支持。这个免费项目为日本麻将AI爱好者和研究者提供了丰富的学习和开发资源。
Online-3D-BPP-PCT - 基于配置树的在线3D装箱算法 支持连续空间与复杂约束
Github开源项目深度强化学习在线算法3D装箱配置树装箱稳定性
该项目开发了基于装箱配置树的在线3D装箱算法。通过深度强化学习实现连续空间装箱、稳定性约束和复杂约束处理。算法可适应任意尺寸容器和物品,提供近似稳定性算法。项目还包含渲染、形状处理和模拟工具,为3D装箱技术研究提供解决方案。相比传统方法,具有更好性能和适应性。
warp-drive - GPU驱动的高效多智能体强化学习框架
Github开源项目深度强化学习多智能体GPU加速并行计算WarpDrive
WarpDrive是一款开源的强化学习框架,专为GPU环境优化。它支持单GPU或多GPU上的端到端多智能体强化学习,通过充分利用GPU并行计算能力,显著提升训练速度。WarpDrive通过减少CPU和GPU间的数据传输,并在多智能体和多环境副本间并行运行模拟,大幅提高了计算效率。这使得同时运行海量并发模拟成为可能,实现了比传统CPU方案高出百倍的训练吞吐量。
Lux-Design-S2 - AI代理对战,优化资源管理的智能算法挑战
Github开源项目深度强化学习NeurIPS 2023资源优化Lux AI Challenge多智能体竞赛
Lux-Design-S2是一项AI算法挑战赛,专注于资源管理优化。本季新增GPU/TPU支持、非对称地图等特性,并提供高质量历史数据。比赛支持多种编程语言,在Kaggle平台进行,截止日期为11月17日。参赛者可通过Discord社区交流学习,共同提升AI算法水平。
UAV_Obstacle_Avoiding_DRL - 深度强化学习驱动的无人机自主避障算法研究
Github开源项目深度强化学习路径规划多智能体强化学习UAV障碍物避障
本项目研究了深度强化学习在UAV自主避障中的应用,涵盖静态和动态环境。研究结合多智能体强化学习、人工势场法和扰动流场算法等创新技术,并与A*、RRT等传统路径规划方法进行对比。项目实现了MADDPG、TD3、PPO等多种算法,提供MATLAB和Python代码。仿真实验表明,深度强化学习方法在无人机障碍物避免任务中展现出优越性能,为自主导航技术发展提供了新思路。
autonomous-learning-library - PyTorch深度强化学习库助力智能代理开发
Github开源项目PyTorch深度强化学习智能体算法实现自主学习库
autonomous-learning-library是基于PyTorch的深度强化学习库,为快速构建和评估智能代理提供丰富组件。库中包含灵活的函数近似API、多种内存缓冲区和环境接口,并实现了A2C、DQN、PPO等主流算法。支持Atari、经典控制和机器人仿真等环境,集成Tensorboard等工具便于实验监控。该库特别强调模块化设计,便于研究人员快速实现和测试新想法。同时提供完整文档和示例项目,降低了强化学习研究的入门门槛。
robopianist - 机器人钢琴演奏的深度强化学习平台
Github开源项目深度强化学习MuJoCoRoboPianist机器人钢琴演奏高维控制
RoboPianist是一个高维控制基准测试套件,通过模拟人类双手弹奏钢琴来评估机器人的精确控制和协调能力。该项目基于MuJoCo物理引擎,提供了软件工具和任务设置,支持MIDI文件处理和声音合成,为人工智能和机器人研究提供了探索复杂动作控制和接触动力学的平台。
Online-3D-BPP-DRL - 深度强化学习解决在线三维装箱问题的高效算法
Github开源项目深度强化学习AAAI3D装箱问题在线算法约束优化
Online-3D-BPP-DRL项目开发了一种基于约束深度强化学习的在线三维装箱算法。该算法结合深度神经网络和蒙特卡洛树搜索,在优化装箱策略的同时考虑了稳定性约束。算法不仅适用于随机序列,还能解决实际场景中的三维装箱问题。项目提供完整代码实现,包含训练、测试和用户研究功能,为复杂三维装箱问题提供了创新解决方案。
godot_rl_agents - Godot引擎智能NPC开发框架
Github开源项目机器学习开源框架深度强化学习Godot RL Agents游戏AI
Godot RL Agents是一个开源框架,用于在Godot引擎中开发智能NPC。它支持多种强化学习算法,适用于2D和3D游戏,并提供丰富的AI传感器。该框架完全免费开源,可帮助开发者创造复杂行为的游戏角色,实现自动化游戏测试,为游戏开发和AI研究提供新的可能性。
xuance - 多框架支持的深度强化学习算法库
Github开源项目深度强化学习开源库多框架支持算法实现XuanCe
XuanCe是一个开源的深度强化学习算法库,支持PyTorch、TensorFlow和MindSpore等多种框架。它兼容单智能体和多智能体任务,提供丰富的算法实现。XuanCe设计模块化,易于学习和使用,运行速度快。支持经典控制、Box2D、MuJoCo、Atari等多种环境,为研究和开发提供全面的深度强化学习工具。
codet5-large - 支持多编程语言的代码理解与生成大模型
Github开源项目代码生成语言模型深度强化学习模型HuggingfaceCodeT5CodeSearchNet
CodeT5-large预训练模型支持多语言代码处理,并在CodeXGLUE基准中展示了卓越的性能。