#深度强化学习

AI-Optimizer: 下一代深度强化学习工具包

3 个月前

AI-Optimizer 深度强化学习多智能体强化学习离线强化学习自监督学习 Github 开源项目

3 个月前

深度强化学习玩转Flappy Bird:深度Q网络算法详解

3 个月前

Deep Q-Network Flappy Bird 深度强化学习卷积神经网络 Python Github 开源项目

3 个月前

MIT深度学习课程:开启人工智能的探索之旅

3 个月前

MIT Deep Learning 深度学习教程卷积神经网络生成对抗网络深度强化学习 Github 开源项目

3 个月前

DouZero: 基于自我对弈深度强化学习的斗地主AI系统

3 个月前

DouZero 斗地主深度强化学习 DouDizhu 快手 Github 开源项目热门

3 个月前

相关项目

mit-deep-learning

本项目汇集了MIT深度学习课程的全面教程，涵盖基础知识、场景分割和生成对抗网络（GANs）等主题，适合初学者和进阶用户。项目包括前沿模型如DeepLab和BigGAN，并提供Jupyter Notebook和Google Colab示例，帮助学习者掌握核心技术。另有深度强化学习竞赛DeepTraffic，挑战开发者在复杂交通环境中训练神经网络实现高速驾驶。

DeepLearningFlappyBird

该项目演示了如何使用深度Q学习算法在Flappy Bird游戏中进行应用。项目利用Python、TensorFlow和OpenCV等技术，详细讲解了如何通过卷积神经网络处理游戏画面并优化游戏策略，使AI智能体可以自学并在游戏中取得高分。内容包括游戏画面的预处理、网络结构的设计、训练过程的参数调整以及常见问题的解决方案。此项目适合对深度强化学习有兴趣的开发者和研究人员参考。

cleanrl

CleanRL是一款简洁高效的深度强化学习库，提供单文件实现和广泛的算法支持，包括PPO、DQN等。它支持本地和云端实验、Tensorboard日志记录及Weights and Biases管理，适用于研究与快速原型开发。

AI-Optimizer

AI-Optimizer是一款多功能深度强化学习平台，涵盖从无模型到基于模型，从单智能体到多智能体的多种算法。其分布式训练框架高效便捷，支持多智能体强化学习、离线强化学习、迁移和多任务强化学习、自监督表示学习等，解决维度诅咒、非平稳性和探索-利用平衡等难题，广泛应用于无人机、围棋、扑克、机器人控制和自动驾驶等领域。

DouZero

DouZero是一个基于自我对弈的深度强化学习框架，专注于中国最流行的纸牌游戏斗地主。该项目由快手AI平台开发，通过深度神经网络、动作编码和并行执行者的结合，实现了在斗地主这一具有高度竞争与合作、信息不完全、状态空间巨大以及复杂动作空间的游戏领域中的显著进步。DouZero不仅在轻松应对大量可能动作方面取得了突破，而且在全球范围内的多个AI竞赛中名列前茅。项目代码已在GitHub公开，以期为未来的研究提供动力和启示。

deep-rl-class

本页面提供Hugging Face深度强化学习课程的全部资源，包括mdx文件和教程笔记。学习者可获取课程大纲、注册信息及详细介绍，适合研究AI和机器学习的人员深入了解深度强化学习的核心概念和应用技术。

Reinforcement-Learning

本课程深入分析了神经网络与强化学习的结合，提供了Python和PyTorch实用实现。掌握Q学习、深度Q学习、PPO和演员批评算法，通过在OpenAI Gym的RoboSchool和Atari游戏中实际应用，熟悉深度强化学习的关键技术和应用场景。

gymfc

GymFC是一款专注于姿态控制的飞行控制调优框架，可以合成性能超越传统PID控制器的神经飞行控制器，也可以调优传统控制器。它是Neuroflight固件开发控制器的主要方法，支持多种飞行器。项目依赖Ubuntu和Gazebo模拟器，支持传感器数据订阅和控制信号发布。用户需要提供飞行控制器、调优器、环境接口和数字孪生来实现个性化调优。框架灵活，适合各种飞行控制系统开发，旨在扩展飞行控制研究领域。

dm_control

Google DeepMind的dm_control软件包使用MuJoCo物理引擎，提供物理仿真和强化学习环境的全面工具。核心组件包括Python绑定库、强化学习环境、交互式查看器，以及创建复杂控制任务的附加库。用户可通过pip命令安装，并支持多种OpenGL渲染后端。dm_control为研究人员和开发者提供丰富功能和灵活配置，助力连续控制任务的开发与实验。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com