Contra-PPO-pytorch

Contra NES游戏中的Proximal Policy Optimization算法实现与训练方法

PPO Contra Nes AI训练强化学习 Python代码 Github 开源项目

本项目利用Proximal Policy Optimization (PPO)算法，通过Python代码训练AI智能体进行Contra NES游戏。PPO算法由OpenAI提出，其早期版本曾用于训练OpenAI Five在电竞中取得胜利。项目提供了详细的训练指南、示例代码，并支持Docker环境，方便进行模型的训练和测试。本项目展示了PPO算法在游戏AI中的实际应用效果。

Github

介绍相关项目

[PYTORCH] 近端策略优化（PPO）用于魂斗罗NES

介绍

这是我用于训练代理玩魂斗罗NES的Python源代码。通过使用论文 Proximal Policy Optimization Algorithms 提出的近端策略优化（PPO）算法，可以进行训练。论文。

供您参考，PPO是由OpenAI提出的算法，并用于训练OpenAI Five，这是第一个在电子竞技游戏中击败世界冠军的AI。具体来说，OpenAI Five在2018年8月与一组Dota 2玩家中的排名在99.95百分位的主播和前职业选手展开了比赛。

示例结果

动机

自从发布我的A3C实现 (A3C代码) 和PPO实现 (PPO代码) 用于训练代理玩超级马里奥兄弟以来已经有一段时间了。由于PPO在完成的关卡数上表现优于A3C，因此作为下一步，我想看看前者在另一款著名的NES游戏魂斗罗中的表现。

如何使用我的代码

使用我的代码，你可以：

训练模型 通过运行 python train.py。例如：python train.py --level 1 --lr 1e-4
测试已训练的模型 通过运行 python test.py。例如：python test.py --level 1

Docker

为了方便，我提供了Dockerfile，可以用于运行训练以及测试阶段。

假设docker镜像的名称是ppo。你只想使用第一个GPU。你已经克隆了这个仓库并进入了对应目录。

构建：

sudo docker build --network=host -t ppo .

运行：

docker run --runtime=nvidia -it --rm --volume="$PWD"/../Contra-PPO-pytorch:/Contra-PPO-pytorch --gpus device=0 ppo

然后在docker容器内，你可以简单运行 train.py 或 test.py 脚本，如上所述。

注意：在使用docker时渲染有个bug。因此，当使用docker进行训练或测试时，请在 src/process.py 脚本中进行训练或在 test.py 脚本中进行测试时注释掉 env.render() 行。因此，你将不能再看到窗口弹出进行可视化。但这不是大问题，因为训练过程仍会继续，并且测试过程将以输出mp4文件的形式结束以进行可视化。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号