Project Icon

arena

多样化强化学习环境平台,支持多种游戏和学习模式

DIAMBRA Arena是一个开源的强化学习环境平台,集成了多款经典街机格斗游戏。它提供符合OpenAI Gym/Gymnasium标准的Python接口,支持单人和双人模式,适用于多种强化学习研究场景。该平台兼容主流操作系统,安装简便,并配有详细文档和示例。用户注册后可免费使用,还能参与在线竞赛。

diambra

文档网站

领英DiscordTwitchYouTubeTwitter

论文

Arena测试 代理测试 最新标签 Pypi版本

支持的操作系统 文档最后更新

DIAMBRA Arena

目录

概述

DIAMBRA Arena是一个软件包,包含一系列用于强化学习研究和实验的高质量环境。它为流行的街机模拟视频游戏提供了标准接口,提供完全兼容OpenAI Gym/Gymnasium格式的Python API,使其使用变得简单直接。

支持所有主要操作系统(Linux、Windows和MacOS),并且可以通过Python PIP轻松安装,详见下方的**安装部分。它完全免费使用**,用户只需要在官方网站注册

此外,它还附带全面的文档,本仓库提供了涵盖主要用例的示例集合只需几个步骤即可运行

主要特性

所有环境都是情节性强化学习任务,具有离散动作(游戏手柄按钮)和由屏幕像素加上特定RAM状态(如角色生命条或角色舞台位置)组成的观察。

它们同时支持单人(1P)和双人(2P)模式,使其成为探索以下所有强化学习子领域的完美资源:

standardRlcompetitiveMacompetitiveHaselfPlayimitationLearninghumanInTheLoop
标准强化学习竞争性
多智能体
竞争性
人机对抗
自我对弈模仿学习人机协作

可用游戏

接口游戏是从最受欢迎的格斗复古游戏中精选而来。虽然它们共享相同的基本机制,但提供了略微不同的挑战,具有特定功能,如不同类型和数量的角色、如何执行连击、生命条充能等。

在可能的情况下,游戏会解锁所有隐藏/奖励角色。

更多详细信息可以在我们文档的专门章节中找到。

doappsfiii3ntektagtumk3samsh6spkof98umh
生死格斗++街头霸王III
3rd Strike
铁拳
Tag Tournament
终极
真人快打3
侍魂

特别版
拳皇'98
终极之战
英雄版
mvscxmvsfsoulclbr
漫画英雄
对战
卡普空
X战警
对战
街头霸王
灵魂能力

更多游戏即将推出...

竞赛平台

DIAMBRA 竞赛平台

我们的竞赛平台允许您提交您的智能体,并与全球其他程序员在史诗级视频游戏锦标赛中一决高下!

它设有一个公开的全球排行榜,根据用户的智能体在我们不同环境中取得的最佳分数对用户进行排名。

根据您智能体的表现,它还为您提供了解锁酷炫成就的机会。

提交的智能体将被评估,其游戏回合将在我们的Twitch频道上直播。

我们致力于使提交过程尽可能顺畅,立即加入我们并尝试吧!

安装

  • 在我们的网站上创建账户,只需点击几下即可完成,而且完全免费

  • 安装Docker桌面版:Linux | Windows | MacOS

  • 安装DIAMBRA命令行界面:python3 -m pip install diambra

  • 安装DIAMBRA Arena:python3 -m pip install diambra-arena

强烈建议使用虚拟环境来隔离Python包的安装

快速入门与示例

DIAMBRA Arena的使用遵循标准的强化学习交互框架:智能体向环境发送动作,环境处理该动作并相应地执行转换,从初始状态到新状态,然后将观察结果和奖励返回给智能体以完成交互循环。下图展示了这种典型的交互方案和数据流。

rl方案

下载游戏ROM并检查有效性

查看可用游戏:

diambra arena list-roms

输出示例:

[...]
 标题: Dead Or Alive ++ - 游戏ID: doapp
   难度等级: 最低 1 - 最高 4
   SHA256 校验和: d95855c7d8596a90f0b8ca15725686567d767a9a3f93a8896b489a160e705c4e
   原始ROM名称: doapp.zip
   搜索关键词: ['DEAD OR ALIVE ++ [JAPAN]', 'dead-or-alive-japan', '80781', 'wowroms']
   角色列表: ['Kasumi', 'Zack', 'Hayabusa', 'Bayman', 'Lei-Fang', 'Raidou', 'Gen-Fu', 'Tina', 'Bass', 'Jann-Lee', 'Ayane']
[...]

使用上面游戏列表命令提供的搜索关键词在网上搜索ROM。请注意,遵循那里报告的特定游戏说明,并将所有ROM存储在同一个文件夹中,该文件夹的绝对路径在以下内容中将被称为 your/roms/local/path

需要特定游戏的ROM文件,检查下载的ROM的有效性:

diambra arena check-roms your/roms/local/path/romFileName.zip

有效ROM文件的输出应类似于:

Dead Or Alive ++的正确ROM文件,sha256 = d95855c7d8596a90f0b8ca15725686567d767a9a3f93a8896b489a160e705c4e

请务必查看我们的使用条款,特别是第7条。使用本软件即表示您完全接受这些条款。

基础脚本

使用随机智能体运行一个完整回合只需约10行Python代码:

 import diambra.arena

 env = diambra.arena.make("doapp", render_mode="human")
 observation, info = env.reset(seed=42)

 while True:
     env.render()

     actions = env.action_space.sample()
     observation, reward, terminated, truncated, info = env.step(actions)

     if terminated or truncated:
         observation, info = env.reset()
         break

 env.close()

要执行脚本,请运行:

diambra run -r your/roms/local/path python script.py

文档的入门部分提供了更多详细信息和使用案例。

示例

examples/文件夹包含了代表最重要用例的即用脚本,特别是:

  • 单人环境
  • 多人环境
  • 包装器选项
  • 回合录制
  • 回合数据加载器

这些示例展示了如何利用单人和双人模式,如何设置环境包装器并指定所有选项,如何记录人类专家示范以及如何加载它们以应用模仿学习。它们可以作为模板和起点,用于探索软件包的所有功能。

diambraGif

强化学习库兼容性

DIAMBRA Arena 的构建旨在最大化与所有主要强化学习库的兼容性。它原生提供与两个最重要的包的接口:Stable Baselines 3 和 Ray RLlib,同时 Stable Baselines 也可用但已过时。它们的使用在文档DIAMBRA Agents存储库中有详细说明。它可以以类似的方式轻松地与任何其他包对接。

原生接口,通过以下列出的特定选项安装,已经与以下版本进行了测试:

  • Stable Baselines 3 | pip install diambra-arena[stable-baselines3] (文档 - GitHub - Pypi): 2.1.*
  • Ray RLlib | pip install diambra-arena[ray-rllib] (文档 - GitHub - Pypi): 2.7.*
  • Stable Baselines | pip install diambra-arena[stable-baselines] (文档 - GitHub - Pypi): 2.10.2

参考

支持、功能请求和错误报告

要获得支持,请使用我们Discord 服务器中的专用频道。

要请求功能或报告错误,请使用GitHub 问题追踪器

引用

论文:https://arxiv.org/abs/2210.10595

@article{Palmas22,
    author = {{Palmas}, Alessandro},
    title = "{DIAMBRA Arena: a New Reinforcement Learning Platform for Research and Experimentation}",
    journal = {arXiv e-prints},
    keywords = {reinforcement learning, transfer learning, multi-agent, games},
    year = 2022,
    month = oct,
    eid = {arXiv:2210.10595},
    pages = {arXiv:2210.10595},
    archivePrefix = {arXiv},
    eprint = {2210.10595},
    primaryClass = {cs.AI}
 }

使用条款

DIAMBRA Arena 软件包受我们的使用条款约束。使用它即表示您完全接受这些条款。

DIAMBRA, Inc. © 版权所有 2018-2024。保留所有权利。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号