ma-gym
这是一个基于OpenAI gym的多智能体环境集合。此外,您可以使用minimal-marl来快速启动智能体的训练。
安装
- 设置(重要):
pip install 'pip<24.1' pip install 'setuptools<=66' pip install 'wheel<=0.38.4'
- 安装包:
-
使用PyPI:
pip install ma-gym
-
直接从源代码安装(推荐):
git clone https://github.com/koulanurag/ma-gym.git cd ma-gym pip install -e .
-
引用:
如果您想引用本项目,请使用以下bibtex:
@misc{magym,
author = {Koul, Anurag},
title = {ma-gym: Collection of multi-agent environments based on OpenAI gym.},
year = {2019},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/koulanurag/ma-gym}},
}
使用方法:
import gym
env = gym.make('ma_gym:Switch2-v0')
done_n = [False for _ in range(env.n_agents)]
ep_reward = 0
obs_n = env.reset()
while not all(done_n):
env.render()
obs_n, reward_n, done_n, info = env.step(env.action_space.sample())
ep_reward += sum(reward_n)
env.close()
完整的使用详情请参考Wiki
环境:
- 跳棋
- 战斗
- 捕食者-猎物
- 双人乒乓
(双人乒乓游戏)
- 开关
- 伐木工人
- 交通路口
注意:可以通过前缀"ma_"以多智能体形式访问openai的环境。例如:ma_CartPole-v0
这将返回一个包含单个智能体的CartPole-v0实例,置于"多智能体包装器"中。
这些环境在调试时很有帮助。
更多详情请参考Wiki。
展示!
跳棋-v0 | 战斗-v0 | 伐木工人-v0 |
---|---|---|
双人乒乓-v0 | 捕食者-猎物5x5-v0 | 捕食者-猎物7x7-v0 |
开关2-v0 | 开关4-v0 | 交通路口4-v0 |
交通路口10-v0 | ||
测试:
- 安装:
pip install -e ".[test]"
- 运行:
pytest
致谢:
- 这个项目最初是为了配合我在SAS的研究实习而开发的(2019年夏季)。