Project Icon

crafter

多维度评估AI代理能力的开放世界生存游戏

Crafter是一个开放世界生存游戏环境,专门用于评估AI代理的多方面能力。游戏提供随机生成的2D世界,AI需要完成寻找食物、建造庇护所、对抗怪物等任务。通过聚焦强泛化、深度探索等研究挑战,Crafter为强化学习提供了高效的基准测试。其语义化成就系统和快速迭代特性,显著降低了评估AI能力的计算需求。

状态: 稳定版本

PyPI

Crafter

开放世界生存游戏,用于在单一环境中评估智能体的广泛能力。

Crafter地形

概述

Crafter 提供随机生成的 2D 世界,玩家需要寻找食物和水、寻找睡眠庇护所、抵御怪物、收集材料并制作工具。Crafter 旨在成为强化学习的有效基准测试,专注于以下设计目标:

  • 研究挑战: Crafter 为当前方法提出了重大挑战,评估强大的泛化能力、广泛深入的探索、表征学习以及长期推理和信用分配。

  • 有意义的评估: 通过每个回合中可以解锁的语义上有意义的成就来评估智能体,为有奖励和无监督的智能体能力谱系提供洞察。

  • 迭代速度: Crafter 在单一环境中评估智能体的多种能力,与需要从头开始训练多个单独环境的基准测试套件相比,大大降低了计算需求。

查看研究论文了解更多信息:评估智能体能力谱系

@article{hafner2021crafter,
  title={Benchmarking the Spectrum of Agent Capabilities},
  author={Danijar Hafner},
  year={2021},
  journal={arXiv preprint arXiv:2109.06780},
}

亲自游玩

python3 -m pip install crafter  # 安装 Crafter
python3 -m pip install pygame   # 人机界面所需
python3 -m crafter.run_gui      # 启动游戏
键盘映射(点击展开)
按键动作
WASD移动
空格收集材料、从湖中饮水、攻击生物
TAB睡眠
T放置桌子
R放置石头
F放置熔炉
P放置植物
1制作木镐
2制作石镐
3制作铁镐
4制作木剑
5制作石剑
6制作铁剑

Crafter视频

接口

要安装 Crafter,运行 pip3 install crafter。环境遵循 OpenAI Gym 接口。观察是大小为 (64, 64, 3) 的图像,输出是 17 个分类动作之一。

import gym
import crafter

env = gym.make('CrafterReward-v1')  # 或 CrafterNoReward-v1
env = crafter.Recorder(
  env, './path/to/logdir',
  save_stats=True,
  save_video=False,
  save_episode=False,
)

obs = env.reset()
done = False
while not done:
  action = env.action_space.sample()
  obs, reward, done, info = env.step(action)

评估

智能体允许使用 100 万环境步骤的预算,通过 22 项成就的成功率和几何平均分数来评估。仓库的 analysis 目录中包含了计算这些指标的示例脚本。

  • 奖励: 稀疏奖励为在回合中解锁成就时得到 +1,失去或恢复生命值时分别得到 -0.1+0.1。结果应以成功率和分数而非奖励形式报告。

  • 成功率: 22 项成就的成功率计算为所有训练回合中解锁该成就的百分比,从而洞察智能体的能力谱系。

  • Crafter 分数: 分数是成功率的几何平均值,因此在难度较高的成就上的改进比在已有高成功率的成就上的改进贡献更大。

排行榜

如果您想将自己或其他算法添加到排行榜,请创建一个拉取请求。对于强化学习和无监督智能体类别,交互预算为 100 万步。外部知识类别的定义更为广泛。

强化学习

无监督代理

算法得分 (%)奖励开源
Plan2Explore2.1±0.12.1±1.5danijar/dreamerv2
RND2.0±0.10.7±1.3alirezakazemipour/PPO-RND
随机1.6±0.02.1±1.3

外部知识

算法得分 (%)奖励使用交互开源
人类50.5±6.814.3±2.3生活经验0crafter_human_dataset
SPRING27.3±1.212.3±0.7大语言模型、场景描述、Crafter论文0
成就蒸馏21.8±1.412.6±0.3奖励结构1Msnu-mllab/Achievement-Distillation
ELLM6.0±0.4大语言模型、场景描述5M

基准

Crafter提供了各种代理的基准分数,包括有奖励和无奖励的情况。这些分数以JSON格式存储在仓库的scores目录中。作为对比,人类专家玩家的得分为50.5%。基准实现可在单独的仓库中获取。

问题

请在 Github 上提交问题

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号