DI-1024:深度强化学习 + 1024游戏
1024 游戏有时也被称为 2048。
这是人机协作共同解密,还是人机对抗捕捉 AI 背后的种种漏洞。欢迎一起回味二的幂次方,体验极客瞬间~
附:路过记得点个 star ,持续更新中。
另附:想了解更多深度强化学习相关知识?快来 DI-engine 和 LightZero 训练自己的智能体。
新闻
[微信] 今日忌加班,宜玩1024
使用指南
- 在线网页版试玩 -> 传送门
训练指南
先用以下命令安装依赖的包:
pip3 install -r requirements.txt
MuZero 智能体训练
在 1024 环境上快速训练一个 MuZero 智能体:
cd DI-1024
python3 -u agent/config/muzero_2048_config.py
StochasticMuZero 智能体训练
在 1024 环境上快速训练一个 StochasticMuZero 智能体:
cd DI-1024
python3 -u agent/config/stochastic_muzero_2048_config.py
训练曲线
更新计划
- 网页在线版试玩
- 完整强化学习训练样例
- 结合 Stochastic MuZero 的最强 1024 游戏智能体
- 提供可供本地试玩的模型权重
- 设计更有趣的人机对抗算法
致谢
- JS 前端部分主要基于 https://github.com/xwjdsh/2048-ai 进行修改,请大家也多多支持这个仓库
许可证
DI-1024 使用 Apache 2.0 许可证发布。