#蒙特卡洛树搜索

alpha-zero-general - 通用自学强化学习平台，支持多种游戏和深度学习框架

Alpha ZeroOthello强化学习深度学习蒙特卡洛树搜索Github开源项目

该项目基于AlphaGo Zero论文，提供了简化和灵活的自学强化学习实现，适用于各种双人回合制对抗游戏和深度学习框架。用户可通过实现Game.py和NeuralNet.py中的类，为所选游戏自定义实现。项目提供了Othello、五子棋和井字棋等游戏示例，支持PyTorch和Keras框架，并包含核心训练循环、蒙特卡洛树搜索和神经网络参数设置的详细说明，此外还提供预训练模型和Docker环境设置。

mctx - 高效JAX实现的蒙特卡洛树搜索库

MctxJAX蒙特卡洛树搜索强化学习深度学习Github开源项目

Mctx是一个基于JAX的蒙特卡洛树搜索库，实现了AlphaZero和MuZero等算法。该库支持JIT编译和并行批处理，以提高计算效率。Mctx平衡了性能和易用性，为研究人员提供了探索搜索型强化学习算法的便利工具。它包含通用搜索函数和具体策略实现，用户只需提供学习到的环境模型组件即可使用。

tinyzero - 简易强化学习框架快速训练类AlphaZero智能体

AlphaZero强化学习神经网络蒙特卡洛树搜索环境模拟Github开源项目

tinyzero是一个简易的强化学习框架，用于在任意环境中训练类AlphaZero的智能体。该框架提供简单接口实现新环境、模型和智能体，支持多种游戏类型。tinyzero采用Monte Carlo树搜索和深度学习技术，可在Google Colab上快速部署，适合研究人员和爱好者探索AI在各类任务中的应用。

相关文章

Article Cover

AlphaZero通用框架:一种强大的自学习AI算法

Article Cover

TinyZero: 轻松训练AlphaZero风格的强化学习智能体

Article Cover

Alpha Zero General学习资料汇总 - 适用于任何游戏的通用强化学习框架

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号