#蒙特卡洛树搜索

Alpha Zero General学习资料汇总 - 适用于任何游戏的通用强化学习框架

3 个月前

Alpha Zero Othello 强化学习深度学习蒙特卡洛树搜索 Github 开源项目

3 个月前

TinyZero: 轻松训练AlphaZero风格的强化学习智能体

3 个月前

AlphaZero 强化学习神经网络蒙特卡洛树搜索环境模拟 Github 开源项目

3 个月前

AlphaZero通用框架:一种强大的自学习AI算法

2024年08月30日

Alpha Zero Othello 强化学习深度学习蒙特卡洛树搜索 Github 开源项目

2024年08月30日

相关项目

alpha-zero-general

该项目基于AlphaGo Zero论文，提供了简化和灵活的自学强化学习实现，适用于各种双人回合制对抗游戏和深度学习框架。用户可通过实现Game.py和NeuralNet.py中的类，为所选游戏自定义实现。项目提供了Othello、五子棋和井字棋等游戏示例，支持PyTorch和Keras框架，并包含核心训练循环、蒙特卡洛树搜索和神经网络参数设置的详细说明，此外还提供预训练模型和Docker环境设置。

mctx

Mctx是一个基于JAX的蒙特卡洛树搜索库，实现了AlphaZero和MuZero等算法。该库支持JIT编译和并行批处理，以提高计算效率。Mctx平衡了性能和易用性，为研究人员提供了探索搜索型强化学习算法的便利工具。它包含通用搜索函数和具体策略实现，用户只需提供学习到的环境模型组件即可使用。

tinyzero

tinyzero是一个简易的强化学习框架，用于在任意环境中训练类AlphaZero的智能体。该框架提供简单接口实现新环境、模型和智能体，支持多种游戏类型。tinyzero采用Monte Carlo树搜索和深度学习技术，可在Google Colab上快速部署，适合研究人员和爱好者探索AI在各类任务中的应用。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com