#自我对弈

AlphaZero在五子棋上的实现:深度强化学习的突破性应用

3 个月前

AlphaZero Gomoku AI模型训练自我对弈 Github 开源项目

3 个月前

相关项目

AlphaZero_Gomoku

AlphaZero-Gomoku项目通过自我对弈训练，实现了五子棋（Gomoku）的AI开发。该项目专注于展示AlphaZero算法在相对简单的棋类游戏中的表现，可在数小时内使用单台PC训练出高水平AI模型。支持TensorFlow和PyTorch进行训练，提供实例游戏和操作指南，适合学习AI自我对弈算法和深度学习框架的开发者。

AutoIF

AutoIF是一种创新的大语言模型指令遵循能力提升方法。它通过代码执行反馈自动生成和验证指令数据，结合指令增强、验证函数生成和交叉验证等技术合成高质量训练样本。实验结果显示，AutoIF能有效提升不同规模模型的指令遵循表现，为大语言模型指令微调提供了新的研究思路。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com