hok_env

腾讯王者荣耀AI环境提供多智能体强化学习新挑战

王者荣耀 AI 强化学习 MOBA 开放环境 Github 开源项目

腾讯开发的Honor of Kings AI开放环境基于王者荣耀游戏,为多智能体强化学习提供新的泛化挑战。环境支持多样化英雄和对手,详细定义了观察空间、动作空间和奖励设计,并提供与游戏引擎交互的Python接口。目前支持1v1和3v3模式,可使用20个英雄进行训练。项目还包含基线算法实现和泛化挑战分析,为AI研究提供了新的基准测试平台。

访问官网

Github

介绍相关项目

awesome-deep-rl - 深度强化学习领域的最新研究综述与应用案例

Deep Reinforcement LearningGithubModel-basedPolicy GradientReinforcement LearningUnsupervised RL开源项目

该项目收录了深度强化学习领域的重要研究成果和应用示例，包括最新的学术论文、框架、算法和应用案例，覆盖无监督、离线、价值基础和策略梯度等多种方法。项目内容经常更新，提供最新的研究动态和工具，如2024年的HILP与2022年的EDDICT。适合从事人工智能、机器学习和强化学习的专业人员与爱好者了解该领域的最新进展。

Gym-Trading-Env - Gymnasium金融交易环境支持强化学习算法研究

GithubGym Trading EnvPython库交易模拟开源项目强化学习金融数据

Gym-Trading-Env是基于Gymnasium的股票交易模拟环境，专为强化学习算法研究设计。它支持多交易所数据快速下载、高效环境配置、复杂交易操作和高性能渲染。适用于Python 3.9+的Windows、Mac和Linux平台，为交易算法研究提供了简化的工具。

AgentBench - 全面评估大型语言模型在多环境下的自主代理能力

AgentBenchGithubLLM-as-Agent任务设置开源项目测试结果评估框架

AgentBench是首个评估大型语言模型（LLM）作为自主代理的基准，涵盖操作系统、数据库、知识图谱等8个不同环境。该项目通过多任务设置和完整的数据集，深入分析LLM的实际应用能力。新版AgentBench v0.2优化了框架结构，并增加了更多模型的测试结果，方便开发者扩展和使用。

PokeLLMon - 结合大语言模型的宝可梦对战模拟器

AI对战GithubOpenAI APIPokéLLMonPokémon Showdown开源项目本地对战

PokéLLMon是一个结合大语言模型(LLM)的宝可梦对战模拟项目。它基于OpenAI API和Pokémon Showdown引擎，允许用户在本地环境中与AI对手进行宝可梦对战。该项目展示了大语言模型在策略游戏中的应用潜力。

pogema - 多智能体路径规划的灵活环境平台

GithubPOGEMA多智能体寻路开源项目强化学习网格环境部分可观测

POGEMA是一个专为部分可观测多智能体路径规划(PO-MAPF)研究设计的网格环境平台。该平台具有灵活性、可调节性和可扩展性,支持多种PO-MAPF场景。POGEMA允许智能体在网格中移动并避免碰撞,提供随机地图生成和自定义地图输入功能。此外,POGEMA与多个主流强化学习框架兼容,便于研究人员创建实验环境,探索分布式决策和多智能体协作导航等问题。

tmrl - 实时机器人控制与自动驾驶AI的分布式强化学习框架

GithubGymnasium环境TMRLTrackMania 2020开源项目强化学习自动驾驶

TMRL是一个面向机器人学习的分布式强化学习框架，专注于实时应用中的深度强化学习AI训练。该框架以TrackMania 2020游戏为例，展示了基于原始截图的自动驾驶控制。TMRL具备安全远程训练、灵活定制和实时环境兼容性等特点，采用单服务器多客户端架构，可在多个节点收集样本并在高性能集群上进行训练。

IoA - 多元AI代理协作平台，实现高效任务管理

AI代理GithubInternet of Agents开源框架开源项目异构代理异步任务执行

IoA是一个开源框架，旨在通过互联网风格的架构让不同AI代理协同工作，解决复杂任务。该平台支持自主团队形成、多任务执行和灵活对话管理。安装简单且支持扩展，适用于科研和应用开发。

LLM-RLHF-Tuning - RLHF三阶段训练支持指令微调、奖励模型和多种训练方式

DPOGithubLLaMALLaMA2PPORLHF开源项目

本项目实现了RLHF的三阶段训练，包括指令微调、奖励模型训练和PPO算法训练。支持LLaMA和LLaMA2模型，并提供多种分布式加速训练方法。项目附有详细的实现文档，并对比了其他开源框架的功能，是RLHF训练的宝贵资源。

warp-drive - GPU驱动的高效多智能体强化学习框架

GPU加速GithubWarpDrive多智能体并行计算开源项目深度强化学习

WarpDrive是一款开源的强化学习框架，专为GPU环境优化。它支持单GPU或多GPU上的端到端多智能体强化学习，通过充分利用GPU并行计算能力，显著提升训练速度。WarpDrive通过减少CPU和GPU间的数据传输，并在多智能体和多环境副本间并行运行模拟，大幅提高了计算效率。这使得同时运行海量并发模拟成为可能，实现了比传统CPU方案高出百倍的训练吞吐量。

Practical_RL - 强化学习开源课程：实用技巧与实践

GithubGoogle ColabHSEPractical_RLYSDA开源项目强化学习

Practical_RL是一个专注于强化学习实用性的开源课程，提供HSE和YSDA的课堂教学及线上学习支持，涵盖英语和俄语材料。课程从基础理论到实践应用，包括价值迭代、Q学习、深度学习、探索策略、策略梯度方法、序列模型及部分观察MDP等内容。学生可以通过GitHub改进课程，使用Google Colab或本地环境进行实践。适合希望在实际问题中应用强化学习的学生和研究者。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号