Project Icon

PettingZoo

Python多智能体强化学习库

PettingZoo是一个Python库,专为多智能体强化学习研究设计。它采用Agent Environment Cycle (AEC)游戏模型,提供统一的API支持各类多智能体环境。该库包含Atari、Butterfly、Classic等多个环境家族,支持多样化的智能体交互。PettingZoo还提供并行API用于同步行动场景,并通过严格的版本控制确保实验可重现性。

rl-baselines3-zoo - Stable Baselines3 强化学习代理的训练框架,包括超参数优化和预训练代理
GithubRL Baselines3 ZooStable Baselines3开源项目强化学习训练框架超参数调整
RL Baselines3 Zoo提供一个灵活的训练框架支持众多增强学习算法和环境。此框架便于进行算法基准测试、调优以及AI模型的训练和评估。已集成200多个预训练智能体,并配备全面的文档和安装指南,适合科研和开发使用。
rl-baselines-zoo - 一站式强化学习训练与优化集成环境
GithubRL Baselines ZooStable-Baselines3开源项目强化学习训练代理超参数调优
RL Baselines Zoo提供一个多元化的强化学习代理集合,支持用户通过简易界面进行代理训练和算法评测。项目含多个环境和算法,带有经过优化的默认超参数,适用于教育和研究用途。注意:此库已停止维护,建议使用更新的RL-Baselines3 Zoo版本。
ma-gym - 基于OpenAI Gym的多智能体强化学习环境库
GithubOpenAI gymPython包ma-gym多智能体环境开源项目强化学习
ma-gym是一个基于OpenAI Gym构建的多智能体强化学习环境库。它包含多种场景如跳棋、战斗和捕食者与猎物等。研究人员可以方便地使用这些环境来开发和评估多智能体强化学习算法。该项目提供了详细文档和示例代码,便于快速上手。作为多智能体强化学习研究的重要工具,ma-gym已在多篇学术论文中得到引用。
Gymnasium - Python强化学习标准API和环境开源库
AI环境GithubGymnasiumPython库开源项目强化学习
Gymnasium是一个用于开发和比较强化学习算法的开源Python库,提供标准API和丰富的环境集。它包括经典控制、Box2D、玩具文本、MuJoCo和Atari等多种环境类型,促进算法与环境的高效交互。作为OpenAI Gym的延续,Gymnasium现由独立团队维护,提供完善的文档和活跃的社区支持。该库采用严格的版本控制以确保实验可重复性,并提供灵活的安装选项满足不同用户需求。
AgentGym - 多环境下的广泛能力AI智能体进化平台
AgentGymGithub人工智能基准套件开源项目自我进化方法高质量轨迹集
AgentGym是一个框架,通过多种交互环境和统一任务格式,协助科研人员评估和开发具备广泛能力的语言模型智能体。平台支持实时反馈和并发操作,包含14种环境,如网页导航、文字游戏和家务任务。核心组成包括高质量的轨迹集AgentTraj和基准测试套件AgentEval,并提出了智能体自我进化方法AgentEvol。实验结果显示,进化后的智能体可与当前最先进的模型媲美。
autonomous-learning-library - PyTorch深度强化学习库助力智能代理开发
GithubPyTorch开源项目智能体深度强化学习算法实现自主学习库
autonomous-learning-library是基于PyTorch的深度强化学习库,为快速构建和评估智能代理提供丰富组件。库中包含灵活的函数近似API、多种内存缓冲区和环境接口,并实现了A2C、DQN、PPO等主流算法。支持Atari、经典控制和机器人仿真等环境,集成Tensorboard等工具便于实验监控。该库特别强调模块化设计,便于研究人员快速实现和测试新想法。同时提供完整文档和示例项目,降低了强化学习研究的入门门槛。
panda-gym - 机器人学习环境集,基于PyBullet和gymnasium
GithubPyBulletgymnasiumpanda-gym开源项目强化学习机器人环境
panda-gym是基于PyBullet物理引擎和gymnasium的机器人环境集,提供抓取、推动、滑动等多种任务环境。项目支持随机动作采样和人机交互渲染,并提供预训练模型和基准测试结果。panda-gym安装简便,适用于机器人学习研究。
envpool - 高性能并行强化学习环境执行引擎
EnvPoolGithub并行处理开源项目强化学习环境仿真高性能计算
EnvPool是一款基于C++的高性能并行强化学习环境引擎。它支持Atari、Mujoco等多种环境,提供同步和异步执行模式,适用于单玩家和多玩家场景。EnvPool易于集成新环境,在高端硬件上可达到每秒100万Atari帧或300万Mujoco步骤的模拟速度,比传统Python子进程方法快约20倍。作为通用解决方案,EnvPool可显著加速各类强化学习环境的并行化执行。
Gymnasium-Robotics - 基于Gymnasium和MuJoCo的强化学习机器人环境库
GithubGymnasiumMuJoCoPython开源项目强化学习机器人环境
Gymnasium-Robotics是一个强化学习机器人环境库,基于Gymnasium API和MuJoCo物理引擎开发。它提供多种机器人环境,包括Fetch机械臂、Shadow灵巧手等,并支持多目标API。该项目还集成了D4RL环境,如迷宫导航和Adroit机械臂。Gymnasium-Robotics为研究人员提供丰富的机器人操作任务,有助于开发和测试强化学习算法。
tinyzero - 简易强化学习框架 快速训练类AlphaZero智能体
AlphaZeroGithub开源项目强化学习环境模拟神经网络蒙特卡洛树搜索
tinyzero是一个简易的强化学习框架,用于在任意环境中训练类AlphaZero的智能体。该框架提供简单接口实现新环境、模型和智能体,支持多种游戏类型。tinyzero采用Monte Carlo树搜索和深度学习技术,可在Google Colab上快速部署,适合研究人员和爱好者探索AI在各类任务中的应用。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号