#MO-Gymnasium
morl-baselines - 多目标强化学习算法库 支持单策略和多策略实现
MORL-Baselines多目标强化学习算法库PyTorchMO-GymnasiumGithub开源项目
MORL-Baselines是一个多目标强化学习算法库,提供多种PyTorch实现。该项目遵循MO-Gymnasium API,支持单策略和多策略算法,适用于SER和ESR标准。特点包括自动性能报告、代码规范和自动测试。实现了GPI-LS、MORL/D等多种算法,支持连续和离散观察/动作空间,为MORL研究和基准测试提供有力支持。
MO-Gymnasium - 标准化多目标强化学习环境和算法开发平台
MO-Gymnasium多目标强化学习Python库环境API算法开发Github开源项目
MO-Gymnasium是一个开源Python库,为多目标强化学习(MORL)算法提供标准化开发和比较平台。它基于Gymnasium API,提供返回向量化奖励的环境集合,包括MORL文献中的环境和经典环境的多目标版本。该库支持简单的环境创建和交互,并提供LinearReward包装器实现奖励函数标量化。MO-Gymnasium采用严格的版本控制,保证实验可重复性,是MORL研究和基准测试的理想工具。