DI-HPC:决策智能 - 高性能计算
DI-HPC是一个用于强化学习算法中通用算法模块的加速算子组件,如GAE、n步TD和LSTM等。这些算子支持前向和后向传播,可用于训练、数据收集和测试模块。
要求
设置1
- CUDA 9.2
- PyTorch 1.5(推荐)
- Python 3.6或Python 3.7或Python 3.8
- Linux平台
设置2
- CUDA 9.0
- gcc 5.4.0
- PyTorch 1.1.0
- Python 3.6或Python 3.7
- Linux平台
注:我们建议DI-HPC和DI-Engine共享相同的环境,PyTorch版本从1.1.0到1.10.0应该都可以。
快速开始
从whl安装
获取DI-HPC最简单的方法是使用pip,你可以从以下链接获取.whl
文件:
- di_hpc_rll-0.0.2-cp36-cp36m-linux_x86_64.whl
- di_hpc_rll-0.0.2-cp37-cp37m-linux_x86_64.whl
- di_hpc_rll-0.0.2-cp38-cp38-linux_x86_64.whl
然后执行:
$ pip install <你的WHL文件>
从源代码安装
或者,你可以从git主分支安装最新的DI-HPC:
$ python3 setup.py install
在Linux上运行
你可以通过以下命令获得基准测试结果:
$ python3 tests/test_gae.py
待办事项
- [] 为强化学习开发Trition内核
反馈和贡献
- 在Github上提交问题
- 在DI-engine的(也适用于DI-hpc)Discord服务器上讨论
- 联系我们的邮箱(opendilab@pjlab.org.cn)
我们感谢所有改进DI-engine的反馈和贡献,包括算法和系统设计。CONTRIBUTING.md
提供了一些必要的信息。
许可证
DI-hpc基于Apache 2.0许可证发布。