#OpenCL
TornadoVM
TornadoVM是一个针对OpenJDK和GraalVM的插件,能够在异构硬件上自动运行Java程序。它支持OpenCL、PTX和SPIR-V设备,包括多核CPU、专用GPU(如Intel、NVIDIA、AMD)、集成GPU(如Intel HD Graphics和ARM Mali)和FPGA(如Intel和Xilinx)。TornadoVM具有三个后端,可生成OpenCL C、NVIDIA CUDA PTX汇编和SPIR-V二进制文件,开发人员可以选择安装和运行所需的后端。
femtoGPT
femtoGPT是一个用Rust实现的最小生成预训练转换器,支持在CPU和GPU上进行GPT模型的推理与训练。项目从零开始构建了张量处理逻辑以及训练和推理代码,适合对大语言模型感兴趣并想深入了解其工作原理的用户。使用了随机生成、数据序列化和并行计算库,尽管速度较慢,但能在NVIDIA和AMD显卡上运行。
ocl
ocl库为Rust开发者提供了高效的OpenCL编程接口。它不仅保留了OpenCL的全部功能,还简化了设备操作流程,减少了冗余代码。ocl的设计注重性能和安全性,适用于各种跨平台的高性能计算项目。支持OpenCL 1.1及更高版本,兼容主流操作系统。
dlprimitives
DLPrimitives是一个开源项目,旨在提供跨平台的OpenCL深度学习和推理工具。该项目创建了支持多种GPU架构的深度学习原语库和高效推理库。DLPrimitives的目标包括开发简约的深度学习框架,并与PyTorch、TensorFlow等主流框架集成,使OpenCL API在深度学习领域得到广泛应用。目前,DLPrimitives已支持多种神经网络模型,并在AMD、Intel、NVIDIA等多种GPU上进行了测试。