#OpenCL

TornadoVM: 加速Java程序的高效异构编程框架

3 个月前
Cover of TornadoVM: 加速Java程序的高效异构编程框架

TornadoVM: 加速Java程序的革命性技术

3 个月前
Cover of TornadoVM: 加速Java程序的革命性技术

femtoGPT: 纯Rust实现的极简生成式预训练Transformer

3 个月前
Cover of femtoGPT: 纯Rust实现的极简生成式预训练Transformer

OCL: 开启OpenCL在Rust中的无限可能

3 个月前
Cover of OCL: 开启OpenCL在Rust中的无限可能

DLPrimitives: 开源跨平台深度学习原语库和推理引擎

3 个月前
Cover of DLPrimitives: 开源跨平台深度学习原语库和推理引擎

TornadoVM入门指南 - 自动加速Java程序的异构编程框架

2 个月前
Cover of TornadoVM入门指南 - 自动加速Java程序的异构编程框架

femtoGPT学习资料汇总 - 纯Rust实现的极简生成式预训练Transformer

2 个月前
Cover of femtoGPT学习资料汇总 - 纯Rust实现的极简生成式预训练Transformer
相关项目
Project Cover

TornadoVM

TornadoVM是一个针对OpenJDK和GraalVM的插件,能够在异构硬件上自动运行Java程序。它支持OpenCL、PTX和SPIR-V设备,包括多核CPU、专用GPU(如Intel、NVIDIA、AMD)、集成GPU(如Intel HD Graphics和ARM Mali)和FPGA(如Intel和Xilinx)。TornadoVM具有三个后端,可生成OpenCL C、NVIDIA CUDA PTX汇编和SPIR-V二进制文件,开发人员可以选择安装和运行所需的后端。

Project Cover

femtoGPT

femtoGPT是一个用Rust实现的最小生成预训练转换器,支持在CPU和GPU上进行GPT模型的推理与训练。项目从零开始构建了张量处理逻辑以及训练和推理代码,适合对大语言模型感兴趣并想深入了解其工作原理的用户。使用了随机生成、数据序列化和并行计算库,尽管速度较慢,但能在NVIDIA和AMD显卡上运行。

Project Cover

ocl

ocl库为Rust开发者提供了高效的OpenCL编程接口。它不仅保留了OpenCL的全部功能,还简化了设备操作流程,减少了冗余代码。ocl的设计注重性能和安全性,适用于各种跨平台的高性能计算项目。支持OpenCL 1.1及更高版本,兼容主流操作系统。

Project Cover

dlprimitives

DLPrimitives是一个开源项目,旨在提供跨平台的OpenCL深度学习和推理工具。该项目创建了支持多种GPU架构的深度学习原语库和高效推理库。DLPrimitives的目标包括开发简约的深度学习框架,并与PyTorch、TensorFlow等主流框架集成,使OpenCL API在深度学习领域得到广泛应用。目前,DLPrimitives已支持多种神经网络模型,并在AMD、Intel、NVIDIA等多种GPU上进行了测试。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号