#硬件后端
tvm - 适用于 CPU、GPU 和专用加速器的开放式深度学习编译器堆栈
Github开源项目深度学习Apache TVM编译器Apache-2.0硬件后端
Apache TVM为深度学习提供高效编译支持,优化执行效率,适合用于学术与工业研究领域,填补了框架与后端之间的技术差距。
bitsandbytes - 高效CUDA优化库 支持多位量化和矩阵运算
Github开源项目CUDA量化优化器硬件后端bitsandbytes
bitsandbytes是一个轻量级Python库,为CUDA自定义函数提供封装。该库主要提供8位优化器、矩阵乘法(LLM.int8())以及8位和4位量化功能。通过bitsandbytes.nn模块实现多位线性层,bitsandbytes.optim模块提供优化器。目前正在拓展对更多硬件后端的支持,包括Intel CPU+GPU、AMD GPU和Apple Silicon,Windows平台的支持也在开发中。