ppl.llm.kernel.cuda
ppl.llm.kernel.cuda是PPL.LLM系统的核心组件,为大语言模型提供CUDA内核实现。该项目针对Ampere和Hopper架构优化,支持x86_64和arm64平台。它提供简单的构建流程,包含NCCL和JIT编译选项,便于性能调优。作为开源项目,ppl.llm.kernel.cuda旨在提高大规模语言模型的计算效率,为AI开发提供底层支持。