#AI计算
ppl.llm.kernel.cuda - 优化大语言模型计算的CUDA内核库
PPL LLMCUDAAI计算GPU加速深度学习Github开源项目
ppl.llm.kernel.cuda是PPL.LLM系统的核心组件,为大语言模型提供CUDA内核实现。该项目针对Ampere和Hopper架构优化,支持x86_64和arm64平台。它提供简单的构建流程,包含NCCL和JIT编译选项,便于性能调优。作为开源项目,ppl.llm.kernel.cuda旨在提高大规模语言模型的计算效率,为AI开发提供底层支持。
vasttools - 面向GPU云平台的综合管理优化工具
Vast.aiGPU托管AI计算云服务开源工具Github开源项目
vasttools是针对Vast.ai等GPU云平台的综合工具集,提供服务器安装指南、性能测试、温度监控和超频管理等功能。它还包含分析仪表盘、自动价格更新等高级特性,全面优化GPU服务器性能和管理效率,为云主机提供商和用户提供多方位支持。
pytorch-onn - 基于PyTorch的光子神经网络仿真与优化框架
PyTorch光子集成电路神经网络AI计算GPU加速Github开源项目
pytorch-onn是一个基于PyTorch的光子神经网络仿真框架。该框架支持GPU加速的相干和非相干光学神经网络训练与推理,可扩展至百万参数规模。它提供了高度优化的并行处理和多功能API,支持从器件到系统级的协同设计与优化。这一工具主要面向神经形态光子学、光学AI系统和光子集成电路优化等领域的研究人员。
相关文章