Logo

#SIMD

llama2.rs: 纯Rust实现的高性能Llama 2推理引擎

2 个月前
Cover of llama2.rs: 纯Rust实现的高性能Llama 2推理引擎

相关项目

Project Cover
llama2.rs
llama2.rs是一个用Rust开发的Llama2 CPU推理库,专注于提供高性能的推理能力。项目支持4位GPT-Q量化、批量预填充提示标记、SIMD加速和内存映射等技术,实现了70B模型的即时加载。通过Python API,开发者可在普通台式机上运行70B Llama2模型(1 token/s)和7B模型(9 tokens/s)。该项目为大规模语言模型的CPU推理提供了高效且灵活的开源解决方案。
Project Cover
SIMD-itertools
SIMD-itertools是一个Rust开源项目,提供SIMD加速的迭代器操作。通过替换标准库函数为SIMD版本,如contains()改为contains_simd(),可显著提升性能。支持u8至u64等多种数据类型,实现了find、filter、position等常用操作。项目需要Rust nightly版本,使用简单配置即可启用。根据项目提供的基准测试结果,SIMD-itertools在处理u32类型数据时,相比标准库实现可获得显著的性能提升。使用时需通过rustup安装nightly版本,并在编译时添加-C target-cpu=native参数以获得最佳性能。SIMD-itertools为开发者提供了高效的Rust数组处理工具,在多数情况下性能优于标准库实现。
Project Cover
highway
Highway是一个跨平台C++向量化库,支持x86、ARM等多种CPU架构的SIMD指令。它提供统一API,实现一次编码多平台运行,支持静态编译和运行时动态调度。Highway适用于图像处理、数据压缩、密码学等领域,提供丰富的向量化操作,易用性和性能兼备,是开发高性能软件的理想选择。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号