Project Icon

bitsandbytes

高效CUDA优化库 支持多位量化和矩阵运算

bitsandbytes是一个轻量级Python库,为CUDA自定义函数提供封装。该库主要提供8位优化器、矩阵乘法(LLM.int8())以及8位和4位量化功能。通过bitsandbytes.nn模块实现多位线性层,bitsandbytes.optim模块提供优化器。目前正在拓展对更多硬件后端的支持,包括Intel CPU+GPU、AMD GPU和Apple Silicon,Windows平台的支持也在开发中。

caffe - 一个用于深度学习的快速开放框架
BAIRBVLCCaffeGithub开源项目模型动物园深度学习框架
Caffe是由伯克利AI研究中心和社区贡献者开发的深度学习框架,强调高效表达、速度和模块化。用户可以通过项目网站获取详细信息,包括DIY深度学习教程、文档、参考模型和社区模型库。Caffe提供多种自定义版本,例如优化CPU和多节点支持的Intel Caffe、适用于AMD和Intel设备的OpenCL Caffe,以及Windows Caffe。社区用户可通过Gitter聊天和Google论坛进行交流,提交问题和建议。项目遵循BSD 2-Clause许可证,鼓励在研究中引用。
finn - 高效量化神经网络加速器框架,助力FPGA上的AI推理
FINNFPGAGithub开源项目数据流架构深度学习推理量化神经网络
FINN是一个开源实验框架,专注于FPGA上的量化神经网络推理。它为每个网络生成定制的数据流式架构,实现高效、高吞吐量和低延迟的FPGA加速器。FINN提供跨软硬件抽象层的灵活性,支持深度神经网络研究,并通过Docker提供编译器环境和丰富的文档资源。
DeepSpeed-MII - 开源低延迟模型推理库
DeepSpeed-MIIGithub优化技术低延迟开源项目模型支持高吞吐量
DeepSpeed-MII是一款开源Python库,专注于高吞吐量、低延迟和成本效益的模型推理。支持的技术包括块状KV缓存、连续批处理、高性能CUDA内核等,适用于37000多个模型,如Llama-2、Mixtral和Phi-2。v0.2版本提升了性能和功能,吞吐量提高至2.5倍。适用于语言模型及图像生成任务。
AutoAWQ - 面向大型语言模型的高效4位量化框架
AutoAWQGPU加速Github大语言模型开源项目推理量化
AutoAWQ是一个专门针对大型语言模型的4位量化框架,通过实现激活感知权重量化算法,可将模型速度提升3倍,同时减少3倍内存需求。该框架支持Mistral、LLaVa、Mixtral等多种模型,具备多GPU支持、CUDA和ROCm兼容性以及PEFT兼容训练等特性。AutoAWQ为提升大型语言模型的推理效率提供了有力工具。
optimizer - 一个通过预包装的优化通道对ONNX模型进行优化的C++库
GithubONNX优化器命令行安装开源项目模型优化
ONNX提供了一个C++库,通过预包装的优化通道对ONNX模型进行优化。主要目标是促进各ONNX后端实现共享工作,并支持多种直接在ONNX图上实现的优化。用户可以通过简单的函数调用使用这些通道,或添加新的优化通道。安装方式包括通过PyPI或从源代码构建。
nnAudio - 基于PyTorch的快速GPU音频处理工具箱
GPUGithubPyTorchnnAudio开源项目音频处理频谱图
nnAudio是一款基于PyTorch的音频处理工具箱,利用卷积神经网络实现实时频谱图生成和傅里叶核心训练。它具备跨平台兼容性、可训练性和可微分性,支持STFT、梅尔频谱、MFCC、CQT等多种音频处理功能。相比传统工具,nnAudio在GPU上提供更高效的音频分析和处理方案。
optimum-intel - Transformers和Diffusers库与Intel提供的不同工具和库之间的接口,用于加速 Intel 架构上的端到端管道
GithubIntel Extension for PyTorchNNCFNeural CompressorOpenVINOOptimum Intel开源项目
Optimum Intel接口将Hugging Face的Transformers和Diffusers库与Intel的工具相结合,优化PyTorch模型性能。支持Intel Neural Compressor的量化和剪枝技术,OpenVINO的高性能推理以及Intel Extension for PyTorch的操作融合和图优化。Optimum Intel提供简单直观的接口和丰富示例,便于在Intel硬件上部署高效模型。
llm-compressor - 开源大型语言模型压缩优化库
GithubHugging FaceLLM Compressorvllm开源项目模型优化量化
llm-compressor是一个专注于大型语言模型优化和压缩的开源库。它提供全面的量化算法集,支持权重和激活量化,并与Hugging Face模型和仓库无缝集成。该项目采用safetensors文件格式,确保与vllm兼容,同时通过accelerate支持大规模模型处理。llm-compressor涵盖多种量化格式和算法,包括激活量化、混合精度和稀疏化技术,为模型优化提供灵活多样的选择。
rwkv.cpp - 多精度量化推理和CPU优化的大语言模型
GithubPythonRWKVcuBLASggmlhipBLAS开源项目
该项目将RWKV-LM移植到ggerganov的ggml,支持FP32、FP16及量化的INT4、INT5和INT8推理,主要针对CPU使用,同时兼容cuBLAS。项目提供C库和Python封装。RWKV是一种不同于Transformer的大语言模型架构,只需前一步状态计算logits,适合长上下文使用。支持RWKV v5和v6模型以及LoRA检查点加载,适用于高质量和高性能需求的场景。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号