Project Icon

brevitas

面向神经网络量化的PyTorch库

Brevitas是一个开源的神经网络量化PyTorch库,支持PTQ和QAT。它为常见PyTorch层提供量化版本,如QuantConv和QuantLSTM等,允许精细调整量化参数。兼容Python 3.8+和PyTorch 1.9.1-2.1,跨平台支持,推荐GPU加速。作为研究项目,Brevitas在深度学习模型压缩和效率优化方面具有重要应用价值。

Qwen2.5-Coder-7B-Instruct-GGUF - 深度学习模型的多规格量化版本适配不同硬件和性能要求
GGUFGithubHuggingfaceQwen2.5-Coder-7B-Instructllama.cpp大语言模型开源项目模型量化
本项目为Qwen2.5-Coder-7B-Instruct模型提供了从15GB到2.78GB的多种量化版本。采用llama.cpp最新技术,包括K-quants和I-quants两种量化方案,并针对ARM架构优化。用户可根据设备内存容量和性能需求选择适合版本。各版本保留原始模型核心功能,适用于多种部署场景。
Halu-8B-Llama3-v0.35-GGUF - Halu-8B-Llama3-v0.35量化版本选择指南,助力性能优化
GithubHalu-8B-Llama3-v0.35Huggingfacehuggingface-clitransformers开源项目文本生成模型量化
项目Halu-8B-Llama3-v0.35提供多种量化版本,通过不同的量化类型优化模型性能,以适应各类RAM和VRAM的需求。可选择K-quants或I-quants,满足特定场景下的性能需求。高质量的I-quants适用于CPU和Apple Metal,性能优于传统K-quants但不兼容Vulcan,并附有详细的性能图表和量化指南,帮助选择适合的量化版本。
Embedded-Neural-Network - 深度神经网络压缩与加速技术综述
Github剪枝开源项目模型量化硬件加速器神经网络压缩稀疏化
Embedded-Neural-Network项目汇集了减小深度神经网络模型大小和加速ASIC/FPGA应用的前沿研究。内容涵盖网络压缩、硬件加速等领域,包括参数共享、知识蒸馏、定点训练、稀疏正则化和剪枝等技术。项目还整理了相关教程和重要会议论文。
torchquad - 基于GPU加速的开源数值积分框架
GPUGithubPyTorchtorchquad开源项目数值积分机器学习
torchquad是一个开源的高性能数值积分框架,支持PyTorch、JAX和Tensorflow等多个后端。该框架针对GPU进行了优化,能有效处理高维积分问题,并在GPU上展现出优异的扩展性。torchquad提供多种积分方法,支持自动微分,适用于机器学习和科学计算等领域。其简洁的API设计使研究人员和开发者能够高效地完成复杂的数值积分任务。
IQA-PyTorch - 纯Python和PyTorch图像质量评估工具箱
GPU加速GithubIQAPyTorch图像质量评估开源项目纯Python
IQA-PyTorch是一款基于纯Python和PyTorch的图像质量评估工具箱,支持多种主流全参考和无参考评估指标。通过GPU加速,评估速度优于Matlab实现,用户可通过命令行或代码进行图像质量评估。该工具箱还支持作为损失函数使用,提供便捷的基准数据集下载和详细文档,适用于评估各种场景。定期更新及多种预训练模型让它成为图像质量评估的理想选择。详情请查阅文档和示例代码。
Mistral-7B-Instruct-v0.1-GPTQ - Mistral-7B-Instruct量化模型 多种精度选项
AI模型GPTQ量化GithubHuggingfaceMistral大语言模型开源项目指令微调模型
Mistral-7B-Instruct-v0.1模型的GPTQ量化版本提供4位和8位精度等多种参数选项。量化后的模型体积显著减小,性能基本不变,适合消费级GPU推理。支持通过ExLlama或Transformers加载,可用于高效文本生成。用户可根据硬件和需求选择合适版本。
Replete-LLM-V2.5-Qwen-32b-GGUF - 量化模型文件下载指南,通过选择适合的文件优化性能
GithubHuggingfaceReplete-LLM-V2.5-Qwen-32b嵌入输出权重开源项目文本生成模型视觉处理量化
该项目使用llama.cpp工具进行模型量化,提供多种Replete-LLM-V2.5-Qwen-32b模型文件下载选项。每种文件类型均说明其特性,如高质量和性能等,并适应不同硬件环境,以帮助用户根据需求优化模型质量或速度。文件适用于多种RAM和VRAM配置,便于在不同系统中实现优异性能。
tiny-cuda-nn - 专注于快速训练和查询神经网络的开源框架
C++编程CUDAGPUGithubTiny CUDA Neural Networks开源项目深度学习
Tiny CUDA Neural Networks是一个紧凑、高效的开源框架,专注于快速训练和查询神经网络。它包含优化的多层感知器(MLP)和多分辨率哈希编码,并支持多种输入编码、损失函数和优化器。适用于NVIDIA GPU,通过C++/CUDA API和PyTorch扩展,助力高性能计算和深度学习项目。
pytorch - 能GPU加速的Python深度学习平台
GPU加速PyTorch深度学习神经网络
PyTorch是一个开源的提供强大GPU加速的张量计算和深度神经网络平台,基于动态autograd系统设计。它不仅支持广泛的科学计算需求,易于使用和扩展,还可以与Python的主流科学包如NumPy、SciPy无缝集成,是进行深度学习和AI研究的理想工具。
TinyLlama-1.1B-Chat-v1.0-GPTQ-4bit - 基于GPTQ量化技术的轻量级4位对话AI模型
GPTQGithubHuggingfaceTinyLlama开源项目机器学习模型模型压缩量化模型
TinyLlama-1.1B-Chat-v1.0的4位量化版本,是一个轻量级对话AI模型。该项目采用AutoGPTQ技术进行量化,使用GPTQ方法将模型压缩至4位精度。量化配置包括128的组大小、0.01%的阻尼比例和对称量化等特性。这种优化显著降低了模型大小和内存占用,同时保持了模型性能,为资源受限的AI应用提供了高效解决方案。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号