Project Icon

brevitas

面向神经网络量化的PyTorch库

Brevitas是一个开源的神经网络量化PyTorch库,支持PTQ和QAT。它为常见PyTorch层提供量化版本,如QuantConv和QuantLSTM等,允许精细调整量化参数。兼容Python 3.8+和PyTorch 1.9.1-2.1,跨平台支持,推荐GPU加速。作为研究项目,Brevitas在深度学习模型压缩和效率优化方面具有重要应用价值。

TinyNeuralNetwork - 高效易用的深度学习模型压缩框架
GithubTinyNeuralNetwork开源项目模型压缩深度学习神经网络量化训练
TinyNeuralNetwork是一个开源的深度学习模型压缩框架,提供神经架构搜索、剪枝、量化和模型转换等功能。该框架支持计算图捕获、依赖解析、多种剪枝算法、量化感知训练和模型转换,为深度学习模型优化提供全面解决方案。TinyNeuralNetwork已应用于天猫精灵、海尔电视等超过1000万IoT设备,实现AI能力部署。
Qwen2.5-14B-Instruct-GGUF - 针对不同硬件环境优化的大模型量化版本
GPU运算GithubHuggingfaceQwen2.5-14B-Instruct人工智能模型开源项目模型模型推理模型量化
Qwen2.5-14B-Instruct模型的量化优化项目,通过F16到Q2_K等多种精度量化方案,将模型体积压缩至5.36GB-29.55GB范围。项目集成了ARM芯片优化版本和创新的I-quant量化技术,实现了模型性能、速度与硬件适配的平衡。量化版本涵盖了从高精度到轻量级的多个选项,方便在不同计算资源条件下部署使用。
Llama-3-8B-Instruct-GPTQ-4-Bit - 利用GPTQ量化优化模型性能的新方法
Apache AirflowGPTQGithubHuggingfaceMeta-Llama-3-8B-Instruct开源项目数据协调模型量化
Astronomer的4比特量化模型通过GPTQ技术减少VRAM占用至不足6GB,比原始模型节省近10GB。此优化提高了延迟和吞吐量,即便在较便宜的Nvidia T4、K80或RTX 4070 GPU上也能实现高效性能。量化过程基于AutoGPTQ,并按照最佳实践进行,使用wikitext数据集以减小精度损失。此外,针对vLLM和oobabooga平台提供详细配置指南,以有效解决加载问题。
q-diffusion - 扩散模型的创新量化方法
GithubQ-Diffusion图像生成开源项目扩散模型深度学习量化
Q-Diffusion是一种针对扩散模型的后训练量化方法。它能将无条件扩散模型压缩至4位精度,同时保持接近原模型的性能。该方法通过时间步感知校准和分离捷径量化技术解决了扩散模型量化的主要难题。Q-Diffusion不仅适用于无条件图像生成,还可用于文本引导的图像生成,首次实现了4位权重下的高质量生成效果。这一技术为扩散模型的高效实现开辟了新途径。
qwen2.5-7b-ins-v3-GGUF - 量化优化AI模型的多样化选择指南
GithubHuggingfaceQwen2.5-7b-ins-v3quantization参数嵌入权重开源项目模型
该项目利用llama.cpp的b3901版本和imatrix选项对AI模型进行量化优化,支持各种硬件的量化格式下载。在LM Studio中运行这些模型,可通过缩小文件大小实现更高效的部署。K-quant格式在低资源环境中表现突出,而I-quants则在某些情况下显示出其新方法的优越性能,尤其建议ARM芯片用户选择Q4_0_X_X以获取更快速的响应。
Qwen2.5-14B_Uncensored_Instruct-GGUF - 高性能量化版本适用于多种设备和场景
GGUFGithubHuggingfaceQwen2.5-14B开源项目文本生成模型模型压缩量化
此项目为Qwen2.5-14B无审查指令模型提供多种量化版本,涵盖从29.55GB的F16到5.36GB的IQ2_M等不同规格。量化类型包括Q8_0、Q6_K、Q5_K、Q4_K、Q3_K和IQ系列,适应不同硬件配置需求。项目详细介绍了各版本特点、文件大小和适用场景,并提供选择指南和下载方法,方便用户根据设备性能选择合适版本。
CompressAI - 基于PyTorch的端到端压缩研究开源库
CompressAIGithubPyTorch图像压缩开源项目深度学习评估平台
CompressAI是基于PyTorch的开源库,致力于端到端压缩研究。该库提供深度学习数据压缩的自定义组件、预训练图像压缩模型,以及评估工具用于比较学习型模型与传统编解码器。支持Python 3.8+和PyTorch 1.7+,为压缩技术研究提供了实用平台。
lightning-uq-box - 神经网络不确定性量化开源工具库
GithubLightning-UQ-BoxPyTorch不确定性量化开源项目机器学习深度学习
Lightning-UQ-Box是基于PyTorch的开源库,为神经网络提供多种不确定性量化技术。该库实现了多种UQ方法,支持不同架构和理论基础,便于在数据集上比较方法效果。它简化了UQ在工作流中的应用,降低了使用门槛,有助于促进UQ方法的比较和开发,并注重实验的可重现性。
vectorbt - 高性能量化交易和投资组合分析Python库
GithubPython库vectorbt回测开源项目数据分析量化交易
vectorbt是一个Python库,专注于量化交易和投资组合分析。它提供策略回测、参数优化和数据可视化功能,支持高性能计算以处理大规模数据和复杂策略。该库适用于多种金融工具,包括加密货币,并集成了丰富的技术指标和分析工具。vectorbt能够满足从简单投资策略到复杂算法交易的各种需求,为量化分析提供全面支持。
ao - 优化PyTorch工作流,实现高性能和内存占用减少
GithubPyTorchtorchao开源项目推理模型量化训练
torchao是一个用于PyTorch工作流的高性能库,能够创建并集成自定义数据类型和优化技术,实现推理速度提升至2倍,显存减少65%。无需大幅修改代码,保持准确度。支持量化、稀疏化及浮点数优化,适用于HuggingFace等模型。用户可以轻松优化模型,提高计算效率。支持int8、int4和float8等多种数据类型,兼容torch.compile()和FSDP。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号