Project Icon

ao

优化PyTorch工作流,实现高性能和内存占用减少

torchao是一个用于PyTorch工作流的高性能库,能够创建并集成自定义数据类型和优化技术,实现推理速度提升至2倍,显存减少65%。无需大幅修改代码,保持准确度。支持量化、稀疏化及浮点数优化,适用于HuggingFace等模型。用户可以轻松优化模型,提高计算效率。支持int8、int4和float8等多种数据类型,兼容torch.compile()和FSDP。

segment-anything-fast - 高性能图像分割模型加速框架
AI模型加速GithubPyTorchSegment Anything图像分割开源项目推理优化
segment-anything-fast是基于Facebook's segment-anything的优化版本,专注于提高图像分割模型的性能。通过整合bfloat16、torch.compile和自定义Triton内核等技术,该项目显著提升了模型推理速度。它支持多种优化方法,如动态int8对称量化和2:4稀疏格式,同时保持了简单的安装和使用流程。这使得开发者能够轻松替换原始segment-anything,实现更高效的图像分割。该优化框架适用于需要实时或大规模图像分割处理的应用,如自动驾驶、医疗影像分析或视频编辑等领域,可显著提高处理效率和资源利用率。
bolt - 增强深度学习模型部署的高效轻量级库
BoltGithub华为开源项目推理精度模型转换深度学习
Bolt是一款轻量级深度学习库,旨在提升模型部署效率。它支持Caffe、ONNX、TFLite和Tensorflow的模型转换,提供从FP32到1-BIT的多种推理精度,并适用于ARM和X86 CPU以及多种GPU。该库在华为多个部门广泛应用,具备高性能、丰富的图优化和高效的线程亲和性设置,提升时序数据处理效率。
talos - 全自动化TensorFlow和Keras超参数优化工具
GithubKerasTalosTensorFlow开源项目模型评估超参数优化
Talos通过自动化超参数实验和模型评估,提升了TensorFlow (tf.keras) 和 Keras 的工作流程,无需学习新的语法或模板。用户可以在几分钟内配置和评估超参数实验,适用于各种预测任务。Talos支持 Linux、Mac OS 和 Windows 系统,并兼容 CPU、GPU 和多 GPU 系统,非常适合研究者和数据科学家使用。
AdalFlow - 打造和优化大语言模型任务流水线的轻量级、模块化应用库
AI库AdalFlowGithubLLM应用大语言模型开源项目模块化
AdalFlow是一个基于PyTorch设计模式的大语言模型(LLM)应用库,旨在帮助开发人员构建和优化任务流水线。这个库注重代码的可读性和模块化,能够灵活应对从聊天机器人到文本分类等不同的AI应用。AdalFlow支持用户根据自身的需求进行定制和迭代,提供一种清晰的流水线结构和基于组件的构建方式,使用户能够轻松理解和部署LLM工作流。
PINTO_model_zoo - 提供多框架神经网络模型转换与量化的开源工具
GithubONNXPINTO_model_zooPyTorchTensorFlow开源项目量化
PINTO_model_zoo 是一个开源工具库,支持 TensorFlow、PyTorch、ONNX、OpenVINO 等多个框架的模型转换和量化。项目提供多种量化方法,包括权重量化、整数量化和浮点数量化,旨在优化模型性能以适应不同平台,如 RaspberryPi 和 EdgeTPU。它还提供大量预量化模型和详细转换指南,帮助开发者在各种设备上高效部署深度学习模型。
neural-compressor - 开源深度学习模型压缩工具库
GithubIntel Neural Compressor大语言模型开源项目模型压缩深度学习框架量化
Neural Compressor是一款开源深度学习模型压缩工具库,支持TensorFlow、PyTorch和ONNX Runtime等主流框架。它提供量化、剪枝、知识蒸馏等多种压缩技术,适用于Intel等多种硬件平台。该工具支持大语言模型优化,并与主流云服务和AI生态系统集成。其自动化的精度感知量化策略有助于平衡模型性能和精度。
torchgeo - 优化地理空间数据处理的机器学习与遥感工具
GithubPyTorchTorchGeo地理空间数据开源项目机器学习遥感
TorchGeo 是一个基于 PyTorch 的地理空间数据处理库,提供丰富的数据集、采样器、变换和预训练模型,旨在帮助机器学习和遥感专家更高效地处理和探索地理空间数据。该库支持多光谱传感器的预训练模型,并与 PyTorch 数据加载器完全兼容,易于集成到现有的训练工作流中。其全面的文档包括 API 使用指南、教程和示范,非常适合开发者和研究人员使用。
Llama-3-8B-Instruct-GPTQ-4-Bit - 利用GPTQ量化优化模型性能的新方法
Apache AirflowGPTQGithubHuggingfaceMeta-Llama-3-8B-Instruct开源项目数据协调模型量化
Astronomer的4比特量化模型通过GPTQ技术减少VRAM占用至不足6GB,比原始模型节省近10GB。此优化提高了延迟和吞吐量,即便在较便宜的Nvidia T4、K80或RTX 4070 GPU上也能实现高效性能。量化过程基于AutoGPTQ,并按照最佳实践进行,使用wikitext数据集以减小精度损失。此外,针对vLLM和oobabooga平台提供详细配置指南,以有效解决加载问题。
TensorRT - 提升PyTorch推理效率的工具
CUDAGithubPyTorchTensorRTTorch-TensorRT安装开源项目
Torch-TensorRT将TensorRT的强大功能引入PyTorch,用户仅需一行代码即可显著提升推理性能。该工具支持在多个平台上安装,包括PyPI和NVIDIA NGC PyTorch容器。通过torch.compile或导出式工作流,用户可以高效优化和部署模型。Torch-TensorRT依赖CUDA和TensorRT,与Linux和Windows等多种平台兼容。提供丰富资源,包括教程、工具和技术讲座,供用户学习使用。
stable-fast - 优化HuggingFace Diffusers推理性能的轻量级框架
CUDADiffusersGithubPyTorchStable FastTorchScript开源项目
stable-fast是一个优化HuggingFace Diffusers推理性能的轻量级框架,支持NVIDIA GPU。相比TensorRT和AITemplate需要几十分钟的编译时间,stable-fast仅需几秒钟即可完成模型编译。主要特色包括动态形状、低精度计算和多种算子融合。它还兼容ControlNet和LoRA,并支持最新的StableVideoDiffusionPipeline,是加速PyTorch推理的有效工具。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号