Project Icon

aimet

深度学习模型优化的量化与压缩工具

AI Model Efficiency Toolkit (AIMET) 提供先进的模型量化和压缩技术,专注于优化已训练的神经网络模型。其主要功能包括跨层均衡、偏差校正、自适应舍入和量化感知训练,显著提升模型运行性能,降低计算和内存要求,并保持任务精度。AIMET 兼容 PyTorch、TensorFlow 和 ONNX 模型,通过 AIMET Model Zoo 提供优化的8位推理神经网络模型。同时,AIMET 支持空间SVD和通道剪枝等压缩技术,并提供可视化工具检查模型量化和压缩效果。

compression - 帮助构建端到端优化的数据压缩机器学习模型的一套数据压缩工具
GithubTensorFlow Compression开源项目数据压缩机器学习模型
TensorFlow Compression 提供一套数据压缩工具,帮助构建端到端优化的数据压缩机器学习模型。该库支持高效存储数据表示,减少性能损失。主要功能包括范围编码、熵模型类以及用于数据压缩的额外TensorFlow功能和Keras层。2024年2月1日起,该库进入维护模式,适用于TensorFlow 2.14及以上版本。用户可以通过教程和论文链接深入了解有损数据压缩及模型优化方法。
kaito - Kubernetes集群AI/ML模型自动化部署与管理工具
AIGPUGithubKubernetes大型模型开源项目自动化
Kaito是一款专为Kubernetes集群设计的AI/ML模型自动化管理工具。它支持falcon和phi-3等开源大模型,通过容器镜像管理模型文件,提供预设配置,自动配置GPU节点,并利用Microsoft Container Registry托管模型镜像。Kaito显著简化了在Kubernetes环境中部署和管理大型AI推理模型的过程,为开发者和运维人员提供了高效、便捷的解决方案。
Mythalion-13B-AWQ - 利用高效的低比特量化提升Transformer推理速度
GithubHuggingfaceMythalion 13B伪人AI开源项目文本生成模型模型整合量化
该项目提供高效的AWQ模型文件,支持4比特量化在多用户环境中实现快速Transformer推理。虽然未量化模型的整体吞吐量更高,但通过使用更小的GPU,AWQ模型显著降低了部署成本,例如仅需1台48GB GPU即可运行70B模型。该模型适合需要高吞吐量并行推理的场景,用户可借助vLLM或AutoAWQ轻松调用以降低成本并简化部署。
quantized-models - 提供多源量化模型以提升大语言模型推理效率
GithubHuggingfacequantized-modelstransformers大型语言模型开源项目文本生成推理模型量化模型
quantized-models项目整合了多种来源的量化模型,旨在提高大语言模型的推理效率。模型支持者包括TheBloke、LoneStriker、Meta Llama等,提供gguf、exl2格式的支持。用户可通过transformers库便捷地进行文本生成,这些模型按现状发布,需遵循其各自的许可协议。
onnx-tool - 专注于深度学习和自然语言处理的ONNX模型管理工具
Githubonnx-tool内存压缩开源项目形状推理模型压缩模型概要分析
ONNX-tool是一款强大的工具,支持ONNX模型的解析和编辑、推断和压缩。适用于自然语言处理和计算机视觉模型,提供模型构建、形状推断、激活压缩、权重压缩及计算图优化,以提升推理性能和存储效率。
StarCoder2-7B-GGUF - 多种量化模型版本,提升代码生成性能与存储效率
GithubHuggingfaceLlamaEdgeStarCoder2代码生成开源项目模型模型压缩量化模型
此项目提供多种量化模型版本,旨在优化代码生成任务中的性能与存储效率。可选范围包括小容量、质量损失较大的版本到大容量、质量损失低的版本,以满足各种需求。Q4_K_M与Q5_K_M模型在质量与容量间表现出良好的平衡。该项目使用llama.cpp进行量化,适合空间与性能有特定需求的开发者。
DeepSeek-Coder-V2-Lite-Instruct-GGUF - 高性能代码模型的多版本量化优化支持多种硬件推理应用
DeepSeek-CoderGithubHuggingface人工智能代码生成开源项目模型模型压缩量化模型
本项目针对DeepSeek-Coder-V2-Lite-Instruct模型进行量化优化,提供20多种GGUF格式文件,大小从6GB到17GB不等。采用llama.cpp的imatrix技术实现高效压缩,同时保持模型性能。用户可根据硬件条件选择适合的版本,支持NVIDIA、AMD等平台的深度学习推理。
DeepSeek-Coder-V2-Lite-Instruct-GGUF - 完整的DeepSeek代码助手模型量化版集合
DeepSeek-CoderGithubHuggingfaceLlamaEdge代码开发开源项目模型模型量化深度学习
这是一个专为代码编写优化的DeepSeek量化模型系列,提供从2位到16位的多种精度选项,支持通过LlamaEdge和WasmEdge进行部署。模型拥有12.8万token的上下文长度,文件大小从6.43GB到31.4GB不等。Q4_K_M和Q5_K_M版本在性能和资源占用上达到最佳平衡,适合大多数应用场景。
lightning-flash - 跨数据领域和任务的AI模型训练与处理解决方案
AIGithubPyTorchlightning-flash开源项目模型训练深度学习
Lightning Flash提供多任务和多数据领域的AI解决方案,用户只需三步即可完成数据加载、模型配置和微调。项目支持多种预训练模型和优化策略,简化深度学习工作流程,适用于各种数据域和任务类型。其功能包括模型预测、训练策略、优化器和调度器选择,以及自定义数据变换。Flash旨在让用户无需自行开发复杂的研究框架,即可在生产环境中应用AI模型。
lite.ai.toolkit - C++ AI模型工具包,包括目标检测、面部识别、图像分割和抠图等
GithubLite.Ai.ToolKit人脸识别分割开源项目抠图模型检测
一款轻量级的C++工具包,支持多种AI模型,包括目标检测、面部识别、图像分割和抠图等。依赖最小,仅需OpenCV和ONNXRuntime,兼容GPU和CPU设备,提供300多种C++实现和500多种预训练模型,易于使用和集成。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号