Efficient-Computing

华为诺亚方舟实验室开发的AI模型优化技术集合

高效计算模型压缩神经网络深度学习 Huawei Noah's Ark Lab Github 开源项目

Efficient-Computing项目旨在提高AI模型的计算效率和性能。这个由华为诺亚方舟实验室开发的高效计算方法集合包含多个子项目，涵盖了模型压缩、二值神经网络、知识蒸馏、网络剪枝、模型量化、自监督学习、训练加速、目标检测和低层视觉等领域的技术。该项目为AI研究和开发提供了多样化的工具和资源。

Github

介绍相关项目

optimum-intel - Transformers和Diffusers库与Intel提供的不同工具和库之间的接口，用于加速 Intel 架构上的端到端管道

GithubIntel Extension for PyTorchNNCFNeural CompressorOpenVINOOptimum Intel开源项目

Optimum Intel接口将Hugging Face的Transformers和Diffusers库与Intel的工具相结合，优化PyTorch模型性能。支持Intel Neural Compressor的量化和剪枝技术，OpenVINO的高性能推理以及Intel Extension for PyTorch的操作融合和图优化。Optimum Intel提供简单直观的接口和丰富示例，便于在Intel硬件上部署高效模型。

codegemma-2b - 深度学习模型微调的新方案：提升效率与内存节约

GemmaGithubHuggingfaceLlama-2Unslothfinetune内存优化开源项目模型

CodeGemma-2b项目使用Unsloth技术，加速多个深度学习模型的微调，包括Mistral、Gemma、Llama等。速度提升最高达5倍，内存使用减少70%。通过Google Colab和Kaggle的免费notebook，用户可以轻松展开微调工作。简化的界面设计支持从数据添加到模型导出的完整流程，适合初学者快速上手。这种创新优化方法节省计算资源，提高模型性能，是开发者提升生产力的有力助手。

Qwen2-0.5B - 使用Unsloth提升微调效率和内存优化

GithubHuggingfaceLlamaQwen2Unsloth内存优化开源项目快速微调模型

Unsloth提供的工具支持在Google Colab上微调多种模型，如Llama、Gemma、Mistral等，速度提升可达5倍，内存使用减少至74%。简便的操作流程允许用户快速上传数据集并运行所有步骤，生成优化后的模型，支持导出和上传至各大平台，显著提高微调效率，是开发和测试AI模型的可靠工具。

nanotron - 高效的大规模模型预训练库

GithubNanotronTransformer并行计算开源项目模型预训练深度学习

Nanotron是一个开源的Transformer模型预训练库。它提供灵活API，支持自定义数据集预训练。该库特点包括高性能、可扩展性强，支持3D并行、专家并行、AFAB和1F1B调度策略、ZeRO-1优化器等先进技术。Nanotron适用于大规模模型训练，旨在提高预训练效率。

Llama-3.1-Nemotron-70B-Instruct-HF-FP8-dynamic - 多语种量化优化模型，显著降低内存占用

GithubHuggingfaceLlama-3.1-Nemotron-70B-Instruct-HF-FP8-dynamic多语言支持开源项目文本生成模型模型优化量化

通过将权重和激活量化为FP8格式，该项目优化了Llama-3.1-Nemotron模型，显著降低了GPU内存与磁盘的占用。模型适用于商业与研究，支持多语言开发和会话助手的构建。利用vLLM，可以实现高效部署并具有OpenAI兼容性。Llama-3.1-Nemotron-70B-Instruct-HF-FP8-dynamic在诸多测试中表现优良，在Arena-Hard评估中达99.41%的恢复率。

OmniQuant - 简便高效的大型语言模型量化技术

GithubLLaMAOmniQuant大语言模型开源项目量化高效QAT

OmniQuant是一种高效的量化技术，支持多种大型语言模型（LLM）的权重和激活量化，包括LLaMa和OPT等。其实现了4位及更低精度的权重量化，并通过MLC-LLM优化在多种硬件设备上的推理性能和内存占用。此外，项目还支持Mixtral和Falcon模型的压缩应用，大幅降低内存需求，提高运行效率。

tf_efficientnetv2_b0.in1k - 轻量高效的图像分类解决方案

EfficientNet-v2GithubHuggingfaceImageNettimm图像分类开源项目模型特征提取

EfficientNetV2-B0是EfficientNet-v2系列中的轻量级模型，由谷歌研究团队开发并在ImageNet-1k数据集上训练。模型参数仅7.1M，GMACs为0.5，在保持较高准确率的同时大幅降低计算复杂度。除图像分类外，还可用于特征提取和生成图像嵌入。该模型适用于资源受限的环境，如移动设备和边缘计算场景，为开发者提供了高效的图像处理解决方案。

StarCoder2-7B-GGUF - 多种量化模型版本，提升代码生成性能与存储效率

GithubHuggingfaceLlamaEdgeStarCoder2代码生成开源项目模型模型压缩量化模型

此项目提供多种量化模型版本，旨在优化代码生成任务中的性能与存储效率。可选范围包括小容量、质量损失较大的版本到大容量、质量损失低的版本，以满足各种需求。Q4_K_M与Q5_K_M模型在质量与容量间表现出良好的平衡。该项目使用llama.cpp进行量化，适合空间与性能有特定需求的开发者。

edgeyolo - 优化边缘设备性能的模型，支持ONNX和TensorRT导出

COCO2017EdgeYOLOGithubHuawei AscendNvidia Jetson AGX XavierTensorRT开源项目

EdgeYOLO为边缘设备优化，在Nvidia Jetson AGX Xavier上达34FPS，并通过RH loss提升小型和中型物体检测。支持COCO2017和VisDrone2019数据集，提供多种模型格式和部署代码，包括RKNN、MNN和TensorRT。项目定期更新，并集成了SAMLabeler Pro工具，支持多人远程标注。可快速上手和训练，适配不同设备和应用场景。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号