Efficient-AI-Backbones学习资料汇总 - 华为诺亚方舟实验室开发的高效AI骨干网络

Ray

Efficient-AI-Backbones

Efficient-AI-Backbones项目简介

Efficient-AI-Backbones是华为诺亚方舟实验室开发的一系列高效AI骨干网络,旨在为移动设备等资源受限场景提供轻量级但高性能的深度学习模型。该项目包含了多个创新网络结构,如GhostNet、TNT (Transformer in Transformer)、AugViT、WaveMLP和ViG等。这些网络在保持高精度的同时,大幅降低了计算复杂度和参数量,非常适合部署在移动设备上。

主要模型介绍

1. GhostNet系列

GhostNet是该项目中最具代表性的网络之一,它通过"幽灵"(Ghost)模块大幅减少了卷积操作的计算量。目前已发展出多个版本:

  • GhostNet: 原始版本,在ImageNet上以167M FLOPs达到73.9%的Top-1准确率。
  • GhostNetV2: 引入了长程注意力机制,进一步提升性能。
  • G-GhostNet: 针对异构设备优化的GhostNet变体。

2. TNT (Transformer in Transformer)

TNT是一种创新的视觉Transformer结构,通过在Transformer block中嵌套小型Transformer来建模局部特征。这种设计既保留了Transformer的长程建模能力,又增强了对局部细节的感知。

3. WaveMLP

WaveMLP是一种受量子启发的纯MLP视觉主干网络。它将图像patch视为波,通过简单的MLP结构实现了与CNN和ViT相当的性能,同时具有更高的推理效率。

使用指南

  1. 安装依赖:

    python 3
    pytorch == 1.7.1
    torchvision == 0.8.2
    timm == 0.3.2
    
  2. 克隆仓库:

    git clone https://github.com/huawei-noah/Efficient-AI-Backbones.git
    
  3. 选择需要的模型,如GhostNetV2:

    cd Efficient-AI-Backbones/ghostnetv2_pytorch
    
  4. 训练模型:

    python -m torch.distributed.launch --nproc_per_node=8 train.py /path/to/imagenet/ --model ghostnetv2 --width 1.0
    

预训练模型

项目提供了多个预训练模型供下载使用,包括:

相关论文

  1. GhostNet: More Features from Cheap Operations (CVPR 2020)
  2. GhostNetV2: Enhance Cheap Operation with Long-Range Attention (NeurIPS 2022 Spotlight)
  3. Transformer in Transformer (NeurIPS 2021)
  4. An Image Patch is a Wave: Quantum Inspired Vision MLP (CVPR 2022)

总结

Efficient-AI-Backbones项目为移动设备AI应用提供了一系列高效的骨干网络。通过创新的网络结构设计,这些模型在保持高精度的同时大幅降低了计算复杂度。无论是学术研究还是工业应用,该项目都提供了宝贵的资源和参考。研究人员和开发者可以根据自己的需求,选择合适的模型进行进一步的探索和应用开发。

avatar
0
0
0
相关项目
Project Cover

onnx

ONNX是一个开放生态系统,提供AI模型的开源格式,支持深度学习和传统机器学习。通过定义可扩展的计算图模型和内置操作符及标准数据类型,ONNX增强了不同框架间的互操作性,加速了从研究到生产的转化。ONNX广泛支持各种工具和硬件,助力AI社区快速创新。了解ONNX的文档、教程和预训练模型,加入社区,共同推动ONNX的发展。

Project Cover

PaddleHub

PaddleHub提供超过400种高质量AI模型,覆盖计算机视觉、自然语言处理和语音识别等领域。用户仅需3行代码即可进行模型预测,同时支持模型即服务,通过简单命令即可部署。最新版本v2.3.0引入了ERNIE-ViLG、Disco Diffusion和Stable Diffusion等模型,并支持在HuggingFace平台上发布。PaddleHub兼容Linux、Windows和MacOS,适合多平台开发。

Project Cover

LibreChat

LibreChat是一个开源AI聊天平台,提供类似ChatGPT的用户界面,支持暗黑模式和流媒体功能。用户可以选择使用OpenAI、Azure、Google等多种AI模型,并可在远程和本地AI服务之间切换。平台支持多语言界面,提供图像分析、多模态聊天、对话分支和插件等功能。LibreChat允许创建、保存和分享自定义预设,支持多用户安全认证和社区驱动开发,并提供本地和云端部署选项。

Project Cover

mistral-inference

该项目提供了简洁高效的代码库,支持Mistral 7B、8x7B和8x22B模型的部署和运行。通过命令行界面和Python接口,可以方便地下载、安装和测试模型,并与其互动。项目包含详细的使用示例和多GPU环境的部署指南,为开发者和研究人员提供了可靠的支持。

Project Cover

dalai

Dalai项目允许用户在Linux、Mac和Windows系统上运行LLaMA和Alpaca模型,提供用户友好的Web应用和JavaScript API。通过简单的安装步骤即可在本地使用这些模型,支持多种模型尺寸,适应不同计算机配置。详细的安装和故障排除指南帮助用户快速上手。

Project Cover

BentoML

BentoML是一个开源模型服务框架,简化了AI和ML模型的生产部署。可以将任何模型推理脚本轻松转化为REST API服务器,并通过简单配置文件管理环境、依赖和模型版本。BentoML支持高性能推理API的构建,利用动态批处理、模型并行化和多阶段流水线等优化功能,最大化CPU/GPU利用率。此外,还支持自定义AI应用、异步推理任务和定制化前后处理逻辑。通过Docker容器或BentoCloud可轻松部署至生产环境,适用于各种机器学习框架和推理运行时。

Project Cover

generative-ai

此资源库提供关于在Google Cloud上使用Generative AI的指南和示例,包括笔记本、代码样本和应用程序示例,帮助用户开发和管理生成式AI工作流。

Project Cover

ludwig

Ludwig是一个低代码深度学习框架,用于构建定制的人工智能模型,如LLMs和其他深度神经网络。它支持多任务和多模态学习,优化了批量大小选择,分布式训练和模型微调,确保高效处理大规模数据集。Ludwig的模块化设计允许用户轻松实验不同的模型架构,支持超参数优化和丰富的度量可视化,适用于生产环境,并整合了Docker和Ray等工具,支持模型导出到Torchscript和Triton,一键上传至HuggingFace。

Project Cover

cog-face-to-many

face-to-many项目可以将任何面部图像转换为3D、像素艺术、电子游戏、粘土动画和玩具效果。该项目可在Replicate和ComfyUI上运行,提供了必要的自定义节点,如ComfyUI Controlnet Aux、InstantID和IPAdapter Plus等。通过克隆仓库、创建虚拟环境并安装依赖项,用户可以在本地运行该项目。详细的安装和运行指南帮助用户快速启动并体验项目功能。

最新项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号