#MobileViT
mobilevit-small - 高效轻量的移动端视觉转换器
模型神经网络MobileViT开源项目Huggingface图像分类机器学习ImageNetGithub
MobileViT-small是一款轻量级视觉模型,在ImageNet-1k数据集上预训练。该模型融合MobileNetV2结构和transformer块,实现高效全局图像处理。仅5.6M参数量,却在ImageNet上获得78.4%的top-1准确率。适用于移动设备的图像分类等任务,平衡了性能与效率。
mobilevit_s.cvnets_in1k - MobileViT 轻量级通用移动友好的图像分类模型
特征提取Huggingface图像分类MobileViT模型timmGithub开源项目ImageNet-1k
mobilevit_s.cvnets_in1k是一款基于MobileViT架构的图像分类模型,在ImageNet-1k数据集上进行了训练。该模型仅有5.6M参数和2.0 GMACs计算量,体现了其轻量级特性。它不仅可用于图像分类,还支持特征图提取和图像嵌入等功能。通过融合MobileNet的效率和Vision Transformer的性能,这个模型特别适合在计算资源有限的移动设备上应用。
mobilevit_xs.cvnets_in1k - MobileViT 轻量级通用移动友好的视觉Transformer
特征提取Huggingface图像分类MobileViT模型timmGithub开源项目ImageNet-1k
MobileViT是一种轻量级视觉Transformer模型,专为移动设备设计。mobilevit_xs.cvnets_in1k版本在ImageNet-1k数据集上训练,仅有2.3M参数和1.1 GMACs计算量。该模型适用于图像分类、特征提取和嵌入生成等任务,平衡了性能和资源消耗。它融合了MobileNet的轻量化结构和Vision Transformer的强大特性,为资源受限环境提供了高效解决方案。
mobilevit-xx-small - 轻量级移动端视觉转换模型,适用于通用图像分类
图像分类ImageNet-1kMobileViTHuggingfaceGithub开源项目模型Transformer卷积神经网络
MobileViT模型的设计同时保证了轻量和低延迟性能,通过结合MobileNetV2和全局处理变换器块,适合各种图像分类应用。模型无需位置嵌入,已在ImageNet-1k数据集预训练并取得69%的top-1准确率。训练过程中采用简单的数据增强方法,可无须微调即可学到多尺度特征。目前支持PyTorch框架。