#ImageNet-1k
convnextv2_tiny.fcmae_ft_in1k - ConvNeXt-V2轻量级图像分类和特征提取模型
Huggingface图像分类模型timmGithub预训练模型开源项目ConvNeXt-V2ImageNet-1k
convnextv2_tiny.fcmae_ft_in1k是基于ConvNeXt-V2架构的轻量级图像分类模型。该模型通过全卷积masked自编码器预训练,在ImageNet-1k数据集微调,拥有2860万参数。它可用于图像分类、特征图提取和图像嵌入,在ImageNet验证集上Top-1准确率达82.92%。这是一个在性能和效率间取得平衡的优秀选择。
fbnetv3_b.ra2_in1k - FBNet-v3轻量级图像分类模型支持多种应用场景
特征提取Huggingface图像分类模型FBNet-v3timmGithub开源项目ImageNet-1k
fbnetv3_b.ra2_in1k是基于FBNet-v3架构的轻量级图像分类模型。该模型在ImageNet-1k数据集上训练,使用RandAugment数据增强和EMA权重平均等技术。模型参数仅8.6M,GMAC为0.4,适合移动设备部署。支持图像分类、特征图提取和图像嵌入等应用,可用于多种计算机视觉任务。
tf_mobilenetv3_small_minimal_100.in1k - MobileNetV3小型化模型:高效移动端图像分类
模型图像分类MobileNet-v3GithubtimmImageNet-1k特征提取开源项目Huggingface
tf_mobilenetv3_small_minimal_100.in1k是一款针对移动设备优化的轻量级图像分类模型。基于MobileNet-v3架构,该模型在ImageNet-1k数据集上训练,仅有200万参数和0.1 GMACs,适用于224x224像素的图像输入。除图像分类外,它还可作为特征提取器用于其他计算机视觉任务。通过timm库,开发者可以方便地加载预训练模型,实现图像分类、特征图提取和图像嵌入等功能。这个模型平衡了性能和效率,特别适合资源受限的移动应用场景。
visformer_small.in1k - 视觉友好型Transformer图像分类模型
模型图像分类GithubtimmImageNet-1k深度学习模型VisformerHuggingface开源项目
visformer_small.in1k是基于Visformer架构的图像分类模型,在ImageNet-1k数据集上训练。该模型采用视觉友好的Transformer设计,平衡了高效性和分类性能。它具有4020万参数,处理224x224尺寸图像,可用于分类任务和特征提取。研究者可通过timm库轻松使用此预训练模型进行图像分析和嵌入生成。
rexnet_100.nav_in1k - 轻量级ReXNet图像分类模型 为资源受限场景提供高效解决方案
模型图像分类ReXNet模型比较GithubImageNet-1k特征提取开源项目Huggingface
rexnet_100.nav_in1k是一款基于ReXNet架构的轻量级图像分类模型,在ImageNet-1k数据集上进行了预训练。该模型仅有4.8M参数和0.4 GMACs,适合在计算资源有限的环境中部署。它支持图像分类、特征图提取和图像嵌入等功能,为开发者提供多样化的应用选择。在ImageNet-1k验证集上,该模型展现出77.832%的Top-1准确率和93.886%的Top-5准确率,在轻量级模型中表现优异。
cait_m36_384.fb_dist_in1k - CaiT图像分类模型:ImageNet-1k预训练的类注意力转换器
图像转换器GithubCaiT模型ImageNet-1k开源项目Huggingface图像分类模型预训练
cait_m36_384.fb_dist_in1k是一个基于类注意力图像转换器(CaiT)的图像分类模型,由Facebook研究团队开发。该模型在ImageNet-1k数据集上进行预训练和蒸馏,包含2.712亿个参数,支持384x384像素的输入图像。通过timm库,它可以轻松应用于图像分类和特征提取等计算机视觉任务。
levit_128.fb_dist_in1k - LeViT-128 轻量级卷积视觉Transformer实现快速图像分类
LeViT开源项目模型比较Huggingface图像分类Github模型预训练模型ImageNet-1k
levit_128.fb_dist_in1k是基于LeViT架构的轻量级图像分类模型,采用卷积模式实现。该模型在ImageNet-1k数据集上经过预训练和蒸馏,拥有920万参数,处理224x224尺寸图像。在0.4 GMACs计算量下实现78.474%的Top-1准确率,体现了高效能与低复杂度的平衡。模型可用于图像分类和特征提取,适合需要快速推理的视觉任务。
vgg19_bn.tv_in1k - VGG19架构的ImageNet预训练图像分类模型
模型VGGImageNet-1k开源项目Huggingface图像分类特征提取Githubtimm
vgg19_bn.tv_in1k是一个在ImageNet-1k数据集上预训练的VGG19模型,拥有1.437亿参数。该模型适用于图像分类、特征提取和嵌入生成等多种计算机视觉任务。通过timm库,用户可以方便地加载和使用这个模型,实现高精度的图像识别功能。模型在保持较高计算效率的同时,还提供了多种使用方式,如图像分类、特征图提取和图像嵌入等。
mnasnet_100.rmsp_in1k - MNasNet轻量级移动端图像分类模型
模型MNasNetImageNet-1k开源项目Huggingface图像分类神经网络架构Githubtimm
mnasnet_100.rmsp_in1k是基于MNasNet架构的轻量级图像分类模型,针对移动设备优化设计。该模型在ImageNet-1k数据集上训练,通过timm库实现。它采用RMSProp优化器和指数衰减学习率,参数量为4.4M,GMACs为0.3,适用于224x224像素图像。模型支持图像分类、特征提取和嵌入等功能,为移动端AI应用提供高效解决方案。
deit_base_patch16_224.fb_in1k - 基于Transformer架构的DeiT图像分类模型
模型神经网络ImageNet-1k开源项目Huggingface图像分类Github深度学习DeiT
deit_base_patch16_224.fb_in1k是一款基于Transformer架构的图像分类模型,在ImageNet-1k数据集上训练。该模型拥有8660万参数,支持224x224像素图像处理,可用于图像分类和嵌入向量生成。通过数据高效训练方法和注意力蒸馏技术,该模型在减少大规模数据依赖的同时保持了高性能。研究人员和开发者可以利用timm库轻松应用此模型进行推理或特征提取。
efficientnet_b1.ra4_e3600_r240_in1k - EfficientNet B1轻量级图像分类模型
模型图像分类pytorch-image-modelsGithubImageNet-1k预训练模型EfficientNetHuggingface开源项目
efficientnet_b1.ra4_e3600_r240_in1k是基于EfficientNet架构的轻量级图像分类模型。该模型在ImageNet-1k数据集上训练,参数量为7.79M,在240x240输入尺寸下达到81.440%的Top-1准确率。它在模型大小和性能之间取得平衡,适用于计算资源有限的应用场景,也可作为特征提取器用于其他计算机视觉任务。
eca_halonext26ts.c1_in1k - 基于ResNeXt架构的HaloNet图像分类模型
模型图像分类GithubtimmImageNet-1kHaloNet特征提取开源项目Huggingface
eca_halonext26ts.c1_in1k是一种基于ResNeXt架构的HaloNet图像分类模型,采用高效通道注意力机制。该模型在timm库中使用ImageNet-1k数据集训练,参数量为10.8M,GMACs为2.4,适用于256x256图像。它结合了ResNet Strikes Back的训练方法和局部自注意力机制,可用于图像分类、特征图提取和图像嵌入等任务。通过灵活的BYOB架构,该模型在保持计算效率的同时提供了良好的性能和可定制性。
inception_resnet_v2.tf_in1k - Inception-ResNet-v2架构的图像分类与特征提取模型
inception_resnet_v2模型图像分类GithubtimmImageNet-1k特征提取开源项目Huggingface
inception_resnet_v2.tf_in1k是基于Inception-ResNet-v2架构的图像分类模型,在ImageNet-1k数据集上训练。模型拥有5580万参数,13.2 GMACs计算量,适用于299x299像素的输入图像。除图像分类外,该模型还支持特征图提取和图像嵌入功能。它在保持较低计算复杂度的同时提供高精度图像识别能力,适用于多种计算机视觉任务。
mobilevit_xs.cvnets_in1k - MobileViT 轻量级通用移动友好的视觉Transformer
特征提取Huggingface图像分类MobileViT模型timmGithub开源项目ImageNet-1k
MobileViT是一种轻量级视觉Transformer模型,专为移动设备设计。mobilevit_xs.cvnets_in1k版本在ImageNet-1k数据集上训练,仅有2.3M参数和1.1 GMACs计算量。该模型适用于图像分类、特征提取和嵌入生成等任务,平衡了性能和资源消耗。它融合了MobileNet的轻量化结构和Vision Transformer的强大特性,为资源受限环境提供了高效解决方案。
mobilenetv3_small_075.lamb_in1k - 移动网络V3小型模型的图像分类与优化方法
特征提取开源项目模型timmGithubHuggingfaceMobileNet-v3ImageNet-1k图像分类
该项目采用MobileNet-v3模型进行图像分类,在ImageNet-1k数据集上通过LAMB优化器和RMSProp优化器进行微调。利用指数衰减学习率调度和EMA权重平均,提高性能表现。模型在特征提取和图像嵌入方面表现出色,适合开发轻量级视觉识别应用。
deit-small-patch16-224 - 数据高效的图像Transformer模型,用于精炼图像分类
图像分类DeiTImageNet-1kHuggingfaceGithub开源项目模型预训练Vision Transformer
Data-efficient Image Transformer(DeiT)小型模型在ImageNet-1k上经过预训练和微调。该模型通过高效的预训练方法和识别精确的标签蒸馏技术实现了性能与效率的平衡。DeiT-small在ImageNet中实现79.9%的top-1准确率,支持PyTorch平台,适合图像分类任务,并可以通过ViTModel或ViTForImageClassification进行应用。
tf_mobilenetv3_large_075.in1k - MobileNet-v3大规模图像分类与特征提取模型
开源项目模型GithubHuggingfaceMobileNetV3深度学习ImageNet-1k图像分类特征图提取
该模型为MobileNet-v3图像分类模型,基于ImageNet-1k数据集在Tensorflow上训练,并由Ross Wightman移植至PyTorch实现。使用224x224图像,拥有4.0百万参数和0.2 GMACs的效率。提供代码示例,帮助实现图像分类、特征提取和图像嵌入。更详细的比较信息可于timm项目页面查阅。
xception41.tf_in1k - Xception架构的高效图像分类神经网络
模型XceptionImageNet-1k开源项目Huggingface图像分类深度学习Githubtimm
xception41.tf_in1k是一款基于Xception架构的图像分类模型,在ImageNet-1k数据集上训练而成。该模型采用深度可分离卷积技术,拥有2700万参数和9.3 GMACs的计算量,支持图像分类、特征图提取和图像嵌入等功能。通过timm库,研究者可以方便地加载预训练模型进行推理或微调。xception41.tf_in1k在维持高精度的同时优化了计算效率,适用于多种计算机视觉任务。
xcit_medium_24_p8_224.fb_in1k - 基于XCiT架构的图像分类与特征提取模型
Huggingface图像分类模型深度学习Github模型预训练XCiT开源项目ImageNet-1k
XCiT是Facebook Research开发的图像分类模型,在ImageNet-1k数据集上完成预训练。模型采用Cross-Covariance Image Transformer架构,拥有8430万参数,支持224x224图像输入分析。通过timm库实现,既可用于图像分类,也可作为特征提取器生成图像嵌入向量,为开发者提供便捷的模型加载和图像处理功能。
xcit_tiny_12_p8_224.fb_in1k - 跨协方差图像转换器实现图像分类与特征提取
神经网络开源项目模型ImageNet-1kXCiT图像分类机器学习GithubHuggingface
基于XCiT(Cross-Covariance Image Transformer)架构开发的图像分类模型,在ImageNet-1k数据集上完成预训练。模型包含670万参数量,GMACs为4.8,支持224x224图像输入分辨率。通过跨协方差注意力机制实现图像特征表示,可用于图像分类和特征提取。模型已集成到timm库中,支持top-k分类预测和特征向量提取功能。
inception_v4.tf_in1k - 面向图像分类的Inception-v4预训练模型
GithubInception-v4图像分类Huggingface深度学习ImageNet-1k开源项目神经网络模型
Inception-v4是一个在ImageNet-1k数据集上预训练的深度学习模型,参数量为4270万,支持299x299图像输入。通过timm库可实现图像分类、特征图提取和图像嵌入等核心功能。该模型从TensorFlow移植至PyTorch,适用于计算机视觉领域的各类图像处理任务。
convit_small.fb_in1k - ConViT结合软卷积特性的图像分类框架
Github图像分类Huggingface深度学习ConViTImageNet-1k开源项目神经网络模型
ConViT是一个在ImageNet-1k数据集上训练的图像分类模型,结合了CNN和Transformer优势。模型参数量2780万,支持224x224图像输入,可用于分类和特征提取任务。模型提供预训练权重,适用于多种计算机视觉应用场景。
resnet152d.ra2_in1k - ResNet152d.ra2_in1k模型在图像分类中的应用与特点
图像分类ResNet-DImageNet-1kRandAugmentHuggingfacetimmGithub开源项目模型
ResNet152d.ra2_in1k是基于ResNet-D架构的图像分类模型,采用ReLU激活和三层3x3卷积stem结构。该模型在ImageNet-1k上训练,并使用RandAugment RA2策略、RMSProp优化器和EMA权重平均进行优化,支持动态学习率调度和特征映射提取,其性能在复杂图像处理任务中表现优秀。
convnextv2_large.fcmae - 用于图像特征提取的自监督卷积模型
图像分类ConvNeXt-V2ImageNet-1k自监督学习HuggingfaceGithub开源项目模型特征提取
ConvNeXt-V2是一种运用全卷积掩码自动编码器框架进行预训练的自监督特征表示模型,适用于微调和特征提取。模型适用于图像分类、特征图提取和图像嵌入,具备较高的参数和计算效率,可在ImageNet-1k等大规模数据集上展现出色表现。通过timm库加载,模型提供了处理多种图像任务的灵活性与精确度,是计算机视觉领域的重要工具。
mobilenetv3_small_050.lamb_in1k - 探索资源有效利用的MobileNet-v3图像分类模型
图像分类Github开源项目timm模型Huggingface特征提取ImageNet-1kMobileNet-v3
该项目展示了在ImageNet-1k上训练的MobileNet-v3图像分类模型,强调其在资源受限环境中的适用性。使用LAMB优化器和EMA权重平均化,该模型参照ResNet Strikes Back设计,通过简化预处理流程,支持图像分类、特征提取和图像嵌入等多种深度学习任务,增强模型性能。
efficientnet_b1.ft_in1k - 基于ImageNet-1k微调的EfficientNet图像分类模型
Github开源项目图像分类PyTorchEfficientNetHuggingface特征图提取ImageNet-1k模型
EfficientNet图像分类模型已在ImageNet-1k上进行微调,适用于PyTorch。该模型参数为7.8M,支持特征图提取和图像嵌入,可用作高效的图像分类工具。
ese_vovnet39b.ra_in1k - 高效实时的VoVNet-v2图像分类解决方案
图像分类Github开源项目timm模型VoVNet-v2Huggingface特征提取ImageNet-1k
VoVNet-v2是一种预训练于ImageNet-1k的图像分类模型,含高效计算和低能耗优点,并采用RandAugment优化。适用于特征骨干网络,支持图像分类、特征提取和图像嵌入。其关键性能包括24.6M参数、7.1 GMACs等。通过`timm`库,用户可以实现高效的图像分类和特征提取。模型使用ResNet Strikes Back的训练方案,提高了准确度和应用多样性。
vgg19.tv_in1k - VGG19深度卷积网络在ImageNet数据集上的图像分类与特征提取
图像分类Github开源项目模型Huggingface特征提取深度卷积网络VGGImageNet-1k
针对图像识别任务,VGG19模型在ImageNet-1k数据集上采用原始的torchvision权重训练,支持224x224像素的输入图像。其140M+参数配置使得模型能够处理复杂的图像特征,包括分类、特征提取和嵌入应用,只需适用模型提供的转换配置即可实现高效部署。
deit3_base_patch16_224.fb_in1k - ImageNet-1k图像分类与嵌入的DeiT-III解决方案
GithubDeiT-III模型ImageNet-1k开源项目模型比较图像分类HuggingfaceImage Embeddings
DeiT-III是一款经过ImageNet-1k训练的图像分类和嵌入模型,拥有86.6M参数以及17.6 GMACs。该模型可以进行图像特征提取与多任务处理,适用于各种视觉应用。对于图形识别及计算机视觉项目的从业者而言,其为ViT提供了一个新的升级途径。
resnet18.fb_swsl_ig1b_ft_in1k - 基于ResNet-B的ReLU激活图像分类模型
Githubtimm库模型ImageNet-1k开源项目ResNet-B半弱监督学习图像分类Huggingface
本项目展示ResNet-B模型,用于图像分类,特征包括ReLU激活、7x7卷积池化和1x1卷积下采样。模型在Instagram-1B数据集上以半监督学习预训练,并在ImageNet-1k数据集上微调,适用于特征提取和图像嵌入。
efficientnet_b2.ra_in1k - EfficientNet B2模型的图像分类能力分析
timmEfficientNetImageNet-1k模型GithubRandAugment开源项目图像分类Huggingface
EfficientNet B2模型在ImageNet-1k数据集上训练,结合RandAugment增强策略和RMSProp优化器,实现卓越的图像分类与特征提取性能。
regnetz_c16.ra3_in1k - 采用灵活配置的RegNetZ模型实现高效图像分类
BYOBNet开源项目模型timmGithubHuggingfaceRegNetZImageNet-1k图像分类
RegNetZ模型在ImageNet-1k上训练后,展现出色的图像分类性能。该模型基于timm库实现,通过BYOBNet灵活配置支持,包括block/stage布局、激活层、归一化层及自注意层等自定义选项。提供多种应用,如图像分类、特征提取及嵌入生成,设计适合处理不同组宽及层配置需求,尤其适用于高精度及灵活性任务。
convnext_atto.d2_in1k - 轻量级ConvNeXt模型,优化图像分类和特征提取
Ross Wightman特征提取开源项目模型GithubHuggingfaceConvNeXtImageNet-1k图像分类
ConvNeXt图像分类模型,经过Ross Wightman在timm库中使用ImageNet-1k数据集训练。其参数为3.7M,计算量为0.6 GMACs,适合高效图像嵌入与特征提取,计算复杂度低但准确度高,适合多种图像分析任务。
inception_next_tiny.sail_in1k - InceptionNeXt架构的轻量级图像分类模型
特征提取开源项目模型timmGithubHuggingfaceImageNet-1kInceptionNeXt图像分类
inception_next_tiny.sail_in1k是基于InceptionNeXt架构的图像分类模型,在ImageNet-1k数据集上训练。该模型结合Inception和ConvNeXt的特点,提供图像分类、特征图提取和图像嵌入功能。模型参数为28.1M,GMACs为4.2,适用于224x224大小的图像输入。它通过timm库提供简洁的API,支持预训练权重,可轻松应用于多种计算机视觉任务。
mobilevit-xx-small - 轻量级移动端视觉转换模型,适用于通用图像分类
图像分类ImageNet-1kMobileViTHuggingfaceGithub开源项目模型Transformer卷积神经网络
MobileViT模型的设计同时保证了轻量和低延迟性能,通过结合MobileNetV2和全局处理变换器块,适合各种图像分类应用。模型无需位置嵌入,已在ImageNet-1k数据集预训练并取得69%的top-1准确率。训练过程中采用简单的数据增强方法,可无须微调即可学到多尺度特征。目前支持PyTorch框架。
convnextv2_huge.fcmae_ft_in22k_in1k_384 - 高级卷积网络用于图像分类与特征提取
图像分类HuggingfaceConvNeXt-V2开源项目模型预训练模型Github特征骨干ImageNet-1k
ConvNeXt-V2是一种先进的卷积网络模型,专为图像分类与特征提取而设计。此模型通过全卷积掩码自编码器进行预训练,并在ImageNet-22k和ImageNet-1k上进行微调。具备660.3M参数和338.0 GMACs的计算成本,专为384x384大小的图像设计,确保高效处理与高精度结果。其在主流图像分类任务中的表现卓越,达到88.668的Top-1准确率和98.738的Top-5准确率,其框架优化适配多种计算场景。