#ImageNet-1k
resnest14d.gluon_in1k - ResNeSt14d:基于分割注意力机制的深度学习模型
timm特征提取ImageNet-1k模型Github开源项目图像分类ResNeStHuggingface
ResNeSt14d是一款基于ResNet的分割注意力图像分类模型,由研究团队在ImageNet-1k数据集上训练。此模型拥有10.6M的参数和2.8 GMACs,支持224x224的图像尺寸。提供多种功能,包括图像分类、特征提取和图像嵌入。通过timm库实现预训练模型调用,支持快速有效的图像分析和计算机视觉任务。
tf_efficientnet_b0.in1k - 基于EfficientNet架构的tf_efficientnet_b0.in1k模型解析
图像分类ImageNet-1kHuggingfacetimmGithub开源项目模型特征提取EfficientNet
tf_efficientnet_b0.in1k是一个基于EfficientNet架构的图像分类模型,在ImageNet-1k数据集上使用Tensorflow训练,并由Ross Wightman移植到PyTorch。该模型具有5.3M参数和0.4 GMACs,支持细节丰富的224x224像素图像应用。其功能包括图像分类、特征映射提取和图像嵌入,非常适合在timm库中进行各种深度学习研究和应用,提供一种高效的图像处理方案。
levit_256.fb_dist_in1k - LeViT卷积图像分类模型具备快速推理能力
图像分类Github卷积神经网络开源项目模型比较模型HuggingfaceImageNet-1kLeViT
LeViT图像分类模型利用卷积操作并在ImageNet-1k数据集上预训练,符合快速推理需求。模型参数量为18.9M,适用于不同图像分类任务。通过timm库进行部署,可实现特征提取和多种嵌入应用。
mobilevitv2_075.cvnets_in1k - MobileViT-v2:高效的移动视觉变换器图像分类解决方案
MobileViT-v2图像分类ImageNet-1kSeparable Self-attentionHuggingfaceGithub开源项目模型特征提取
MobileViT-v2是一个高效的移动视觉变换器模型,利用分离自注意力机制优化了图像分类与特征提取。经过ImageNet-1k数据集训练,该模型适配多种计算机视觉任务。模型规格包括2.9M参数和1.1 GMAC,支持256x256图像输入。借助timm库,模型可轻松集成至移动设备的视觉处理应用中。
efficientnetv2_rw_m.agc_in1k - EfficientNetV2模型:图像分类与多功能特征提取
timm模型使用图像分类EfficientNet-v2Huggingface开源项目模型GithubImageNet-1k
EfficientNetV2是一个在timm库中实现的高效图像分类模型。通过使用以ResNet Strikes Back为基础的训练策略和SGD优化器(带Nesterov动量),结合自适应梯度剪裁,模型在ImageNet-1k数据集上进行训练。这一架构轻量且强大,支持包括图像分类、特征提取和图像嵌入的多种图像处理任务。
convnextv2_nano.fcmae_ft_in1k - 基于FCMAE的ConvNeXt-V2高效图像分类与特征提取模型
Github开源项目特征提取图像分类Huggingface深度学习ConvNeXt V2ImageNet-1k模型
ConvNeXt-V2模型通过全卷积掩码自动编码器框架进行预训练,并在ImageNet-1k数据集上进行微调。该模型具备15.6百万参数,支持多种图像尺寸处理,训练尺寸为224x224,测试尺寸为288x288。借助timm库,它可执行图像分类、特征提取和图像嵌入,适用于多种应用场景。
dino-vitb8 - 无需微调,实现高效图像分类的自监督视觉转换器
Github开源项目图像分类Vision Transformer自监督学习Huggingface预训练模型ImageNet-1k模型
Vision Transformer (ViT)模型通过DINO方法进行的自监督训练在ImageNet-1k数据集上预训练,注重提升图像特征提取,无需微调即可应用于图像分类,兼顾多种下游任务。可根据任务需求选择合适的微调版本。
mobilevit_xs.cvnets_in1k - MobileViT 轻量级通用移动友好的视觉Transformer
特征提取Huggingface图像分类MobileViT模型timmGithub开源项目ImageNet-1k
MobileViT是一种轻量级视觉Transformer模型,专为移动设备设计。mobilevit_xs.cvnets_in1k版本在ImageNet-1k数据集上训练,仅有2.3M参数和1.1 GMACs计算量。该模型适用于图像分类、特征提取和嵌入生成等任务,平衡了性能和资源消耗。它融合了MobileNet的轻量化结构和Vision Transformer的强大特性,为资源受限环境提供了高效解决方案。
mobilenetv3_small_075.lamb_in1k - 移动网络V3小型模型的图像分类与优化方法
特征提取开源项目模型timmGithubHuggingfaceMobileNet-v3ImageNet-1k图像分类
该项目采用MobileNet-v3模型进行图像分类,在ImageNet-1k数据集上通过LAMB优化器和RMSProp优化器进行微调。利用指数衰减学习率调度和EMA权重平均,提高性能表现。模型在特征提取和图像嵌入方面表现出色,适合开发轻量级视觉识别应用。
deit-small-patch16-224 - 数据高效的图像Transformer模型,用于精炼图像分类
图像分类DeiTImageNet-1kHuggingfaceGithub开源项目模型预训练Vision Transformer
Data-efficient Image Transformer(DeiT)小型模型在ImageNet-1k上经过预训练和微调。该模型通过高效的预训练方法和识别精确的标签蒸馏技术实现了性能与效率的平衡。DeiT-small在ImageNet中实现79.9%的top-1准确率,支持PyTorch平台,适合图像分类任务,并可以通过ViTModel或ViTForImageClassification进行应用。
tf_mobilenetv3_large_075.in1k - MobileNet-v3大规模图像分类与特征提取模型
开源项目模型GithubHuggingfaceMobileNetV3深度学习ImageNet-1k图像分类特征图提取
该模型为MobileNet-v3图像分类模型,基于ImageNet-1k数据集在Tensorflow上训练,并由Ross Wightman移植至PyTorch实现。使用224x224图像,拥有4.0百万参数和0.2 GMACs的效率。提供代码示例,帮助实现图像分类、特征提取和图像嵌入。更详细的比较信息可于timm项目页面查阅。
xception41.tf_in1k - Xception架构的高效图像分类神经网络
模型XceptionImageNet-1k开源项目Huggingface图像分类深度学习Githubtimm
xception41.tf_in1k是一款基于Xception架构的图像分类模型,在ImageNet-1k数据集上训练而成。该模型采用深度可分离卷积技术,拥有2700万参数和9.3 GMACs的计算量,支持图像分类、特征图提取和图像嵌入等功能。通过timm库,研究者可以方便地加载预训练模型进行推理或微调。xception41.tf_in1k在维持高精度的同时优化了计算效率,适用于多种计算机视觉任务。
xcit_medium_24_p8_224.fb_in1k - 基于XCiT架构的图像分类与特征提取模型
Huggingface图像分类模型深度学习Github模型预训练XCiT开源项目ImageNet-1k
XCiT是Facebook Research开发的图像分类模型,在ImageNet-1k数据集上完成预训练。模型采用Cross-Covariance Image Transformer架构,拥有8430万参数,支持224x224图像输入分析。通过timm库实现,既可用于图像分类,也可作为特征提取器生成图像嵌入向量,为开发者提供便捷的模型加载和图像处理功能。
xcit_tiny_12_p8_224.fb_in1k - 跨协方差图像转换器实现图像分类与特征提取
神经网络开源项目模型ImageNet-1kXCiT图像分类机器学习GithubHuggingface
基于XCiT(Cross-Covariance Image Transformer)架构开发的图像分类模型,在ImageNet-1k数据集上完成预训练。模型包含670万参数量,GMACs为4.8,支持224x224图像输入分辨率。通过跨协方差注意力机制实现图像特征表示,可用于图像分类和特征提取。模型已集成到timm库中,支持top-k分类预测和特征向量提取功能。
inception_v4.tf_in1k - 面向图像分类的Inception-v4预训练模型
GithubInception-v4图像分类Huggingface深度学习ImageNet-1k开源项目神经网络模型
Inception-v4是一个在ImageNet-1k数据集上预训练的深度学习模型,参数量为4270万,支持299x299图像输入。通过timm库可实现图像分类、特征图提取和图像嵌入等核心功能。该模型从TensorFlow移植至PyTorch,适用于计算机视觉领域的各类图像处理任务。
convit_small.fb_in1k - ConViT结合软卷积特性的图像分类框架
Github图像分类Huggingface深度学习ConViTImageNet-1k开源项目神经网络模型
ConViT是一个在ImageNet-1k数据集上训练的图像分类模型,结合了CNN和Transformer优势。模型参数量2780万,支持224x224图像输入,可用于分类和特征提取任务。模型提供预训练权重,适用于多种计算机视觉应用场景。
resnet152d.ra2_in1k - ResNet152d.ra2_in1k模型在图像分类中的应用与特点
图像分类ResNet-DImageNet-1kRandAugmentHuggingfacetimmGithub开源项目模型
ResNet152d.ra2_in1k是基于ResNet-D架构的图像分类模型,采用ReLU激活和三层3x3卷积stem结构。该模型在ImageNet-1k上训练,并使用RandAugment RA2策略、RMSProp优化器和EMA权重平均进行优化,支持动态学习率调度和特征映射提取,其性能在复杂图像处理任务中表现优秀。
convnextv2_large.fcmae - 用于图像特征提取的自监督卷积模型
图像分类ConvNeXt-V2ImageNet-1k自监督学习HuggingfaceGithub开源项目模型特征提取
ConvNeXt-V2是一种运用全卷积掩码自动编码器框架进行预训练的自监督特征表示模型,适用于微调和特征提取。模型适用于图像分类、特征图提取和图像嵌入,具备较高的参数和计算效率,可在ImageNet-1k等大规模数据集上展现出色表现。通过timm库加载,模型提供了处理多种图像任务的灵活性与精确度,是计算机视觉领域的重要工具。
mobilenetv3_small_050.lamb_in1k - 探索资源有效利用的MobileNet-v3图像分类模型
图像分类Github开源项目timm模型Huggingface特征提取ImageNet-1kMobileNet-v3
该项目展示了在ImageNet-1k上训练的MobileNet-v3图像分类模型,强调其在资源受限环境中的适用性。使用LAMB优化器和EMA权重平均化,该模型参照ResNet Strikes Back设计,通过简化预处理流程,支持图像分类、特征提取和图像嵌入等多种深度学习任务,增强模型性能。
efficientnet_b1.ft_in1k - 基于ImageNet-1k微调的EfficientNet图像分类模型
Github开源项目图像分类PyTorchEfficientNetHuggingface特征图提取ImageNet-1k模型
EfficientNet图像分类模型已在ImageNet-1k上进行微调,适用于PyTorch。该模型参数为7.8M,支持特征图提取和图像嵌入,可用作高效的图像分类工具。
ese_vovnet39b.ra_in1k - 高效实时的VoVNet-v2图像分类解决方案
图像分类Github开源项目timm模型VoVNet-v2Huggingface特征提取ImageNet-1k
VoVNet-v2是一种预训练于ImageNet-1k的图像分类模型,含高效计算和低能耗优点,并采用RandAugment优化。适用于特征骨干网络,支持图像分类、特征提取和图像嵌入。其关键性能包括24.6M参数、7.1 GMACs等。通过`timm`库,用户可以实现高效的图像分类和特征提取。模型使用ResNet Strikes Back的训练方案,提高了准确度和应用多样性。
vgg19.tv_in1k - VGG19深度卷积网络在ImageNet数据集上的图像分类与特征提取
图像分类Github开源项目模型Huggingface特征提取深度卷积网络VGGImageNet-1k
针对图像识别任务,VGG19模型在ImageNet-1k数据集上采用原始的torchvision权重训练,支持224x224像素的输入图像。其140M+参数配置使得模型能够处理复杂的图像特征,包括分类、特征提取和嵌入应用,只需适用模型提供的转换配置即可实现高效部署。
deit3_base_patch16_224.fb_in1k - ImageNet-1k图像分类与嵌入的DeiT-III解决方案
GithubDeiT-III模型ImageNet-1k开源项目模型比较图像分类HuggingfaceImage Embeddings
DeiT-III是一款经过ImageNet-1k训练的图像分类和嵌入模型,拥有86.6M参数以及17.6 GMACs。该模型可以进行图像特征提取与多任务处理,适用于各种视觉应用。对于图形识别及计算机视觉项目的从业者而言,其为ViT提供了一个新的升级途径。
resnet18.fb_swsl_ig1b_ft_in1k - 基于ResNet-B的ReLU激活图像分类模型
Githubtimm库模型ImageNet-1k开源项目ResNet-B半弱监督学习图像分类Huggingface
本项目展示ResNet-B模型,用于图像分类,特征包括ReLU激活、7x7卷积池化和1x1卷积下采样。模型在Instagram-1B数据集上以半监督学习预训练,并在ImageNet-1k数据集上微调,适用于特征提取和图像嵌入。
efficientnet_b2.ra_in1k - EfficientNet B2模型的图像分类能力分析
timmEfficientNetImageNet-1k模型GithubRandAugment开源项目图像分类Huggingface
EfficientNet B2模型在ImageNet-1k数据集上训练,结合RandAugment增强策略和RMSProp优化器,实现卓越的图像分类与特征提取性能。
regnetz_c16.ra3_in1k - 采用灵活配置的RegNetZ模型实现高效图像分类
BYOBNet开源项目模型timmGithubHuggingfaceRegNetZImageNet-1k图像分类
RegNetZ模型在ImageNet-1k上训练后,展现出色的图像分类性能。该模型基于timm库实现,通过BYOBNet灵活配置支持,包括block/stage布局、激活层、归一化层及自注意层等自定义选项。提供多种应用,如图像分类、特征提取及嵌入生成,设计适合处理不同组宽及层配置需求,尤其适用于高精度及灵活性任务。
convnext_atto.d2_in1k - 轻量级ConvNeXt模型,优化图像分类和特征提取
Ross Wightman特征提取开源项目模型GithubHuggingfaceConvNeXtImageNet-1k图像分类
ConvNeXt图像分类模型,经过Ross Wightman在timm库中使用ImageNet-1k数据集训练。其参数为3.7M,计算量为0.6 GMACs,适合高效图像嵌入与特征提取,计算复杂度低但准确度高,适合多种图像分析任务。
inception_next_tiny.sail_in1k - InceptionNeXt架构的轻量级图像分类模型
特征提取开源项目模型timmGithubHuggingfaceImageNet-1kInceptionNeXt图像分类
inception_next_tiny.sail_in1k是基于InceptionNeXt架构的图像分类模型,在ImageNet-1k数据集上训练。该模型结合Inception和ConvNeXt的特点,提供图像分类、特征图提取和图像嵌入功能。模型参数为28.1M,GMACs为4.2,适用于224x224大小的图像输入。它通过timm库提供简洁的API,支持预训练权重,可轻松应用于多种计算机视觉任务。
mobilevit-xx-small - 轻量级移动端视觉转换模型,适用于通用图像分类
图像分类ImageNet-1kMobileViTHuggingfaceGithub开源项目模型Transformer卷积神经网络
MobileViT模型的设计同时保证了轻量和低延迟性能,通过结合MobileNetV2和全局处理变换器块,适合各种图像分类应用。模型无需位置嵌入,已在ImageNet-1k数据集预训练并取得69%的top-1准确率。训练过程中采用简单的数据增强方法,可无须微调即可学到多尺度特征。目前支持PyTorch框架。
convnextv2_huge.fcmae_ft_in22k_in1k_384 - 高级卷积网络用于图像分类与特征提取
图像分类HuggingfaceConvNeXt-V2开源项目模型预训练模型Github特征骨干ImageNet-1k
ConvNeXt-V2是一种先进的卷积网络模型,专为图像分类与特征提取而设计。此模型通过全卷积掩码自编码器进行预训练,并在ImageNet-22k和ImageNet-1k上进行微调。具备660.3M参数和338.0 GMACs的计算成本,专为384x384大小的图像设计,确保高效处理与高精度结果。其在主流图像分类任务中的表现卓越,达到88.668的Top-1准确率和98.738的Top-5准确率,其框架优化适配多种计算场景。
repvit_m1.dist_in1k - ImageNet-1k高效图像分类与特征提取开源项目
图像分类Github开源项目timmRepViT模型Huggingface特征提取ImageNet-1k
repvit_m1.dist_in1k是RepViT家族中的高效图像分类模型,专为ImageNet-1k数据集优化,应用蒸馏技术增强性能。模型参数为5.5M,0.8 GMACs,支持224x224图像尺寸。设计灵感源于对移动CNN的创新探索,结合ViT视角。详情请参考相关arXiv文献。该模型能够执行图像分类、特征提取和图像嵌入等任务,适合的研究和工程应用。
convnext_atto_ols.a2_in1k - 高效的ConvNeXt模型实现图像分类与特征提取
图像分类HuggingfaceImageNet-1k特征提取开源项目模型Github图像嵌入ConvNeXt
本项目提供一个基于ImageNet-1k数据集优化的ConvNeXt图像分类模型,其低参数量和高效计算性能使其成为图像处理任务(如特征图提取和图像嵌入生成)的理想选择。该模型在timm库中训练,支持快速且准确的分类任务,并适用于多种计算需求。
tinynet_e.in1k - TinyNet模型在ImageNet-1k上的应用与性能分析
timm特征提取ImageNet-1k模型Github开源项目图像分类tinynet_e.in1kHuggingface
TinyNet是一个旨在优化图像分类和特征提取的模型,通过调整分辨率、深度和宽度,在ImageNet-1k上进行训练。模型参数量为2.0M,并具有低计算负荷。提供简便的代码示例以支持图像分类、特征图提取和图像嵌入,可用于多种图像处理场景。同时,通过timm库探索其指标表现,更深入了解其在神经信息处理中的应用。
efficientnetv2_rw_t.ra2_in1k - EfficientNet-v2的模型特点与应用分析
Github模型ImageNet-1k开源项目图像分类EfficientNet-v2timmHuggingface特征提取
EfficientNet-v2是一个专注于图像分类的高效模型,采用RandAugment策略在ImageNet-1k数据集上训练,具有参数少、训练快的特点。通过timm库实现,支持特征图提取和图像嵌入等多种功能。其结构设计为强大的特征骨干提供了基础。
tf_efficientnet_lite0.in1k - 轻量级EfficientNet-Lite模型实现高效图像分类与特征提取
EfficientNet-LiteGithub模型ImageNet-1k开源项目图像分类Huggingface模型对比特征提取
EfficientNet-Lite0是一款专为高效图像分类和特征提取设计的模型,经过ImageNet-1k训练。该模型已被迁移至PyTorch,并利用timm库进行图像嵌入和特征图提取。在4.7M参数和0.4 GMACs的架构下,实现了高效性能与计算资源节约,适合作为多种视觉任务的解决方案。
rexnet_150.nav_in1k - 高效的图像识别与特征提取
timmReXNet特征提取ImageNet-1k模型Github开源项目图像分类Huggingface
ReXNet是一款在ImageNet-1k数据集上预训练的图像分类模型,具有9.7M参数和0.9 GMACs,专为224x224尺寸图像设计。在timm库中实现模型调用,支持图像分类、特征地图提取及嵌入计算,堪称参数量与准确率之间的理想平衡,适用于深度学习研究和开发。