#ImageNet-1k
tf_efficientnet_b0.in1k - 基于EfficientNet架构的tf_efficientnet_b0.in1k模型解析
图像分类ImageNet-1kHuggingfacetimmGithub开源项目模型特征提取EfficientNet
tf_efficientnet_b0.in1k是一个基于EfficientNet架构的图像分类模型,在ImageNet-1k数据集上使用Tensorflow训练,并由Ross Wightman移植到PyTorch。该模型具有5.3M参数和0.4 GMACs,支持细节丰富的224x224像素图像应用。其功能包括图像分类、特征映射提取和图像嵌入,非常适合在timm库中进行各种深度学习研究和应用,提供一种高效的图像处理方案。
mobilenetv3_large_100.ra_in1k - MobileNet-v3 轻量级高效图像分类模型
特征提取Huggingface图像分类模型timmGithub开源项目MobileNet-v3ImageNet-1k
MobileNet-v3是一款针对移动设备优化的图像分类模型。它在ImageNet-1k数据集上训练,采用RandAugment增强技术和RMSProp优化器。模型参数仅5.5M,计算量0.2 GMACs,支持224x224像素输入。除图像分类外,还可用于特征提取和生成图像嵌入,是资源受限环境下的理想选择。
convnext_xxlarge.clip_laion2b_soup_ft_in1k - 大规模预训练的高性能图像分类模型
Huggingface图像分类模型LAIONtimmGithubConvNeXt开源项目ImageNet-1k
ConvNeXt XXLarge是一款基于ConvNeXt架构的高性能图像分类模型。该模型在LAION-2B数据集上进行CLIP预训练,随后在ImageNet-1k上微调,拥有8.46亿参数。在256x256的图像输入下,Top-1准确率达到88.612%。除图像分类外,该模型还支持特征图提取和图像嵌入生成,可为多种计算机视觉任务提供强大支持。
mobilenetv3_small_100.lamb_in1k - MobileNetV3小型模型:轻量级移动设备图像分类方案
模型ImageNet-1k开源项目Huggingface图像分类特征提取MobileNet-v3Githubtimm
MobileNetV3小型模型是一款基于timm库在ImageNet-1k数据集上训练的轻量级图像分类模型。它采用LAMB优化器和EMA权重平均技术,具有2.5M参数和0.1 GMACs的低计算量。该模型支持224x224像素输入,可用于图像分类、特征提取和嵌入生成,适合在移动设备上部署高效的视觉识别应用。
levit_256.fb_dist_in1k - LeViT卷积图像分类模型具备快速推理能力
图像分类Github卷积神经网络开源项目模型比较模型HuggingfaceImageNet-1kLeViT
LeViT图像分类模型利用卷积操作并在ImageNet-1k数据集上预训练,符合快速推理需求。模型参数量为18.9M,适用于不同图像分类任务。通过timm库进行部署,可实现特征提取和多种嵌入应用。
mobilevitv2_075.cvnets_in1k - MobileViT-v2:高效的移动视觉变换器图像分类解决方案
MobileViT-v2图像分类ImageNet-1kSeparable Self-attentionHuggingfaceGithub开源项目模型特征提取
MobileViT-v2是一个高效的移动视觉变换器模型,利用分离自注意力机制优化了图像分类与特征提取。经过ImageNet-1k数据集训练,该模型适配多种计算机视觉任务。模型规格包括2.9M参数和1.1 GMAC,支持256x256图像输入。借助timm库,模型可轻松集成至移动设备的视觉处理应用中。
efficientnetv2_rw_m.agc_in1k - EfficientNetV2模型:图像分类与多功能特征提取
timm模型使用图像分类EfficientNet-v2Huggingface开源项目模型GithubImageNet-1k
EfficientNetV2是一个在timm库中实现的高效图像分类模型。通过使用以ResNet Strikes Back为基础的训练策略和SGD优化器(带Nesterov动量),结合自适应梯度剪裁,模型在ImageNet-1k数据集上进行训练。这一架构轻量且强大,支持包括图像分类、特征提取和图像嵌入的多种图像处理任务。
convnextv2_nano.fcmae_ft_in1k - 基于FCMAE的ConvNeXt-V2高效图像分类与特征提取模型
Github开源项目特征提取图像分类Huggingface深度学习ConvNeXt V2ImageNet-1k模型
ConvNeXt-V2模型通过全卷积掩码自动编码器框架进行预训练,并在ImageNet-1k数据集上进行微调。该模型具备15.6百万参数,支持多种图像尺寸处理,训练尺寸为224x224,测试尺寸为288x288。借助timm库,它可执行图像分类、特征提取和图像嵌入,适用于多种应用场景。
dino-vitb8 - 无需微调,实现高效图像分类的自监督视觉转换器
Github开源项目图像分类Vision Transformer自监督学习Huggingface预训练模型ImageNet-1k模型
Vision Transformer (ViT)模型通过DINO方法进行的自监督训练在ImageNet-1k数据集上预训练,注重提升图像特征提取,无需微调即可应用于图像分类,兼顾多种下游任务。可根据任务需求选择合适的微调版本。
deit_base_distilled_patch16_224.fb_in1k - DeiT图像分类模型 结合注意力蒸馏技术
模型ImageNet-1k开源项目Huggingface图像分类特征提取GithubtimmDeiT
DeiT_base_distilled_patch16_224.fb_in1k是一个在ImageNet-1k数据集上训练的图像分类模型,采用注意力蒸馏技术优化性能。模型包含8730万个参数,支持224x224像素图像输入。除图像分类外,还可用于特征提取。通过timm库可轻松调用,适用于图像分类和嵌入向量提取。该模型在精度和效率方面表现均衡,可广泛应用于计算机视觉任务。
regnety_002.pycls_in1k - 轻量级RegNetY模型用于图像分类与特征提取
模型ImageNet-1k开源项目Huggingface图像分类RegNetY深度学习Githubtimm
RegNetY-200MF是一款在ImageNet-1k上预训练的轻量级图像分类模型。它具有3.2M的参数量和0.2 GMACs的计算量,适用于资源受限场景。该模型不仅可进行图像分类,还可作为特征提取的主干网络。timm实现添加了随机深度、梯度检查点等增强功能,提升了模型性能和灵活性。RegNetY-200MF可用于图像分类、特征图提取和图像嵌入等多种任务。
mobilevit_s.cvnets_in1k - MobileViT 轻量级通用移动友好的图像分类模型
特征提取Huggingface图像分类MobileViT模型timmGithub开源项目ImageNet-1k
mobilevit_s.cvnets_in1k是一款基于MobileViT架构的图像分类模型,在ImageNet-1k数据集上进行了训练。该模型仅有5.6M参数和2.0 GMACs计算量,体现了其轻量级特性。它不仅可用于图像分类,还支持特征图提取和图像嵌入等功能。通过融合MobileNet的效率和Vision Transformer的性能,这个模型特别适合在计算资源有限的移动设备上应用。
pnasnet5large.tf_in1k - PNASNet大规模图像分类与特征提取模型
模型PNasNetImageNet-1k开源项目Huggingface图像分类特征提取Github深度学习
pnasnet5large.tf_in1k是基于Progressive Neural Architecture Search技术开发的图像分类模型,在ImageNet-1k数据集上训练而成。该模型拥有8610万参数,计算量为25.0 GMACs,支持331x331像素的图像输入。它不仅可用于图像分类,还能进行特征图提取和图像嵌入。研究人员和开发者可通过timm库轻松调用此预训练模型,提高图像处理效率。
poolformer_m36.sail_in1k - MetaFormer架构的PoolFormer图像分类与特征提取模型
模型ImageNet-1kPoolFormer开源项目Huggingface图像分类MetaFormerGithubtimm
poolformer_m36.sail_in1k是一个基于MetaFormer架构的PoolFormer图像分类模型,在ImageNet-1k数据集上训练。该模型拥有5620万参数,支持图像分类、特征图提取和图像嵌入等功能。它能高效处理224x224大小的图像,在保持性能的同时降低计算复杂度。研究人员和开发者可通过timm库轻松使用这一预训练模型,应用于多种计算机视觉任务。
hrnet_w18.ms_aug_in1k - HRNet W18图像分类模型 基于ImageNet-1k训练
模型图像分类GithubtimmImageNet-1kHRNet特征提取开源项目Huggingface
hrnet_w18.ms_aug_in1k是HRNet团队开发的图像分类模型,在ImageNet-1k数据集上训练。该模型拥有2130万参数,4.3 GMACs计算复杂度,可用于图像分类、特征图提取和图像嵌入。模型提供高分辨率视觉表征,适用于多种计算机视觉任务。通过timm库可方便地加载和使用这一预训练模型。
selecsls42b.in1k - SelecSLS图像分类模型实现实时多人3D动作捕捉
模型ImageNet-1k开源项目HuggingfaceSelecSLS图像分类特征提取Githubtimm
selecsls42b.in1k是基于ImageNet-1k数据集训练的SelecSLS图像分类模型,拥有3200万参数和3.0 GMACs计算量。该模型支持224x224图像输入,可用于图像分类、特征提取和嵌入生成。其独特之处在于能利用单个RGB相机实现实时多人3D动作捕捉,在效率和性能方面表现优异。模型源自XNect项目,代码已在GitHub开源。
eca_botnext26ts_256.c1_in1k - 基于ResNeXt架构的BotNet高效图像分类模型
特征提取BotNet图像分类Huggingface模型timmGithub开源项目ImageNet-1k
这是一个基于ResNeXt架构的BotNet图像分类模型,采用高效通道注意力机制。该模型在ImageNet-1k数据集上训练,使用SGD优化器和自适应梯度裁剪技术。模型包含1060万参数,支持256x256像素图像处理。除图像分类外,还可用于特征图提取和图像嵌入,适用于多种计算机视觉任务。
dm_nfnet_f0.dm_in1k - NFNet:无归一化层的高效图像分类模型
模型ImageNet-1kNFNet开源项目Huggingface图像分类特征提取Githubtimm
dm_nfnet_f0.dm_in1k是一款基于NFNet(无归一化网络)架构的图像分类模型。该模型在ImageNet-1k数据集上训练,拥有7150万参数,计算量为7.2 GMACs。通过采用Scaled Weight Standardization技术和策略性放置的标量增益,该模型无需使用归一化层即可实现高性能。dm_nfnet_f0.dm_in1k适用于图像分类、特征提取和图像嵌入等多种任务,为大规模图像识别应用提供了高效解决方案。
nfnet_l0.ra2_in1k - 轻量级NFNet模型:无需规范化层的高效图像识别
模型ImageNet-1kNFNet开源项目Huggingface图像分类特征提取Githubtimm
nfnet_l0.ra2_in1k是一种创新的轻量级NFNet图像分类模型,摒弃了传统的规范化层。它通过Scaled Weight Standardization和策略性放置的标量增益,实现了高效的大规模图像识别。基于ImageNet-1k数据集训练,该模型拥有3510万参数,适用于图像分类、特征提取和嵌入任务。这种无需常规规范化层的设计,为高性能图像处理提供了新的可能。
pit_b_224.in1k - 基于池化的视觉Transformer图像分类模型PiT
模型图像分类特征提取GithubtimmImageNet-1kPiT开源项目Huggingface
pit_b_224.in1k是一个基于池化的视觉Transformer(PiT)图像分类模型,在ImageNet-1k数据集上训练。该模型拥有7380万个参数,计算量为12.4 GMACs,支持224x224像素的输入图像。它可用于图像分类、特征图提取和图像嵌入等任务,在保持高精度的同时提高了计算效率。研究人员和开发者可通过timm库轻松加载并使用这个预训练模型。
dpn107.mx_in1k - Dual-Path Networks图像分类模型:ImageNet-1k数据集的高性能解决方案
特征提取Huggingface图像分类DPN模型timmGithub开源项目ImageNet-1k
dpn107.mx_in1k是一款基于Dual-Path Networks架构的图像分类模型,针对ImageNet-1k数据集优化。该模型拥有8690万参数和18.4 GMACs计算量,支持224x224像素的图像输入。最初由论文作者在MXNet框架上训练,后经Ross Wightman移植至PyTorch。除图像分类外,还可用于特征图提取和图像嵌入,为各种计算机视觉应用提供有力支持。
lcnet_050.ra2_in1k - LCNet轻量级神经网络模型实现高效图像分类和特征提取
LCNet特征提取Huggingface图像分类模型timmGithub开源项目ImageNet-1k
lcnet_050.ra2_in1k是基于LCNet架构的轻量级图像分类模型,在ImageNet-1k数据集上训练。模型采用RandAugment增强和RMSProp优化,参数量仅1.9M,支持224x224输入。可用于图像分类、特征提取和嵌入生成,适合CPU运行,为计算资源有限的场景提供高效解决方案。
convit_base.fb_in1k - ConViT架构图像分类模型在ImageNet-1k上的应用
ConViTHuggingface图像分类模型深度学习timmGithub开源项目ImageNet-1k
convit_base.fb_in1k是一个在ImageNet-1k数据集上训练的ConViT架构图像分类模型。该模型融合卷积神经网络和视觉Transformer技术,拥有8650万参数,计算量为17.5 GMACs。它支持224x224尺寸的输入图像,可用于图像分类和特征提取。研究者可通过timm库加载此预训练模型,进行图像分类或提取图像嵌入向量等任务。
res2net101_26w_4s.in1k - Res2Net101多尺度骨干网络实现高效图像分类和特征提取
特征提取Huggingface图像分类模型Res2NettimmGithub开源项目ImageNet-1k
res2net101_26w_4s.in1k是基于Res2Net架构的图像分类模型,通过ImageNet-1k数据集训练而成。该模型采用多尺度设计,在图像分类和特征提取方面表现优异。它拥有4520万个参数,适用于224x224尺寸的图像处理。除图像分类外,还支持特征图提取和图像嵌入功能。研究人员和开发者可通过timm库便捷地将此模型应用于多种计算机视觉任务。
fbnetc_100.rmsp_in1k - FBNetC-100:轻量级移动设备图像分类模型
FBNet模型图像分类神经网络架构搜索GithubtimmImageNet-1kHuggingface开源项目
fbnetc_100.rmsp_in1k是基于FBNet架构的轻量级图像分类模型,在ImageNet-1k数据集上训练。该模型仅有5.6M参数和0.4 GMACs,适用于224x224图像输入,专为移动设备优化。通过timm库,可轻松实现图像分类、特征图提取和图像嵌入等功能。模型采用RMSProp优化器和指数衰减学习率,平衡了性能和效率。
crossvit_9_240.in1k - 跨注意力多尺度视觉Transformer图像分类模型
Huggingface图像分类模型深度学习CrossViTGithub开源项目神经网络模型ImageNet-1k
CrossViT 9 240是IBM开发的图像分类模型,基于CrossViT架构设计。该模型在ImageNet-1k数据集上训练,参数量为8.6M,适用于240x240分辨率图像。模型采用跨注意力多尺度Vision Transformer技术,可高效提取图像特征,适用于图像分类和特征提取任务。研究人员和开发者可通过timm库使用该预训练模型进行推理或微调。
mobilenetv2_100.ra_in1k - 轻量级CNN模型实现图像分类与特征提取
特征提取MobileNetV2Huggingface图像分类模型timmGithub开源项目ImageNet-1k
MobileNetV2是为移动和嵌入式视觉应用设计的轻量级卷积神经网络。该模型在ImageNet-1k数据集上训练,采用RandAugment数据增强和EMA权重平均技术。MobileNetV2在低计算复杂度下实现了高效的图像分类和特征提取。通过timm库,开发者可以便捷地加载预训练模型,实现图像分类、特征图提取和图像嵌入等功能。
botnet26t_256.c1_in1k - BotNet:结合自注意力机制的ResNet变体图像分类模型
BotNet特征提取开源项目Huggingface模型图像分类GithubtimmImageNet-1k
botnet26t_256.c1_in1k是一个结合ResNet架构和自注意力机制的图像分类模型。该模型采用灵活的BYOBNet设计,支持自定义网络结构。在ImageNet-1k数据集上训练,拥有1250万参数,适用于图像分类、特征提取和嵌入生成。模型整合了ResNet的优势和注意力机制,在视觉识别任务中表现出色。
gmixer_24_224.ra3_in1k - MLP-Mixer变体:采用SwiGLU的图像分类和特征提取模型
模型神经网络ImageNet-1k开源项目Huggingface图像分类机器学习模型Githubtimm
gmixer_24_224.ra3_in1k是一个基于MLP-Mixer架构的图像分类模型,在timm库中由Ross Wightman开发。该模型采用SwiGLU激活函数,在ImageNet-1k数据集上训练,拥有2470万参数,计算复杂度为5.3 GMACs。它支持224x224尺寸的图像输入,可用于图像分类和特征提取。模型提供简洁的API,便于进行图像分类和嵌入提取,适用于多种计算机视觉应用场景。
swinv2_tiny_window8_256.ms_in1k - Swin Transformer V2轻量级图像分类与特征提取模型
模型ImageNet-1k开源项目Huggingface图像分类特征提取Swin Transformer V2Githubtimm
swinv2_tiny_window8_256.ms_in1k是基于Swin Transformer V2架构的轻量级图像分类模型,在ImageNet-1k数据集上预训练。该模型拥有2830万参数,6.0 GMACs计算量,支持256x256像素输入。它可用于图像分类、特征图提取和图像嵌入等任务,提供高效的视觉特征提取能力。研究人员和开发者可通过timm库轻松加载此预训练模型,应用于多种计算机视觉项目。
inception_v3.tf_adv_in1k - Inception-v3对抗训练图像分类模型
模型ImageNet-1k开源项目HuggingfaceInception-v3图像分类特征提取Githubtimm
inception_v3.tf_adv_in1k是一个基于Inception-v3架构的图像分类模型,通过对抗训练提高了抗干扰能力。该模型在ImageNet-1k数据集上训练,参数量为23.8M,适用于299x299像素的图像输入。它可用于图像分类、特征提取和嵌入生成,为计算机视觉任务提供了versatile工具。
sebotnet33ts_256.a1h_in1k - 结合ResNet与自注意力的高性能图像分类模型
模型图像分类GithubtimmImageNet-1k深度学习BotNetHuggingface开源项目
sebotnet33ts_256.a1h_in1k是一个融合ResNet架构和BotNet设计的图像分类模型,整合了Squeeze-and-Excitation通道注意力机制。该模型在ImageNet-1k数据集上训练,通过timm库实现。它采用LAMB优化器、强化的dropout和随机深度技术,以及余弦学习率调度。模型提供灵活的配置选项,包括块/阶段布局和注意力层等,适用于图像分类和特征提取任务。其平衡了性能和训练效率,为计算机视觉领域提供了实用的解决方案。
mixnet_l.ft_in1k - MixNet-L:轻量级混合深度卷积网络实现高效图像分类
模型图像分类MixNetGithubtimmImageNet-1k特征提取开源项目Huggingface
mixnet_l.ft_in1k是一个在ImageNet-1k数据集上微调的MixNet架构图像分类模型。该模型采用混合深度卷积核,参数量仅为7.3M,计算量为0.6 GMACs,实现了高效的分类性能。支持224x224像素输入,可用于图像分类、特征提取和生成图像嵌入。作为一个轻量级yet性能出色的视觉特征提取器,适用于多种计算机视觉应用场景。
gernet_l.idstcv_in1k - GENet架构的GPU高效图像分类模型
GENetImageNet-1k深度学习模型Huggingface开源项目模型图像分类Githubtimm
gernet_l.idstcv_in1k是基于GENet架构的图像分类模型,通过timm库实现并在ImageNet-1k数据集上训练。该模型利用BYOBNet实现灵活配置,支持随机深度和梯度检查点等特性。拥有3110万参数的gernet_l.idstcv_in1k可用于图像分类、特征提取和嵌入生成。模型提供多种使用示例,适用于图像分类、特征图提取等多种计算机视觉任务。
coat_lite_mini.in1k - CoaT图像分类模型:轻量级卷积注意力变换器
Huggingface图像分类模型timmGithub开源项目CoaT神经网络模型ImageNet-1k
coat_lite_mini.in1k是一种轻量级CoaT(Co-Scale Conv-Attentional Transformer)图像分类模型,在ImageNet-1k数据集上训练。该模型仅有1100万参数,适用于224x224像素的图像处理。它可通过timm库轻松加载,用于图像分类和特征提取。创新的卷积注意力机制使其在保持低计算复杂度的同时,实现高效的图像特征提取。这个模型展示了如何在轻量级设计中融合卷积和注意力机制的优势。
resnest14d.gluon_in1k - ResNeSt14d:基于分割注意力机制的深度学习模型
timm特征提取ImageNet-1k模型Github开源项目图像分类ResNeStHuggingface
ResNeSt14d是一款基于ResNet的分割注意力图像分类模型,由研究团队在ImageNet-1k数据集上训练。此模型拥有10.6M的参数和2.8 GMACs,支持224x224的图像尺寸。提供多种功能,包括图像分类、特征提取和图像嵌入。通过timm库实现预训练模型调用,支持快速有效的图像分析和计算机视觉任务。