项目简介:efficientnetv2_rw_t.ra2_in1k
概述
efficientnetv2_rw_t.ra2_in1k是一个用于图像分类的模型,该模型基于EfficientNet-v2架构。这是一种由timm
库特定变体的架构,并在ImageNet-1k数据集上经过训练。项目采用了一些独特的训练策略以提高模型的性能和效率。
训练细节
该模型采用了RA2
(RandAugment 2)训练策略,这是从EfficientNet RandAugment策略中演变而来的,并在“ResNet Strikes Back”论文中作为B
策略发表。此外,模型使用了RMSProp优化器(TF 1.0行为)和EMA权重平均方法,并采用了具有warmup的指数衰减学习率调整策略。
模型细节
- 模型类型: 图像分类/特征提取
- 参数量: 13.6百万
- GMACs: 1.9
- 激活量: 9.9百万
- 图像尺寸: 训练为224x224,测试为288x288
使用方法
图像分类
用户可以通过timm
库加载预训练的efficientnetv2_rw_t.ra2_in1k模型,并应用于图像分类任务。模型可以直接处理图像,并返回分类结果的概率分布。
特征图提取
模型还支持特征图的提取,用户可以获取图像在不同特征层的映射,这对分析模型特征和进行其他计算机视觉任务很有帮助。
图像嵌入
用户也可以使用该模型进行图像嵌入的提取,通过去除分类层,模型可以输出高维的特征向量,这对于图像检索等任务非常有用。
模型比较
用户可以在timm
的模型结果页面,深入了解该模型的性能和数据集的相关信息。
数据集
该模型在ImageNet-1k数据集上进行训练,这是一个流行且广泛使用的图像分类数据集,提供了丰富的视觉信息。
相关研究论文
- EfficientNetV2: Smaller Models and Faster Training: arXiv链接
- ResNet Strikes Back: An Improved Training Procedure in Timm: arXiv链接
原始来源
该模型的开源实现可以在GitHub pytorch-image-models项目中找到。
引用
模型的相关学术引用信息也已提供,确保用户在使用时能正确地引用这些研究。