wide_resnet50_2.racm_in1k项目介绍
项目概述
wide_resnet50_2.racm_in1k是一个基于Wide ResNet架构的图像分类模型。该模型是使用timm库在ImageNet-1k数据集上训练得到的。它采用了RandAugment数据增强策略,并使用了RMSProp优化器和步进学习率调度。
模型特点
该模型具有以下特点:
- 使用ReLU激活函数
- 采用单层7x7卷积加池化的结构
- 使用1x1卷积进行短路下采样
- 参数数量为68.9百万
- GMACs(十亿次乘加运算)为11.4
- 激活数为14.4百万
- 训练时输入图像尺寸为224x224,测试时为288x288
训练细节
模型的训练采用了以下策略:
- 使用RandAugment
RACM
数据增强方案 - 采用RMSProp优化器(TensorFlow 1.0行为)
- 使用指数衰减的步进学习率调度,并进行预热
- 使用EMA(指数移动平均)进行权重平均
模型应用
该模型可以应用于多种计算机视觉任务:
- 图像分类:可以直接用于预测图像类别
- 特征图提取:可以提取不同层级的特征图,用于下游任务
- 图像嵌入:可以提取图像的高维特征表示
使用方法
用户可以通过timm库轻松加载和使用该模型:
- 对于图像分类任务,可以直接使用预训练模型进行推理
- 对于特征提取,可以设置
features_only=True
来获取多尺度特征图 - 对于图像嵌入,可以设置
num_classes=0
或使用forward_features
方法
模型比较
在ImageNet验证集上,该模型在288x288分辨率下的Top-1准确率为82.27%,Top-5准确率为96.06%。相比其他模型,它在准确率和计算效率之间取得了很好的平衡。
总的来说,wide_resnet50_2.racm_in1k是一个强大而灵活的图像分类模型,可以满足多种计算机视觉应用的需求。