项目介绍:efficientnet_b2.ra_in1k
efficientnet_b2.ra_in1k 是一个基于 EfficientNet 的图像分类模型,专为在 ImageNet-1k 数据集上进行训练。该模型使用了名为 timm
的库,用于图像分类和特征提取,它具有高效的模型缩放能力。
训练方法
efficientnet_b2.ra_in1k 模型的训练基于 RandAugment RA
的配方,这种方法是对 EfficientNet RandAugment 方法的改进,最初在论文《ResNet Strikes Back》中介绍。训练过程中,使用了 RMSProp(TF 1.0 行为)优化器和 EMA 权重平均策略,以及具有预热阶段的指数递减学习率。
模型详情
- 模型类型: 图像分类/特征主干
- 模型参数:
- 参数量: 9.1 百万
- GMACs: 0.9
- 激活数量: 12.8 百万
- 图像尺寸: 训练时 256x256,测试时 288x288
- 相关论文:
- EfficientNet: 重新思考卷积神经网络的模型缩放
- ResNet strikes back: timm 中改进的训练程序
- 数据集: ImageNet-1k
模型使用
efficientnet_b2.ra_in1k 模型可用于图像分类、特征图提取和图像嵌入,以下是使用方法的简单介绍。
图像分类
通过输入图像获得分类结果,代码示例展示如何载入图像并提取前五个概率最高的类别。
特征图提取
模型可以配置为仅提取特征图,以分析输入图像在不同层特征图的形状和维度。
图像嵌入
提供了一种通过移除分类层来获取图像嵌入特征的方法,这对于下游任务非常有用。
模型比较
用户可以通过 timm 的模型结果查看模型的数据集和运行时指标,以便与其他模型进行比较。
文献引用
在研究或应用中使用本模型时,请引用相关学术文献。
@inproceedings{tan2019efficientnet,
title={Efficientnet: Rethinking model scaling for convolutional neural networks},
author={Tan, Mingxing and Le, Quoc},
booktitle={International conference on machine learning},
pages={6105--6114},
year={2019},
organization={PMLR}
}
@misc{rw2019timm,
author = {Ross Wightman},
title = {PyTorch Image Models},
year = {2019},
publisher = {GitHub},
journal = {GitHub repository},
doi = {10.5281/zenodo.4414861},
howpublished = {\url{https://github.com/huggingface/pytorch-image-models}}
@inproceedings{wightman2021resnet,
title={ResNet strikes back: An improved training procedure in timm},
author={Wightman, Ross and Touvron, Hugo and Jegou, Herve},
booktitle={NeurIPS 2021 Workshop on ImageNet: Past, Present, and Future}
}
通过 efficientnet_b2.ra_in1k 模型,用户可以实现复杂的图像分类任务,并获得高质量的图像特征,为各种计算机视觉应用提供了强大的支持。