#PoolFormer
poolformer - 视觉任务中MetaFormer架构的应用及其效能
MetaFormerPoolFormerTransformer图像分类CVPR 2022Github开源项目
该项目展示了MetaFormer架构在视觉任务中的应用,特别通过简单的池化操作实现token混合。研究证实,基于这种方法的PoolFormer模型在ImageNet-1K验证集上表现优于DeiT和ResMLP。此外,后续工作介绍了IdentityFormer、RandFormer等MetaFormer基线模型。本项目证明了Transformer模型的竞争力主要来源于其通用架构MetaFormer,而非特定的token混合器。
poolformer_m36.sail_in1k - MetaFormer架构的PoolFormer图像分类与特征提取模型
模型ImageNet-1kPoolFormer开源项目Huggingface图像分类MetaFormerGithubtimm
poolformer_m36.sail_in1k是一个基于MetaFormer架构的PoolFormer图像分类模型,在ImageNet-1k数据集上训练。该模型拥有5620万参数,支持图像分类、特征图提取和图像嵌入等功能。它能高效处理224x224大小的图像,在保持性能的同时降低计算复杂度。研究人员和开发者可通过timm库轻松使用这一预训练模型,应用于多种计算机视觉任务。