#EVA02
eva02_large_patch14_448.mim_m38m_ft_in22k_in1k - EVA02大型视觉模型在ImageNet达到90.054%分类准确率
EVA02图像分类Huggingface开源项目模型GithubImageNet神经网络深度学习
EVA02_large_patch14_448是一个基于视觉Transformer架构的图像处理模型,通过在Merged-38M数据集预训练和ImageNet数据集微调,在图像分类任务中达到90.054%的准确率。模型整合了均值池化、位置编码等技术,支持图像分类和特征提取应用。
eva02_base_patch14_448.mim_in22k_ft_in22k_in1k - EVA02视觉Transformer的图像分类与特征提取模型
ImageNetGithub开源项目图像分类EVA02模型微调Huggingface视觉变换器模型
EVA02是一款基于视觉Transformer架构的图像分类和特征提取模型。它结合了平均池化、SwiGLU和旋转位置嵌入技术,在ImageNet-22k数据集上进行预训练并在ImageNet-1k上微调。兼容timm库,以确保在不同设备上的一致性和高效性,广泛适用于多种图像分类和特征提取任务。