#XCiT
xcit_medium_24_p8_224.fb_in1k - 基于XCiT架构的图像分类与特征提取模型
Huggingface图像分类模型深度学习Github模型预训练XCiT开源项目ImageNet-1k
XCiT是Facebook Research开发的图像分类模型,在ImageNet-1k数据集上完成预训练。模型采用Cross-Covariance Image Transformer架构,拥有8430万参数,支持224x224图像输入分析。通过timm库实现,既可用于图像分类,也可作为特征提取器生成图像嵌入向量,为开发者提供便捷的模型加载和图像处理功能。
xcit_tiny_12_p8_224.fb_in1k - 跨协方差图像转换器实现图像分类与特征提取
神经网络开源项目模型ImageNet-1kXCiT图像分类机器学习GithubHuggingface
基于XCiT(Cross-Covariance Image Transformer)架构开发的图像分类模型,在ImageNet-1k数据集上完成预训练。模型包含670万参数量,GMACs为4.8,支持224x224图像输入分辨率。通过跨协方差注意力机制实现图像特征表示,可用于图像分类和特征提取。模型已集成到timm库中,支持top-k分类预测和特征向量提取功能。
xcit_small_12_p16_224.fb_in1k - 跨协方差图像Transformer的高效视觉分类与特征提取模型
ImageNet计算机视觉图像分类Github开源项目模型Huggingface深度学习XCiT
XCiT (Cross-Covariance Image Transformer)是Facebook Research开发的视觉分类模型,采用创新的跨协方差注意力机制。模型在ImageNet-1k数据集预训练,包含2630万参数,处理224x224图像输入。通过优化计算效率,该模型在图像分类和特征提取任务中展现出稳定性能。