#ViT模型
fashion-images-gender-age-vit-large-patch16-224-in21k-v3 - 基于Vision Transformer的时尚图像性别年龄识别模型
计算机视觉图像分类Huggingface模型模型微调时尚图像分析Github开源项目ViT模型
该模型基于Google的ViT-Large-Patch16-224-In21k在时尚图像数据集上微调,专门用于识别时尚图像中的性别和年龄。经过5轮训练后,模型在评估集上实现了99.60%的准确率,验证损失降至0.0223。这一高精度模型可为时尚行业的个性化推荐和营销分析提供数据支持。
vit-xray-pneumonia-classification - 基于ViT的胸部X光肺炎分类模型
模型图像分类肺炎检测GithubViT模型胸部X光分类开源项目Huggingface机器学习
该项目利用ViT模型对胸部X光图像进行肺炎分类,在验证集上准确率达97.42%。模型能快速区分正常和肺炎X光片,并提供简易推理代码。这一工具有助于提升肺炎诊断的效率和准确性,为医疗行业带来实际价值。
vit-base-cats-vs-dogs - 基于Vision Transformer的猫狗图像分类模型
Huggingface图像分类模型迁移学习猫狗数据集Github开源项目ViT模型Hugging Face
该模型是基于google/vit-base-patch16-224-in21k在cats_vs_dogs数据集上微调的图像分类模型。采用Vision Transformer架构,在评估集上实现98.83%的准确率。模型可用于宠物识别、动物摄影分类等猫狗图像分类任务。开发者可以方便地将其集成到各种应用中,实现高效的猫狗识别功能。