#ConvNext

CLIP-convnext_xxlarge-laion2B-s34B-b82K-augreg - 基于LAION-2B数据集的卷积神经网络达到79%零样本分类准确率

Github开源项目图像分类CLIPHuggingface神经网络机器学习ConvNext模型

CLIP ConvNeXt-XXLarge是一个在LAION-2B数据集上训练的大规模视觉语言模型，总参数量12亿，图像分辨率256x256。模型采用ConvNeXt-XXLarge图像结构和ViT-H-14规模的文本编码器，在ImageNet零样本分类上达到79%准确率。主要应用于图像分类、检索等研究任务。

CLIP-convnext_base_w-laion_aesthetic-s13B-b82K - LAION-5B训练的ConvNeXt-Base CLIP模型

数据集ConvNext开源项目模型Github机器学习HuggingfaceCLIP图像分类

ConvNeXt-Base架构的CLIP模型在LAION-5B子集上完成训练，支持256x256和320x320两种图像分辨率。在ImageNet零样本分类评测中取得70.8%-71.7%的top-1准确率，样本效率超过同规模ViT-B/16模型。该模型主要用于研究领域，可执行零样本图像分类和图文检索等任务。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号