datacomp
DataComp是一项聚焦于多模态预训练数据集设计的竞赛。参赛者需从海量未筛选的图像-文本对中构建高质量数据集,以提升CLIP模型在下游任务的表现。竞赛设有两个赛道和四个规模,适应不同计算资源需求。项目提供完整工具包,涵盖数据获取、模型训练和评估等环节,支持参与者进行数据集创新。
CLIP-ViT-B-32-DataComp.XL-s13B-b90K
CLIP ViT-B/32是一个使用DataComp-1B数据集训练的图像分类模型,在ImageNet-1k测试中达到72.7%零样本分类准确率。模型支持图像分类、图像文本检索等功能,主要面向多模态机器学习研究使用。