#Chinese-CLIP
相关项目
Chinese-CLIP
Chinese-CLIP项目,基于大规模中文图文对数据,专门针对中文领域的特点进行优化,提供高效的图文特征计算与相似度测算,实现零样本分类和跨模态检索。该项目改进了多个模型,包括ViT与ResNet结构,并在多个公开数据集上展示了显著的性能提升,为中文处理场景下的企业和研究者提供强大工具。
chinese-clip-vit-base-patch16
项目通过ViT和RoBERTa实现了中文CLIP模型,支持图像和文本的嵌入计算及相似性分析,具备零样本学习和图文检索功能。该模型在多项基准测试中表现优秀,包括MUGE、Flickr30K-CN等。结合其官方API,用户可轻松实现多场景中的图文转换与识别。详细信息和实施教程可在GitHub获取。
chinese-clip-vit-large-patch14
这一模型采用ViT-L/14和RoBERTa-wwm-base进行编码,在大规模中文图文数据集上训练,支持高效的图文嵌入和相似度计算。项目提供直观的API和多项任务评估,展现了在零样本图像分类和图文检索上的杰出表现。
chinese-clip-vit-huge-patch14
chinese-clip-vit-huge-patch14是一个基于ViT-H/14和RoBERTa-wwm-large的中文CLIP模型,在大规模中文图文数据上训练,表现卓越。支持在MUGE、Flickr30K-CN和COCO-CN等数据集中的图文检索和零样本分类。提供API实现简便的图文特征提取及相似度计算,详情请参见GitHub仓库。