#Chinese-CLIP

Chinese-CLIP - 中文多模态嵌入和检索性能优化的领先方案
Chinese-CLIP跨模态检索零样本图像分类图文特征提取模型下载Github开源项目
Chinese-CLIP项目,基于大规模中文图文对数据,专门针对中文领域的特点进行优化,提供高效的图文特征计算与相似度测算,实现零样本分类和跨模态检索。该项目改进了多个模型,包括ViT与ResNet结构,并在多个公开数据集上展示了显著的性能提升,为中文处理场景下的企业和研究者提供强大工具。
chinese-clip-vit-base-patch16 - 中文数据驱动的多模态对比学习工具
Github模型开源项目零样本学习深度学习Chinese-CLIP图像识别Huggingface多模态检索
项目通过ViT和RoBERTa实现了中文CLIP模型,支持图像和文本的嵌入计算及相似性分析,具备零样本学习和图文检索功能。该模型在多项基准测试中表现优秀,包括MUGE、Flickr30K-CN等。结合其官方API,用户可轻松实现多场景中的图文转换与识别。详细信息和实施教程可在GitHub获取。
chinese-clip-vit-large-patch14 - 结合ViT-L/14和RoBERTa-wwm-base的中文图文对比模型
Chinese-CLIP图文相似度开源项目模型GithubHuggingface图像编码器零样本分类文本编码器
这一模型采用ViT-L/14和RoBERTa-wwm-base进行编码,在大规模中文图文数据集上训练,支持高效的图文嵌入和相似度计算。项目提供直观的API和多项任务评估,展现了在零样本图像分类和图文检索上的杰出表现。
chinese-clip-vit-huge-patch14 - 基于ViT-H/14和RoBERTa的中文图文对比学习模型
检索图像编码器Chinese-CLIP中文数据集开源项目文本编码器模型HuggingfaceGithub
chinese-clip-vit-huge-patch14是一个基于ViT-H/14和RoBERTa-wwm-large的中文CLIP模型,在大规模中文图文数据上训练,表现卓越。支持在MUGE、Flickr30K-CN和COCO-CN等数据集中的图文检索和零样本分类。提供API实现简便的图文特征提取及相似度计算,详情请参见GitHub仓库。