热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#多语言CLIP
XLM-Roberta-Large-Vit-B-16Plus - 支持50多种语言的多模态视觉语言模型
多语言CLIP
图像识别
Huggingface
模型
机器学习
XLM-Roberta
Github
开源项目
自然语言处理
XLM-Roberta-Large-Vit-B-16Plus是一个多语言视觉语言模型,扩展了CLIP模型至50多种语言。该模型包含多语言文本编码器,可与Vit-B-16Plus图像编码器协同工作。在多语言MS-COCO数据集的文本-图像检索任务中,它在11种语言中均表现出色。模型能够从多语言文本和图像中提取特征向量,适用于跨语言的图像文本匹配应用。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号