热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#WebLI数据集
siglip-base-patch16-256-multilingual - 基于Sigmoid损失函数的多语言视觉语言模型
图像分类
Huggingface
开源项目
模型
WebLI数据集
Github
零样本学习
多模态模型
SigLIP
SigLIP是一个基于CLIP架构的多语言视觉语言模型,通过Sigmoid损失函数优化训练效果。模型在WebLI数据集上以256x256分辨率预训练,实现零样本图像分类和图文检索功能。相比CLIP模型,在批量处理和整体性能上都有提升。模型经过16个TPU-v4芯片训练,支持多语言处理,主要应用于图像分类和跨模态检索任务。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号