热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#图文匹配
siglip-base-patch16-512 - 采用Sigmoid损失函数的开源计算机视觉模型
Github
开源项目
深度学习
计算机视觉
模型
图像分类
Huggingface
SigLIP
图文匹配
SigLIP在CLIP架构基础上改进了损失函数设计,使用Sigmoid损失函数处理图像-文本对训练。该模型在WebLI数据集上预训练,支持512x512分辨率的图像输入,主要应用于零样本图像分类和图文检索。相比CLIP,新的损失函数无需全局相似度归一化,使模型在不同批量规模下都能保持稳定表现。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号