热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#跨模态检索
Chinese-CLIP
Chinese-CLIP项目,基于大规模中文图文对数据,专门针对中文领域的特点进行优化,提供高效的图文特征计算与相似度测算,实现零样本分类和跨模态检索。该项目改进了多个模型,包括ViT与ResNet结构,并在多个公开数据集上展示了显著的性能提升,为中文处理场景下的企业和研究者提供强大工具。
ImageBind
ImageBind是由Meta AI研发的AI模型,可将图像、文本、音频、深度、热感和IMU数据统一到单一嵌入空间。该模型支持跨模态检索、模态组合运算、检测和生成等应用,在多个零样本分类任务中表现良好。ImageBind为多模态AI研究提供了新思路,研究者可通过其开源的PyTorch实现和预训练模型进行进一步探索。
相关文章
Chinese-CLIP:基于大规模中文数据的跨模态预训练模型
2 个月前
ImageBind: 融合多模态数据的统一嵌入空间
2 个月前
Chinese-CLIP入门学习资料-中文版CLIP模型实现图文跨模态检索与表示生成
1 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号