#图像文本对

MetaCLIP: 揭秘CLIP数据的新方法

2 个月前

Cover of MetaCLIP: 揭秘CLIP数据的新方法

MetaCLIP是由Meta AI研究团队开发的一种新型计算机视觉模型,旨在改进CLIP数据的筛选和处理方法。本文将详细介绍MetaCLIP的主要特点、技术创新以及在计算机视觉领域的潜在应用。

MetaCLIP CLIP 图像文本对预训练模型数据清洗 Github 开源项目

2 个月前

Cover of MetaCLIP: 揭秘CLIP数据的新方法

DataComp: 探索下一代多模态数据集的前沿

2 个月前

Cover of DataComp: 探索下一代多模态数据集的前沿

DataComp是一个创新的多模态数据集设计竞赛,旨在推动机器学习领域在数据集构建方面的进步。参与者需要从海量图像-文本对中筛选和构建高质量的数据集,以提升CLIP模型在下游任务上的性能。

DataComp CLIP模型数据集图像文本对机器学习 Github 开源项目

2 个月前

Cover of DataComp: 探索下一代多模态数据集的前沿

相关项目

Project Cover

DataComp是一项聚焦于多模态预训练数据集设计的竞赛。参赛者需从海量未筛选的图像-文本对中构建高质量数据集，以提升CLIP模型在下游任务的表现。竞赛设有两个赛道和四个规模，适应不同计算资源需求。项目提供完整工具包，涵盖数据获取、模型训练和评估等环节，支持参与者进行数据集创新。

Project Cover

VLDet是一种开放词汇目标检测方法，通过学习对象与语言的对齐来直接从图像-文本对训练检测器。基于CLIP的视觉-语言预训练模型，该方法将任务构建为二分图匹配问题，在COCO和LVIS等数据集上实现了领先性能，并可轻松扩展到新目标类别。VLDet为开放词汇目标检测提供了高效的解决方案。

Project Cover

MetaCLIP是一个改进CLIP模型数据处理的开源项目。它提出了一种新的数据筛选算法,无需依赖现有模型即可从头整理数据。该项目强调数据质量,提供了可扩展到CommonCrawl全数据集的方法。MetaCLIP公开训练数据分布,提高了透明度,并为CLIP模型提供标准化的实验设置,便于控制实验和公平比较。

Project Cover

LAION作为非营利组织，提供开放机器学习资源，包括大规模数据集、工具和模型。平台主要产品有LAION-400M、LAION-5B图像文本对数据集，CLIP视觉转换器模型和LAION-Aesthetics美学筛选子集。LAION致力于推动开放式机器学习研究，鼓励资源重复利用，支持环保理念和公共教育发展。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号