热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#MINT-1T
MINT-1T: 突破性的一万亿标记多模态数据集
2 个月前
MINT-1T是一个包含一万亿文本标记和34亿图像的开源多模态数据集,规模是现有开源数据集的10倍,为大规模多模态AI模型训练提供了宝贵资源。
MINT-1T
多模态数据集
开源数据
海量数据
图文数据
Github
开源项目
2 个月前
相关项目
MINT-1T
MINT-1T是一个大规模开源多模态数据集,包含1万亿文本标记和34亿张图像,比现有开源数据集规模扩大约10倍。该数据集首次纳入PDF和ArXiv论文等新数据源,提供HTML、PDF和ArXiv等多个子集。MINT-1T旨在为大规模多模态AI模型研究提供丰富的训练资源,其规模和多样性有望促进多模态AI技术的发展。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号