热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#海量数据
MINT-1T - 万亿级开源多模态数据集推动AI研究
Github
开源项目
多模态数据集
MINT-1T
开源数据
海量数据
图文数据
MINT-1T是一个大规模开源多模态数据集,包含1万亿文本标记和34亿张图像,比现有开源数据集规模扩大约10倍。该数据集首次纳入PDF和ArXiv论文等新数据源,提供HTML、PDF和ArXiv等多个子集。MINT-1T旨在为大规模多模态AI模型研究提供丰富的训练资源,其规模和多样性有望促进多模态AI技术的发展。
1
1
相关文章
MINT-1T: 突破性的一万亿标记多模态数据集
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号