热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#视频与语言
XPretrain - 涵盖视频语言和图像语言模型的多模态学习与预训练研究
XPretrain
多模态学习
预训练
视频与语言
图像与语言
Github
开源项目
Microsoft Research MSM组在多模态学习和预训练方法上的最新研究成果,包含用于视频语言的HD-VILA-100M数据集,以及HD-VILA、LF-VILA、CLIP-ViP等预训练模型,和用于图像语言的Pixel-BERT、SOHO、VisualParsing模型。这些研究发表在CVPR、NeurIPS和ICLR等顶级会议,代码和数据集已公开,社区成员可以贡献和提出建议。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号