热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#X-CLIP
xclip-base-patch32 - X-CLIP视频语言理解模型在Kinetics-400数据集上的应用
模型
计算机视觉
Github
开源项目
Huggingface
X-CLIP
深度学习
自然语言处理
视频分类
xclip-base-patch32是一个基于CLIP架构的视频语言理解模型,通过Kinetics-400数据集进行全监督训练。该模型支持零样本、少样本及全监督视频分类,以及视频文本检索等任务。在224x224分辨率和每视频8帧的训练条件下,模型在Kinetics-400测试集上达到80.4%的top-1准确率和95.0%的top-5准确率,展现出优秀的视频分类性能。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号