#TimeSformer
timesformer-base-finetuned-k600 - 采用空间时间注意力的视频分类技术,提升视频理解能力
Kinetics-600TimeSformer视频分类空间时间注意力深度学习模型Github开源项目Huggingface
TimeSformer模型运用空间时间注意力机制进行视频分类,能够识别Kinetics-600中的600种标签。该工具旨在提升视频理解的准确性,提供简便的视觉分析能力。
timesformer-base-finetuned-k400 - TimeSformer视频分类模型的Kinetics-400数据集实现
TimeSformerKinetics-400开源项目模型Github机器学习视频分类Huggingface视频理解
TimeSformer是一个基于空间-时间注意力机制的视频分类模型,在Kinetics-400数据集上完成微调。该模型支持400类视频标签分类,由Facebook Research开发并在Hugging Face平台开源。模型采用transformer架构处理视频序列,可通过Python接口实现快速部署和预测。