#TimeSformer
timesformer-hr-finetuned-k600 - TimeSformer:空间-时间注意力机制的视频分类模型
模型视频分类TimeSformer计算机视觉Github深度学习开源项目Huggingface机器学习
TimeSformer-hr-finetuned-k600是基于Kinetics-600数据集微调的视频分类模型。该模型利用创新的空间-时间注意力机制,可对600个类别的视频进行分类。由Facebook AI Research开发,适用于多种视频理解任务。研究者和开发者可通过Transformers库轻松应用此模型,实现高效的视频内容分析。
timesformer-base-finetuned-k600 - 采用空间时间注意力的视频分类技术,提升视频理解能力
Kinetics-600TimeSformer视频分类空间时间注意力深度学习模型Github开源项目Huggingface
TimeSformer模型运用空间时间注意力机制进行视频分类,能够识别Kinetics-600中的600种标签。该工具旨在提升视频理解的准确性,提供简便的视觉分析能力。
timesformer-base-finetuned-k400 - TimeSformer视频分类模型的Kinetics-400数据集实现
TimeSformerKinetics-400开源项目模型Github机器学习视频分类Huggingface视频理解
TimeSformer是一个基于空间-时间注意力机制的视频分类模型,在Kinetics-400数据集上完成微调。该模型支持400类视频标签分类,由Facebook Research开发并在Hugging Face平台开源。模型采用transformer架构处理视频序列,可通过Python接口实现快速部署和预测。