热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#视频识别
hiera - 简洁高效的分层视觉Transformer模型
Github
开源项目
图像识别
视觉Transformer
Hiera
视频识别
MAE预训练
Hiera是一种分层视觉Transformer模型,在图像和视频任务中表现出色,同时保持高效推理。该模型简化了现有Transformer的复杂模块,并通过MAE预训练学习空间偏置,实现了简洁高效的架构。项目提供了模型库、推理示例和基准测试脚本,支持通过PyTorch Hub和Hugging Face Hub使用预训练模型。
1
1
相关文章
Hiera: 快速、强大且简单的层级视觉Transformer
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号