热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#NaViT
siglip-so400m-14-980-flash-attn2-navit - 提升视觉模型分辨率与NaViT策略融合
Github
开源项目
模型
Huggingface
图像分辨率
视觉模型
SiglipVisionModel
HuggingFaceM4
NaViT
项目提升视觉塔最大分辨率到980x980,结合NaViT策略,支持变分辨率及纵横比自适应的图像处理。这些更新确保与原模型的向后兼容性,同时扩展了视觉处理潜力。通过插值位置嵌入提升分辨率,NaViT策略实现灵活性。用户无需指定patch_attention_mask即可兼容旧版本,享受新功能的优势,确保模型在高效处理高分辨率图像时保持兼容性。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号