热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#LLaVA-Onevision
llava-onevision-qwen2-7b-ov-hf - 支持单图多图和视频理解的多模态语言模型
多模态
Huggingface
模型
视频理解
图像理解
人工智能
Github
LLaVA-Onevision
开源项目
LLaVA-Onevision-qwen2-7b-ov-hf是一个基于Qwen2微调的开源多模态大语言模型。作为首个能在单图、多图和视频场景中同时提升性能的模型,它展现了卓越的跨模态和跨场景迁移学习能力。该模型特别擅长视频理解和跨场景任务,支持多图像和多提示生成,适用于广泛的视觉理解应用。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号