热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#图像交互
llava-onevision-qwen2-72b-si - 多模态模型提高视觉数据交互准确率
LLaVA-OneVision
图像交互
Huggingface
准确率
预训练模型
Github
开源项目
多模态
模型
此开源项目使用多模态模型,准确率介于85.1%至93.7%之间,在AI2D、DocVQA、Science-QA等数据集表现优异。基于Qwen2语言模型,LLaVA-OneVision能在多语言环境中与视觉数据进行交互,经过大型图像及视频数据集训练,使用bfloat16精度。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号