热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#UForm-Gen2-dpo
uform-gen2-dpo - 基于偏好优化的视觉语言模型 用于图像描述和视觉问答
多模态模型
UForm-Gen2-dpo
Huggingface
模型
深度学习
Github
开源项目
图像描述
视觉问答
UForm-Gen2-dpo是一个经过直接偏好优化(DPO)训练的视觉语言模型,专门用于图像描述和视觉问答。该模型结合了CLIP式ViT-H/14视觉编码器和Qwen1.5-0.5B-Chat语言模型,能够生成准确的图像描述、回答图像相关问题,并支持多模态对话。在MME基准测试中,UForm-Gen2-dpo在感知、推理、OCR等多个图像理解任务上展现出优秀性能,为视觉语言处理提供了高效可靠的解决方案。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号