#PubMedVision
HuatuoGPT-Vision:注入医学视觉知识到大规模多模态语言模型中
3 个月前
相关项目
HuatuoGPT-Vision
HuatuoGPT-Vision项目致力于增强多模态语言模型的医疗视觉理解能力。该项目推出了包含130万高质量医疗视觉问答对的PubMedVision数据集,显著提升了模型在医疗领域的多模态表现。研究团队基于此开发了HuatuoGPT-Vision-7B和34B两个版本的医疗多模态语言模型,在多项医疗视觉问答基准测试中均取得了优异成绩。这一项目不仅为医疗人工智能领域提供了宝贵的数据资源和先进模型,还有望推动医疗影像分析和诊断技术的进步。
HuatuoGPT-Vision-7B
HuatuoGPT-Vision-7B是基于Qwen2-7B和LLaVA-v1.5架构的多模态医疗语言模型。该模型利用PubMedVision数据集训练,将医学视觉知识融入多模态LLM中,能同时处理文本和图像输入。开源代码可从GitHub获取,便于模型部署和使用。HuatuoGPT-Vision-7B在医疗诊断、图像分析等领域展现出潜力,为医疗应用提供了新的解决方案。