#LLaVA Interleave
llava-interleave-qwen-0.5b-hf - 多模态模型中的图像到文本生成的应用与研究
机器学习Github模型图像文本转换开源项目多模态模型HuggingfaceLLaVA Interleave自然语言处理
LLaVA Interleave是基于变换器架构进行优化的开源自回归语言模型,专注于多模态大模型和聊天机器人的研究,支持多图像和多提示生成,适用于计算机视觉和自然语言处理领域的研究人员和爱好者。在遵循开放许可证要求的前提下,模型提升了图像到文本的生成能力。通过4比特量化和Flash Attention 2优化策略,显著提高了生成效率。
llava-interleave-qwen-7b-hf - 领先的多模态AI模型 支持多图像视频和3D输入处理
图像识别自然语言处理开源项目模型GithubAI对话HuggingfaceLLaVA Interleave多模态模型
LLaVA Interleave是基于Qwen1.5-7B-Chat开发的多模态AI模型,支持多图像、视频和3D输入处理。模型采用transformer架构,具备4-bit量化和Flash Attention 2优化功能。目前主要面向计算机视觉、自然语言处理和人工智能领域的研究人员,仅供学术研究使用。