#视觉指令微调

LLaVAR: 增强视觉指令调优以实现文本丰富图像理解

3 个月前
Cover of LLaVAR: 增强视觉指令调优以实现文本丰富图像理解

BakLLaVA: 多模态视觉语言模型的创新与突破

3 个月前
Cover of BakLLaVA: 多模态视觉语言模型的创新与突破