#视觉指令调优

LLaVA: 大型语言视觉助手的发展与应用

2024年09月04日

LLaVA 视觉指令调优大型语言与视觉模型 GPT-4 多模态交互 Github 开源项目

2024年09月04日

相关项目

LLaVA

LLaVA项目通过视觉指令调优提升大型语言与视觉模型的性能，达到了GPT-4级别。最新更新包括增强版LLaVA-NeXT模型及其在视频任务上的迁移能力，以及高效的LMMs-Eval评估管道。这些更新提升了模型的多任务和像素处理能力，支持LLama-3和Qwen等不同规模的模型，并提供丰富的示例代码、模型库和数据集，方便用户快速上手和深度研究。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com