#Mantis

Mantis: 革命性的多图像指令调优模型

2024年09月05日

Mantis 多图像指令调优大型多模态模型 LLaMA-3 人工智能 Github 开源项目

2024年09月05日

相关项目

Mantis

Mantis是基于LLaMA-3的大型多模态模型,专注于多图像视觉语言任务。通过在Mantis-Instruct数据集上进行36小时的指令微调,该模型在5个多图像基准测试中实现了领先性能。Mantis能处理交错的文本和图像输入,有效应对复杂多图像任务,同时保持出色的单图像处理能力。项目开源了代码、模型和演示,为AI研究和开发提供了强大的多图像处理工具。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com