OmniFusion
OmniFusion是一个整合多模态数据的人工智能系统,基于Mistral-7B核心和CLIP-ViT-L视觉编码器。通过创新的适配器机制,该系统能够处理图像等多种数据形式,在图像描述和视觉问答等任务中展现出优秀性能。OmniFusion由AIRI研究所FusionBrain团队与Sber AI合作开发,目前主要处理图像数据,未来计划扩展到音频等更多模态。