#GLaMM

揭秘groundingLMM:首个实现像素级语义分割的大型多模态模型

3 个月前

3 个月前

相关项目

groundingLMM

GLaMM是一种新型多模态AI模型，将自然语言生成与对象分割技术相结合。该模型提出了接地对话生成任务，并基于GranD数据集进行训练。GLaMM能够处理图像和区域级输入，支持视觉对话和指代表达分割等功能，为视觉语言交互提供了新的解决方案。

投诉举报邮箱: service@vectorlightyear.com