#指令引导
ml-mgie - 基于多模态大语言模型的智能图像编辑技术
大型语言模型Github开源项目图像编辑多模态MGIE指令引导
MGIE项目通过多模态大语言模型增强指令式图像编辑能力。该技术生成详细指令并提供明确指导,使编辑模型能更准确理解和执行编辑意图。结合端到端训练的视觉想象和图像操作,MGIE为图像编辑提供更灵活精确的控制方法。
MagicBrush - 基于人工标注的指令引导图像编辑数据集
Github开源项目数据集图像编辑指令引导MagicBrushInstructPix2Pix
MagicBrush是一个大规模人工标注的指令引导图像编辑数据集,包含10,000组源图像、指令和目标图像的三元组。该数据集涵盖单轮、多轮、带掩码和无掩码等多种编辑场景,支持图像编辑模型的训练和评估。MagicBrush还提供经过微调的模型检查点,可应用于实际图像编辑任务,为计算机视觉研究提供了重要资源。