#DocVQA

ComfyUI-Florence2：将微软强大的视觉语言模型整合到AI艺术创作中

3 个月前

Florence2 ComfyUI 视觉基础模型多任务学习 DocVQA Github 开源项目

3 个月前

相关项目

ComfyUI-Florence2

ComfyUI-Florence2项目基于Florence-2视觉基础模型，可处理多种视觉和视觉-语言任务。除支持图像描述、物体检测和分割外，还新增文档视觉问答功能。项目利用FLD-5B数据集进行多任务学习，采用序列到序列架构，在零样本和微调场景下表现优异。用户可通过ComfyUI界面便捷使用Florence2的各项功能。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com