项目简介:ComfyUI YoloWorld-EfficientSAM
ComfyUI YoloWorld-EfficientSAM 是一个结合了高效检测和分割技术的非官方项目实现,整合了 YOLO-World 和 EfficientSAM 两大开源项目,通过这些技术为用户提供先进的对象检测和实例分割能力。
项目背景
本项目采用了来自 YOLO-World 项目的高精度检测算法以及 EfficientSAM 的高效分割技术。这两个项目均在物体检测与分割领域表现出色,使得用户能够在图片和视频中精确地识别和提取目标。
项目特点
- 多模式支持:支持图片与视频两种输入格式,能够适应多种应用场景。
- 灵活的蒙版处理:可以单独选择输出特定的蒙版,也可以将所有蒙版叠加在一起输出。
- 支持多种检测和分割模型:YOLO-World 提供三种不同尺寸的模型(L、M、S),EfficientSAM 支持 CUDA 和 CPU 环境。
- 丰富的配置参数:允许用户调整检测模型的置信度阈值,边界框重叠(IoU)阈值,检测框与文字的厚度及缩放,还可通过是否显示置信度以及抑制类别重叠进行细化设置。
功能模块
- YOLO-World 模型加载器:自动下载并加载模型,确保使用最新的检测算法。
- EfficientSAM 模型加载器:根据用户的硬件环境选择最优的分割模型。
- 检测与分割节点:集成检测与分割功能,能够根据用户指定的类别及参数高效运行。
视频演示
项目在开发过程中录制了V1.0和V2.0版本的视频演示,展示了其在不同输入类型下的实际效果,帮助用户更好地理解与使用该工具。
安装指南
推荐使用 ComfyUI Manager 进行安装以确保更简便和自动化的流程,也提供了手动安装的方法,便于手动配置环境。用户需下载相关模型文件放置于指定路径以完成配置。
工作流说明
项目提供了不同版本的工作流文件,V2.0 版本相比 V1.0 新增了更高级的蒙版处理功能,满足更复杂的处理需求。用户可根据需求选择合适的工作流进行使用。
更新日志
自 2024 年 2 月 20 日项目创建以来,已经更新到 V2.0 版本,新增功能包括蒙版分离,支持选择单独输出蒙版,提供更细致的处理能力。
开发者信息
项目由 Zho 维护,提供了多种社交媒体和联系方式,欢迎用户通过邮件、QQ群等方式进行联系,也欢迎对项目的支持与鼓励。
鸣谢
感谢各类模型和代码的开发者和贡献者,对 YOLO-World 和 EfficientSAM 项目以及提供检测节点的用户表示感谢,为此项目的实现奠定了坚实的基础。