项目简介
DLTA-AI 是一款新一代的标注工具,专注于数据标注、跟踪和注释。该工具集成了计算机视觉领域的最新技术,使得创建图像数据集比以往更加简便。通过与现有标注工具 Labelme 的无缝结合,DLTA-AI 为用户提供了一种直观的工作流程。
安装指南 🛠️
用户可以在新创建的环境中安装 PyTorch,然后使用 pip 安装 DLTA-AI:
pip install DLTA-AI
安装完成后,用户只需运行命令:
DLTA-AI
DLTA-AI 的用户指南中提供了详细的安装步骤和常见问题的解决方案。
Segment Anything 功能 🪄
DLTA-AI 利用最新的 Meta 模型 Segment Anything (SAM),支持对任意类别进行零样本分割。即使是对目标的粗略标注,SAM 也能提高分割的准确性。此外,SAM 还支持视频模式下的物体跟踪。
模型选择 🤖
DLTA-AI 提供 Model Explorer 工具,允许用户使用各种模型,包括 mmdetection 和 yolov8 的模型,以及 SAM 的模型。用户可以通过该工具比较、下载并选择适合他们需求的模型。
图像分割 🎨
借助 Model Explorer 中的模型,DLTA-AI 为用户提供了单图像和批量图像标注的无缝体验,用户可以选择类别、修改阈值,并对分割结果进行全方位编辑。
物体跟踪 🚗
在分割和检测模型的基础上,DLTA-AI 提供了完整的物体跟踪解决方案,支持 5 种不同的跟踪模型。用户可以导入视频、调整跟踪设置,并选择不同的可视化选项。跟踪结果可导出为视频文件。此外,DLTA-AI 提供了一种编辑跟踪结果的新方式,包括在多个帧间编辑和删除。
导出功能 📤
DLTA-AI 支持将实例分割结果导出为标准 COCO 格式,跟踪结果可导出为 MOT 格式或包含自定义可视化选项的视频文件。
其他功能 🌟
DLTA-AI 还提供了许多其他功能,如:
- 阈值选择(置信度和 IoU)
- 选择类别(80 个 COCO 类别)并保存默认类别
- 仅跟踪指定对象
- 模型合并(运行并合并结果)
- 显示运行时类型(CPU/GPU)和 GPU 内存使用情况
- 视频导航(逐帧、快进、快退、播放/暂停)
- 支持浅色/深色主题切换
- 完全可定制的用户界面
- 操作系统通知(用于长时间任务)
- 使用 orjson 提高 JSON 序列化速度
- 附加脚本用于评估分割结果(COCO)和从视频文件中提取帧
社区参与 🤝
DLTA-AI 作为一个开源项目,欢迎社区贡献。用户可以通过报告问题、提出新功能建议或直接改进代码等方式进行贡献。
致谢 🙏
DLTA-AI 是开罗大学工程学院的毕业项目的一部分,感谢指导老师和一众贡献者对该项目的支持与帮助。