PyLabel 项目介绍
PyLabel 是一个专为计算机视觉模型(如 PyTorch 和 YOLOv5)准备图像数据集的 Python 软件包。这个工具包能够在不同的注释格式之间进行转换,此外,它还包括一个可以在 Jupyter notebook 中运行的人工智能辅助标注工具。
主要功能
格式转换
PyLabel 允许用户通过简单的一行代码将注释格式进行转换。例如,可以方便地将 COCO 格式的标注转换为 YOLOv5 格式:
importer.ImportCoco(path_to_annotations).export.ExportToYoloV5()
数据分析
对于需要对图像数据集进行分析的用户,PyLabel 将注释储存在 pandas dataframe 结构中,这使得数据分析变得简单。
数据集拆分
使用 PyLabel 可以将图像数据集合理地拆分为训练集、测试集和验证集,同时保持类别分布的一致性,以确保模型训练效果。
标注工具
PyLabel 提供了一个可以在 Jupyter notebook 中运行的图像标注工具。该工具支持手动标注和利用预训练模型进行自动标注,使标注过程变得更为高效。
数据可视化
通过 PyLabel,用户可以将数据集中图像以及相应的边界框直接渲染出来,这有助于确认标注的准确性。
教学示例
PyLabel 项目提供了一些示例 Jupyter notebook,展示了该工具的实际应用:
- 将 COCO 转换为 YOLOv5
- 将 COCO 转换为 VOC
- 将 VOC 转换为 COCO
- 将 YOLO 转换为 COCO
- 将 YOLO 转换为 VOC
- 导入 YOLO YAML 文件并进行处理
- 图像数据集拆分为训练、测试、验证集的示例
- AI 辅助标注工具演示
PyLabel 的开发背景
PyLabel 由 Jeremy Fraenkel, Alex Heaton 和 Derek Topper 开发,作为加州大学伯克利分校信息学院(UC Berkeley School of Information)信息与数据科学硕士(MIDS)课程的结业项目。用户如有问题或反馈,可以通过项目的 GitHub 页面创建 issue,开发者非常乐于听取意见以改进 PyLabel,使其更有用。