LVIS API 项目介绍
LVIS API 是为大词汇量实例分割开发的接口工具。LVIS(发音类似“埃尔维斯”)是一个全新数据集,专用于大规模实例分割任务。当项目完成时,它将涵盖超过1200个基层对象类别,提供超过200万高质量的实例分割掩码,这些数据会跨越16.4万张图像。
LVIS v1.0 版本
截至目前,LVIS v1.0 版本已标注了159,623张图像,其中包括10万张训练集图像、2万张验证集图像、2万张测试开发集图像以及2万张测试挑战集图像。该版本已经在LVIS官网上公开发布,并将用于2020年ECCV大会上的第二届Joint COCO和LVIS Workshop中的LVIS Challenge比赛中。
功能概述
LVIS API 的主要功能是提供读取与交互注释文件的能力,支持可视化注释以及评估分割结果。通过它,研究人员和开发人员可以高效处理和分析大规模实例分割数据集。
环境搭建与安装
要使用 LVIS API,可以通过以下步骤进行环境搭建:
-
创建一个虚拟环境并激活它:
python3 -m venv env # 创建虚拟环境 source env/bin/activate # 激活虚拟环境
-
安装 COCO API,这需要先确保已安装 numpy:
pip install 'git+https://github.com/cocodataset/cocoapi.git#subdirectory=PythonAPI'
-
安装 LVIS API:
pip install lvis
-
完成工作后退出虚拟环境:
deactivate
或者,用户可以先克隆代码仓库,然后在仓库内部进行安装:
python3 -m venv env # 创建虚拟环境
source env/bin/activate # 激活虚拟环境
# 安装 COCO API。
pip install 'git+https://github.com/cocodataset/cocoapi.git#subdirectory=PythonAPI'
# 安装 LVIS API
pip install .
# 测试安装是否正确
python test.py
# 完成后退出虚拟环境
deactivate
研究引用
如果 LVIS 的代码或数据在研究中有所帮助,请使用以下方式引用来自论文的内容:
@inproceedings{gupta2019lvis,
title={{LVIS}: A Dataset for Large Vocabulary Instance Segmentation},
author={Gupta, Agrim and Dollar, Piotr and Girshick, Ross},
booktitle={Proceedings of the {IEEE} Conference on Computer Vision and Pattern Recognition},
year={2019}
}
项目贡献
LVIS API 的代码是基于 COCO 的 PythonAPI 重新编写而成,其主要功能保持一致,并根据 LVIS 的具体要求进行了一些修改。
总的来说,LVIS API 是一款强大而实用的工具,为研究人员和开发人员提供了一个分析和处理大规模实例分割数据的高效平台。