Torchreid

Torchreid 是一个用于深度学习行人再识别的库，用 PyTorch <https://pytorch.org/>_ 编写，并为我们 ICCV'19 项目 Omni-Scale Feature Learning for Person Re-Identification <https://arxiv.org/abs/1905.00953>_ 开发。

它具有以下特点：

多 GPU 训练
支持图像和视频再识别
端到端的训练和评估
极其简单的再识别数据集准备
多数据集训练
跨数据集评估
大多数研究论文中使用的标准协议
高度可拓展（容易添加模型、数据集、训练方法等）
先进的深度再识别模型实现
访问预训练的再识别模型
先进的训练技术
可视化工具（tensorboard、ranks 等）

代码: https://github.com/KaiyangZhou/deep-person-reid

文档: https://kaiyangzhou.github.io/deep-person-reid

操作指南: https://kaiyangzhou.github.io/deep-person-reid/user_guide

模型库: https://kaiyangzhou.github.io/deep-person-reid/MODEL_ZOO

技术报告: https://arxiv.org/abs/1910.10093

你可以在 这里 <https://github.com/KaiyangZhou/deep-person-reid/tree/master/projects>_ 找到一些基于 Torchreid 构建的研究项目。

安装

确保已安装 conda <https://www.anaconda.com/distribution/>_。

.. code-block:: bash

# cd 到你喜欢的目录并克隆此仓库
git clone https://github.com/KaiyangZhou/deep-person-reid.git

# 创建环境
cd deep-person-reid/
conda create --name torchreid python=3.7
conda activate torchreid

# 安装依赖
# 确保 `which python` 和 `which pip` 指向正确路径
pip install -r requirements.txt

# 安装 torch 和 torchvision（选择合适的 cuda 版本以适应机器）
conda install pytorch torchvision cudatoolkit=9.0 -c pytorch

# 安装 torchreid（如果修改源代码，无需重新构建）
python setup.py develop

另一种安装方法是在 docker 容器内运行：

构建: make build-image
运行: make run

快速入门：30 秒到 Torchreid

导入 torchreid

.. code-block:: python

import torchreid

2. 加载数据管理器

.. code-block:: python

datamanager = torchreid.data.ImageDataManager(
    root="reid-data",
    sources="market1501",
    targets="market1501",
    height=256,
    width=128,
    batch_size_train=32,
    batch_size_test=100,
    transforms=["random_flip", "random_crop"]
)

3. 构建模型、优化器和 lr_scheduler

.. code-block:: python

model = torchreid.models.build_model(
    name="resnet50",
    num_classes=datamanager.num_train_pids,
    loss="softmax",
    pretrained=True
)

model = model.cuda()

optimizer = torchreid.optim.build_optimizer(
    model,
    optim="adam",
    lr=0.0003
)

scheduler = torchreid.optim.build_lr_scheduler(
    optimizer,
    lr_scheduler="single_step",
    stepsize=20
)

4. 构建引擎

.. code-block:: python

engine = torchreid.engine.ImageSoftmaxEngine(
    datamanager,
    model,
    optimizer=optimizer,
    scheduler=scheduler,
    label_smooth=True
)

5. 运行训练和测试

.. code-block:: python

engine.run(
    save_dir="log/resnet50",
    max_epoch=60,
    eval_freq=10,
    print_freq=10,
    test_only=False
)

统一接口

在 "deep-person-reid/scripts/" 文件夹中，我们提供了一个统一的接口来训练和测试模型。详见 "scripts/main.py" 和 "scripts/default_config.py"，文件夹 "configs/" 中包含一些预定义配置，您可以使用它们作为起点。

下面我们提供一个例子来训练和测试 OSNet (Zhou et al. ICCV'19) <https://arxiv.org/abs/1905.00953>_。假设 :code:PATH_TO_DATA 是包含再识别数据集的目录。环境变量 :code:CUDA_VISIBLE_DEVICES 被省略，您需要指定它，如果您有一组 gpu 并且想使用其中的一部分。

传统设置 ^^^^^^^^^^^^^^^^^^^^^

在 Market1501 上训练 OSNet，执行

.. code-block:: bash

python scripts/main.py \
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml \
--transforms random_flip random_erase \
--root $PATH_TO_DATA

配置文件将 Market1501 设置为默认数据集。如果您想使用 DukeMTMC-reID，执行

.. code-block:: bash

python scripts/main.py \
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml \
-s dukemtmcreid \
-t dukemtmcreid \
--transforms random_flip random_erase \
--root $PATH_TO_DATA \
data.save_dir log/osnet_x1_0_dukemtmcreid_softmax_cosinelr

代码将自动（下载并）加载 ImageNet 预训练权重。训练完成后，模型将保存为 "log/osnet_x1_0_market1501_softmax_cosinelr/model.pth.tar-250"。在同一文件夹中，您可以找到 tensorboard <https://pytorch.org/docs/stable/tensorboard.html>_ 文件。要使用 tensorboard 可视化学习曲线，可以在终端中运行: tensorboard --logdir=log/osnet_x1_0_market1501_softmax_cosinelr 并在您的浏览器中访问：http://localhost:6006/。

在训练结束时会自动进行评估。要使用训练好的模型再次运行测试，执行

.. code-block:: bash

python scripts/main.py \
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml \
--root $PATH_TO_DATA \
model.load_weights log/osnet_x1_0_market1501_softmax_cosinelr/model.pth.tar-250 \
test.evaluate True

跨域设置 ^^^^^^^^^^^^^^^^^^^^^

假设您想在 DukeMTMC-reID 上训练 OSNet 并测试其在 Market1501 上的性能，可以执行

.. code-block:: bash python scripts/main.py
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad.yaml
-s dukemtmcreid
-t market1501
--transforms random_flip color_jitter
--root $PATH_TO_DATA

这里我们仅测试跨域性能。然而，如果你也想测试源数据集，即DukeMTMC-reID上的性能，你可以设置：-t dukemtmcreid market1501，这将分别评估模型在这两个数据集上的表现。

不同于同域设置，这里我们用 color_jitter 取代 random_erase。这可以提高模型在未见过的目标数据集上的泛化性能。

预训练模型可在 Model Zoo <https://kaiyangzhou.github.io/deep-person-reid/MODEL_ZOO.html>_ 中找到。

数据集

图像行人重识别数据集 ^^^^^^^^^^^^^^^^^^^^^^^

Market1501 <https://www.cv-foundation.org/openaccess/content_iccv_2015/papers/Zheng_Scalable_Person_Re-Identification_ICCV_2015_paper.pdf>_
CUHK03 <https://www.cv-foundation.org/openaccess/content_cvpr_2014/papers/Li_DeepReID_Deep_Filter_2014_CVPR_paper.pdf>_
DukeMTMC-reID <https://arxiv.org/abs/1701.07717>_
MSMT17 <https://arxiv.org/abs/1711.08565>_
VIPeR <http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.331.7285&rep=rep1&type=pdf>_
GRID <http://www.eecs.qmul.ac.uk/~txiang/publications/LoyXiangGong_cvpr_2009.pdf>_
CUHK01 <http://www.ee.cuhk.edu.hk/~xgwang/papers/liZWaccv12.pdf>_
SenseReID <http://openaccess.thecvf.com/content_cvpr_2017/papers/Zhao_Spindle_Net_Person_CVPR_2017_paper.pdf>_
QMUL-iLIDS <http://www.eecs.qmul.ac.uk/~sgg/papers/ZhengGongXiang_BMVC09.pdf>_
PRID <https://pdfs.semanticscholar.org/4c1b/f0592be3e535faf256c95e27982db9b3d3d3.pdf>_

地理定位数据集 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^

University-1652 <https://dl.acm.org/doi/abs/10.1145/3394171.3413896>_

视频行人重识别数据集 ^^^^^^^^^^^^^^^^^^^^^^^^^^^

MARS <http://www.liangzheng.org/1320.pdf>_
iLIDS-VID <https://www.eecs.qmul.ac.uk/~sgg/papers/WangEtAl_ECCV14.pdf>_
PRID2011 <https://pdfs.semanticscholar.org/4c1b/f0592be3e535faf256c95e27982db9b3d3d3.pdf>_
DukeMTMC-VideoReID <http://openaccess.thecvf.com/content_cvpr_2018/papers/Wu_Exploit_the_Unknown_CVPR_2018_paper.pdf>_

模型

ImageNet 分类模型 ^^^^^^^^^^^^^^^^^^^^^^^^^^^

ResNet <https://arxiv.org/abs/1512.03385>_
ResNeXt <https://arxiv.org/abs/1611.05431>_
SENet <https://arxiv.org/abs/1709.01507>_
DenseNet <https://arxiv.org/abs/1608.06993>_
Inception-ResNet-V2 <https://arxiv.org/abs/1602.07261>_
Inception-V4 <https://arxiv.org/abs/1602.07261>_
Xception <https://arxiv.org/abs/1610.02357>_
IBN-Net <https://arxiv.org/abs/1807.09441>_

轻量级模型 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^

NASNet <https://arxiv.org/abs/1707.07012>_
MobileNetV2 <https://arxiv.org/abs/1801.04381>_
ShuffleNet <https://arxiv.org/abs/1707.01083>_
ShuffleNetV2 <https://arxiv.org/abs/1807.11164>_
SqueezeNet <https://arxiv.org/abs/1602.07360>_

ReID 专用模型 ^^^^^^^^^^^^^^^^^^^^^^^^^^

MuDeep <https://arxiv.org/abs/1709.05165>_
ResNet-mid <https://arxiv.org/abs/1711.08106>_
HACNN <https://arxiv.org/abs/1802.08122>_
PCB <https://arxiv.org/abs/1711.09349>_
MLFN <https://arxiv.org/abs/1803.09132>_
OSNet <https://arxiv.org/abs/1905.00953>_
OSNet-AIN <https://arxiv.org/abs/1910.06827>_

有用链接

OSNet-IBN1-Lite (仅测试代码及精简版 docker 容器) <https://github.com/RodMech/OSNet-IBN1-Lite>_
行人重识别的深度学习：综述和展望 <https://github.com/mangye16/ReID-Survey>_

引用

如果你在研究中使用了此代码或模型，请引用以下论文：

.. code-block:: bash

@article{torchreid,
  title={Torchreid: A Library for Deep Learning Person Re-Identification in Pytorch},
  author={Zhou, Kaiyang and Xiang, Tao},
  journal={arXiv preprint arXiv:1910.10093},
  year={2019}
}

@inproceedings{zhou2019osnet,
  title={Omni-Scale Feature Learning for Person Re-Identification},
  author={Zhou, Kaiyang and Yang, Yongxin and Cavallaro, Andrea and Xiang, Tao},
  booktitle={ICCV},
  year={2019}
}

@article{zhou2021osnet,
  title={Learning Generalisable Omni-Scale Representations for Person Re-Identification},
  author={Zhou, Kaiyang and Yang, Yongxin and Cavallaro, Andrea and Xiang, Tao},
  journal={TPAMI},
  year={2021}
}

deep-person-reid

Torchreid

最新动态

安装

快速入门：30 秒到 Torchreid

统一接口

数据集

模型

有用链接

引用

相关项目

最新项目