Project Icon

easyportrait

人像分割和面部解析大规模数据集

EasyPortrait是一个包含40,000张高质量标注RGB图像的数据集,用于人像分割和面部解析研究。数据集提供9个类别的标注,涵盖背景、人物、皮肤、眉毛、眼睛等。它可应用于视频会议背景移除、面部美化等多个场景。数据集基于用户ID划分训练、验证和测试集,并提供多个基线模型的预训练权重,为计算机视觉研究提供了有价值的资源。

easyportrait

EasyPortrait - 面部解析和人像分割数据集

我们推出了一个大规模图像数据集EasyPortrait,用于人像分割和面部解析。该数据集可用于多项任务,如会议应用中的背景去除、牙齿美白、面部皮肤增强、红眼去除或眼睛着色等。

EasyPortrait数据集大小约为91.78GB,包含40,000张RGB图像(约38.3K全高清图像),带有高质量的标注掩码。该数据集按照user_id主题分为训练集、验证集和测试集。训练集包含30,000张图像,验证集包含4,000张图像,测试集包含6,000张图像。

更多信息请参阅我们的论文EasyPortrait – 面部解析和人像分割数据集

🔥 更新日志

  • 2023/11/13: 我们发布了EasyPortrait 2.0版本。✌️
    • 40,000张RGB图像(约38.3K全高清图像)
    • 增加了地区、种族、人类情绪和光照条件的多样性
    • 数据进行了进一步清理并添加了新内容
    • 训练/验证/测试集划分:(30,000)75% /(4,000)10% /(6,000)15%,按照user_id主题划分
    • 多GPU训练和测试
    • 为面部解析和人像分割添加了新模型
    • 数据集大小为91.78GB
    • 13,705个独特个体
  • 2023/02/23: EasyPortrait(初始数据集)💪
    • 数据集大小为26GB
    • 20,000张RGB图像(约17.5K全高清图像),标注了9个类别
    • 训练/验证/测试集划分:(14,000)70% /(2,000)10% /(4,000)20%,按照user_id主题划分
    • 8,377个独特个体

旧版EasyPortrait数据集也可在EasyPortrait_v1分支中获取!

下载

链接大小
images91.8 GB
annotations657.1 MB
meta1.9 MB
训练集68.3 GB
验证集10.7 GB
测试集12.8 GB

此外,您还可以从Kaggle下载EasyPortrait数据集。

结构

.
├── images.zip
│   ├── train/         # 训练集:30k
│   ├── val/           # 验证集:4k
│   ├── test/          # 测试集:6k
├── annotations.zip
│   ├── train/
│   ├── val/
│   ├── test/
├── meta.zip       # 元信息(宽度、高度、亮度、imhash、user_id)
...

模型

我们提供了一些预训练模型作为人像分割和面部解析的基准。我们使用平均交并比(mIoU)作为主要评估指标。

人像分割:

模型名称参数量(百万)输入尺寸平均交并比
BiSeNet-V256.5384 x 38497.95
DANet190.2384 x 38498.63
DeepLabv3260384 x 38498.63
ExtremeC3Net0.15384 x 38496.54
Fast SCNN6.13384 x 38497.64
FCN + MobileNetv231.17384 x 38498.19
FPN + ResNet50108.911024 × 102498.54
FPN + ResNet50108.91512 × 51298.64
FPN + ResNet50108.91384 x 38498.64
FPN + ResNet50108.91224 × 22498.31
SegFormer-B014.91024 × 102498.74
SegFormer-B014.9512 × 51298.66
SegFormer-B014.9384 x 38498.61
SegFormer-B014.9224 × 22498.17
SINet0.13384 x 38493.32

人脸解析:

模型名称参数量 (百万)输入尺寸平均交并比
BiSeNet-V256.5384 x 38476.72
DANet190.2384 x 38479.3
DeepLabv3260384 x 38479.11
EHANet44.81384 x 38472.56
Fast SCNN6.13384 x 38467.56
FCN + MobileNetv231.17384 x 38475.23
FPN + ResNet50108.911024 × 102485.37
FPN + ResNet50108.91512 × 51283.33
FPN + ResNet50108.91384 x 38481.83
FPN + ResNet50108.91224 × 22475.6
SegFormer-B014.91024 × 102485.42
SegFormer-B014.9512 × 51283.19
SegFormer-B014.9384 x 38481.38
SegFormer-B014.9224 × 22474.83

标注

标注以2D数组的形式呈现,图像以 *.png 格式存储,包含多个类别:

索引类别
0背景
1人物
2皮肤
3左眉
4右眉
5左眼
6右眼
7嘴唇
8牙齿

此外,我们在 annotations/meta.zip 文件中提供了一些额外的数据集元信息:

图像名称用户ID高度宽度集合亮度
0a753e021-...56...720960训练集126
14ff04492-...ba...19201440测试集173
2e8934c99-...1d...19201440验证集187

其中:

  • image_name - 不带扩展名的图像文件名
  • user_id - 唯一的匿名用户ID
  • height - 图像高度
  • width - 图像宽度
  • brightness - 图像亮度
  • set - "train"、"test" 或 "val" 分别表示训练集、测试集或验证集

图像

easyportrait

在EasyPortrait上进行训练、评估和测试

代码基于 MMSegmentation 0.30.0版本。

模型在8个NVIDIA V100 GPU上使用CUDA 11.2进行训练和评估。

安装过程请按照这里的说明进行,并使用我们仓库中的 requirements.txt 文件。

训练

单GPU模式:

python ./pipelines/tools/train.py ./pipelines/local_configs/easy_portrait_experiments/<model_dir>/<config_file>.py --gpu-id <GPU_ID>

分布式训练模式:

./pipelines/tools/dist_train.sh ./pipelines/local_configs/easy_portrait_experiments/<model_dir>/<config_file>.py <NUM_GPUS>
评估

单GPU模式:

python ./pipelines/tools/test.py <PATH_TO_MODEL_CONFIG>  <PATH_TO_CHECKPOINT> --gpu-id <GPU_ID> --eval mIoU

分布式评估模式:

./pipelines/tools/dist_test.sh <PATH_TO_MODEL_CONFIG>  <PATH_TO_CHECKPOINT> <NUM_GPUS> --eval mIoU
运行演示 ```console python ./pipelines/demo/image_demo.py <图片路径> <模型配置路径> <检查点路径> --palette=easy_portrait --out-file=<输出文件路径> ```

作者与贡献者

相关链接

引用

您可以使用以下BibTeX条目引用本论文:

@article{EasyPortrait,
    title={EasyPortrait - Face Parsing and Portrait Segmentation Dataset},
    author={Kapitanov, Alexander and Kvanchiani, Karina and Kirillova Sofia},
    journal={arXiv preprint arXiv:2304.13509},
    year={2023}
}

许可证

知识共享许可协议
本作品采用知识共享署名-相同方式共享 4.0 国际许可协议的一个变种进行许可。

请查看具体的许可证

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号