imgaug入门学习资料汇总-强大的图像增强库
imgaug是一个用于机器学习实验的图像增强库。它可以将一组输入图像转换为一组新的、更大的、稍微改变的图像集。imgaug支持多种增强技术,可以轻松组合和随机应用这些技术,具有简单而强大的随机接口,不仅可以增强图像,还可以增强关键点/地标、边界框、热图和分割图。
主要特性
- 支持多种增强技术:仿射变换、透视变换、对比度变化、高斯噪声、区域丢弃、色调/饱和度变化、裁剪/填充、模糊等
- 优化的高性能实现
- 易于仅对某些图像应用增强
- 易于随机顺序应用增强
- 支持图像(uint8)、热图(float32)、分割图(int)、掩码(bool)、关键点/地标、边界框、多边形、线条等多种数据类型
- 自动对齐采样的随机值
学习资源
import imgaug.augmenters as iaa
# 定义一个增强序列
seq = iaa.Sequential([
iaa.Crop(px=(0, 16)), # 随机裁剪
iaa.Fliplr(0.5), # 50%的概率水平翻转
iaa.GaussianBlur(sigma=(0, 3.0)) # 高斯模糊
])
for batch_idx in range(1000):
images = load_batch(batch_idx)
images_aug = seq(images=images)
train_on_images(images_aug)
-
项目主页:
-
教程文章:
-
示例图片:
通过这些资源,你可以快速上手imgaug库,并将其应用到自己的机器学习项目中。imgaug强大而灵活的API可以帮助你轻松实现各种图像增强需求,提升模型性能。