在 PyTorch 的 torchvision
库中,transforms
模块提供了一系列用于预处理图像
和进行数据增强
的工具。这些变换可以对数据进行标准化
、裁剪
、旋转
等操作,是构建深度学习模型中图像处理
流程的重要部分。
主要功能
-
数据类型转换:
ToTensor
:将 PIL 图像或 NumPy 数组转换为 FloatTensor,并在 0 到 1 之间缩放图像数据。ToPILImage
:将 tensor 或数组转换回 PIL 图像。
-
图像尺寸调整:
Resize
:调整图像的大小。CenterCrop
、RandomCrop
、RandomResizedCrop
:进行中心裁剪或随机裁剪,以及调整大小和裁剪的组合。Pad
:对图像边缘进行填充。
-
图像变换:
RandomHorizontalFlip
、RandomVerticalFlip
:随机水平或垂直翻转图像。RandomRotation
:随机旋转图像一定角度。RandomAffine