[Pytorch] Transform

데이터가 항상 머신러닝 알고리즘 학습에 필요한 최종 처리가 된 형태로 제공되지는 않는다. 변형(transform)을 해서 데이터를 조작하고 학습에 적합하게 만들자.

모든 TorchVision 데이터셋들은 변형 로직을 갖는, 호출 가능한 객체(callable)를 받는 매개변수 두개 ( 특징(feature)을 변경하기 위한 transform과 정답(label)을 변경하기 위한 target_transform)를 갖는다 torchvision.transforms모듈은 주로 사용하는 몇가지 변형(transform)을 제공한다.

FashionMNIST 특징(feature)은 PIL Image 형식이며, 정답(label)은 정수(integer)이다. 학습을 하려면 정규화(normalize)된 텐서 형태의 특징(feature)과 원-핫(one-hot)으로 부호화(encode)된 텐서 형태의 정답(label)이 필요하다. 이러한 변형(transformation)을 하기 위해 ToTensor와 Lambda를 사용한다.

import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))
)

ToTensor()

ToTensor는 PIL Image나 NumPy ndarray를 FloatTensor로 변환하고, 이미지의 픽셀의 크기(intensity)값을 [0., 1.] 범위로 비례하여 조정(scale)한다.

Lambda 변형(Transform)

Lambda변형은 사용자 정의 람다(lambda) 함수를 적용한다. 여기에서는 정수를 원-핫으로 부호화된 텐서로 바꾸는 함수를 정의한다. 이 함수는 먼저 (데이터셋 정답의 개수인) 크기 10짜리 영 텐서(zero tensor)를 만들고, scatter_를 호출하여 주어진 정답 y에 해당하는 인덱스에 value=1을 할당한다.

참고: https://tutorials.pytorch.kr/beginner/basics/transforms_tutorial.html

'Python > PyTorch' 카테고리의 다른 글

[Pytorch] TORCH.AUTOGRAD를 사용한 자동 미분 (0)	2021.09.26
[Pytorch] 신경망 모델 구성하기 (0)	2021.09.25
[Pytorch] Dataset과 Dataloader (0)	2021.09.25
[Pytorch] .requires_grad(), torch.no_grad(), model.eval() (0)	2021.09.06
Custom Dataset 생성 (0)	2021.08.25

새상을 이롭게

[Pytorch] Transform

ToTensor()

Lambda 변형(Transform)

'Python > PyTorch' 카테고리의 다른 글

티스토리툴바

[Pytorch] Transform

ToTensor()

Lambda 변형(Transform)

'Python > PyTorch' 카테고리의 다른 글

'Python/PyTorch' Related Articles

티스토리툴바