PyTorch - Set di dati

In questo capitolo, ci concentreremo maggiormente su torchvision.datasetse le sue varie tipologie. PyTorch include i seguenti caricatori di set di dati:

  • MNIST
  • COCO (sottotitoli e rilevamento)

Il set di dati include la maggior parte dei due tipi di funzioni indicate di seguito:

  • Transform- una funzione che accetta un'immagine e restituisce una versione modificata di materiale standard. Questi possono essere composti insieme alle trasformazioni.

  • Target_transform- una funzione che prende il bersaglio e lo trasforma. Ad esempio, accetta la stringa della didascalia e restituisce un tensore degli indici mondiali.

MNIST

Di seguito è riportato il codice di esempio per il set di dati MNIST:

dset.MNIST(root, train = TRUE, transform = NONE, 
target_transform = None, download = FALSE)

I parametri sono i seguenti:

  • root - directory principale del set di dati in cui esistono i dati elaborati.

  • train - True = Training set, False = Test set

  • download - Vero = scarica il set di dati da Internet e lo inserisce nella radice.

COCO

Ciò richiede l'installazione dell'API COCO. L'esempio seguente viene utilizzato per dimostrare l'implementazione COCO del set di dati utilizzando PyTorch -

import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ‘ dir where images are’, 
annFile = ’json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)

L'output ottenuto è il seguente:

Number of samples: 82783
Image Size: (3L, 427L, 640L)