Weka - Caricamento dati
In questo capitolo, iniziamo con la prima scheda che utilizzi per preelaborare i dati. Questo è comune a tutti gli algoritmi che applicheresti ai tuoi dati per la costruzione del modello ed è un passaggio comune per tutte le operazioni successive in WEKA.
Affinché un algoritmo di apprendimento automatico fornisca una precisione accettabile, è importante prima pulire i dati. Questo perché i dati grezzi raccolti dal campo possono contenere valori nulli, colonne irrilevanti e così via.
In questo capitolo imparerai come preelaborare i dati grezzi e creare un dataset pulito e significativo per un ulteriore utilizzo.
Innanzitutto imparerai a caricare il file di dati nell'explorer WEKA. I dati possono essere caricati dalle seguenti fonti:
- File system locale
- Web
- Database
In questo capitolo vedremo in dettaglio tutte e tre le opzioni di caricamento dei dati.
Caricamento dei dati dal file system locale
Appena sotto le schede Machine Learning che hai studiato nella lezione precedente, troverai i seguenti tre pulsanti:
- Apri il file ...
- Apri URL ...
- Apri DB ...
Clicca sul Open file... pulsante. Si apre una finestra del navigatore di directory come mostrato nella schermata seguente:
Ora vai alla cartella in cui sono archiviati i tuoi file di dati. L'installazione di WEKA fornisce molti database di esempio da sperimentare. Questi sono disponibili indata cartella dell'installazione WEKA.
A scopo di apprendimento, seleziona qualsiasi file di dati da questa cartella. Il contenuto del file verrebbe caricato nell'ambiente WEKA. Molto presto impareremo come ispezionare ed elaborare questi dati caricati. Prima di ciò, vediamo come caricare il file di dati dal Web.
Caricamento dei dati dal Web
Dopo aver fatto clic sul file Open URL ... pulsante, puoi vedere una finestra come segue:
Apriremo il file da un URL pubblico Digita il seguente URL nella finestra popup -
https://storm.cis.fordham.edu/~gweiss/data-mining/weka-data/weather.nominal.arff
Puoi specificare qualsiasi altro URL in cui sono archiviati i tuoi dati. IlExplorer caricherà i dati dal sito remoto nel suo ambiente.
Caricamento dati da DB
Dopo aver fatto clic sul file Open DB ..., puoi vedere una finestra come segue:
Imposta la stringa di connessione al tuo database, imposta la query per la selezione dei dati, elabora la query e carica i record selezionati in WEKA.