Weka - Formati di file

WEKA supporta un gran numero di formati di file per i dati. Ecco l'elenco completo -

  • arff
  • arff.gz
  • bsi
  • csv
  • dat
  • data
  • json
  • json.gz
  • libsvm
  • m
  • names
  • xrff
  • xrff.gz

I tipi di file supportati sono elencati nella casella di riepilogo a discesa nella parte inferiore dello schermo. Questo è mostrato nella schermata riportata di seguito.

Come noterai, supporta diversi formati tra cui CSV e JSON. Il tipo di file predefinito è Arff.

Formato Arff

Un Arff il file contiene due sezioni: intestazione e dati.

  • L'intestazione descrive i tipi di attributo.
  • La sezione dati contiene un elenco di dati separati da virgole.

Ad esempio per il formato Arff, il file Weather il file di dati caricato dai database di esempio WEKA è mostrato di seguito:

Dallo screenshot, puoi dedurre i seguenti punti:

  • Il tag @relation definisce il nome del database.

  • Il tag @attribute definisce gli attributi.

  • Il tag @data avvia l'elenco di righe di dati, ciascuna contenente i campi separati da virgole.

  • Gli attributi possono assumere valori nominali come nel caso di Outlook mostrato qui -

@attribute outlook (sunny, overcast, rainy)
  • Gli attributi possono assumere valori reali come in questo caso -

@attribute temperature real
  • Puoi anche impostare una variabile Target o Classe chiamata play come mostrato qui -

@attribute play (yes, no)
  • Il Target assume due valori nominali sì o no.

Altri formati

Explorer può caricare i dati in uno qualsiasi dei formati menzionati in precedenza. Poiché arff è il formato preferito in WEKA, puoi caricare i dati da qualsiasi formato e salvarli nel formato arff per un uso successivo. Dopo aver preelaborato i dati, salvarli nel formato arff per ulteriori analisi.

Ora che hai imparato a caricare i dati in WEKA, nel prossimo capitolo imparerai come preelaborare i dati.