Seaborn - Importazione di set di dati e librerie

In questo capitolo, discuteremo come importare dataset e librerie. Cominciamo col capire come importare le librerie.

Importazione di librerie

Cominciamo importando Pandas, che è un'ottima libreria per la gestione di set di dati relazionali (in formato tabella). Seaborn è utile quando si ha a che fare con DataFrame, la struttura dati più utilizzata per l'analisi dei dati.

Il seguente comando ti aiuterà a importare i Panda:

# Pandas for managing datasets
import pandas as pd

Ora, importiamo la libreria Matplotlib, che ci aiuta a personalizzare i nostri grafici.

# Matplotlib for additional customization
from matplotlib import pyplot as plt

Importeremo la libreria Seaborn con il seguente comando:

# Seaborn for plotting and styling
import seaborn as sb

Importazione di set di dati

Abbiamo importato le librerie richieste. In questa sezione, capiremo come importare i set di dati richiesti.

Seaborn viene fornito con alcuni importanti set di dati nella libreria. Quando Seaborn è installato, i set di dati vengono scaricati automaticamente.

Puoi utilizzare uno qualsiasi di questi set di dati per il tuo apprendimento. Con l'aiuto della seguente funzione è possibile caricare il set di dati richiesto

load_dataset()

Importazione dei dati come Pandas DataFrame

In questa sezione, importeremo un set di dati. Questo set di dati viene caricato come Pandas DataFrame per impostazione predefinita. Se è presente una funzione in Pandas DataFrame, funziona su questo DataFrame.

La seguente riga di codice ti aiuterà a importare il set di dati:

# Seaborn for plotting and styling
import seaborn as sb
df = sb.load_dataset('tips')
print df.head()

La riga di codice precedente genererà il seguente output:

total_bill  tip   sex    smoker day  time   size
0    16.99    1.01   Female  No    Sun  Dinner  2
1    10.34    1.66   Male    No    Sun  Dinner  3
2    21.01    3.50   Male    No    Sun  Dinner  3
3    23.68    3.31   Male    No    Sun  Dinner  2
4    24.59    3.61   Female  No    Sun  Dinner  4

Per visualizzare tutti i set di dati disponibili nella libreria Seaborn, è possibile utilizzare il seguente comando con il get_dataset_names() funziona come mostrato di seguito -

import seaborn as sb
print sb.get_dataset_names()

La riga di codice precedente restituirà l'elenco dei set di dati disponibili come output seguente

[u'anscombe', u'attention', u'brain_networks', u'car_crashes', u'dots', 
u'exercise', u'flights', u'fmri', u'gammas', u'iris', u'planets', u'tips', 
u'titanic']

DataFramesmemorizzare i dati sotto forma di griglie rettangolari con cui i dati possono essere visualizzati facilmente. Ogni riga della griglia rettangolare contiene i valori di un'istanza e ogni colonna della griglia è un vettore che contiene i dati per una variabile specifica. Ciò significa che non è necessario che le righe di un DataFrame contengano valori dello stesso tipo di dati, possono essere numerici, di carattere, logici, ecc. I DataFrame per Python sono forniti con la libreria Pandas e sono definiti come strutture di dati con etichetta bidimensionale con tipi di colonne potenzialmente diversi.

Per maggiori dettagli su DataFrames, visita il nostro tutorial sui panda.