Seaborn - Stime della densità del kernel
Kernel Density Estimation (KDE) è un modo per stimare la funzione di densità di probabilità di una variabile casuale continua. Viene utilizzato per analisi non parametriche.
L'impostazione di hist flag su False in distplot produrrà il grafico di stima della densità del kernel.
Esempio
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'],hist=False)
plt.show()
Produzione
Adattamento della distribuzione parametrica
distplot() viene utilizzato per visualizzare la distribuzione parametrica di un set di dati.
Esempio
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'])
plt.show()
Produzione
Tracciare la distribuzione bivariata
La distribuzione bivariata viene utilizzata per determinare la relazione tra due variabili. Questo si occupa principalmente della relazione tra due variabili e di come si comporta una variabile rispetto all'altra.
Il modo migliore per analizzare la distribuzione bivariata in seaborn è usare il jointplot() funzione.
Jointplot crea una figura multi-pannello che proietta la relazione bivariata tra due variabili e anche la distribuzione univariata di ciascuna variabile su assi separati.
Grafico a dispersione
Il grafico a dispersione è il modo più conveniente per visualizzare la distribuzione in cui ciascuna osservazione è rappresentata in un grafico bidimensionale tramite gli assi xey.
Esempio
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df)
plt.show()
Produzione
La figura sopra mostra la relazione tra petal_length e petal_widthnei dati Iris. Una tendenza nella trama dice che esiste una correlazione positiva tra le variabili in studio.
Hexbin Plot
Il binning esagonale viene utilizzato nell'analisi dei dati bivariati quando la densità dei dati è scarsa, ovvero quando i dati sono molto dispersi e difficili da analizzare attraverso grafici a dispersione.
Un parametro aggiuntivo chiamato "tipo" e valore "esadecimale" traccia il grafico hexbin.
Esempio
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()
Stima della densità del kernel
La stima della densità del kernel è un modo non parametrico per stimare la distribuzione di una variabile. In seaborn, possiamo tracciare un kde usandojointplot().
Passa il valore "kde" al tipo di parametro per tracciare la trama del kernel.
Esempio
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()