Seaborn - Stime della densità del kernel

Kernel Density Estimation (KDE) è un modo per stimare la funzione di densità di probabilità di una variabile casuale continua. Viene utilizzato per analisi non parametriche.

L'impostazione di hist flag su False in distplot produrrà il grafico di stima della densità del kernel.

Esempio

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'],hist=False)
plt.show()

Produzione

Adattamento della distribuzione parametrica

distplot() viene utilizzato per visualizzare la distribuzione parametrica di un set di dati.

Esempio

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'])
plt.show()

Produzione

Tracciare la distribuzione bivariata

La distribuzione bivariata viene utilizzata per determinare la relazione tra due variabili. Questo si occupa principalmente della relazione tra due variabili e di come si comporta una variabile rispetto all'altra.

Il modo migliore per analizzare la distribuzione bivariata in seaborn è usare il jointplot() funzione.

Jointplot crea una figura multi-pannello che proietta la relazione bivariata tra due variabili e anche la distribuzione univariata di ciascuna variabile su assi separati.

Grafico a dispersione

Il grafico a dispersione è il modo più conveniente per visualizzare la distribuzione in cui ciascuna osservazione è rappresentata in un grafico bidimensionale tramite gli assi xey.

Esempio

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df)
plt.show()

Produzione

La figura sopra mostra la relazione tra petal_length e petal_widthnei dati Iris. Una tendenza nella trama dice che esiste una correlazione positiva tra le variabili in studio.

Hexbin Plot

Il binning esagonale viene utilizzato nell'analisi dei dati bivariati quando la densità dei dati è scarsa, ovvero quando i dati sono molto dispersi e difficili da analizzare attraverso grafici a dispersione.

Un parametro aggiuntivo chiamato "tipo" e valore "esadecimale" traccia il grafico hexbin.

Esempio

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()

Stima della densità del kernel

La stima della densità del kernel è un modo non parametrico per stimare la distribuzione di una variabile. In seaborn, possiamo tracciare un kde usandojointplot().

Passa il valore "kde" al tipo di parametro per tracciare la trama del kernel.

Esempio

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()

Produzione