Seaborn - Visualizzazione della relazione a coppie

I set di dati oggetto di studio in tempo reale contengono molte variabili. In questi casi, dovrebbe essere analizzata la relazione tra ciascuna variabile. Tracciare la distribuzione bivariata per (n, 2) combinazioni sarà un processo molto complesso e richiederà tempo.

Per tracciare più distribuzioni bivariate a coppie in un set di dati, è possibile utilizzare il pairplot()funzione. Questo mostra la relazione per la combinazione (n, 2) della variabile in un DataFrame come matrice di grafici e i grafici diagonali sono i grafici univariati.

Assi

In questa sezione impareremo cosa sono gli assi, il loro utilizzo, i parametri e così via.

Utilizzo

seaborn.pairplot(data,…)

Parametri

La tabella seguente elenca i parametri per gli assi:

Sr.No. Parametro e descrizione
1

data

Dataframe

2

hue

Variabile nei dati per mappare gli aspetti del grafico a colori diversi.

3

palette

Set di colori per mappare la variabile di tonalità

4

kind

Tipo di trama per le relazioni di non identità. {'scatter', 'reg'}

5

diag_kind

Tipo di trama per le sottotrame diagonali. {'hist', 'kde'}

Tutti gli altri parametri, tranne i dati, sono facoltativi. Ci sono pochi altri parametri chepairplotpuò accettare. I parametri sopra menzionati sono spesso usati.

Esempio

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.set_style("ticks")
sb.pairplot(df,hue = 'species',diag_kind = "kde",kind = "scatter",palette = "husl")
plt.show()

Produzione

Possiamo osservare le variazioni in ogni trama. I grafici sono in formato matrice in cui il nome della riga rappresenta l'asse x e il nome della colonna rappresenta l'asse y.

I grafici diagonali sono grafici della densità del kernel in cui gli altri grafici sono grafici a dispersione come menzionato.