Panda Python - Visualizzazione
Tracciatura di base: trama
Questa funzionalità su Series e DataFrame è solo un semplice wrapper attorno a matplotlib libraries plot() metodo.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('1/1/2000',
periods=10), columns=list('ABCD'))
df.plot()
Suo output è il seguente -
Se l'indice è costituito da date, chiama gct().autofmt_xdate() per formattare l'asse x come mostrato nell'illustrazione sopra.
Possiamo tracciare una colonna rispetto a un'altra usando il x e y parole chiave.
I metodi di stampa consentono una manciata di stili di stampa diversi dal grafico a linee predefinito. Questi metodi possono essere forniti come argomento della parola chiave gentile aplot(). Questi includono:
- bar o barh per i grafici a barre
- hist per istogramma
- box per boxplot
- 'area' per i grafici dell'area
- 'scatter' per grafici a dispersione
Bar Plot
Vediamo ora cos'è un grafico a barre creandone uno. È possibile creare un grafico a barre nel modo seguente:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar()
Suo output è il seguente -
Per produrre un grafico a barre in pila, pass stacked=True -
import pandas as pd
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar(stacked=True)
Suo output è il seguente -
Per ottenere grafici a barre orizzontali, utilizzare il barh metodo -
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.barh(stacked=True)
Suo output è il seguente -
Istogrammi
Gli istogrammi possono essere tracciati utilizzando il plot.hist()metodo. Possiamo specificare il numero di contenitori.
import pandas as pd
import numpy as np
df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
df.plot.hist(bins=20)
Suo output è il seguente -
Per tracciare istogrammi diversi per ogni colonna, utilizzare il codice seguente:
import pandas as pd
import numpy as np
df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
df.diff.hist(bins=20)
Suo output è il seguente -
Box Plots
Boxplot può essere disegnato chiamando Series.box.plot() e DataFrame.box.plot(), o DataFrame.boxplot() per visualizzare la distribuzione dei valori all'interno di ogni colonna.
Ad esempio, ecco un grafico a scatole che rappresenta cinque prove di 10 osservazioni di una variabile casuale uniforme su [0,1).
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box()
Suo output è il seguente -
Grafico dell'area
Il grafico dell'area può essere creato utilizzando il Series.plot.area() o il DataFrame.plot.area() metodi.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.area()
Suo output è il seguente -
Grafico a dispersione
Il grafico a dispersione può essere creato utilizzando l'estensione DataFrame.plot.scatter() metodi.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b')
Suo output è il seguente -
Grafico a torta
Il grafico a torta può essere creato utilizzando il DataFrame.plot.pie() metodo.
import pandas as pd
import numpy as np
df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x'])
df.plot.pie(subplots=True)
Suo output è il seguente -