Statistiche - Modelli di dati

I modelli di dati sono molto utili quando vengono disegnati graficamente. Modelli di dati comunemente descritti in termini di caratteristiche come centro, diffusione, forma e altre proprietà insolite. Altre etichette descrittive speciali sono simmetriche, a forma di campana, oblique, ecc.

Centro

Il centro di una distribuzione, graficamente, si trova alla mediana della distribuzione. Un grafico di questo tipo mostra che quasi la metà delle osservazioni si trova su entrambi i lati. L'altezza di ogni colonna indica la frequenza delle osservazioni.

Diffusione

La diffusione di una distribuzione si riferisce alla variazione dei dati. Se l'insieme di osservazioni copre un ampio intervallo, lo spread è maggiore. Se le osservazioni sono centrate attorno a un singolo valore, lo spread è inferiore.

Forma

La forma di una distribuzione può essere descritta utilizzando le seguenti caratteristiche.

  • Symmetry - Nella distribuzione simmetrica, il grafico può essere diviso al centro in modo tale che ciascuna metà sia un'immagine speculare dell'altra.

  • Number of peaks.- Distribuzioni con uno o più picchi. La distribuzione con un picco chiaro è nota come unimodale e la distribuzione con due picchi chiari è chiamata bimodale. Una distribuzione simmetrica a picco singolo al centro, viene definita a forma di campana.

  • Skewness- Alcune distribuzioni possono avere più osservazioni su un lato del grafico rispetto all'altro. Si dice che le distribuzioni che hanno meno osservazioni verso valori più bassi siano distorte a destra; e si dice che le distribuzioni con meno osservazioni verso valori più bassi siano distorte a sinistra.

  • Uniform - Quando la serie di osservazioni non ha un picco e i dati sono equamente distribuiti nell'intervallo della distribuzione, la distribuzione viene chiamata distribuzione uniforme.

Caratteristiche insolite

Le caratteristiche insolite comuni dei modelli di dati sono lacune e valori anomali.

  • Gaps- Gaps indica aree di una distribuzione che non hanno osservazioni. La figura seguente presenta uno spazio vuoto poiché non ci sono osservazioni al centro della distribuzione.

  • Outliers- Le distribuzioni possono essere caratterizzate da valori estremi che differiscono notevolmente dall'altra serie di dati di osservazione. Questi valori estremi sono indicati come valori anomali. La figura seguente illustra una distribuzione con un valore anomalo.