SAS - Istogrammi

Un istogramma è una visualizzazione grafica dei dati utilizzando barre di diverse altezze. Raggruppa i vari numeri nel set di dati in molti intervalli. Rappresenta anche la stima della probabilità di distribuzione di una variabile continua. In SAS ilPROC UNIVARIATE viene utilizzato per creare istogrammi con le opzioni seguenti.

Sintassi

La sintassi di base per creare un istogramma in SAS è:

PROC UNIVARAITE DATA = DATASET;
HISTOGRAM variables;
RUN;

Di seguito è riportata la descrizione dei parametri utilizzati:

  • DATASET è il nome del set di dati utilizzato.

  • variables sono i valori usati per tracciare l'istogramma.

Istogramma semplice

Viene creato un semplice istogramma specificando il nome della variabile e l'intervallo da considerare per raggruppare i valori.

Esempio

Nell'esempio seguente, consideriamo i valori minimo e massimo della potenza variabile e prendiamo un intervallo di 50. Quindi i valori formano un gruppo in passi di 50.

proc univariate data = sashelp.cars;
   histogram horsepower
   / midpoints = 176 to 350 by 50;
run;

Quando eseguiamo il codice sopra, otteniamo il seguente output:

Istogramma con adattamento della curva

Possiamo adattare alcune curve di distribuzione nell'istogramma utilizzando opzioni aggiuntive.

Esempio

Nell'esempio seguente adattiamo una curva di distribuzione con valori di deviazione media e standard indicati come EST. Questa opzione utilizza e stima dei parametri.

proc univariate data = sashelp.cars noprint;
histogram horsepower
/ 
normal ( 
   mu = est
   sigma = est
   color = blue
   w = 2.5 
)
barlabel = percent
midpoints = 70 to 550 by 50;
run;

Quando eseguiamo il codice sopra, otteniamo il seguente output: