SAS - Deviazione standard

La deviazione standard (SD) è una misura della variabilità dei dati in un set di dati. Matematicamente misura quanto distanti o vicini sono ogni valore al valore medio di un set di dati. Un valore di deviazione standard vicino a 0 indica che i punti dati tendono ad essere molto vicini alla media del set di dati e una deviazione standard alta indica che i punti dati sono distribuiti su una gamma più ampia di valori

In SAS i valori SD vengono misurati utilizzando PROC MEAN e PROC SURVEYMEANS.

Utilizzando PROC MEANS

Per misurare la SD utilizzando proc meansscegliamo l'opzione STD nel passaggio PROC. Evidenzia i valori SD per ogni variabile numerica presente nel set di dati.

Sintassi

La sintassi di base per il calcolo della deviazione standard in SAS è:

PROC means DATA = dataset STD;

Di seguito la descrizione dei parametri utilizzati:

  • Dataset - è il nome del set di dati.

Esempio

Nell'esempio seguente creiamo il data set CARS1 dal data set CARS nella libreria SASHELP. Scegliamo l'opzione STD con PROC significa passo.

PROC SQL;
create table CARS1 as
SELECT make, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc means data = CARS1 STD;
run;

Quando eseguiamo il codice precedente, fornisce il seguente output:

Utilizzo di PROC SURVEYMEANS

Questa procedura viene utilizzata anche per la misurazione della SD insieme ad alcune funzionalità avanzate come la misurazione della SD per le variabili categoriali e per fornire stime della varianza.

Sintassi

La sintassi per l'utilizzo di PROC SURVEYMEANS è:

PROC SURVEYMEANS options statistic-keywords ;
BY variables ;
CLASS variables ;
VAR variables ;

Di seguito la descrizione dei parametri utilizzati:

  • BY - indica le variabili utilizzate per creare gruppi di osservazioni.

  • CLASS - indica le variabili utilizzate per le variabili categoriali.

  • VAR - indica le variabili per le quali verrà calcolata la SD.

Esempio

L'esempio seguente descrive l'uso di class opzione che crea le statistiche per ciascuno dei valori nella variabile di classe.

proc surveymeans data = CARS1 STD;
class type;
var type horsepower;
ods output statistics = rectangle;
run;
proc print data = rectangle;
run;

Quando eseguiamo il codice precedente, fornisce il seguente output:

Utilizzando l'opzione BY

Il codice seguente fornisce un esempio dell'opzione BY. In esso il risultato è raggruppato per ogni valore nell'opzione BY.

Esempio

proc surveymeans data = CARS1 STD;
var horsepower;
BY make;
ods output statistics = rectangle;
run;
proc print data = rectangle;
run;

Quando eseguiamo il codice precedente, fornisce il seguente output:

Risultato per make = "Audi"

Risultato per make = "BMW"