SAS - Analisi di correlazione

L'analisi di correlazione si occupa delle relazioni tra le variabili. Il coefficiente di correlazione è una misura dell'associazione lineare tra due variabili. I valori del coefficiente di correlazione sono sempre compresi tra -1 e +1. SAS fornisce la proceduraPROC CORR per trovare i coefficienti di correlazione tra una coppia di variabili in un set di dati.

Sintassi

La sintassi di base per applicare PROC CORR in SAS è:

PROC CORR DATA = dataset options;
VAR variable;

Di seguito la descrizione dei parametri utilizzati:

  • Dataset è il nome del set di dati.

  • Options è l'opzione aggiuntiva con procedure come il tracciamento di una matrice ecc.

  • Variable è il nome della variabile del set di dati utilizzato per trovare la correlazione.

Esempio

I coefficienti di correlazione tra una coppia di variabili disponibili in un set di dati possono essere ottenuti utilizzando i loro nomi nell'istruzione VAR. Nell'esempio seguente utilizziamo il set di dati CARS1 e otteniamo il risultato che mostra i coefficienti di correlazione tra potenza e peso.

PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc corr data = cars1 ;
VAR horsepower weight ;
BY make;
run;

Quando il codice sopra viene eseguito, otteniamo il seguente risultato:

Correlazione tra tutte le variabili

I coefficienti di correlazione tra tutte le variabili disponibili in un dataset possono essere ottenuti semplicemente applicando la procedura con il nome del dataset.

Esempio

Nell'esempio seguente utilizziamo il set di dati CARS1 e otteniamo il risultato che mostra i coefficienti di correlazione tra ciascuna coppia di variabili.

proc corr data = cars1 ;
run;

Quando il codice sopra viene eseguito, otteniamo il seguente risultato:

Matrice di correlazione

Possiamo ottenere una matrice del grafico a dispersione tra le variabili scegliendo l'opzione per tracciare la matrice nel file PROC dichiarazione.

Esempio

Nell'esempio seguente otteniamo la matrice tra potenza e peso.

proc corr data = cars1 plots = matrix ;
VAR horsepower weight ;
run;

Quando il codice sopra viene eseguito, otteniamo il seguente risultato: