Statistiche - Coefficiente di correlazione
Coefficiente di correlazione
Un coefficiente di correlazione è una misura statistica del grado in cui le modifiche al valore di una variabile prevedono la modifica del valore di un'altra. Nelle variabili positivamente correlate, il valore aumenta o diminuisce in tandem. Nelle variabili correlate negativamente, il valore di una aumenta al diminuire del valore dell'altra.
I coefficienti di correlazione sono espressi come valori compresi tra +1 e -1.
Un coefficiente di +1 indica una correlazione positiva perfetta: un cambiamento nel valore di una variabile predice un cambiamento nella stessa direzione nella seconda variabile.
Un coefficiente di -1 indica un perfetto negativo: un cambiamento nel valore di una variabile predice un cambiamento nella direzione opposta nella seconda variabile. I gradi di correlazione minori sono espressi come decimali diversi da zero. Un coefficiente di zero indica che non esiste una relazione distinguibile tra le fluttuazioni delle variabili.
Formula
$ {r = \ frac {N \ sum xy - (\ sum x) (\ sum y)} {\ sqrt {[N \ sum x ^ 2 - (\ sum x) ^ 2] [N \ sum y ^ 2 - (\ sum y) ^ 2]}}} $
Dove -
$ {N} $ = Numero di coppie di punteggi
$ {\ sum xy} $ = Somma dei prodotti di punteggi accoppiati.
$ {\ sum x} $ = Somma di x punteggi.
$ {\ sum y} $ = Somma di y punteggi.
$ {\ sum x ^ 2} $ = Somma dei punteggi x al quadrato.
$ {\ sum y ^ 2} $ = Somma dei punteggi y al quadrato.
Esempio
Problem Statement:
Calcola il coefficiente di correlazione di quanto segue:
X | Y |
---|---|
1 | 2 |
3 | 5 |
4 | 5 |
4 | 8 |
Solution: