Statistiche - Coefficiente di correlazione

Coefficiente di correlazione

Un coefficiente di correlazione è una misura statistica del grado in cui le modifiche al valore di una variabile prevedono la modifica del valore di un'altra. Nelle variabili positivamente correlate, il valore aumenta o diminuisce in tandem. Nelle variabili correlate negativamente, il valore di una aumenta al diminuire del valore dell'altra.

I coefficienti di correlazione sono espressi come valori compresi tra +1 e -1.

Un coefficiente di +1 indica una correlazione positiva perfetta: un cambiamento nel valore di una variabile predice un cambiamento nella stessa direzione nella seconda variabile.

Un coefficiente di -1 indica un perfetto negativo: un cambiamento nel valore di una variabile predice un cambiamento nella direzione opposta nella seconda variabile. I gradi di correlazione minori sono espressi come decimali diversi da zero. Un coefficiente di zero indica che non esiste una relazione distinguibile tra le fluttuazioni delle variabili.

Formula

$ {r = \ frac {N \ sum xy - (\ sum x) (\ sum y)} {\ sqrt {[N \ sum x ^ 2 - (\ sum x) ^ 2] [N \ sum y ^ 2 - (\ sum y) ^ 2]}}} $

Dove -

  • $ {N} $ = Numero di coppie di punteggi

  • $ {\ sum xy} $ = Somma dei prodotti di punteggi accoppiati.

  • $ {\ sum x} $ = Somma di x punteggi.

  • $ {\ sum y} $ = Somma di y punteggi.

  • $ {\ sum x ^ 2} $ = Somma dei punteggi x al quadrato.

  • $ {\ sum y ^ 2} $ = Somma dei punteggi y al quadrato.

Esempio

Problem Statement:

Calcola il coefficiente di correlazione di quanto segue:

X Y
1 2
3 5
4 5
4 8

Solution:

$ {\ sum xy = (1) (2) + (3) (5) + (4) (5) + (4) (8) = 69 \\ [7pt] \ sum x = 1 + 3 + 4 + 4 = 12 \\ [7pt] \ sum y = 2 + 5 + 5 + 8 = 20 \\ [7pt] \ sum x ^ 2 = 1 ^ 2 + 3 ^ 2 + 4 ^ 2 + 4 ^ 2 = 42 \ \ [7pt] \ sum y ^ 2 = 2 ^ 2 + 5 ^ 2 + 5 ^ 2 + 8 ^ 2 = 118 \\ [7pt] r = \ frac {69 - \ frac {(12) (20)} { 4}} {\ sqrt {(42 - \ frac {(12) ^ 2} {4}) (118- \ frac {(20) ^ 2} {4}}} \\ [7pt] = .866} $