Statistiche - Kurtosis

Il grado di coda di una distribuzione è misurato dalla curtosi. Ci dice fino a che punto la distribuzione è più o meno incline ai valori anomali (più pesante o coda leggera) rispetto alla distribuzione normale. Di seguito sono riportati tre diversi tipi di curve, per gentile concessione di Investopedia:

È difficile distinguere diversi tipi di curtosi dai grafici di densità (pannello di sinistra) perché le code sono vicine allo zero per tutte le distribuzioni. Ma le differenze nelle code sono facili da vedere nei normali grafici quantile-quantile (pannello di destra).

La curva normale è chiamata curva mesocurica. Se la curva di una distribuzione è più incline ai valori anomali (o con coda più pesante) rispetto a una curva normale o mesocurica, si parla di curva leptokurtica. Se una curva è meno incline ai valori anomali (o con una coda più chiara) rispetto a una curva normale, viene chiamata curva platycurtic. La curtosi è misurata dai momenti ed è data dalla seguente formula:

Formula

$ {\ beta_2 = \ frac {\ mu_4} {\ mu_2}} $

Dove -

  • $ {\ mu_4 = \ frac {\ sum (x- \ bar x) ^ 4} {N}} $

Maggiore è il valore di \ beta_2, più la curva ha un picco o leptokurtic. Una curva normale ha un valore di 3, una leptokurtic ha \ beta_2 maggiore di 3 e una platycurtic ha \ beta_2 minore di 3.

Esempio

Problem Statement:

Vengono forniti i dati sulla paga giornaliera di 45 lavoratori di una fabbrica. Calcola \ beta_1 e \ beta_2 utilizzando il momento sulla media. Commenta i risultati.

Salari (Rs.) Numero di lavoratori
100-200 1
120-200 2
140-200 6
160-200 20
180-200 11
200-200 3
220-200 2

Solution:

Salari
(Rs.)
Numero di lavoratori
(f)
Punto medio
m
m - $ {\ frac {170} {20}} $
d
$ {fd} $ $ {fd ^ 2} $ $ {fd ^ 3} $ $ {fd ^ 4} $
100-200 1 110 -3 -3 9 -27 81
120-200 2 130 -2 -4 8 -16 32
140-200 6 150 -1 -6 6 -6 6
160-200 20 170 0 0 0 0 0
180-200 11 190 1 11 11 11 11
200-200 3 210 2 6 12 24 48
220-200 2 230 3 6 18 54 162
  $ {N = 45} $     $ {\ sum fd = 10} $ $ {\ sum fd ^ 2 = 64} $ $ {\ sum fd ^ 3 = 40} $ $ {\ sum fd ^ 4 = 330} $

Poiché le deviazioni sono state prese da una media presunta, quindi calcoliamo prima i momenti sull'origine arbitraria e poi i momenti sulla media. Momenti sull'origine arbitraria '170'

$ {\ mu_1 ^ 1 = \ frac {\ sum fd} {N} \ times i = \ frac {10} {45} \ times 20 = 4.44 \\ [7pt] \ mu_2 ^ 1 = \ frac {\ sum fd ^ 2} {N} \ times i ^ 2 = \ frac {64} {45} \ times 20 ^ 2 = 568,88 \\ [7pt] \ mu_3 ^ 1 = \ frac {\ sum fd ^ 2} {N} \ volte i ^ 3 = \ frac {40} {45} \ times 20 ^ 3 = 7111.11 \\ [7pt] \ mu_4 ^ 1 = \ frac {\ sum fd ^ 4} {N} \ times i ^ 4 = \ frac {330} {45} \ times 20 ^ 4 = 1173333,33} $

Momenti sulla media

$ {\ mu_2 = \ mu'_2 - (\ mu'_1) ^ 2 = 568,88- (4,44) ^ 2 = 549,16 \\ [7pt] \ mu_3 = \ mu'_3 - 3 (\ mu'_1) (\ mu'_2) + 2 (\ mu'_1) ^ 3 \\ [7pt] \, = 7111,11 - (4,44) (568,88) + 2 (4,44) ^ 3 \\ [7pt] \, = 7111,11 - 7577,48 + 175,05 = - 291,32 \\ [7pt] \\ [7pt] \ mu_4 = \ mu'_4 - 4 (\ mu'_1) (\ mu'_3) + 6 (\ mu_1) ^ 2 (\ mu'_2) -3 (\ mu'_1) ^ 4 \\ [7pt] \, = 1173333,33 - 4 (4,44) (7111,11) +6 (4,44) ^ 2 (568,88) - 3 (4,44) ^ 4 \\ [7pt] \, = 1173333.33 - 126293.31 + 67288.03-1165.87 \\ [7pt] \, = 1113162.18} $

Dal valore del movimento sulla media, ora possiamo calcolare $ {\ beta_1} $ e $ {\ beta_2} $:

$ {\ beta_1 = \ mu ^ 2_3 = \ frac {(- 291,32) ^ 2} {(549,16) ^ 3} = 0.00051 \\ [7pt] \ beta_2 = \ frac {\ mu_4} {(\ mu_2) ^ 2 } = \ frac {1113162.18} {(546.16) ^ 2} = 3.69} $

Dai calcoli precedenti, si può concludere che $ {\ beta_1} $, che misura l'asimmetria, è quasi zero, indicando così che la distribuzione è quasi simmetrica. $ {\ beta_2} $ Che misura la curtosi, ha un valore maggiore di 3, il che implica che la distribuzione è leptokurtica.