Statistiche - Bontà di adattamento

Il Goodness of Fittest viene utilizzato per controllare i dati del campione se si adattano a una distribuzione di una popolazione. La popolazione può avere una distribuzione normale o una distribuzione di Weibull. In parole semplici, significa che i dati del campione rappresentano correttamente i dati che ci aspettiamo di trovare dalla popolazione effettiva. I seguenti test sono generalmente utilizzati dagli statistici:

  • Chi-square

  • Kolmogorov-Smirnov

  • Anderson-Darling

  • Shipiro-Wilk

Test chi quadrato

Il test chi-quadrato è il più comunemente usato per testare la bontà dei fit test ed è usato per distribuzioni discrete come la distribuzione binomiale e la distribuzione di Poisson, mentre i test di bontà di Kolmogorov-Smirnov e Anderson-Darling sono usati per le distribuzioni continue .

Formula

$ {X ^ 2 = \ sum {[\ frac {(O_i - E_i) ^ 2} {E_i}]}} $

Dove -

  • $ {O_i} $ = valore osservato del i-esimo livello di variabile.

  • $ {E_i} $ = valore atteso del i-esimo livello di variabile.

  • $ {X ^ 2} $ = variabile casuale chi quadrato.

Esempio

Un'azienda di giocattoli costruisce giocattoli per giocatori di football. Afferma che il 30% delle carte sono mid-fielders, il 60% difensori e il 10% attaccanti. Considerando un campione casuale di 100 giocattoli, ci sono 50 centrocampisti, 45 difensori e 5 attaccanti. Dato il livello di significatività 0,05, puoi giustificare l'affermazione dell'azienda?

Solution:

Determina ipotesi

  • Null hypothesis $ H_0 $ - La proporzione di centrocampisti, difensori e attaccanti è rispettivamente del 30%, 60% e 10%.

  • Alternative hypothesis $ H_1 $ - Almeno una delle proporzioni nell'ipotesi nulla è falsa.

Determina il grado di libertà

I gradi di libertà, DF è uguale al numero di livelli (k) della variabile categoriale meno 1: DF = k - 1. Qui i livelli sono 3. Quindi

$ {DF = k - 1 \\ [7pt] \, = 3 -1 = 2} $

Determina la statistica del test del chi quadrato

$ {X ^ 2 = \ sum {[\ frac {(O_i - E_i) ^ 2} {E_i}]} \\ [7pt] \, = [\ frac {(50-30) ^ 2} {30}] + [\ frac {(45-60) ^ 2} {60}] + [\ frac {(5-10) ^ 2} {10}] \\ [7pt] \, = \ frac {400} {30} + \ frac {225} {60} + \ frac {25} {10} \\ [7pt] \, = 13,33 + 3,75 + 2,50 \\ [7pt] \, = 19,58} $

Determina il valore p

Il valore P è la probabilità che una statistica chi-quadrato, $ X ^ 2 $ con 2 gradi di libertà, sia più estrema di 19,58. Utilizza il calcolatore della distribuzione del chi quadrato per trovare $ {P (X ^ 2 \ gt 19,58) = 0,0001} $.

Interpreta i risultati

Poiché il valore P (0,0001) è molto inferiore al livello di significatività (0,05), l'ipotesi nulla non può essere accettata. Pertanto, il reclamo dell'azienda non è valido.