Statistiche - Bontà di adattamento
Il Goodness of Fittest viene utilizzato per controllare i dati del campione se si adattano a una distribuzione di una popolazione. La popolazione può avere una distribuzione normale o una distribuzione di Weibull. In parole semplici, significa che i dati del campione rappresentano correttamente i dati che ci aspettiamo di trovare dalla popolazione effettiva. I seguenti test sono generalmente utilizzati dagli statistici:
Chi-square
Kolmogorov-Smirnov
Anderson-Darling
Shipiro-Wilk
Test chi quadrato
Il test chi-quadrato è il più comunemente usato per testare la bontà dei fit test ed è usato per distribuzioni discrete come la distribuzione binomiale e la distribuzione di Poisson, mentre i test di bontà di Kolmogorov-Smirnov e Anderson-Darling sono usati per le distribuzioni continue .
Formula
Dove -
$ {O_i} $ = valore osservato del i-esimo livello di variabile.
$ {E_i} $ = valore atteso del i-esimo livello di variabile.
$ {X ^ 2} $ = variabile casuale chi quadrato.
Esempio
Un'azienda di giocattoli costruisce giocattoli per giocatori di football. Afferma che il 30% delle carte sono mid-fielders, il 60% difensori e il 10% attaccanti. Considerando un campione casuale di 100 giocattoli, ci sono 50 centrocampisti, 45 difensori e 5 attaccanti. Dato il livello di significatività 0,05, puoi giustificare l'affermazione dell'azienda?
Solution:
Determina ipotesi
Null hypothesis $ H_0 $ - La proporzione di centrocampisti, difensori e attaccanti è rispettivamente del 30%, 60% e 10%.
Alternative hypothesis $ H_1 $ - Almeno una delle proporzioni nell'ipotesi nulla è falsa.
Determina il grado di libertà
I gradi di libertà, DF è uguale al numero di livelli (k) della variabile categoriale meno 1: DF = k - 1. Qui i livelli sono 3. Quindi
Determina la statistica del test del chi quadrato
Determina il valore p
Il valore P è la probabilità che una statistica chi-quadrato, $ X ^ 2 $ con 2 gradi di libertà, sia più estrema di 19,58. Utilizza il calcolatore della distribuzione del chi quadrato per trovare $ {P (X ^ 2 \ gt 19,58) = 0,0001} $.
Interpreta i risultati
Poiché il valore P (0,0001) è molto inferiore al livello di significatività (0,05), l'ipotesi nulla non può essere accettata. Pertanto, il reclamo dell'azienda non è valido.