Statistiche - Funzione outlier
Un valore anomalo in una funzione di distribuzione di probabilità è un numero che è più di 1,5 volte la lunghezza del set di dati lontano dal quartile inferiore o superiore. In particolare, se un numero è minore di $ {Q_1 - 1.5 \ times IQR} $ o maggiore di $ {Q_3 + 1.5 \ times IQR} $, allora è un valore anomalo.
Outlier è definito e dato dalla seguente funzione di probabilità:
Formula
$ {Valore anomalo \ datas \ are \, \ lt Q_1 - 1.5 \ times IQR \ (o) \ \ gt Q_3 + 1.5 \ times IQR} $
Dove -
$ {Q_1} $ = primo quartile
$ {Q_2} $ = terzo quartile
$ {IQR} $ = Intervallo interquartile
Esempio
Problem Statement:
Considera un set di dati che rappresenta il conteggio periodico delle attività di 8 studenti diversi. Il set di informazioni sul conteggio delle attività è, 11, 13, 15, 3, 16, 25, 12 e 14. Scopri i dati anomali dai conteggi periodici delle attività degli studenti.
Solution:
Il set di dati fornito è:
11 | 13 | 15 | 3 | 16 | 25 | 12 | 14 |
Disporlo in ordine crescente:
3 | 11 | 12 | 13 | 14 | 15 | 16 | 25 |
Valore primo quartile () $ {Q_1} $
$ {Q_1 = \ frac {(11 + 12)} {2} \\ [7pt] \ = 11,5} $
Valore terzo quartile () $ {Q_3} $
$ {Q_3 = \ frac {(15 + 16)} {2} \\ [7pt] \ = 15,5} $
Intervallo valori anomali inferiore (L)
$ {Q_1 - 1,5 \ volte IQR \\ [7pt] \ = 11,5 - (1,5 \ volte 4) \\ [7pt] \ = 11,5 - 6 \\ [7pt] \ = 5,5} $
Intervallo valori anomali superiori (L)
$ {Q_3 + 1.5 \ times IQR \\ [7pt] \ = 15,5 + (1,5 \ times 4) \\ [7pt] \ = 15,5 + 6 \\ [7pt] \ = 21,5} $
Nelle informazioni fornite, 5,5 e 21,5 è maggiore degli altri valori nel set di dati specificato, ad eccezione di 3 e 25 poiché 3 è maggiore di 5,5 e 25 è minore di 21,5.
In questo modo, utilizziamo 3 e 25 come valori anomali.