Statistiche - Funzione outlier

Un valore anomalo in una funzione di distribuzione di probabilità è un numero che è più di 1,5 volte la lunghezza del set di dati lontano dal quartile inferiore o superiore. In particolare, se un numero è minore di $ {Q_1 - 1.5 \ times IQR} $ o maggiore di $ {Q_3 + 1.5 \ times IQR} $, allora è un valore anomalo.

Outlier è definito e dato dalla seguente funzione di probabilità:

Formula

$ {Valore anomalo \ datas \ are \, \ lt Q_1 - 1.5 \ times IQR \ (o) \ \ gt Q_3 + 1.5 \ times IQR} $

Dove -

  • $ {Q_1} $ = primo quartile

  • $ {Q_2} $ = terzo quartile

  • $ {IQR} $ = Intervallo interquartile

Esempio

Problem Statement:

Considera un set di dati che rappresenta il conteggio periodico delle attività di 8 studenti diversi. Il set di informazioni sul conteggio delle attività è, 11, 13, 15, 3, 16, 25, 12 e 14. Scopri i dati anomali dai conteggi periodici delle attività degli studenti.

Solution:

Il set di dati fornito è:

11 13 15 3 16 25 12 14

Disporlo in ordine crescente:

3 11 12 13 14 15 16 25

Valore primo quartile () $ {Q_1} $

$ {Q_1 = \ frac {(11 + 12)} {2} \\ [7pt] \ = 11,5} $

Valore terzo quartile () $ {Q_3} $

$ {Q_3 = \ frac {(15 + 16)} {2} \\ [7pt] \ = 15,5} $

Intervallo valori anomali inferiore (L)

$ {Q_1 - 1,5 \ volte IQR \\ [7pt] \ = 11,5 - (1,5 \ volte 4) \\ [7pt] \ = 11,5 - 6 \\ [7pt] \ = 5,5} $

Intervallo valori anomali superiori (L)

$ {Q_3 + 1.5 \ times IQR \\ [7pt] \ = 15,5 + (1,5 \ times 4) \\ [7pt] \ = 15,5 + 6 \\ [7pt] \ = 21,5} $

Nelle informazioni fornite, 5,5 e 21,5 è maggiore degli altri valori nel set di dati specificato, ad eccezione di 3 e 25 poiché 3 è maggiore di 5,5 e 25 è minore di 21,5.

In questo modo, utilizziamo 3 e 25 come valori anomali.