Statistiche - Campionamento stratificato

Questa strategia di esame viene utilizzata come una parte delle circostanze in cui la popolazione può essere facilmente suddivisa in gruppi o strati che sono particolarmente diversi tra loro, tuttavia i componenti all'interno di un incontro sono omogenei per quanto riguarda alcuni attributi, ad esempio i sotto studi della scuola possono essere suddivisi in strati sulla base dell'orientamento sessuale, dei corsi offerti, dell'età e così via. In questo la popolazione viene inizialmente suddivisa in strati e successivamente viene prelevato un campione irregolare di base da ogni strato. Il test stratificato è di due tipi: ispezione stratificata proporzionata e esame stratificato sproporzionato.

  • Proportionate Stratified Sampling- In questo il numero di unità selezionate da ogni strato è proporzionale alla quota di strato nella popolazione, ad esempio in un college ci sono in totale 2500 studenti di cui 1500 studenti sono iscritti a corsi di laurea e 1000 sono iscritti a corsi post-laurea. Se un campione di 100 deve essere scelto utilizzando un campionamento stratificato proporzionato, il numero di studenti universitari nel campione sarebbe 60 e 40 sarebbero studenti post-laurea. Quindi i due strati sono rappresentati nella stessa proporzione nel campione come è la loro rappresentazione nella popolazione.

    Questo metodo è più adatto quando lo scopo del campionamento è stimare il valore della popolazione di alcune caratteristiche e non c'è differenza nelle varianze all'interno dello strato.

  • Disproportionate Stratified Sampling- Quando lo scopo dello studio è confrontare le differenze tra gli strati, diventa necessario estrarre unità uguali da tutti gli strati indipendentemente dalla loro quota di popolazione. A volte alcuni strati sono più variabili rispetto ad alcune caratteristiche rispetto ad altri strati, in tal caso un numero maggiore di unità può essere tratto dagli strati più variabili. In entrambe le situazioni il campione prelevato è un campione stratificato sproporzionato.

    La differenza nella dimensione dello strato e nella variabilità dello strato può essere allocata in modo ottimale utilizzando la seguente formula per determinare la dimensione del campione da diversi strati

    Formula

    $ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + ... + n_k \ sigma_k} \ for \ i = 1,2 ... k} $

    Dove -

    • $ {n_i} $ = la dimensione del campione di i strati.

    • $ {n} $ = la dimensione degli strati.

    • $ {\ sigma_1} $ = la deviazione standard di i strati.

    Oltre a ciò, potrebbe esserci una situazione in cui il costo della raccolta di un campione potrebbe essere maggiore in uno strato che in un altro. Il campionamento ottimale sproporzionato dovrebbe essere eseguito in modo tale

    $ {\ frac {n_1} {n_1 \ sigma_1 \ sqrt {c_1}} = \ frac {n_2} {n_2 \ sigma_1 \ sqrt {c_2}} = ... = \ frac {n_k} {n_k \ sigma_k \ sqrt { c_k}}} $

    Dove $ {c_1, c_2, ..., c_k} $ si riferiscono al costo del campionamento in k strati. La dimensione del campione da diversi strati può essere determinata utilizzando la seguente formula:

    $ {n_i = \ frac {\ frac {n.n_i \ sigma_i} {\ sqrt {c_i}}} {\ frac {n_1 \ sigma_1} {\ sqrt {c_i}} + \ frac {n_2 \ sigma_2} {\ sqrt {c_2}} + ... + \ frac {n_k \ sigma_k} {\ sqrt {c_k}}} \ for \ i = 1,2 ... k} $

Esempio

Problem Statement:

Un'organizzazione ha 5000 dipendenti che sono stati stratificati in tre livelli.

  • Strato A: 50 dirigenti con deviazione standard = 9

  • Strato B: 1250 lavoratori non manuali con deviazione standard = 4

  • Strato C: 3700 operai con deviazione standard = 1

In che modo un campione di 300 dipendenti verrà estratto in modo sproporzionato con un'allocazione ottimale?

Solution:

Utilizzando la formula del campionamento sproporzionato per un'allocazione ottimale.

$ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + n_3 \ sigma_3}} \\ [7pt] \, per lo stream A, {n_1 = \ frac {300 (50) (9 )} {(50) (9) + (1250) (4) + (3700) (1)}} \\ [7pt] \, = {\ frac {135000} {1950} = {14,75} \ o \ say \ {15}} \\ [7pt] \, Per lo stream B, {n_1 = \ frac {300 (1250) (4)} {(50) (9) + (1250) (4) + (3700) (1 )}} \\ [7pt] \, = {\ frac {150000} {1950} = {163.93} \ o \ say \ {167}} \\ [7pt] \, per lo stream C, {n_1 = \ frac { 300 (3700) (1)} {(50) (9) + (1250) (4) + (3700) (1)}} \\ [7pt] \, = {\ frac {110000} {1950} = { 121.3} \ o \ say \ {121}} $