Statistiche - Dimensione campione richiesta

Una parte critica del test è la scelta della misura del test, cioè la quantità di unità da scegliere tra la popolazione per completare l'esplorazione. Non esiste una risposta o una risposta univoca per caratterizzare la taglia più adatta. Ci sono sicuramente giudizi fuorvianti riguardo alla durata del test come l'esempio dovrebbe essere il 10% della popolazione o la dimensione del campione è relativa all'estensione dell'universo. Tuttavia, come detto prima, questi sono solo giudizi fuorvianti. Quanto dovrebbe essere ampio un esemplare è la capacità della varietà nei parametri della popolazione in esame e l'esattezza di valutazione richiesta dallo specialista.

La decisione sulla dimensione ottimale del campione può essere affrontata da due angoli, vale a dire. il soggettivo e il matematico.

  1. Approccio soggettivo alla determinazione della dimensione del campione

  2. Approccio matematico alla determinazione della dimensione del campione

Approccio soggettivo alla determinazione della dimensione del campione

La scelta della dimensione del campione è influenzata da vari fattori discussi di seguito:

  • The Nature of Population- Il livello di omogeneità o eterogeneità influenza l'estensione di un campione. Nella remota possibilità che la popolazione sia omogenea riguardo alle qualità di interesse, anche una piccola dimensione dell'esemplare è adeguata. Tuttavia, nel caso in cui la popolazione fosse eterogenea, sarebbe necessario un esempio più ampio per garantire una rappresentatività sufficiente.

  • Nature of Respondent- Se gli intervistati sono facilmente accessibili e disponibili, i dati richiesti possono essere ottenuti da un piccolo esempio. Nella remota possibilità che, nonostante, gli intervistati non collaborino e si invoca la mancata reazione per essere elevata, è necessario un campione più grande.

  • Nature of Study- Uno studio precedente può essere condotto utilizzando un esempio sostanziale. Se si verificano studi di esame che sono di natura costante e devono essere seriamente completati, un piccolo campione è più adatto in quanto è tutt'altro che difficile da sorvegliare e mantenere un piccolo esempio per un lungo periodo di tempo.

  • Sampling Technique Used- Una variabile essenziale che influenza la durata del test è il sistema di esame ricevuto. In primo luogo, un sistema di non probabilità richiede un campione più grande di una strategia di probabilità. Oltre al test di verosimiglianza, se viene utilizzato un esame irregolare semplice, richiede un esempio più ampio rispetto a quando viene utilizzata la stratificazione, dove è sufficiente un piccolo campione.

  • Complexity of Tabulation- Mentre si stabilisce la stima del campione, lo specialista dovrebbe considerare anche la quantità di classificazioni e classi in cui le scoperte devono essere assemblate e scomposte. Si è visto che maggiore è la quantità di classificazioni che devono essere prodotte, maggiore è la dimensione dell'esempio. Poiché ogni classe dovrebbe essere ascoltata a sufficienza, è necessario un campione più grande per fornire misure solide della classificazione più piccola.

  • Availability of Resources- Le risorse e il tempo a disposizione dello specialista influiscono sull'arco di prova. L'esame è un incarico con aumento del periodo e in contanti, con esercizi come la disponibilità dello strumento, l'assunzione e la preparazione del personale sul campo, i costi di trasporto e così via che assorbono una parte considerevole delle risorse. Successivamente se lo scienziato non ha abbastanza tempo e supporti accessibili si accontenterà di un esempio più piccolo.

  • Degree of Precision and Accuracy Required-. È risultato chiaro dal nostro discorso precedente che l'accuratezza, misurata da un errore standard, sarà elevata solo se SE è inferiore o la dimensione dell'esempio è sostanziale.

Anche per ottenere un alto livello di precisione è necessario un campione più grande. Oltre a questi sforzi soggettivi, anche la dimensione del campione può essere determinata matematicamente.

Approccio matematico alla determinazione della dimensione del campione

Nell'approccio matematico alla determinazione della dimensione del campione, viene prima stabilita la precisione della stima richiesta e quindi viene elaborata la dimensione del campione. La precisione può essere specificata come $ {\ pm} $ 1 della media vera con un livello di confidenza del 99%. Ciò significa che se la media del campione è 200, il valore reale della media sarà compreso tra 199 e 201. Questo livello di precisione è indicato dal termine "c"

Determinazione della dimensione del campione per i mezzi.

L'intervallo di confidenza per la media dell'universo è dato da

$ {\ bar x \ pm Z \ frac {\ sigma_p} {\ sqrt N} \ o \ \ bar x \ pm e} $

Dove -

  • $ {\ bar x} $ = Media campione

  • $ {e} $ = errore accettabile

  • $ {Z} $ = Valore della variazione normale standard a un dato livello di confidenza

  • $ {\ sigma_p} $ = Deviazione standard della popolazione

  • $ {n} $ = dimensione del campione

L'errore accettabile 'e' cioè la differenza tra $ {\ mu} $ e $ {\ bar x} $ è dato da

$ {Z. \ frac {\ sigma_p} {\ sqrt N}} $

Pertanto, la dimensione del campione è:

$ {n = \ frac {Z ^ 2 {\ sigma_p} ^ 2} {e ^ 2}} $

O

Nel caso in cui la dimensione del campione sia significativa rispetto alla dimensione della popolazione, la formula sopra sarà corretta dal moltiplicatore di popolazione finita.

$ {n = \ frac {Z ^ 2.N. {\ sigma_p} ^ 2} {(N-1) e ^ 2 + Z ^ 2. {\ sigma_p} ^ 2}} $

Dove -

  • $ {N} $ = dimensione della popolazione

Determinazione della dimensione del campione per le proporzioni

Il metodo per determinare la dimensione del campione quando si stima una proporzione rimane lo stesso del metodo per stimare la media. L'intervallo di confidenza per la proporzione dell'universo $ {\ hat p} $ è dato da

$ {p \ pm Z. \ sqrt {\ frac {pq} {n}}} $

Dove -

  • $ {p} $ = proporzione del campione

  • $ {q = (1 - p)} $

  • $ {Z} $ = Valore della variazione normale standard per una proporzione campionaria

  • $ {n} $ = dimensione del campione

Poiché $ {\ hat p} $ deve essere stimato, il valore di p può essere determinato prendendo il valore di p = 0,5, un valore accettabile, che fornisce una dimensione del campione conservativa. L'altra opzione è che il valore di p sia stimato tramite uno studio pilota o in base al giudizio personale. Dato il valore di p, l'errore accettabile 'e' è dato da

$ {e = Z. \ sqrt {\ frac {pq} {n}} \\ [7pt] e ^ 2 = Z ^ 2 \ frac {pq} {n} \\ [7pt] n = \ frac {Z ^ 2.pq} {e ^ 2}} $

Nel caso in cui la popolazione sia finita, la formula sopra sarà corretta dal moltiplicatore di popolazione finita.

$ {n = \ frac {Z ^ 2.pqN} {e ^ 2 (N-1) + Z ^ 2.pq}} $

Esempio

Problem Statement:

Un negozio è interessato a stimare la proporzione di famiglie che possiedono la tessera Privilege Membership del negozio. Studi precedenti hanno dimostrato che il 59% della famiglia aveva una carta di credito del negozio. Al livello di confidenza del 95% con un livello di errore tollerabile di 05.

  1. Determina la dimensione del campione richiesta per condurre lo studio.

  2. Quale sarebbe la dimensione del campione se si sapesse che il numero di famiglie target è 1000?

Solution:

Il negozio ha le seguenti informazioni

$ {p = .59 \\ [7pt] \ Freccia destra q = (1-p) = (1-.59) = .41 \\ [7pt] CL = .95 \\ [7pt] E \ the \ Z \ standard \ variate \ per \ CL \ .95 \ è \ 1.96 \\ [7pt] e = \ pm .05} $

La dimensione del campione può essere determinata applicando la seguente formula:

$ {n = \ frac {Z ^ 2.pq} {e ^ 2}} $
$ {n = \ frac {(1.96) ^ 2. (. 59). (. 41)} {(. 05) ^ 2} \\ [7pt] = \ frac {.9226} {. 0025} \\ [ 7pt] = 369} $

Quindi un campione di 369 famiglie è sufficiente per condurre lo studio.

Poiché la popolazione, ovvero le famiglie target, è nota essere 1000 e il campione di cui sopra è una percentuale significativa della popolazione totale, viene utilizzata la formula corretta che include un moltiplicatore di popolazione finito.

$ {n = \ frac {Z ^ 2.pqN} {e ^ 2 (N-1) + Z ^ 2.pq} \\ [7pt] = \ frac {(1.96) ^ 2. (. 59). ( .41). (1000)} {(. 05) ^ 2 \ times 999 + (1.96) ^ 2 (.59) (. 41)} \\ [7pt] = \ frac {922.6} {2.497 + .922} \\ [7pt] = 270} $

Pertanto, se la popolazione è finita con 1000 famiglie, la dimensione del campione richiesta per condurre lo studio è 270.

È evidente da questa illustrazione che se la dimensione della popolazione è nota, la dimensione del campione determinata è diminuita di dimensione.