Python - Valore P.

Il valore p è circa la forza di un'ipotesi. Costruiamo ipotesi sulla base di alcuni modelli statistici e confrontiamo la validità del modello utilizzando il valore p. Un modo per ottenere il valore p è usare T-test.

Questo è un test bilaterale per l'ipotesi nulla che il valore atteso (media) di un campione di osservazioni indipendenti 'a' sia uguale alla media della popolazione data, popmean. Consideriamo il seguente esempio.

from scipy import stats
rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2))
print stats.ttest_1samp(rvs,5.0)

Il programma precedente genererà il seguente output.

Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]),
pvalue = array([ 0.16726344, 0.00945234]))

Confrontando due campioni

Negli esempi seguenti, ci sono due campioni, che possono provenire dalla stessa o da una distribuzione diversa, e vogliamo verificare se questi campioni hanno le stesse proprietà statistiche.

ttest_ind- Calcola il test T per la media di due campioni indipendenti di punteggi. Questo è un test bilaterale per l'ipotesi nulla che due campioni indipendenti abbiano valori medi (attesi) identici. Questo test presuppone che le popolazioni abbiano varianze identiche per impostazione predefinita.

Possiamo usare questo test, se osserviamo due campioni indipendenti dalla stessa popolazione o da una diversa. Consideriamo il seguente esempio.

from scipy import stats
rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
print stats.ttest_ind(rvs1,rvs2)

Il programma precedente genererà il seguente output.

Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)

Puoi testare lo stesso con un nuovo array della stessa lunghezza, ma con una media varia. Usa un valore diverso inloc e prova lo stesso.