Un professore universitario vuole confrontare i punteggi dei suoi studenti con la media nazionale. Sceglie un semplice campione casuale (SRS) di 20 studenti, che ottengono una media di 50,2 su un test standardizzato. I loro punteggi hanno una deviazione standard di 2.5. La media nazionale sul test è un 60. Vuole sapere se i suoi studenti hanno ottenuto un punteggio significativamente inferiore alla media nazionale.
I test di significatività seguono una procedura in diversi passaggi.
Passaggio 1modifica
Innanzitutto, indica il problema in termini di distribuzione e identifica i parametri di interesse. Menziona il campione. Assumeremo che i punteggi (X) degli studenti nella classe del professore siano approssimativamente distribuiti normalmente con parametri sconosciuti μ e σ
Passaggio 2Edit
Affermano le ipotesi in simboli e parole.
H O: μ = 60 {\displaystyle H_{O}: \ quad \ mu =60}
L’ipotesi nulla è che i suoi studenti abbiano ottenuto un punteggio alla pari con la media nazionale.
H A: μ < 60 {\displaystyle H_{A}: \ quad \ mu <60}
L’ipotesi alternativa è che i suoi studenti abbiano ottenuto un punteggio inferiore alla media nazionale.
Passaggio 3Edit
In secondo luogo, identificare il test da utilizzare. Poiché abbiamo un SRS di piccole dimensioni e non conosciamo la deviazione standard della popolazione, useremo un t-test di un campione.
La formula per la t-statistica T per un test di un campione è la seguente:
T = X − 60 S / 20 {\displaystyle T={\frac {{\overline {X}}-60}{S/{\sqrt {20}}}}}
dove X {\displaystyle {\overline {X}}}
è la media del campione e S è la deviazione standard del campione.
Un errore abbastanza comune è dire che la formula per la statistica t-test è: Per maggiori informazioni, consulta la nostra informativa sulla privacy.}}}}}
Questa non è una statistica, perché μ è sconosciuta, che è il punto cruciale in un tale problema. La maggior parte delle persone non se ne accorge. Un altro problema con questa formula è l’uso di x e s. Sono da considerarsi le statistiche di esempio e non i loro valori.
La formula generale giusta è:Per maggiori informazioni, consulta la nostra informativa sulla privacy.}}}}}
in cui c è il valore ipotetico per μ specificato dall’ipotesi nulla.
(La deviazione standard del campione divisa per la radice quadrata della dimensione del campione è nota come “errore standard” del campione.)
Passaggio 4Edit
Indica la distribuzione della statistica del test sotto l’ipotesi nulla. Sotto H0 la statistica T seguirà la distribuzione di uno Studente con 19 gradi di libertà: T τ τ ((20 − 1 ) {\displaystyle T\sim \tau \cdot (20-1)}
.
Passo 5Edit
Calcolare il valore osservato t della statistica test T, inserendo i valori, come segue:
t = x − 60 s / 20 = 50.2 − 60.0 2.5 / 20 = − 9.8 2.5 / 4.47 = − 9.8 0.559 = − 17.5 {\displaystyle t={\frac {{\overline {x}}-60}{s/{\sqrt {20}}}}={\frac {50.2-60.0}{2.5/{\sqrt {20}}}}={\frac {-9.8}{2.5/4.47}}={\frac {-9.8}{0.559}}=-17.5}
Passo 6Edit
Determinare il cosiddetto p-value del valore di t della statistica test T. Possiamo rifiutare l’ipotesi nulla per valori molto piccoli di T, quindi calcoliamo la sinistra p-value:
p-value = P ( T ≤ t, H, 0 ) = P ( T ( 19 ) ≤ − 17.5 ) ≈ 0 {\displaystyle =P(T\leq t;H_{0})=P(T(19)\leq -17.5)\approx 0}
La distribuzione dello Studente dà T (19) = 1.729 {\displaystyle T(19)=1.729}
a probabilità 0.95 e gradi di libertà 19. Il valore p è approssimato a 1.777 e-13.
Passaggio 7Edit
Infine, interpretare i risultati nel contesto del problema. Il valore p indica che i risultati quasi certamente non sono accaduti per caso e abbiamo prove sufficienti per respingere l’ipotesi nulla. Gli studenti del professore hanno ottenuto un punteggio significativamente inferiore alla media nazionale.