en høyskoleprofessor ønsker å sammenligne elevenes score med landsgjennomsnittet. Hun velger en enkel tilfeldig prøve (SRS) på 20 studenter, som scorer i gjennomsnitt 50,2 på en standardisert test. Deres score har et standardavvik på 2,5. Landsgjennomsnittet på testen er 60. Hun ønsker å vite om hennes studenter scoret betydelig lavere enn landsgjennomsnittet.
Signifikansprøver følger en prosedyre i flere trinn.
Trinn 1rediger
oppgi først problemet i form av en distribusjon og identifiser parametrene av interesse. Nevn prøven. Vi vil anta at poengsummene (X) til studentene i professorklassen er tilnærmet normalfordelt med ukjente parametere μ og σ
Trinn 2rediger
Angi hypotesene i symboler og ord.
h O : μ = 60 {\displaystyle H_{o}: \ quad \ mu =60}
nullhypotesen er at elevene hennes scoret på nivå med landsgjennomsnittet.
h a : μ < 60 {\displaystyle H_{a}: \ quad \ mu <60}
den alternative hypotesen er at hennes studenter scoret lavere enn landsgjennomsnittet.
Trinn 3edit
for Det Andre, identifiser testen som skal brukes. Siden VI har EN SRS av liten størrelse og ikke kjenner standardavviket til befolkningen, vil vi bruke en en-prøve t-test.
formelen for t-statistikken T for en prøvetest er som følger:
T = X − 60 S / 20 {\displaystyle T={\frac {{\overline {X}}-60}{s / {\sqrt {20}}}}}
hvor X {\displaystyle {\overline {X}}}
er utvalgsgjennomsnittet og S er utvalgsstandardavviket.
en ganske vanlig feil er å si at formelen for t-teststatistikken er:
t = x − μ s / n {\displaystyle T={\frac {{\overline {x}} – \ mu }{s / {\sqrt {n}}}}}
dette er ikke en statistikk, fordi μ er ukjent, noe som er det avgjørende punktet i et slikt problem. De fleste merker det ikke engang. Et annet problem med denne formelen er bruken av x og s. De skal betraktes som utvalgsstatistikken og ikke deres verdier.
den riktige generelle formelen er:
T = X-c S / n {\displaystyle T={\frac {{\overline {X}} – c}{s / {\sqrt {n}}}}}
i hvilken c er den hypotetiske verdien for μ spesifisert av nullhypotesen.
(standardavviket for prøven dividert med kvadratroten av prøvestørrelsen er kjent som» standardfeil » av prøven.)
Trinn 4rediger
Angi fordelingen av teststatistikken under nullhypotesen. Under H0 vil statistikken t følge en students fordeling med 19 frihetsgrader: t ∼ τ ⋅ ( 20 − 1) {\displaystyle t \ Sim \ tau \cdot (20-1)}
.
Trinn 5rediger
Beregn den observerte verdien t i teststatistikken T ved å skrive inn verdiene som følger:
t = x − 60 s / 20 = 50.2 − 60.0 2.5 / 20 = − 9.8 2.5 / 4.47 = − 9.8 0.559 = − 17.5 {\displaystyle t = {\frac {{\overline {x}}-60}{s / {\sqrt {20}}}={\frac {50.2-60.0}{2.5/{\sqrt {20}}}} = {\frac {-9.8}{2.5/4.47}}={\frac {-9.8}{0.559}}=-17.5}
Trinn 6rediger
Bestem den såkalte p-verdien av verdien t av teststatistikken T. vi vil avvise nullhypotesen for for små verdier Av T, så vi beregner venstre p-verdi:
p-verdi = P ( t ≤ T ; H 0 ) = P (T ( 19 ) ≤ − 17.5 ) ≈ 0 {\displaystyle = P (t\leq t; H_{0}) = P (T(19)\leq -17,5) \ ca. 0}
Studentenes fordeling gir T (19) = 1,729 {\displaystyle T(19)=1.729}
ved sannsynligheter 0,95 og frihetsgrader 19. P-verdien er tilnærmet 1,777 e-13.
Trinn 7Edit
tolk til Slutt resultatene i sammenheng med problemet. P-verdien indikerer at resultatene nesten helt sikkert ikke skjedde ved en tilfeldighet, og vi har tilstrekkelig bevis for å avvise nullhypotesen. Professorens studenter scoret betydelig lavere enn landsgjennomsnittet.