en universitetsprofessor ønsker at sammenligne sine studerendes score med det nationale gennemsnit. Hun vælger en simpel tilfældig prøve (SRS) på 20 studerende, der scorer i gennemsnit 50,2 på en standardiseret test. Deres score har en standardafvigelse på 2,5. Det nationale gennemsnit på testen er en 60. Hun vil vide, om hendes studerende scorede betydeligt lavere end landsgennemsnittet.
Signifikanstest følger en procedure i flere trin.
trin 1edit
angiv først problemet med hensyn til en distribution og identificer parametrene af interesse. Nævn prøven. Vi antager, at scorerne (H) af eleverne i professorens klasse er omtrent normalt fordelt med ukendte parametre og Hr. og Hr.
trin 2rediger
Angiv hypoteserne i symboler og ord.
H o: l = 60 {\displaystyle H_{O}: \ firkant \ mu =60}
nulhypotesen er, at hendes studerende scorede på niveau med det nationale gennemsnit.
H a: Hr. < 60 {\displaystyle H_{a}:\firkant \mu <60}
den alternative hypotese er, at hendes studerende scorede lavere end det nationale gennemsnit.
trin 3rediger
for det andet skal du identificere den test, der skal bruges. Da vi har en SRS af lille størrelse og ikke kender standardafvigelsen af befolkningen, vil vi bruge en en-prøve t-test.
formlen for T-statistikken T for en prøveprøve er som følger:
T = 60 S / 20 {\displaystyle T={\frac {{\overline {}} -60}{S/{ \ {20}}}}}
hvor {\displaystyle {\overline { \ }}}
er stikprøvens middelværdi, og S er stikprøvens standardafvigelse.
en ret almindelig fejl er at sige, at formlen for T-teststatistikken er:
T = s / n {\displaystyle T={\frac {{\overline {s}} – \ mu} {s / {\SV {n}}}}}
dette er ikke en statistik, fordi Kristian er ukendt, hvilket er det afgørende punkt i et sådant problem. De fleste mennesker bemærker det endda ikke. De skal betragtes som stikprøvestatistikken og ikke deres værdier.
den rigtige generelle formel er:
T = S-C S / n {\displaystyle T={\frac {{\overline {S}} – c} {S / {\SV {n}}}}}
i hvilken c er den hypotetiske værdi for kr.specificeret af nulhypotesen.
(standardafvigelsen for prøven divideret med kvadratroden af prøvestørrelsen er kendt som “standardfejl” for prøven.)
trin 4edit
Angiv fordelingen af teststatistikken under nulhypotesen. Under H0 vil statistikken t følge en studerendes fordeling med 19 frihedsgrader: t list ( 20-1) {\displaystyle T \ SIM \ Tau \cdot (20-1)}
.
trin 5rediger
Beregn den observerede værdi t af teststatistikken T ved at indtaste værdierne som følger:
t = h-60 s / 20 = 50.2 − 60.0 2.5 / 20 = − 9.8 2.5 / 4.47 = − 9.8 0.559 = − 17.5 {\displaystyle t={\frac {{\overline {}} -60}{s / {\sv {20}}}}={\frac {50.2-60.0}{2.5/{\ {20}}}}={\frac {-9.8}{2.5/4.47}}={\frac {-9.8}{0.559}}=-17.5}
trin 6Edit
Bestem den såkaldte p-værdi af værdien t af teststatistikken T. vi vil afvise nulhypotesen for for små værdier af T, så vi beregner den venstre p-værdi:
p-værdi = P (t-kur t; H 0 ) = P (T ( 19 ) ≤ − 17.5 ) ≈ 0 {\displaystyle =P (T\lekv t;H_{0})=P (T (19) \ lekv -17.5) \ ca 0}
den studerendes distribution giver T (19) = 1.729 {\displaystyle T(19)=1.729}
ved sandsynligheder 0,95 og frihedsgrader 19. P-værdien er tilnærmet til 1.777 e-13.
trin 7edit
endelig fortolke resultaterne i forbindelse med problemet. P-værdien indikerer, at resultaterne næsten helt sikkert ikke skete tilfældigt, og vi har tilstrækkelige beviser til at afvise nulhypotesen. Professorens studerende scorede betydeligt lavere end det nationale gennemsnit.