profesor chce porównać wyniki swoich studentów ze średnią krajową. Wybiera prostą próbkę losową (SRS) z 20 uczniów, którzy uzyskują średnią 50,2 na standaryzowanym teście. Ich wyniki mają odchylenie standardowe 2,5. Średnia krajowa na teście wynosi 60. Chce wiedzieć, czy jej uczniowie uzyskali znacznie niższy wynik niż średnia krajowa.
testy istotności wykonują procedurę w kilku krokach.
krok 1edytuj
najpierw określ problem w zakresie dystrybucji i określ interesujące go parametry. Wspomnij o próbce. Zakładamy, że wyniki (X) uczniów w klasie profesora są w przybliżeniu normalnie rozłożone z nieznanymi parametrami μ i σ
krok 2edit
przedstawiają hipotezy w symbolach i słowach.
h o : μ = 60 {\displaystyle H_{o}: \ quad \ mu =60}
hipoteza zerowa jest taka, że jej uczniowie punktowali na równi ze średnią krajową.
h a : μ < 60 {\displaystyle H_{A}: \ quad \ mu <60}
alternatywną hipotezą jest to, że jej uczniowie uzyskali wynik niższy niż średnia krajowa.
krok 3edytuj
po drugie, określ test, który ma być użyty. Ponieważ mamy SRS o małych rozmiarach i nie znamy odchylenia standardowego populacji, użyjemy testu T z jedną próbką.
wzór na t-statystykę T dla testu jednopróbkowego jest następujący:
T = X-60 S / 20 {\displaystyle T = {\frac {{\overline {X}}-60}{S / {\sqrt {20}}}}}
gdzie X {\displaystyle {\overline {X}}}
jest średnią próby, A S jest odchyleniem standardowym próbki.
dość częstym błędem jest stwierdzenie, że wzór na statystykę T jest:
t = X-μ s / n {\displaystyle T = {\frac {{\overline {x}}- \ mu }{s / {\sqrt {n}}}}}
nie jest to statystyka, ponieważ μ jest nieznane, co jest kluczowym punktem w takim problemie. Większość ludzi nawet tego nie zauważa. Innym problemem z tą formułą jest użycie x I s. należy je traktować jako statystyki próby, a nie ich wartości.
właściwym wzorem ogólnym jest:
T = X-c S / n {\displaystyle T = {\frac {{\overline {X}} – c}{S / {\sqrt {n}}}}}
w którym C jest hipotetyczną wartością μ określoną przez hipotezę zerową.
(odchylenie standardowe próbki podzielone przez pierwiastek kwadratowy wielkości próbki jest znane jako „błąd standardowy” próbki.)
krok 4Edit
podaj rozkład statystyki testu pod hipotezą zerową. Pod H0 statystyka T będzie podążać za rozkładem ucznia z 19 stopniami swobody: t ∼ τ ⋅ ( 20 − 1 ) {\displaystyle T\sim \tau \cdot (20-1)}
.
krok 5edytuj
Oblicz obserwowaną wartość t statystyki badania t, wprowadzając wartości w następujący sposób:
t = x-60 s / 20 = 50.2 − 60.0 2.5 / 20 = − 9.8 2.5 / 4.47 = − 9.8 0.559 = − 17.5 {\displaystyle t = {\frac {{\overline {x}}-60}{s / {\sqrt {20}}}}={\frac {50.2-60.0}{2.5/{\sqrt {20}}}}={\frac {-9.8}{2.5/4.47}}={\frac {-9, 8}{0.559}}=-17.5}
krok 6edytuj
Określ tak zwaną wartość p wartości T statystyki testowej T. odrzucimy hipotezę zerową dla zbyt małych wartości t, więc obliczamy lewą wartość p:
wartość p = p (t ≤ t ; h 0 ) = P (T ( 19 ) ≤ − 17.5 ) ≈ 0 {\displaystyle =p (t\leq t; H_{0})=P(T(19)\leq -17.5) \ approx 0}
rozkład ucznia daje T (19) = 1,729 {\displaystyle T(19)=1.729}
przy prawdopodobieństwie 0,95 i stopniach swobody 19. Wartość p jest przybliżona do wartości 1,777 e-13.
krok 7edytuj
na koniec zinterpretuj wyniki w kontekście problemu. Wartość p wskazuje, że wyniki prawie na pewno nie stało się przez przypadek i mamy wystarczające dowody, aby odrzucić hipotezę zerową. Studenci profesora uzyskali znacznie niższy wynik niż średnia krajowa.