ある大学の教授は、学生のスコアを全国平均と比較したいと考えています。 彼女は、標準化されたテストで50.2の平均を獲得した20人の学生の単純なランダムサンプル(SRS)を選択します。 彼らのスコアは2.5の標準偏差を持っています。 テストの全国平均は60です。 彼女は彼女の学生が全国平均よりも有意に低い得点かどうかを知りたいと考えています。
有意性検定は、いくつかのステップで手順に従います。
ステップ1edit
まず、分布の観点から問題を述べ、関心のあるパラメータを特定します。 サンプルに言及してください。 教授のクラスの学生のスコア(X)は、未知のパラメータσとσ
ステップ2edit
で近似的に正規分布していると仮定します。
H O:λ=60{\displaystyle H_{O}:\quad\mu}=60}
帰無仮説は、彼女の学生が全国平均と同等に得点したということです。
H A:λ<60{\displaystyle H_{A}:\quad\mu<60}
対立仮説は、彼女の学生が全国平均よりも低い得点を記録したということです。
ステップ3edit
次に、使用するテストを特定します。 サイズが小さいSRSがあり、母集団の標準偏差がわからないため、1サンプルのt検定を使用します。
1サンプル検定のt統計量Tの式は次のようになります:
T=X−60S/20{\displaystyle T={\frac{{\overline{X}}-60}{S/{\sqrt{20}}}}}
ここで、X{\displaystyle{\overline{X}}}
は標本平均、Sは標本標準偏差です。
非常によくある間違いは、t検定統計量の式が次のようになると言うことです:
T=x−μ s/n{\displaystyle T={\frac{{\overline{x}}-\mu}{s/{\sqrt{n}}}}}
この統計 でμは不明であるを考えるうえでも重要なポイントなどの問題です。 ほとんどの人はそれに気付かない。 この式のもう一つの問題は、xとsを使用することです。
右の一般式は:
T=X−c S/n{\displaystyle T={\frac{{\overline{X}}-c}{S/{\sqrt{n}}}}}
るcの仮想値μ指定した場合は、null仮説がある。
(サンプルの標準偏差をサンプルサイズの平方根で割ったものを、サンプルの”標準誤差”と呼びます。)
ステップ4edit
は、帰無仮説の下での検定統計量の分布を示します。 H0の下では、統計量Tは19の自由度を持つスチューデント分布に従う:T(20−1){\displaystyle T\Sim\tau\cdot(20-1)}
.
ステップ5edit
次のように値を入力して、検定統計量Tの観測値tを計算します。
t=x-60s/ 20 = 50.2 − 60.0 2.5 / 20 = − 9.8 2.5 / 4.47 = − 9.8 0.559 = − 17.5 {\displaystyle t={\frac{{\overline{x}}-60}{s/{\sqrt{20}}}}={\frac{{\overline{x}}-60}{s/{\sqrt{20}}}}}}}}}}}}}}}}}{50.2-60.0}{2.5/{\sqrt{20}}}}={\frac{1}{2}}}}}}}}}}{-9.8}{2.5/4.47}}={\frac{-9.8}{0.559}}=-17.5}
Tの値が小さすぎる場合は帰無仮説を棄却するので、左のp値を計算します。p値=P(t≤t;H0)=P(T)=p(t)=P(t)=P(t)=P(t)=P(t)=P(t)=P(t)=P(t)=P(t)=P(t)=P(t)=P(t)=P(t)=P(t)=P(t)=P(t)=P(t)=P(t)=P(t)=P(t)=P(t)=P(t)=( 19 ) ≤ − 17.5 ) ≈ 0 {\=P(T\leq t;H_{0})=P(T(19)\leq-17.5)\approx0}
スチューデント分布はT(19)=1.729{\displaystyle T}を与える。(19)=1.729}
確率0.95と自由度19で。 P値は1.777e-13で近似されます。
ステップ7edit
最後に、問題のコンテキストで結果を解釈します。 P値は、結果がほぼ確実に偶然に起こらなかったことを示し、帰無仮説を棄却するのに十分な証拠があることを示しています。 教授の学生は全国平均よりも有意に低いスコアをしました。