um professor universitário quer comparar as pontuações dos seus alunos com a média nacional. Ela escolhe uma amostra aleatória simples (SRS) de 20 alunos, que marcam uma média de 50,2 em um teste padronizado. As suas pontuações têm um desvio padrão de 2,5. A média nacional no teste é de 60. Ela quer saber se os seus alunos pontuaram significativamente abaixo da média nacional.
os testes de significância seguem um procedimento em várias etapas.
passo 1Edit
primeiro, declare o problema em termos de uma distribuição e identifique os parâmetros de interesse. Menciona a amostra. Assumiremos que as pontuações (X) dos alunos da classe do professor são aproximadamente normalmente distribuídas com parâmetros desconhecidos μ e σ
passo 2Edit
expõem as hipóteses em símbolos e palavras.
H O : μ = 60 {\displaystyle H_{o}:\quad \mu =60}
a hipótese nula é que seus alunos pontuaram a par da média nacional.
H A : µ < 60 {\displaystyle H_{A}:\quad \mu <60}
A hipótese alternativa é que os seus alunos obtiveram uma pontuação inferior à média nacional.
passo 3Edit
em segundo lugar, identificar o ensaio a utilizar. Uma vez que temos um SRS de pequeno tamanho e não sabemos o desvio padrão da população, vamos usar uma amostra T-teste.
a fórmula para a estatística t para um ensaio de uma amostra é a seguinte::
T = X − 60 S / 20 {\displaystyle T={\frac {{\overline {X}}-60}{S/{\sqrt {20}}}}}
onde X {\displaystyle {\overline {X}}}
é a média da amostra e S é o desvio padrão da amostra.
um erro bastante comum é dizer que a fórmula para a estatística do teste t é:
T = x − µ s / n {\displaystyle T={\frac {{\overline {x}}-\mu }{s/{\sqrt {n}}}}}
Esta não é uma estatística, porque μ é desconhecido, que é o ponto crucial de tal problema. A maioria das pessoas nem repara. Outro problema com esta fórmula é o uso de x e S. Eles devem ser considerados as Estatísticas da amostra e não seus valores.
a fórmula geral direita é::
T = X − c S / n {\displaystyle T={\frac {{\overline {X}}-c}{S/{\sqrt {n}}}}}
em que c é o valor hipotético para μ especificado pela hipótese nula.
(O desvio padrão da amostra dividido pela raiz quadrada do tamanho da amostra é conhecido como o “erro padrão” da amostra.)
passo 4Edit
declare a distribuição da estatística de ensaio sob a hipótese nula. Sob H0, a estatística T irá seguir um Estudante de distribuição com 19 graus de liberdade: T ∼ τ ⋅ ( 20 − 1 ) {\displaystyle T\sim \tau \cdot (20-1)}
.
Passo 5Edit
Calcule o valor observado t do teste estatístico T, inserindo os valores, da seguinte forma:
t = x − 60 s / 20 = 50.2 − 60.0 2.5 / 20 = − 9.8 2.5 / 4.47 = − 9.8 0.559 = − 17.5 {\displaystyle t={\frac {{\overline {x}}-60}{s/{\sqrt {20}}}}={\frac {50.2-60.0}{2.5/{\sqrt {20}}}}={\frac {-9.8}{2.5/4.47}}={\frac {-9.8}{0.559}}=-17.5}
Passo 6Edit
Determinar o chamado p-valor de o valor de t para o teste estatístico T. Vamos rejeitar a hipótese nula para os demais valores pequenos de T, então podemos calcular a esquerda p-value:
p-value = P ( T ≤ t, H 0 ) = P ( T ( 19 ) ≤ − 17.5 ) ≈ 0 {\displaystyle =P(T\leq t;H_{0})=P(T(19)\leq -17.5)\approx 0}
a distribuição do aluno dá T (19) = 1,729 {\displaystyle T(19)=1.729}
em probabilidades 0,95 e graus de liberdade 19. O valor p é aproximado a 1,777 e-13. Por último, interprete os resultados no contexto do problema. O valor p indica que os resultados quase certamente não aconteceram por acaso e temos evidências suficientes para rejeitar a hipótese nula. Os alunos do professor pontuaram significativamente abaixo da média nacional.