Un profesor universitario quiere comparar los puntajes de sus estudiantes con el promedio nacional. Ella elige una muestra aleatoria simple (SRS) de 20 estudiantes, que obtienen un promedio de 50.2 en un examen estandarizado. Sus puntuaciones tienen una desviación estándar de 2,5. El promedio nacional en la prueba es de 60. Ella quiere saber si sus estudiantes obtuvieron calificaciones significativamente más bajas que el promedio nacional.
Las pruebas de significación siguen un procedimiento en varios pasos.
Paso 1Editar
En primer lugar, indique el problema en términos de una distribución e identifique los parámetros de interés. Menciona la muestra. Asumiremos que las puntuaciones (X) de los estudiantes en la clase del profesor se distribuyen aproximadamente normalmente con parámetros desconocidos μ y σ
Paso 2Editar
Establecen las hipótesis en símbolos y palabras.
H O: μ = 60 {\displaystyle H_{O}: \ quad \ mu =60}
La hipótesis nula es que sus estudiantes obtuvieron calificaciones a la par con el promedio nacional.
H a : µ < 60 {\displaystyle H_{A}:\quad \mu <60}
La hipótesis alternativa es que sus estudiantes obtuvieron calificaciones más bajas que el promedio nacional.
Paso 3editar
En segundo lugar, identificar la prueba que se va a utilizar. Dado que tenemos un SRS de pequeño tamaño y no conocemos la desviación estándar de la población, usaremos una prueba t de una muestra.
La fórmula para el estadístico t T para una prueba de una muestra es la siguiente:
T = X − 60 S / 20 {\displaystyle T={\frac {{\overline {X}}-60}{S/{\sqrt {20}}}}}
donde X {\displaystyle {\overline {X}}}
es la media de la muestra y S es la desviación estándar de la muestra.
Un error bastante común es decir que la fórmula para la estadística de la prueba t es:
T = x − µ s / n {\displaystyle T={\frac {{\overline {x}}-\mu }{s/{\sqrt {n}}}}}
Esto no es una estadística, porque μ es desconocido, que es el punto crucial en un problema. La mayoría de la gente ni siquiera lo nota. Otro problema con esta fórmula es el uso de x y s. Deben considerarse las estadísticas de muestra y no sus valores.
La fórmula general correcta es:
T = X − c S / n {\displaystyle T={\frac {{\overline {X}}-c}{S/{\sqrt {n}}}}}
en la cual c es el hipotético valor de µ especificado por la hipótesis nula.
(La desviación estándar de la muestra dividida por la raíz cuadrada del tamaño de la muestra se conoce como el «error estándar» de la muestra.)
Paso 4editar
Indique la distribución del estadístico de prueba bajo la hipótesis nula. Bajo H0 la estadística T seguirá la distribución de un Estudiante con 19 grados de libertad: T τ τ ⋅ (20 − 1) {\displaystyle T \ sim \ tau \ cdot (20-1)}
.
Paso 5editar
Calcular el valor observado t del estadístico de prueba T, introduciendo los valores, de la siguiente manera:
t = x – 60 s / 20 = 50.2 − 60.0 2.5 / 20 = − 9.8 2.5 / 4.47 = − 9.8 0.559 = − 17.5 {\t = {\frac {{\overline {x}} -60}{s / {\sqrt {20}}}}={\frac {50.2-60.0}{2.5/{\sqrt {20}}}}={\frac {-9.8}{2.5/4.47}}={\frac {-9.8}{0.559}}=-17.5}
Paso 6editar
Determinar el llamado valor p del valor t del estadístico de prueba T. Rechazaremos la hipótesis nula para valores demasiado pequeños de T, por lo que calcularemos el valor p izquierdo:
valor p = P (T ≤ t; H 0) = P ( T ( 19 ) ≤ − 17.5 ) ≈ 0 {\ =P(T\leq t;H_{0}) = P(T (19)\leq -17.5) \ approx 0}
La distribución de Student da T (19) = 1.729 {\displaystyle T(19)=1.729}
con probabilidades de 0,95 y grados de libertad de 19. El valor de p se aproxima a 1.777 e-13.
Paso 7editar
Por último, interprete los resultados en el contexto del problema. El valor de p indica que los resultados casi con certeza no ocurrieron por casualidad y tenemos evidencia suficiente para rechazar la hipótesis nula. Los estudiantes del profesor obtuvieron puntuaciones significativamente más bajas que el promedio nacional.