Principal Ciencias

Estadísticas de la prueba t de Student

Estadísticas de la prueba t de Student
Estadísticas de la prueba t de Student

Vídeo: T de Student (Teoría) 2024, Septiembre

Vídeo: T de Student (Teoría) 2024, Septiembre
Anonim

Prueba t de Student, en estadística, un método de prueba de hipótesis sobre la media de una pequeña muestra extraída de una población distribuida normalmente cuando se desconoce la desviación estándar de la población.

En 1908 William Sealy Gosset, un inglés que publica bajo el seudónimo de Student, desarrolló la prueba t y la distribución t. La distribución t es una familia de curvas en la que el número de grados de libertad (el número de observaciones independientes en la muestra menos uno) especifica una curva particular. A medida que aumenta el tamaño de la muestra (y, por lo tanto, los grados de libertad), la distribución t se aproxima a la forma de campana de la distribución normal estándar. En la práctica, para pruebas que involucran la media de una muestra de tamaño mayor que 30, la distribución normal generalmente se aplica.

Es usual primero formular una hipótesis nula, que establece que no hay una diferencia efectiva entre la media de la muestra observada y la media poblacional hipotética o establecida, es decir, que cualquier diferencia medida se debe solo al azar. En un estudio agrícola, por ejemplo, la hipótesis nula podría ser que una aplicación de fertilizante no ha tenido ningún efecto en el rendimiento del cultivo, y se realizaría un experimento para probar si ha aumentado la cosecha. En general, una prueba t puede ser de dos lados (también denominada de dos colas), indicando simplemente que las medias no son equivalentes, o de un solo lado, especificando si la media observada es mayor o menor que la media hipotética. Luego se calcula el estadístico de prueba t. Si el estadístico t observado es más extremo que el valor crítico determinado por la distribución de referencia apropiada, se rechaza la hipótesis nula. La distribución de referencia apropiada para el estadístico t es la distribución t. El valor crítico depende del nivel de significación de la prueba (la probabilidad de rechazar erróneamente la hipótesis nula).

Por ejemplo, supongamos que un investigador desea probar la hipótesis de que una muestra de tamaño n = 25 con media x = 79 y desviación estándar s = 10 se extrajo al azar de una población con media μ = 75 y desviación estándar desconocida. Usando la fórmula para la estadística t, la t calculada es igual a 2. Para una prueba de dos lados con un nivel común de significancia α = 0.05, los valores críticos de la distribución t en 24 grados de libertad son −2.064 y 2.064. La t calculada no excede estos valores, por lo tanto, la hipótesis nula no se puede rechazar con un 95 por ciento de confianza. (El nivel de confianza es 1 - α.)

Una segunda aplicación de la distribución t prueba la hipótesis de que dos muestras aleatorias independientes tienen la misma media. La distribución t también se puede utilizar para construir intervalos de confianza para la media real de una población (la primera aplicación) o para la diferencia entre dos medias muestrales (la segunda aplicación). Ver también estimación de intervalo.