Las distribuciones T
de Student fueron descubiertas por William S. Gosset (1876-1937) en 1908 cuando
trabajaba para la compañía de cervezas Guinness en Dublín (Irlanda). No pudo
publicar sus descubrimientos usando su propio nombre porque Guinness había prohibido
a sus empleados que publicaran información confidencial. Gosset firmó sus
publicaciones usando el nombre de "Student". Gosset tenía buena
relación con Karl Pearson que había sido su maestro. Necesitaba una
distribución que pudiera usar cuando el tamaño de la muestra fuera pequeño y la
varianza desconocida y tenía que ser estimada a partir de los datos. Las
distribuciones T se usan para tener en cuenta la incertidumbre añadida que
resulta por esta estimación. Fisher comprendió la importancia de los trabajos
de Gosset para muestras pequeñas.
Si el tamaño de la muestra es n entonces decimos que la
distribución T tiene n-1 grados de libertad. Hay una distribución T diferente
para cada tamaño de la muestra. Estas distribuciones son una familia de distribuciones
de probabilidad continuas. Las curvas de densidad son simétricas y con forma de
campana como la distribución normal estándar. Sus medias son 0 y sus varianzas son
mayores que 1 (tienen colas más pesadas). Las colas de las distribuciones t
disminuyen más lentamente que las colas de la distribución normal. Si los
grados de libertad son mayores más próxima a 1 es la varianza y la función de
densidad es más parecida a la densidad normal.
Esta distribución es recomendada cuando se requiere
estimar la media poblacional y no se conoce la desviación estándar y por lo
tanto, hay que estimarla, eso si, siempre y cuando la distribución original sea
aproximadamente normal.
Otro término utilizado en ésta distribución continúa, es el de
grados de libertad (g.l), el cual de manera intuitiva se expone así:
Y= x1 ± x2 ± x3 ± x4 , para satisfacer la ecuación,
tres variables se pueden cambiar a libertad, pero un de ellos no, por eso,
cuando se tiene una sola muestra, se hable de n-1 g .l.
A medida que se aumenten los g.l. la distribución t, se aproxima a la
distribución Z de la normal. Otra lectura que se puede dar es que los g.l es
una medida del número de observaciones independientes en la muestra, que se
usan para estimar la desviación estándar.
En general, cuando el tamaño de muestra no sea
muy pequeño y la simetría no sea alta, se puede usar para estimar la media
poblacional cuando no se conoce la desviación.
No hay comentarios:
Publicar un comentario