martes, 17 de febrero de 2015

Distribución T de Student

Las distribuciones T de Student fueron descubiertas por William S. Gosset (1876-1937) en 1908 cuando trabajaba para la compañía de cervezas Guinness en Dublín (Irlanda). No pudo publicar sus descubrimientos usando su propio nombre porque Guinness había prohibido a sus empleados que publicaran información confidencial. Gosset firmó sus publicaciones usando el nombre de "Student". Gosset tenía buena relación con Karl Pearson que había sido su maestro. Necesitaba una distribución que pudiera usar cuando el tamaño de la muestra fuera pequeño y la varianza desconocida y tenía que ser estimada a partir de los datos. Las distribuciones T se usan para tener en cuenta la incertidumbre añadida que resulta por esta estimación. Fisher comprendió la importancia de los trabajos de Gosset para muestras pequeñas.

Si el tamaño de la muestra es n entonces decimos que la distribución T tiene n-1 grados de libertad. Hay una distribución T diferente para cada tamaño de la muestra. Estas distribuciones son una familia de distribuciones de probabilidad continuas. Las curvas de densidad son simétricas y con forma de campana como la distribución normal estándar. Sus medias son 0 y sus varianzas son mayores que 1 (tienen colas más pesadas). Las colas de las distribuciones t disminuyen más lentamente que las colas de la distribución normal. Si los grados de libertad son mayores más próxima a 1 es la varianza y la función de densidad es más parecida a la densidad normal.

Esta distribución es recomendada cuando se requiere estimar la media poblacional y no se conoce la desviación estándar y por lo tanto, hay que estimarla, eso si, siempre y cuando la distribución original sea aproximadamente normal.

Otro término utilizado en ésta distribución continúa, es el de grados de libertad (g.l), el cual de manera intuitiva se expone así:

Y= x1 ± x2 ± x3 ± x4 , para satisfacer la ecuación, tres variables se pueden cambiar a libertad, pero un de ellos no, por eso, cuando se tiene una sola muestra, se hable de n-1 g.l. A medida que se aumenten los g.l. la distribución t, se aproxima a la distribución Z de la normal. Otra lectura que se puede dar es que los g.l es una medida del número de observaciones independientes en la muestra, que se usan para estimar la desviación estándar.

En general, cuando el tamaño de muestra no sea muy pequeño y la simetría no sea alta, se puede usar para estimar la media poblacional cuando no se conoce la desviación.

No hay comentarios:

Publicar un comentario