Distribución t de Student

De Wikipedia, la enciclopedia libre

Distribución t de Student
Función de densidad de probabilidad
Función de distribución de probabilidad
Parámetros \nu > 0\! grados de libertad (real)
Dominio x \in (-\infty; +\infty)\!
Función de densidad (pdf) \frac{\Gamma((\nu+1)/2)} {\sqrt{\nu\pi}\,\Gamma(\nu/2)} (1+x^2/\nu)^{-(\nu+1)/2}\!
Función de distribución (cdf) \frac{1}{2} + \frac{x \Gamma \left( (\nu+1)/2 \right) \,_2F_1 \left ( \frac{1}{2},(\nu+1)/2;\frac{3}{2};-\frac{x^2}{\nu} \right)} {\sqrt{\pi\nu}\,\Gamma (\nu/2)} donde \,_2F_1 es la función hipergeométrica
Media 0 para ν > 1, indefinida para otros valores
Mediana 0
Moda 0
Varianza \frac{\nu}{\nu-2}\! para ν > 2, indefinida para otros valores
Coeficiente de simetría 0 para ν > 3
Curtosis \frac{6}{\nu-4}\! para ν > 4,
Entropía \begin{matrix}
         \frac{\nu+1}{2}\left[ 
             \psi(\frac{1+\nu}{2}) 
               - \psi(\frac{\nu}{2})
         \right] \\[0.5em]
+ \log{\left[\sqrt{\nu}B(\frac{\nu}{2},\frac{1}{2})\right]}
\end{matrix}
  • ψ: función digamma,
  • B: función beta
Función generadora de momentos (mgf) (No definida)
Función característica


En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño. Ésta es la base de la popular prueba t de Student para la determinación de las diferencias entre dos medias muestrales y para la construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones.

La distribución t surge, en la mayoría de los estudios estadísticos prácticos, cuando la desviación típica de una población se desconoce y debe ser estimada a partir de los datos de una muestra.

[editar] Aparición y especificaciones de la distribución t de Student

Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas normalmente, con media μ y varianza σ2. Sea

\overline{X}_n=(X_1+\cdots+X_n)/n

la media muestral y

s ^ 2(x) = \frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x}) ^ 2

la varianza muestral. Entonces, está demostrado que

Z=\frac{\overline{X}_n-\mu}{\sigma/\sqrt{n}}

tiende a la distribución normal de media 0 y varianza 1 cuando n tiende a infinito.

Gosset estudió una expresión relacionada,

T=\frac{\overline{X}_n-\mu}{S_n/\sqrt{n}}

y mostró que T tiene la siguiente función de densidad:

f(t) = \frac{\Gamma((\nu+1)/2)}{\sqrt{\nu\pi\,}\,\Gamma(\nu/2)} (1+t^2/\nu)^{-(\nu+1)/2}

Con ν igual a n − 1.

La distribución de T se llama ahora la distribución-t.

El parámetro ν se llama convencionalmente el número de grados de libertad. La distribución depende de ν , pero no de μ o σ; la independencia de μ y σ es lo que hace a la distribución t tan importante en la teoría y en la práctica. Γ es la función gamma.

Grados De Libertad (gl): Número de observaciones que se utilizaron para calcular la desviación estándar muestral menos 1, es decir (n-1).

[editar] Intervalos de confianza derivados de la distribución t de Student

El procedimiento para el cálculo del intervalo de confianza basado en la t de Student consiste en estimar la desviación típica de los datos S y calcular el error estándar de la media= S/(raíz cuadrada de n), siendo entonces el intervalo de confianza para la media = x media +- t (alfa/2) multiplicado por (S/(raíz cuadradada de n)). fuente: www.seh-lelha.org/stat1.htm

Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las medias de muestras de dos distribuciones normales se distribuye también normalmente, la distribución t puede usarse para examinar si esa diferencia puede razonablemente suponerse igual a cero.

para efectos prácticos el valor esperado y la varianza son :

E(t(n))= 0 y Var (t(n-1)) = n/(n-2) para n > 2

[editar] Véase también

Tabla distribución t de Student
Herramientas personales
Crear un libro