Modelo lineal generalizado

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

En estadística, el modelo lineal generalizado (MLG) es una generalización flexible de la regresión lineal ordinaria. Relaciona la distribución aleatoria de la variable dependiente en el experimento (la «función de distribución») con la parte sistemática (no aleatoria) (o «predictor lineal») a través de una función llamada la «función de enlace».

Los modelos lineales generalizados fueron formulados por John Nelder y Robert Wedderburn como una manera de unificar varios modelos estadísticos, incluyendo la regresión lineal, regresión logística y regresión de Poisson, bajo un solo marco teórico.[1] Esto les permitió desarrollar un algoritmo general para la estimación de máxima verosimilitud en todos estos modelos. Esto puede ser naturalmente extendido a otros muchos otros modelos también.

Introducción[editar]

En un MLG, se asume que la variable dependiente \scriptstyle \mathbf{Y} está generada por una función de distribución de la familia exponencial. La media \scriptstyle \mu de la distribución depende de las variables independientes \scriptstyle \mathbf{X}, a través de la fórmula

\mathrm{E}(\mathbf{Y}) = \boldsymbol{\mu} = g^{-1}(\mathbf{X}\boldsymbol{\beta}),

donde

\mathrm{E}(\mathbf{Y})\, es el valor esperado de \mathbf{Y};
\mathbf{X \beta}\, es el «predictor lineal», una combinación lineal de parámetros desconocidos \mathbf{\beta};
g\, es la función de enlace.

Con esta notación, la varianza es típicamente una función \mathbf{V} de la media:

 \operatorname{Var}(\mathbf{Y}) = \operatorname{V}( \boldsymbol{\mu} ) = \operatorname{V}(g^{-1}(\mathbf{X}\boldsymbol{\beta})).

Es conveniente si \mathbf{V} proviene de una distribución en la familia exponencial, pero podría simplemente ser que la varianza es una función del valor ajustado.

Los parámetros desconocidos \beta son generalmente estimados por máxima verosimilitud, máxima cuasi-verosimilitud, o técnicas de inferencia bayesiana.

Componentes del modelo[editar]

El MLG consiste de tres elementos.

  1. Una función de distribución f, perteneciente a la familia exponencial.
  2. Un predictor lineal \eta = \mathbf{X \beta}.
  3. Una función de enlace g tal que E(\mathbf{Y}) = \mathbf{\mu} = g^{-1}(\eta).

Referencias[editar]

  1. McCullagh, Peter; Nelder, John (1989). Generalized Linear Models. London: Chapman and Hall. ISBN 0-412-31760-5.  Chapter 1. Nelder and Wedderburn's 1972 JRSS(A) paper is the primary source.