Factor de inflación de la varianza

De Wikipedia, la enciclopedia libre
Ir a la navegación Ir a la búsqueda

En estadística, el factor de inflación de la varianza (FIV, a veces también conocido por su nombre en inglés, variance inflation factor, y de ahí VIF) cuantifica la intensidad de la multicolinealidad en un análisis de regresión normal de mínimos cuadrados. Proporciona un índice que mide hasta qué punto la varianza (el cuadrado de la desviación estándar estimada) de un coeficiente de regresión estimado se incrementa a causa de la colinealidad.

Definición[editar]

Considerando el siguiente modelo lineal con k variables independientes

Y = β0 + β1 X1 + β2 X 2 + ... + βk Xk + ε.

El error estándar de la estimación de βj es la raíz cuadrada de los j+1, j+1 como elemento de s2(XX)−1, donde s es la raíz del error cuadrático medio (RECM), teniendo en cuenta que RECM2 es un estimador insesgado de la varianza del error ); X es la regresión de la matriz de diseño -una matriz en la que Xi, j+1 es el valor de la j enésima variable independiente para el i enésimo caso u observación, por lo que Xi, 1 es 1 para todo i-. Resulta que el cuadrado de este error estándar, la varianza estimada de βj, puede expresarse de manera equivalente como:

donde Rj2 es el múltiplo R2 para la regresión de Xj sobre otras covariables (una regresión que no involucra la respuesta de la variable Y). Esta identidad separa las influencias de varios factores diferentes en la varianza de la estimación del coeficiente:

  • s2: una gran dispersión en los datos de la representación de la regresión llevan proporcionalmente a una mayor varianza en las estimaciones de los coeficientes.
  • n: un gran tamaño de la muestra se traduce proporcionalmente en una menor varianza en los estimadores del coeficiente.
  • : una gran variabilidad en una covariable particular lleva proporcionalmente a una menor varianza en la correspondiente estimación del coeficiente.

Cálculo y análisis[editar]

Se pueden calcular los k factores de inflación de la varianza diferentes (uno para cada Xi) en tres pasos:

Primer paso[editar]

En primer lugar se realiza una regresión de mínimos cuadrados que tenga a Xi como una función de las demás variables explicativas de la primera ecuación.

Si i = 1, por ejemplo, la ecuación sería:

donde c0 es una constante y e es el error.

Segundo paso[editar]

En segundo lugar, se calcula el factor de inflación de la varianza para con la siguiente fórmula:

donde R2i es el coeficiente de determinación de la ecuación de regresión del primer paso, con en el lado izquierdo y el resto de variables predictivas en el derecho.

Tercer paso[editar]

Se analiza la magnitud de la multicolinealidad considerando el tamaño de . Si , la multicolinealidad es alta.[1]

Referencias[editar]

  1. Kutner, M. H.; Nachtsheim, C. J.; Neter, J. (2004). Applied Linear Regression Models (4th edición). McGraw-Hill Irwin. 

Bibliografía[editar]

  • Backhaus, K., Erichson, B., Plinke, W., Weiber, R.: Multivariate Analysemethoden. Eine anwendungsorientierte Einführung. Berlin u. a., 13. Auflage 2013, S.93–96. ISBN 978-3-642-16490-3