Regresiones aparentemente no relacionadas

En econometría, las regresiones aparentemente no relacionadas o Seemingly unrelated regressions (SUR) por sus siglas en inglés^[1]^[2]^[3]^[4]^[5] es un modelo, propuesto por Arnold Zellner en (1962), es una generalización de un modelo de una regresión lineal que consta de varias ecuaciones, cada uno con su propia variable dependiente y potencialmente diferentes conjuntos de variables explicativas exógenas. Cada ecuación es una regresión lineal válida por sí misma y se puede estimar por separado, por lo que el sistema se llama aparentemente sin relación,^[3] aunque algunos autores sugieren que el término aparentemente relacionada sería más apropiado,^[1] ya que los términos de error se supone que están correlacionados a través de las ecuaciones.^[6]

El modelo se puede estimar ecuación por ecuación utilizando métodos estándares como mínimos cuadrados ordinarios (MCO). Estas estimaciones son consistentes, sin embargo por lo general no son tan eficientes como con el método SUR, que asciende a mínimos cuadrados generalizados factibles con una forma específica de la matriz de varianza-covarianza. Hay dos casos importantes en los que el SUR es de hecho equivalente a los MCO, estos son: cuando los términos de error no tienen correlación entre las ecuaciones (para que sean verdaderamente no relacionadas), o cuando cada ecuación contiene exactamente el mismo conjunto de regresores del lado derecho.

El modelo SUR puede ser visto ya sea como la simplificación del modelo lineal general donde ciertos coeficientes en la matriz $\mathrm {B}$ están restringidos a ser iguales a cero, o como la generalización del modelo lineal general donde se permite a los regresores en la del lado de mano derecha sean diferentes en cada ecuación. El modelo SUR puede generalizarse aún más en el modelo de ecuaciones simultáneas, donde los regresores del lado derecho se les permite ser las variables endógenas así.

El modelo[editar]

Supongamos que hay m ecuaciones de regresión

y_{ir}=x_{ir}^{\mathsf {T}}\;\!\beta _{i}+\varepsilon _{ir},\quad i=1,\ldots ,m.

Aquí i representa el número de la ecuación, r = 1, …, R es el índice de la observación y estamos tomando la transpuesta de la $x_{ir}$ vector columna. El número de observaciones R se supone que ser grande, de modo que en el análisis tomamos R → $\infty$ , Mientras que el número de ecuaciones m permanece fija.

Cada ecuación i tiene una única variable de respuesta y del ir y un vector i k-dimensional de regresores x ir. Si apilamos observaciones correspondientes a la ecuación i-ésimo en vectores y matrices-R dimensional, a continuación, el modelo se puede escribir en forma vectorial como

y_{i}=X_{i}\beta _{i}+\varepsilon _{i},\quad i=1,\ldots ,m,

donde y_i y ε_i son R×1 vectores, X_i es una matriz R×k_i, y β_i es un k_i×1 vector.

Por último, si apilamos estas ecuaciones m vectores en la parte superior de uno al otro, el sistema tomará forma^[4]^{: eq. (2.2)}

${\begin{pmatrix}y_{1}\\y_{2}\\\vdots \\y_{m}\end{pmatrix}}={\begin{pmatrix}X_{1}&0&\ldots &0\\0&X_{2}&\ldots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\ldots &X_{m}\end{pmatrix}}{\begin{pmatrix}\beta _{1}\\\beta _{2}\\\vdots \\\beta _{m}\end{pmatrix}}+{\begin{pmatrix}\varepsilon _{1}\\\varepsilon _{2}\\\vdots \\\varepsilon _{m}\end{pmatrix}}=X\beta +\varepsilon \,.$

La suposición del modelo es que los términos de error ε_ir son independientes a lo largo del tiempo, pero pueden tener correlaciones contemporáneas cruzadas. Por lo tanto, suponemos que E[ ε_ir ε_is | X ] = 0 siempre que r ≠ s, mientras que E[ ε_ir ε_jr | X ] = σ_ij. Denominando Σ = [σ_ij] a matriz de skedasticity m × m de cada observación, la matriz de covarianza de los términos de error ε será igual a^[4]^{: eq. (2.4)}^[6]^: 332

\Omega \equiv \operatorname {E} [\,\varepsilon \varepsilon ^{\mathsf {T}}\,|X\,]=\Sigma \otimes I_{R},

donde I_R es la matriz de identidad dimensional y ⊗ denota el producto matriz Kronecker.^[7]^: 197

Estimación[editar]

El modelo SUR generalmente se estima utilizando el método de mínimos cuadrados generalizados (FGLS) factible. Este es un método de dos pasos en el que en el primer paso ejecutamos la regresión ordinaria de mínimos cuadrados para (1). Los residuos de esta regresión se utilizan para estimar los elementos de la matriz $\Sigma$ :^[7]^: 198

{\hat {\sigma }}_{ij}={\frac {1}{R}}\,{\hat {\varepsilon }}_{i}^{\mathsf {T}}{\hat {\varepsilon }}_{j}.

En el segundo paso, ejecutamos la regresión por mínimos cuadrados generalizados para (1) usando la matriz de varianza $\scriptstyle {\hat {\Omega }}\;=\;{\hat {\Sigma }}\,\otimes \,I_{R}$ :

{\hat {\beta }}={\Big (}X^{\mathsf {T}}({\hat {\Sigma }}^{-1}\otimes I_{R})X{\Big )}^{\!-1}X^{\mathsf {T}}({\hat {\Sigma }}^{-1}\otimes I_{R})\,y.

Este estimador es imparcial en muestras pequeñas suponiendo que los términos de error ε ir tienen una distribución simétrica; en muestras grandes es consistente y asintóticamente normal con distribución límite^[7]^: 198

{\sqrt {R}}({\hat {\beta }}-\beta )\ {\xrightarrow {d}}\ {\mathcal {N}}{\Big (}\,0,\;{\Big (}{\tfrac {1}{R}}X^{\mathsf {T}}(\Sigma ^{-1}\otimes I_{R})X{\Big )}^{\!-1}\,{\Big )}.

Se sugirieron otras técnicas de estimación además del FGLS para el modelo SUR: el método de máxima verosimilitud (ML) bajo el supuesto de que los errores se distribuyen normalmente; los mínimos cuadrados iterativos generalizados (IGLS), donde los residuos del segundo paso de FGLS se utilizan para volver a calcular la matriz $\scriptstyle {\hat {\Sigma }}$ , luego estimar $\scriptstyle {\hat {\beta }}$ otra vez usando GLS, y así sucesivamente, hasta que se logre la convergencia; el esquema iterativo de mínimos cuadrados ordinarios (IOLS), donde la estimación se realiza sobre la base de ecuación por ecuación, pero cada ecuación incluye como regresores adicionales los residuos de las ecuaciones estimadas previamente para contabilizar las correlaciones de ecuaciones cruzadas, la estimación es ejecutar iterativamente hasta que se logre la convergencia. Kmenta y Gilbert (1968) llevaron a cabo un estudio de Monte Carlo y establecieron que los tres métodos (IGLS, IOLS y ML) arrojan los resultados numéricamente equivalentes; también encontraron que la distribución asintótica de estos estimadores es la misma que la distribución del FGLS. estimador, mientras que en muestras pequeñas ninguno de los estimadores fue más superior que los otros.^[8] Zellner y Ando (2010) desarrollaron un método directo de Monte Carlo para el análisis bayesiano del modelo SUR.^[9]

Referencias[editar]

↑ ^a ^b Davidson, Russell; MacKinnon, James G. (1993). Estimation and inference in econometrics. Oxford University Press. ISBN 978-0-19-506011-9.
↑ Hayashi, Fumio (2000). Econometrics. Princeton University Press. ISBN 0-691-01018-8.
↑ ^a ^b Greene, William H. (2002). Econometric analysis (5th edición). Prentice Hall. ISBN 0-13-066189-9.
↑ ^a ^b ^c Zellner, Arnold (1962). «An efficient method of estimating seemingly unrelated regression equations and tests for aggregation bias». Journal of the American Statistical Association 57: 348-368. doi:10.2307/2281644.
↑ Srivastava, Virendra K.; Giles, David E.A. (1987). Seemingly unrelated regression equations models: estimation and inference. New York: Marcel Dekker. ISBN 978-0-8247-7610-7.
↑ ^a ^b Greene, William H. (2012). Econometric Analysis (Seventh edición). Upper Saddle River: Pearson Prentice-Hall. pp. 332–344. ISBN 978-0-273-75356-8.
↑ ^a ^b ^c Amemiya, Takeshi (1985). Advanced Econometrics. Cambridge, Massachusetts: Harvard University Press. ISBN 0-674-00560-0.
↑ Kmenta, Jan; Gilbert, Roy F. (1968). «Small sample properties of alternative estimators of seemingly unrelated regressions». Journal of the American Statistical Association 63 (324): 1180-1200. doi:10.2307/2285876.
↑ Zellner, A.; Ando, T. (2010). «A direct Monte Carlo approach for Bayesian analysis of the seemingly unrelated regression model». Journal of Econometrics 159: 33. doi:10.1016/j.jeconom.2010.04.005.

Datos: Q4113687

[DavidsonMacKinnon1993-1] Davidson, Russell; MacKinnon, James G. (1993). Estimation and inference in econometrics. Oxford University Press. ISBN 978-0-19-506011-9.

[2] Hayashi, Fumio (2000). Econometrics. Princeton University Press. ISBN 0-691-01018-8.

[Greene2002-3] Greene, William H. (2002). Econometric analysis (5th edición). Prentice Hall. ISBN 0-13-066189-9.

[Zellner1962-4] Zellner, Arnold (1962). «An efficient method of estimating seemingly unrelated regression equations and tests for aggregation bias». Journal of the American Statistical Association 57: 348-368. doi:10.2307/2281644.

[5] Srivastava, Virendra K.; Giles, David E.A. (1987). Seemingly unrelated regression equations models: estimation and inference. New York: Marcel Dekker. ISBN 978-0-8247-7610-7.

[Greene2012-6] Greene, William H. (2012). Econometric Analysis (Seventh edición). Upper Saddle River: Pearson Prentice-Hall. pp. 332–344. ISBN 978-0-273-75356-8.

[Amemiya1985-7] Amemiya, Takeshi (1985). Advanced Econometrics. Cambridge, Massachusetts: Harvard University Press. ISBN 0-674-00560-0.

[8] Kmenta, Jan; Gilbert, Roy F. (1968). «Small sample properties of alternative estimators of seemingly unrelated regressions». Journal of the American Statistical Association 63 (324): 1180-1200. doi:10.2307/2285876.

[9] Zellner, A.; Ando, T. (2010). «A direct Monte Carlo approach for Bayesian analysis of the seemingly unrelated regression model». Journal of Econometrics 159: 33. doi:10.1016/j.jeconom.2010.04.005.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]