Diferencias en diferencias

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

Las Diferencias en diferencias (a veces 'Diferencia en diferencias", [1] 'DID',[2] or 'DD'[3] ) es una técnica cuasi-experimental utilizada en econometría que mide el efecto de un tratamiento en un determinado período en el tiempo. A menudo se utiliza para medir el cambio inducido por un tratamiento o un evento en particular, aunque puede estar sujeto a ciertas tendencias (reversión a la media prejuicios, etc.) En contraste con una estimación dentro de los sujetos del efecto del tratamiento (que mide la diferencia en un resultado después y antes del tratamiento) o una estimación de entre-sujetos del efecto del tratamiento (que mide la diferencia en el resultado entre los grupos de tratamiento y control), el estimador DID representa la diferencia entre el pre-post tratamiento, dentro de los grupos de tratamiento y control.

Definición formal[editar]

Considere el modelo:

y_{ist} ~=~ \gamma_s + \lambda_t + \delta D_{st} + \epsilon_{ist}

donde y_{ist} es la variable dependiente por persona i, teniendo en cuenta s y t. Las dimensiones de s y t puede ser por ejemplo del estado y el tiempo. \gamma_s y \lambda_t es entonces la intersección vertical para s y t respectivamente. D_{st} es una variable dummy que indica el tratamiento de estado,\delta es el efecto del tratamiento, y \epsilon_{ist} es un término de error.

Sea

\overline{y}_{st} ~=~ \frac{1}{n} \sum_{i=1}^{n} y_{ist},

\overline{\gamma}_s ~=~ \frac{1}{n}\sum_{i=1}^{n}\gamma_s ~=~ \gamma_s,

\overline{\lambda}_t ~=~ \frac{1}{n}\sum_{i=1}^{n}\lambda_t ~=~ \lambda_t,

\overline{D}_{st} ~=~ \frac{1}{n}\sum_{i=1}^{n} D_{st} ~=~ D_{st},

\overline{\epsilon}_{st} ~=~ \frac{1}{n}\sum_{i=1}^{n}\epsilon_{ist},

y supongamos para simplificar, que s=1,2 and t=1,2. Entonces

(\overline{y}_{11} - \overline{y}_{12}) - (\overline{y}_{21} - \overline{y}_{22})

= \left [ (\gamma_1 + \lambda_1 + \delta D_{11} + \overline{\epsilon}_{11}) - (\gamma_1 + \lambda_2 + \delta D_{12} + \overline{\epsilon}_{12}) \right ] - \left [ (\gamma_2 + \lambda_1 + \delta D_{21} + \overline{\epsilon}_{21}) - (\gamma_2 - \lambda_2 + \delta D_{22} + \overline{\epsilon}_{22}) \right ]

= \delta (D_{11} - D_{12}) + \delta(D_{22} - D_{21}) + \overline{\epsilon}_{11} - \overline{\epsilon}_{12} + \overline{\epsilon}_{22} - \overline{\epsilon}_{21}.

El supuesto de exogeneidad estricta implica entonces que:

E \left [ (\overline{y}_{11} - \overline{y}_{12}) - (\overline{y}_{21} - \overline{y}_{22}) \right ] ~=~ \delta (D_{11} - D_{12}) + \delta(D_{22} - D_{21}).

Sin pérdida de generalidad, se supone que D_{22}=1 and D_{11}=D_{12}=D_{21}=0, Dando el estimador DID

\hat{\delta} ~=~ (\overline{y}_{11} - \overline{y}_{12}) - (\overline{y}_{21} - \overline{y}_{22}),

que se puede interpretar como el efecto del tratamiento indicado por D_{st}.

Supuestos[editar]

Archivo:Parallel Trend Assumption.png
Ilustración del supuesto de tendencia paralela

Mantiene todos los supuestos del modelo de mínimos cuadrados ordinarios. Además, DID requiere un supuesto de tendencia paralela. La suposición de tendencia paralela nos dice que \lambda_2 - \lambda_1 son los mismos en ambos s=1 y s=2. Dado que la definición formal anterior representa fielmente la realidad, este supuesto se cumple automáticamente. Sin embargo, un modelo con \lambda_{st} ~:~ \lambda_{22} - \lambda_{21} \neq \lambda_{12} - \lambda_{11} bien puede ser más realista.

Como se ilustra a la derecha, el efecto del tratamiento es la diferencia entre el valor observado de y y lo que el valor de y habría sido con las tendencias paralelas, de no haber habido ningún tratamiento. El talón de Aquiles del DID es que cuando algo distinto del tratamiento en un grupo genera cambios en un grupo pero no en el otro, al mismo tiempo que el tratamiento, lo que implica una violación de la hipótesis tendencia paralela.

Para garantizar la precisión de la estimación de DID, se supone que la composición de los individuos de los dos grupos se mantenga sin cambios en el tiempo. Cuando se utiliza un modelo de DID, surgen diversas cuestiones que pueden poner en peligro los resultados, como la autocorrelación y Ashenfelter dips, ambos debe ser considerados y tratados.

Implementación[editar]

El método DID puede ser implementado de acuerdo a la siguiente tabla, donde la celda inferior derecha es el estimador DID.

y_{st} s=2 s=1 Difference
t=2 y_{22} y_{12} y_{12}-y_{22}
t=1 y_{21} y_{11} y_{11}-y_{21}
Change y_{21}-y_{22} y_{11}-y_{12} (y_{11}-y_{21})-(y_{12}-y_{22})

Ejecución de un análisis de regresión da el mismo resultado. Considere el modelo OLS

y ~=~ \beta_0 + \beta_1 T + \beta_2 S + \beta_3 (T \cdot S) + \varepsilon

donde T es una variable para t=2 , y S es una variable dummy para s=2. La variable compuesta (T \cdot S) es entonces una variable dummy que indica cuándo S=T=1. Aunque no se muestra aquí con rigor, resulta que las estimaciones de este modelo son:

\hat{\beta}_0 ~=~ (y ~|~ T=0,~ S=0)

\hat{\beta}_1 ~=~ (y ~|~ T=1,~ S=0) - (y ~|~ T=0,~ S=0)

\hat{\beta}_2 ~=~ (y ~|~ T=0,~ S=1) - (y ~|~ T=0,~ S=0)

\hat{\beta}_3 ~=~ [(y ~|~ T=1,~ S=1) - (y ~|~ T=0,~ S=1)] - [(y ~|~ T=1,~ S=0) - (y ~|~ T=0,~ S=0)] ,

Referencias[editar]

  1. Mostly harmless econometrics: An empiricist's companion. Princeton University Press. 2008. ISBN 9780691120348. 
  2. «Semiparametric difference-in-differences estimators». Review of Economic Studies 72 (1):  pp. 1-19. 2005. doi:10.1111/0034-6527.00321. 
  3. «How Much Should We Trust Differences-in-Differences Estimates?». Quarterly Journal of Economics 119 (1):  pp. 249–275. 2004. doi:10.1162/003355304772839588. 

Enlaces Externos[editar]