Modelo Tobit

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

El modelo Tobit es un modelo estadístico propuesto por James Tobin (1958) para describir la relación entre una variable dependiente no negativa y_i y una variable independiente (o vector ) x_i. El término Tobit fue derivado del nombre truncando de Tobin y añadiendo, por analogía, el it como en el modelo probit o en el modelo logit.[1]

El modelo supone que existe una variable latente (no observable por ejemplo) y_i^*. Esta variable depende linealmente de x_i a través de un parámetro(vector) \beta que determina la relación entre la variable independiente (o vector) x_i y la variable latente y_i^* (Tal como en un modelo lineal). Además, hay un término de error u_i con una distribución normal para captar las influencias aleatorias en esta relación. La variable observable y_i se define como igual a la variable latente cuando la variable latente es superior a cero y cero en caso contrario.

y_i = \begin{cases} 
    y_i^* & \textrm{si} \; y_i^* >0 \\ 
    0     & \textrm{si} \; y_i^* \leq 0
\end{cases}

donde y_i^* es una variable latente:

 y_i^* = \beta x_i + u_i, u_i \sim N(0,\sigma^2) \,

La consistencia[editar]

Si el parámetro de relación \beta se estima mediante una regresión de lo observado y_i en x_i, el resultado obtenido usando el estimador de mínimos cuadrados ordinarios es inconsistente. Esto dará lugar a una estimación a la baja de polarización del coeficiente de la pendiente hacia arriba y una estimación sesgada de la intersección. Takeshi Amemiya (1973) ha demostrado que el estimador de máxima verosimilitud propuesto por Tobin para este modelo es consistente.

Interpretación[editar]

La \beta del coeficiente no debe interpretarse como el efecto de los x_i en y_i, como uno haría con un modelo de regresión lineal , lo que es un error común. En su lugar, debe interpretarse como la combinación de (1) el cambio en y_i de aquellos por encima del límite, ponderados por la probabilidad de estar por encima del límite, y (2) el cambio en la probabilidad de estar por encima del límite, ponderado por el valor esperado de y_i si es superior.[2]

Variaciones del modelo Tobit[editar]

Las variaciones del modelo Tobit pueden ser producidas mediante el cambio de dónde y cuándo se produce la censura. Amemiya (1985) clasifica estas variaciones en cinco categorías (Tobit tipo I - Tobit tipo V), donde Tobit tipo I representa el primer modelo descrito anteriormente. Schnedler (2005) proporciona una fórmula general para obtener estimadores consistentes de probabilidad para estas y otras variaciones del modelo Tobit.

Tipo I[editar]

El modelo Tobit es un caso especial de un modelo de regresión censurada , ya que la variable latente y_i^* no puede siempre ser observada mientras que la variable independiente  x_i es observable. Una variante común del modelo Tobit está censurando a un valor  y_L diferente de cero:

 y_i = \begin{cases} 
    y_i^* & \textrm{si} \; y_i^* >y_L \\ 
    y_L   & \textrm{si} \; y_i^* \leq y_L.
\end{cases}

Otro ejemplo es la censura de los valores anteriores  y_U.

 y_i = \begin{cases} 
    y_i^* & \textrm{si} \; y_i^* <y_U \\ 
    y_U   & \textrm{si} \; y_i^* \geq y_U.
\end{cases}

Sin embargo, otro modelo resulta cuando  y_i se censura desde arriba y abajo al mismo tiempo.

 y_i = \begin{cases} 
    y_i^* & \textrm{si} \; y_L<y_i^* <y_U \\ 
    y_L   & \textrm{si} \; y_i^* \leq y_L \\
    y_U   & \textrm{si} \; y_i^* \geq y_U.
\end{cases}

El resto de los modelos se presenta como estando limitada desde abajo a 0, aunque esto se puede generalizar como lo hemos hecho en Tipo I.

Tipo II[editar]

Tipo II modelos Tobit introducir una variable latente segundo.

 y_{2i} = \begin{cases} 
    y_{2i}^* & \textrm{si} \; y_{1i}^* >0 \\ 
    0   & \textrm{si} \; y_{1i}^* \leq 0.
\end{cases}

Heckman (1987) cae en el tipo II Tobit. En el tipo Tobit I, la variable latente absorbe tanto el proceso de participación y los "resultados" de interés. En el Tipo Tobit II permite que el proceso de participación / selección y el proceso de "resultado" sean independientes, condicionado a x.

Tipo III[editar]

Tipo III introduce una segunda variable dependiente observada

 y_{1i} = \begin{cases} 
    y_{1i}^* & \textrm{si} \; y_{1i}^* >0 \\ 
    0   & \textrm{si} \; y_{1i}^* \leq 0.
\end{cases}
 y_{2i} = \begin{cases} 
    y_{2i}^* & \textrm{si} \; y_{1i}^* >0 \\ 
    0   & \textrm{si} \; y_{1i}^* \leq 0.
\end{cases}

El modelo Heckman cae en este tipo.

Tipo IV[editar]

Tipo IV introduce tercera variable observada dependiente y una variable latente tercero.

 y_{1i} = \begin{cases} 
    y_{1i}^* & \textrm{si} \; y_{1i}^* >0 \\ 
    0   & \textrm{si} \; y_{1i}^* \leq 0.
\end{cases}
 y_{2i} = \begin{cases} 
    y_{2i}^* & \textrm{si} \; y_{1i}^* >0 \\ 
    0   & \textrm{si} \; y_{1i}^* \leq 0.
\end{cases}
 y_{3i} = \begin{cases} 
    y_{3i}^* & \textrm{si} \; y_{1i}^* >0 \\ 
    0   & \textrm{si} \; y_{1i}^* \leq 0.
\end{cases}

Tipo V[editar]

Semejante al II, Tipo V, sólo observar el signo de y_{1i}^*.

 y_{2i} = \begin{cases} 
    y_{2i}^* & \textrm{si} \; y_{1i}^* >0 \\ 
    0   & \textrm{si} \; y_{1i}^* \leq 0.
\end{cases}
 y_{3i} = \begin{cases} 
    y_{3i}^* & \textrm{si} \; y_{1i}^* >0 \\ 
    0   & \textrm{si} \; y_{1i}^* \leq 0.
\end{cases}

La función de verosimilitud[editar]

A continuación se presentan la Función de verosimilitud y las funciones de registro de probabilidad para un tipo que Tobit. Este es un Tobit censurado desde abajo en  y_L cuando la variable latente  y_j^* \leq y_L . Al escribir la función de verosimilitud, primero definimos una función indicadora  I(y_j) donde:

 I(y_j) = \begin{cases} 
    0  & \textrm{si} \; y_j = y_L \\ 
    1   & \textrm{si} \; y_j \neq y_L.
\end{cases}

A continuación, nos referimos  \Phi a ser el normal estándar función de distribución acumulativa y  \phi a ser el normal estándar función de densidad de probabilidad . Para un conjunto de datos con n observaciones de la función de verosimilitud para un tipo que Tobías es:

 \prod _{j=1}^N \left(\frac{1}{\sigma}\phi \left(\frac{Y_j-X_j\beta  }{\sigma
   }\right)\right)^{I\left(y_j\right)} \left(1-\Phi
   \left(\frac{X_j\beta-y_L}{\sigma}\right)\right)^{1-I\left(y_j\right)}

Referencias[editar]

  1. International Encyclopedia of the Social Sciences (2008)
  2. McDonald, John F.; Moffit, Robert A. (1980), «The Uses of Tobit Analysis», The Review of Economics and Statistics (The MIT Press) 62 (2): 318–321, http://www.jstor.org/stable/1924766 

Bibliografía adicional[editar]

Further reading[editar]