Regresión de Cox

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

En el análisis de la supervivencia, se conoce como regresión de Cox, aunque también como modelo de los riesgos proporcionales, a una clase de modelos usados para modelar los riesgos que afectan a la supervivencia de una población de sujetos.

Recibe su nombre del estadístico británico David Cox.

Formulación[editar]

El modelo de Cox expresa la función de riesgo instantáneo de muerte λ en función del tiempo t y de variables X_1,\cdots ,X_n así:

\lambda\left(t,X_1,\cdots ,X_n\right)=\lambda_0\left(t\right) exp\left(\Sigma_{i=1}^{n}\beta_i X_i\right)

A \lambda_0\left(t\right) se lo denomina riesgo base y corresponde al riesgo de muerte cuando todas las variables tienen valor 0 (posiblemente, después de una reparametrización). Es la única parte de la expresión que depende del tiempo: la otra, exp\left(\Sigma_{i=1}^{n}\beta_i X_i\right), sólo depende del resto de las variables.

La hipótesis de los riesgos proporcionales[editar]

El modelo no busca tanto estimar la función \lambda_0\left(t\right), que es idéntica para todos los sujetos, como la relación entre los riesgos de muerte entre dos individuos expuestos a factores distintos. Para ello, el modelo parte de una hipótesis fundamental: que los riesgos son proporcionales. Para comprender esta noción, puede estudiarse el caso de dos invidiuos, i y j que sólo se diferencian en la k-ésima variable. Supóngase que vale 0 para i y 1 para j. Entonces, para cualquier tiempo t,

\frac{\lambda\left(t,j\right)}{\lambda\left(t,i\right)}=\frac{\lambda_0\left(t\right) exp\left(\beta_1X_1^'+\cdots +\beta_{k-1}X_{k-1}^'+\beta_k\times 1+\beta_{k+1}X_{k+1}^'+\beta_nX_n^'\right)}{\lambda_0\left(t\right) exp\left(\beta_1X_1^'+\cdots +\beta_{k-1}X_{k-1}^'+\beta_k\times 0+\beta_{k+1}X_{k+1}^'+\beta_nX_n^'\right)}=exp\left(\beta_k\right)

La fórmula muestra que el cociente es independiente del tiempo.

Al utilizar la regresión de Cox es necesario verificar que se cumple dicha hipótesis. Para ello es necesario comprobar que el efecto de cada variable es constante en el tiempo. Existen varios métodos para ello. Por un lado puede utilizarse un método gráfico. Si una variable, por ejemplo, toma únicamente los valores 0 y 1, pueden representarse las curvas de supervivencia para los dos grupos de sujetos definidos por dicha variable y estudiar si son paralelas.

No obstante, existen métodos estadísticos rigurosos, como el de los residuos de Schoenfeld.


Enlaces externos[editar]

Bibliografía[editar]

  • Borges, R. (2005). Análisis de sobrevivencia utilizando el Lenguaje R. XV Simposio de Estadística, Paipa, Colombia. Disponible en PDF