Página principal | Main page

Análisis de supervivencia
Modelo exponencial

Disponemos de un conjunto de n pares de datos

en donde, si di = 1, xi es el tiempo que ha sobrevivido el i-ésimo sujeto de la muestra (tiempo de supervivencia o de fallo) , y si di = 0, xi es el instante en el que a dicho sujeto se le perdió la pista y ya no se pudo continuar con su seguimiento.

Cuando xi es un tiempo de supervivencia observado, caso di = 1, entonces será la realización de la variable aleatoria Ti, la cual, bajo el modelo exponencial, tiene la función de densidad de probabilidad

,
siendo el parámetro el que debe ser estimado a la luz de los datos de la muestra.

Hay varias maneras alternativas de especificar un modelo de probabilidad para el tiempo de supervivencia. El primero, y parece que el más directo, es mediante la función de densidad, como se acaba de hacer, o su correspondiente función de distribución

.

El segundo método es mediante la llamada función de riesgo

,
y el tercero especificando la función de supervivencia

Conocida cualquiera de estas tres funciones, F, h o S, es posible calcular las otras dos.

El primer problema que se plantea es ajustar el parámetro del modelo exponencial a los datos, lo cual se hace bajo el criterio de máxima verosimilitud. Así, se estima mediante

donde
es el número total de fallos observados en la muestra.

Una vez estimado , queda por saber si el ajuste es bueno, si la población bajo estudio sigue realmente el modelo exponencial de supervivencia. Tomando logaritmos a ambos lados de la definición de la función de supervivencia, tenemos que

,
de donde se deduce que el logaritmo de la función de supervivencia depende linealmente del tiempo, por lo que si representamos en el plano los pares de puntos
(xi, log (xi)),
siendo (xi) el valor que toma la función empírica de supervivencia en el tiempo de fallo xi, deberían estar aproximadamente dispuestos a lo largo de una línea recta. El applet representa estos puntos, junto con la recta y = - t, para facilitar la comparación entre las estimaciones paramétrica y no paramétrica de la función de supervivencia.

Finalmente, verificado que el modelo se ajusta bien a la hipótesis exponencial, es tiempo de extraer conclusiones sobre el comportamiento del tiempo de fallo del fenómeno de interés. Por ejemplo, podemos estar interesados en conocer el tiempo mediano de supervivencia, tm, que verifica S(tm) = 1/2, que en el caso exponencial es

tm = log 2 / .


Caso

En un seguimiento de 16 semanas de duración realizado a 14 pacientes afectados de hepatitis vírica severa y sometidos a un tratamiento basado en esteroides, los datos registrados, en semanas, fueron los siguientes, siendo los valores acompañados del símbolo + las lecturas censuradas:
1, 1, 1, 1+, 4+, 5, 7, 8, 10, 10+, 12+, 16+, 16+, 16+
Queremos saber si estos datos siguen un modelo exponencial.

A la vista de los resultados no parece que se puedan dar conclusiones definitivas sobre el ajuste exponencial, ya que si bien los puntos estimados de la función de supervivencia parecen acompañar a la recta a lo largo de su trayectoria, no es menos cierto que aquéllos parecen seguir un patrón ligeramente curvilíneo siempre por debajo de ésta. En caso de que el modelo parezca suficiente para esta población, el tiempo mediano de fallo es de 10.7 semanas.

(Fuente: P.B. Gregory et al.(1976) Steroid therapy in severe viral hepatitis. New England Journal of Medicine, 294: 681-686.)

Manual de las applets de BioMates
Hay problemas en la carga del applet.


© BioMates, 2003