No son escasas las veces en las que se requiere un estudio sobre el tiempo necesario para que ocurra cierto evento, como puede ser la muerte de un organismo o la curación completa de un paciente tras un determinado tratamiento.
Se requiere para ello realizar un muestreo consistente en hacer un seguimiento a n individuos, tomando como origen temporal el momento en el que se ha producido una intervención quirúrgica o en el que se ha empezado un tratamiento. Representaríamos por Ti al tiempo transcurrido hasta que se produce el evento a investigar en el i-ésimo individuo muestral y lo llamaríamos, abusando del lenguaje, su tiempo de supervivencia .
El problema en estudios de seguimiento temporal es que pueden producirse circunstancias que impidan conocer el valor que toma Ti, quizás porque el sujeto de la muestra haya cambiado su residencia y se le perdió la pista, o porque ha fallecido por causa ajena al objeto del estudio, o simplemente porque terminó el tiempo asignado al trabajo de investigación; en todo caso, Ti pasa a ser un dato desconocido y la única información de que se dispone es de la última vez que se le vió con vida. Se ha producido un dato censurado.
En los diversos procedimientos que se tratan a continuación, cada observación Xi debe ir acompañada de un indicador de censura di, de modo que si di = 1, el individuo sobrevivió hasta Xi = Ti, y si di = 0, entonces Xi < Ti.
Cuando la censura se produce siguiendo el modelo recién descrito, hablamos de censura por la derecha, que es la más común y la única que se tratará aquí. Otros tipos de censura son por la izquierda y por intervalos.
Los procedimientos estadísticos para el tratamiento de datos censurados se agrupan en dos bloques. En el contexto biomédico y epidemiológico se suelen utilizar los métodos no paramétricos:
Dentro de las técnicas no paramétricas interesa el estudio de la comparación entre dos patrones de supervivencia, quizás entre pacientes sometidos a dos tratamientos diferentes. Sirve en este caso el
En el ámbito de la estadística industrial, cuando se investiga el tiempo de fallo de una máquina o la vida útil que tienen las piezas que se fabrican (análisis de fiabilidad), es habitual el uso de los modelos paramétricos, que consisten en especificar una distribución de probabilidad común a todas las variables aleatorias Ti; dicha distribución dependerá de unos parámetros a estimar a partir de la muestra. Hablamos entonces de métodos paramétricos:
© BioMates, 2003