Análisis de datos de supervivencia – Servicio de quejas

Esta página muestra algunos procedimientos asociados al análisis de datos cuya variable dependiente resume la duración de un evento. Este tipo de datos toma el nombre de análisis de supervivencia o douración, entre otros. El ejercicio utiliza información que simula el tiempo (en días) de respuesta de entidad de salud a quejas de clientes (ver descripción de los datos). El alcance del ejercicio es el análisis gráfico preliminar de examen de la variable duración y la estimación de modelo de regresión apropiado.

La secuencia de pasos sugeridos para realizar el ejercicio puede ser:

Llevar datos a Stata.


Los datos ofrecidos acá están en un archivo que delimita las información con el caracter coma.

El comando para traer la base de datos es:

import delimited http://rodrigotaborda.com/ads/datos/pqr/pqr.csv, delimiters(",")

Generar nuevas variables y etiquetas.


Para el desarrollo de este ejemplo solo se va a generar una nueva variables. La variable emocion_cliente fue generada como variable de texto, para analizar su comportamiento con variables numéricas se requiere redefinirla numéricamente. Esta redefinición se logra facilmente con el comando recode.

recode emocion_cliente, generate(emocion_cliente_n)
label var emocion_cliente_n "Estado emocional"

Para asignar una etiqueta a las variables se utilizan los siguientes comandos:

label var estado "Estado de solicitud"
label var pqr "PQR"
label var fecha_entra "Fecha ingrso solicitud"
label var tiempo_respuesta "Tiempo respuesta (días)"
label var emocion_cliente "Estado emocional"
label var producto_n "Producto"
label var producto_tipo_n "Producto (Tipo)"
label var oficina_n "Oficina"

Para aplicar los métodos correspondientes a variables que miden la duración de un evento, Stata requiere que se defina cual es la variable que tiene esta característica. Esta definición puede ser muy detallada en términos de fecha de inicio y final del proceso que se estudia. En este ejemplo, solo se trabaja con una variable que ya ha medido la duración del evento, el comando es sencillo:

stset tiempo_respuesta

Examen visual de los datos.


El análisis de supervivencia se beneficia particularmente de visualización de los datos. La función de supervivencia es el resumen inicial para entender el comportamiento de la variable que se estudia. En esta función se resume el tiempo que ha pasado hasta que ocurre la falla o muerte del evento. En el caso de este ejercicio la falla es la solución de la queja.

La función de sobrevivencia y falla Kaplan – Meier se obtiene:

sts graph, survival

sts graph, failure

La función acumulada de riezgo Nelson – Aalen

sts graph, cumhaz

Regresión Cox.


La regresión Cox es el ejercicio mas sencillo de regresión para el caso de variable dependiente de supervivencia.

En esta ocación se examina si el estado emocional del cliente permite distinguir el tiempo de respuesta

stcox emocion_cliente

El resultado sugiere que no hay diferencia entre el estado de animo del cliente, que distingue entre: “Molesto” y “Neutro”. El resultado del análisis es presentado en términos del cociente de riesgo. Si se quisiera examinar el coeficiente, se solicita la opción de ofrecer los resultados sin modificación.

stcox emocion_cliente, nohr