Title: Anlisis de Regresin con Variable Dependiente Nominal
1 Análisis de Regresión con Variable Dependiente
Nominal
- Especificación del modelo básico
- Modelo con interacciones
- Bondad de Ajuste-Diagnóstico
2Resultado del Programa Dicotómica
- Variable de Resultado del Programa Dicotómica
- Y 1 si respuesta favorable
- Y 0 si respuesta desfavorable
- Variables de programa y de confusión pueden ser
contínuas o categóricas (dummies). - Modelo puede incluir variables de confusión e
interacciones.
3Modelo Básico
Linea de Regresión
X
4Modelo Básico
- F(P,X1,Xp) toma la forma de una función de
probabilidad aculumada - Logística F(P,X1,Xp) 1/1exp(-Z)
- Probit F(P,X1,Xp) ?(Z).
- Función de prob. Acumulada Normal.
- donde
- Z ß0 ß1Pi ß2Xi1 ß3Xi2 ... ßkXip
0 ? F(P,X1,Xp) ? 1 - Estimación por Máxima Verosimilitud.
5Interpretación (Logística o Probit)
- La significancia del coeficiente de reg. (ß1)
asociado a la variable de programa (P) indica la
existencia de un impacto del programa. - El impacto es medido por medio de la comparación
de los valores predichos P(Y1 P,X1,Xp), de P
1 vs. P 0 (u otros valores, si P es contínuo),
manteniendo el resto de las variables de control
constantes. - Puede estudiarse el impacto en personas con
diferentes perfiles - Valores predichos como estimación de la
prevalencia.
6Interpretación para el Modelo Logístico
- Transformación Logit (log-odds)
P(Y1 P,X1,Xp) 1/1exp(-Z)
Odds (Razón de Probabilidades)
Log-odds Z
donde Z ß0 ß1Pi ß2Xi1 ß3Xi2 ... ßkXip
7Interpretación del OR
- Interpretación del OR
- Si OR 1 no impacto
- Si OR gt 1 impacto positivo
- Si OR lt 1 impacto negativo
- Interpretación del OR como aproximación del RR.
Indica que tanto más (o menos) probable es
obtener un impacto positivo (o negativo) como
resultado del programa. - Nota La aproximación es adecuada si la
probabilidad del evento de interés es pequeña.
8Odds Ratio (OR) Si P es dicotómico
- Si P es dicotómico indicando quienes fueron
sujetos al programa e.g., P 1 si expuesto al
programa, P 0 sino), OR compara los odds
(probabilidad de resultado favorable vs. no
favorables) entre individuos expuestos al
programa con respecto a los no expuestos al
programa. El OR puede ser estimado fácilmente del
modelo logístico
9Odds Ratio (OR) Si P es continua
- Si P es contínuo, la comparación puede hacerse
entre cualquiera dos valores de P (o niveles de
exposición al programa), P a vs. P b.
10Odds Ratio (OR)
- Nota La asociación entre el programa (P) y el
resultado (Y) medida por medio del OR basado en
el modelo logístico controla el efecto de las
variables de confusión X1,Xp.
11Ejemplo
- Y (1 si usa método de PF)
- P (1 si ha escuchado un mensaje de PF en los
últimos 6 meses) - X1 NSE
- X2 Nivel de educación
- X3 Localización (Rural/Urbana)
12Salida de STATA
Logit estimates
Number of obs 8665
LR chi2(4)
387.40
Prob gt chi2 0.0000 Log
likelihood -2114.8367
Pseudo R2 0.0839 --------------------
--------------------------------------------------
-------- curuse Odds Ratio Std. Err.
z Pgtz 95 Conf. Interval ----------
--------------------------------------------------
----------------- fpmess 2.390186
.2129244 9.782 0.000 2.007263
2.846159 sumasset 1.087682 .0510276
1.792 0.073 .9921302 1.192437 gradef
1.160567 .0163274 10.585 0.000
1.129004 1.193014 rural .6383728
.0605398 -4.733 0.000 .5300917
.7687723 -----------------------------------------
-------------------------------------
13Modelo con Interacciones
- El impacto es medido por medio del coeficiente de
reg. (ß1) asociado a la variable de programa (P)
y los coeficientes asociados a las interaciones
con P.
14Ejemplo
- Y (1 si usa método de PF)
- P (1 si ha escuchado un mensaje de PF en los
últimos 6 meses) - X1 NSE
- X2 Nivel de educación
- X3 Localización (Rural/Urbana)
- X4 PX3
15Salida de STATA
Logit estimates
Number of obs 8665
LR chi2(5)
387.70
Prob gt chi2 0.0000 Log
likelihood -2114.6835
Pseudo R2 0.0840 --------------------
--------------------------------------------------
-------- curuse Coef. Std. Err.
z Pgtz 95 Conf. Interval ----------
--------------------------------------------------
----------------- fpmess .7917358
.1680062 4.713 0.000 .4624497
1.121022 sumasset .0834465 .04687
1.780 0.075 -.008417 .1753101 gradef
.1487409 .014067 10.574 0.000
.1211701 .1763117 rural -.5265657
.168192 -3.131 0.002 -.8562159
-.1969154 fprural .1096598 .1973707
0.556 0.578 -.2771796 .4964992 _cons
-3.381294 .1746237 -19.363 0.000
-3.72355 -3.039037 -----------------------------
-------------------------------------------------
16Interpretación de la Interacción
- Impacto del programa para personas en localidad
urbana (i.e., rural0) - OR exp(ß1) exp(0.79) 2.21
- Impacto del programa para personas en localidad
rural (i.e., rural1) - OR exp(ß1 ß5) exp(0.79 0.11) 2.46
17Diagnósticos
- Bondad de ajuste vs. falla de ajuste.
- Análisis de Residuos
- Residuos de Pearson.
- Residuos Deviance.
- Valores extremos.
- Multicolinealidad.
18Bondad de Ajuste
- Qué tan cercanos están las probabilidades
predichas por el modelo de los probabilidades
observadas? - Estadísticos para la evaluación de la bondad del
ajuste - Seudo-R2.
- Chi-cuadrada de Pearson.
- Hosmer y Lemeshow (preferible cuando el de obs.
por patrón de covariable es pequeño).
19Evaluación del Modelo Dicotómico
- Seudo R2 y significancia Global
- Chi-cuadrada de Pearson
- Hosmer y Lemeshow