Title: Mtodos de estimacin de impacto en diseos observacionales
1Métodos de estimación de impacto en diseños
observacionales
- Regresión lineal multivariada
2Modelo Conceptual
Factores Individuales (Xis)
Impacto (Y)
Programa (P)
Factores Comunales (Xjs)
Otros Factores
3Construcción del modelo
- Variable de Resultado, Y.
- Variable(s) Programa, P.
- Variables de confusión, X1, X2,
CUIDADO ...
El número de variables que puede incluir
está limitado por el tamaño de la muestra que
se tiene para el ajuste del modelo.
4Notación matemática del modelo
Yi ß0 ß1P ß2Xi1 ß3Xi2 ... ßkXip ?i
i 1,, N individuos Yi Variable de resultado
o de impacto P Variable de Programa, (Genera
la hipótesis) Xij Variables de control a nivel
individual, j 1,, p, ?i Término de error,
representa variables omitidas
5CUÁNDO USAR REGRESIÓN LINEAL?
- Variable de impacto o variable resultado es
continua - Diseño observacional o cuasi-experimental, donde
la influencia de condiciones distintas al
programa puede afectar el impacto - Cuando se tienen suficientes observaciones
- Cuando se cumplen los siguientes supuestos
6Supuestos para la regresión lineal básica
- 1) Linealidad.
- 2) Homocedasticidad.
- 3) Normalidad.
- 4) Independencia.
- 5) Independencia lineal entre Variables
independientes y entre estas y el término de
error.
7Regresión Lineal Notación matemática
Yi ß0 ß1P ß2Xi1 ß3Xi2 ... ßkXip ?i
i 1,, N individuos Yi Variable de resultado
continua, P Variable de Programa, (Genera la
hipótesis) Xij Variables de control a nivel
individual, j 1,, p, ?i Término de error,
representa variables omitidas
8Interpretación Regresión Lineal
- El coeficiente de reg. (ß1) está asociado a la
variable o al conjunto de variables de programa
(Pi). - Si P es continuo Un aumento de P en una unidad
está asociado a un aumento de ß1 unidades en Y en
promedio. - Si P es dicotómico (condición nominal) Está
variable está asociada a un aumento de ß1
unidades en Y en promedio.
9Ejemplo Modelo simplificado de uso de
anticonceptivos y fecundidad
Características Individuo
Preferencias tamaño de familia (Y)
Mensaje (P)
Cuáles son los factores relevantes? Cómo se
específica el modelo empírico?
10Operacionalización de las variables
- Y ideal de hijos
- P (1 si ha escuchado un mensaje de PF en los
últimos 6 meses) - X1 NSE
- X2 Nivel de educación
- X3 Localización (Rural/Urbana)
11Salidas del STATA
Source SS df MS
Number of obs 7437 -------------------
-------------------- F( 4, 7432)
272.17 Model 6558.60075 4
1639.65019 Prob gt F
0.0000 Residual 44772.7388 7432 6.02431899
R-squared 0.1278 -------------
-------------------------- Adj
R-squared 0.1273 Total 51331.3395 7436
6.90308493 Root MSE
2.4544 ------------------------------------------
------------------------------------ idealnum
Coef. Std. Err. t Pgtt 95
Conf. Interval ---------------------------------
--------------------------------------------
fpmess -.2628111 .0593421 -4.429 0.000
-.3791385 -.1464838 sumasset -.0239791
.0351287 -0.683 0.495 -.0928413
.0448831 gradef -.2376848 .0088476
-26.864 0.000 -.2550287 -.220341
rural .6617381 .0747568 8.852 0.000
.5151936 .8082826 _cons 6.77729
.0904055 74.965 0.000 6.60007
6.954511 -----------------------------------------
-------------------------------------
12Bondad de Ajuste
Source SS df MS
Number of obs 7437 --------------------
------------------- F( 4, 7432)
272.17 Model 6558.60075 4 1639.65019
Prob gt F 0.0000 Residual
44772.7388 7432 6.02431899
R-squared 0.1278 -------------------------
-------------- Adj R-squared
0.1273 Total 51331.3395 7436 6.90308493
Root MSE 2.4544
13Diagnósticos de Regresión
- Valores Influenciales
- Multicolinealidad
- Análisis de residuos
- Valores extremos.
- Gráfico de Residuos vs. Valores Predichos.
14Variables Independientes Categóricas
- Variables dicotómicas por naturaleza
- Variables categóricas
- Variables continuas categorizadas. Esto puede
ser útil para capturar efectos no-lineales.
15Variables Independientes Categóricas (Dummies)
- Se necesitan k-1 variables dummies para
representar una variable categórica con k
categorías - Ej. NSE (Alto, Medio, Bajo), k 3, se necesitan
dos variables dummies - D1 1 si NSE Alto, D1 0 sino
- D2 1 si NSE Medio, D2 0 sino
- NSE Bajo, es la categoría de referencia.
CUIDADO ...
Con los valores perdidos a la hora de crear las
variables Dummies.
16Construcción del modelo con interaciones
- Variable de Impacto (Resultado), Y.
- Variable(s) de programa, P.
- Variables de confusión, X1, X2,
- Variables de interacción PX1, PX2.
CUIDADO ...
El número de variables que puede incluir
está limitado por el tamaño de la muestra que
se tiene para el ajuste del modelo.
17Interpretación en Presencia de Interacciones
- El cambio es medido por el coeficiente de reg.
(ß1) asociado a la variable de programa (P) y los
coeficientes asociados a las interaciones con P
18Ejemplo
- Y ideal de hijos
- P (1 si ha escuchado un mensaje de PF en los
últimos 6 meses) - X1 NSE
- X2 Nivel de educación
- X3 Localización (Rural/Urbana)
- X4 PX3
19Ejemplo (STATA)
Source SS df MS
Number of obs 11357 ---------------------
------------------ F( 5, 11351)
360.06 Model 10079.5427 5 2015.90854
Prob gt F 0.0000 Residual
63551.8644 11351 5.59878992
R-squared 0.1369 -------------------------
-------------- Adj R-squared
0.1365 Total 73631.4071 11356 6.48392102
Root MSE 2.3662 -------------
--------------------------------------------------
--------------- idealnum Coef. Std. Err.
t Pgtt 95 Conf.
Interval ---------------------------------------
-------------------------------------- fpmess
-.2845594 .1000326 -2.845 0.004
-.4806405 -.0884783 sumasset -.0273396
.0268911 -1.017 0.309 -.0800507
.0253716 gradef -.2219804 .0069847
-31.781 0.000 -.2356715 -.2082893
rural .7543981 .0900177 8.381 0.000
.5779478 .9308485 fprural -.1225611
.1121747 -1.093 0.275 -.3424428
.0973206 _cons 6.547628 .091991
71.177 0.000 6.36731
6.727946 -----------------------------------------
-------------------------------------
20Ejemplo (Interpretación)
- Efecto de la causa principal para las personas en
la zona urbana (i.e., rural0) - Efecto ß1 -0.285.
- Interpretación Entre las personas que viven en
el área urbana, aquellas que han escuchado un
mensaje de PF dicen desear 0.285 hijos menos en
promedio que las que no han escuchado un mensaje
de PF.
21Ejemplo (Interpretación)
- Efecto del programa para las personas en la zona
urbana (i.e., rural0) - Efecto ß1 ß5 - 0.285 - 0.123 -0.408.
- Interpretación Entre las personas que viven en
el área urbana, aquellas que han escuchado un
mensaje de PF dicen desear 0.408 hijos menos en
promedio que las que no han escuchado un mensaje
de PF.
22RESUMEN
- Modelo conceptual general
- Especificación del modelo empírico
- Operacionalización de las variables
- Uso de regresión lineal multivariada
- Supuesto básicos de la regresión lineal
- Ejemplos con el marco conceptual y el desarrollo
del modelo empírico - Ejemplo en Stata en laboratorio