Econometra de Datos de Panel - PowerPoint PPT Presentation

1 / 56
About This Presentation
Title:

Econometra de Datos de Panel

Description:

Hasta ahora hemos trabajado bajo el supuesto de que los datos que tenemos ... Gronau, R. (1974) 'Wage comparisons: A selectivity bias,' Journal of Political ... – PowerPoint PPT presentation

Number of Views:352
Avg rating:3.0/5.0
Slides: 57
Provided by: martingonz
Category:

less

Transcript and Presenter's Notes

Title: Econometra de Datos de Panel


1
Econometría de Datos de Panel
Martín Gonzalez Rozada
  • Lecture 6 Segundo Trimestre 2009

Maestría en Economía Maestría en Econometría
2
Paneles No Balanceados
  • Hasta ahora hemos trabajado bajo el supuesto de
    que los datos que tenemos conforman lo que se
    denomina un panel balanceado. Esto es, todas las
    observaciones de corte transversal y de series
    temporales están disponibles.
  • La realidad es que en la práctica esta es la
    excepción más que la regla.
  • Muchas veces, los datos que tenemos tienen la
    característica de que algunas observaciones de
    series temporales no están disponibles para
    algunas observaciones de corte transversal.

3
Paneles No Balanceados
  • Cuando esto ocurre, decimos que tenemos paneles
    no balanceados.
  • Los paneles no balanceados pueden surgir por
    varias razones. Primero, por diseño de la
    muestra. Por ejemplo, el procedimiento puede
    simplemente rotar algunas de las observaciones de
    corte transversal de acuerdo a una regla
    específica.

4
Paneles No Balanceados
  • Una segunda forma de tener paneles desbalanceados
    es el problema de la no respuesta. En la
    práctica, muchas veces, las unidades de corte
    transversal pueden elegir no responder alguna
    pregunta.
  • El problema de attrition es otra forma en la
    que surgen paneles desbalanceados.
  • El problema denominado attrition en la
    literatura se da cuando algunas unidades de corte
    transversal eligen salirse del panel.

5
Paneles No Balanceados
  • Otra forma de obtener un panel desbalanceado
    surge cuando las unidades de corte transversal no
    desaparecen, pero ciertas variables no se
    observan por al menos algún período de tiempo.
    Este problema se conoce en la literatura como el
    incidental truncation problem.
  • Cualquiera de estos casos puede presentar
    potencialmente un problema de sesgo de selección
    muestral.

6
Paneles No Balanceados
  • Si la decisión de rotar las unidades de corte
    transversal no se hace aleatoriamente, ó si la no
    respuesta está relacionada con la variable a
    explicar, tendremos un problema de sesgo en la
    muestra.
  • De la misma manera, si la attrition se basa en
    factores sistemáticamente relacionados con la
    variable a explicar, entonces tendremos un
    problema de sesgo de selección.

7
Paneles No Balanceados
  • Comenzaremos analizando los supuestos bajo los
    cuales, el estimador usual de FE es consistente
    en paneles desbalanceados.
  • El modelo es el de efectos no observables
  • Yjt xjt ? cj ujt t1, 2,..., T
    (UEM)
  • Donde xjt es 1xK y ? es Kx1. En esta ecuación,
    permitimos que xjt y cj estén correlacionados.
  • Considere el caso en el que algunos períodos
    temporales no están disponibles para algunas
    unidades de corte transversal.

8
Paneles No Balanceados
  • Denotemos por sj ? (sj1 sj2 ... sjT) al vector
    Tx1 de indicadores de selección sjt 1 si (xjt,
    yjt) se observa y cero en cualquier otro caso.
  • Podemos tratar a (xj, yj, sj) j1, 2, ..., N
    como una muestra aleatoria de la población los
    indicadores de selección nos dicen que períodos
    temporales no se observan para cada j.
  • Podemos escribir el estimador de FE como

9
Paneles No Balanceados
  • Donde

10
Paneles No Balanceados
  • Tj es el número de períodos temporales observados
    para la unidad de corte transversal j, y
    aplicamos la transformación de FE sobre los
    períodos temporales disponibles.
  • Como se desprende de la ecuación anterior, el
    estimador de efectos fijos en paneles
    desbalanceados será consistente siempre que
    para todo t.

11
Paneles No Balanceados
  • Como depende de todos los elementos en Xj y
    sj, necesitamos alguna forma de exogeneidad
    estricta.
  • Supuesto FEUP.1 (a) E(ujt Xj, sj, cj)0,
    t1,2, ...,T (b) no es
    singular y (c) E(ujt ujt Xj, sj, cj) ?u2
    IT.
  • Bajo FEUP.1(a) aplicando
    la ley de expectativas iteradas. FEUP.1(b) es la
    condición de rango usual para identificar ?.
    Estos dos supuestos aseguran la consistencia del
    estimador de FE.

12
Paneles No Balanceados
  • Note que en el caso de paneles rotativos
    aleatorios, ó en el caso de que la no respuesta
    sea aleatoria y en cualquier otro caso en el que
    el mecanismo de selección sea completamente
    aleatorio, sj será independiente de (uj, Xj, cj),
    en cuyo caso FEUP.1(a) se cumple bajo el supuesto
    estándar FE.1 E(ujt Xj, cj) 0 para todo t.
  • En este caso, los supuestos naturales sobre el
    modelo poblacional implican consistencia y
    normalidad asintótica en paneles no balanceados.

13
Paneles No Balanceados
  • Note que FEUP.1(a) no asume nada acerca de la
    relación entre sj y (Xj, cj). Por lo tanto, si
    pensamos que el mecanismo de selección en todos
    los períodos temporales está correlacionado con
    cj ó Xj, pero ujt es independiente en media de
    sj, dado (Xj, cj) para todo t, entonces FE en el
    panel no balanceado es consistente y
    asintóticamente normal.
  • Lo que FEUP.1(a) descarta es correlación entre sj
    y ujt.

14
Paneles No Balanceados
  • Si adicionamos el supuesto FEUP.1(c), los
    procedimiento de inferencia estándar de FE son
    válidos. En particular
  • Por lo tanto la varianza asintótica del estimador
    de efectos fijos se puede estimar como

15
Paneles No Balanceados
  • El estimador de ?u2 se obtiene como
  • Donde ûjt son los residuos de la estimación por
    FE.
  • Los programas que resuelven datos de panel no
    balanceados corrigen por grados de libertad
    restando K de .

16
Paneles No Balanceados
  • Estos resultados implican que el sesgo de
    selección muestral en el contexto del modelo de
    FE es un problema solo si el mecanismo de
    selección está relacionado con los errores
    idiosincráticos.
  • Por lo tanto, cualquier test de selección
    muestral solo tiene que contrastar ese supuesto.
  • Un test simple es el propuesto por Nijman y
    Verbeek (1992).

17
Paneles No Balanceados
  • No obstante Nijman y Verbeek desarrollaron su
    test dentro del contexto de RE, también puede ser
    aplicado con FE.
  • El test consiste en adicionar el indicador de
    selección muestral rezagado, sjt-1, a la
    ecuación. Estimar el modelo por FE en el panel
    desbalanceado y hacer un test t sobre el
    coeficiente que acompaña a sjt-1.
  • Bajo la hipótesis nula que E(ujtsjr)0 ?r, el
    coeficiente que acompaña a sjt-1 no debiera ser
    estadísticamente significativo.

18
Paneles No Balanceados
  • Note que poner sjt-1 no funciona si sjt-1 es uno
    siempre que sjt es uno, porque entonces no hay
    variación en sjt-1 en la muestra seleccionada
    (sjt1).
  • Este es el caso del problema de attrition en el
    que , digamos, una persona solo puede aparecer en
    el período t siempre que haya aparecido en t-1.
  • Una alternativa para el test anterior es incluir
    un adelanto del indicador de selección, sjt1.

19
Paneles No Balanceados
  • Note que para observaciones j que están en la
    muestra todos los períodos sjt1 siempre es uno,
    mientras que para los que dejan la muestra, sjt1
    cambia de uno a cero en el período anterior al de
    la attrition.
  • El problema del truncamiento incidental es un
    poco más complicado de analizar.
  • Wooldridge (1995) extiende el método de Heckman
    al caso de datos de panel.

20
Paneles No Balanceados
  • Considere el siguiente modelo que contiene la
    ecuación de interés y una regla de selección
    muestral.
  • La ecuación de interés es
  • La variable yjt se observa siempre que sjt1.
    Para cada t1, 2,,T, definamos la siguiente
    variable latente

21
Paneles No Balanceados
  • Donde vjt Xj Normal(0,1). El indicador de
    selección binario se define entonces como sjt ?
    1hjt gt 0.
  • xjt denota el conjunto total de variables
    explicativas en el período t y xjt1 es un
    subconjunto de esas variables.
  • El mecanismo de selección descripto por la
    ecuación (W2) puede ser visto como la forma
    reducida de la ecuación de selección.

22
Paneles No Balanceados
  • Incorporar las variables explicativas en todos
    los períodos temporales en la ecuación de
    selección en el período t permite acomodar
    modelos de selección muy generales, incluyendo
    aquellos que tienen efectos no observables.
  • Por ejemplo, consideremos la siguiente ecuación
    de selección estructural

23
Paneles No Balanceados
  • Donde (?j, ajt) tiene distribución conjunta
    normal con E(ajt)0 y ajt independiente de Xj. ?j
    es un efecto no observable constante en el
    tiempo.
  • Si ?j es independiente de Xj como en una
    especificación de RE, entonces (W2) se cumple con
    ?t0?0 ? E(?j), ?tr0, r?t, y ?tt?.
  • Para permitir que ?j esté correlacionada con Xj,
    podemos especificar, siguiendo Chamberlain (1980)
    la siguiente ecuación

24
Paneles No Balanceados
  • ?j ?0 xj1 ?1 xjT ?T ?j
  • donde ?j es independiente de Xj con media cero y
    distribución normal. Con estas definiciones, (W2)
    se satisface con ?t0?0, ?tr?r, r?t, ?tt??t,
    y vjt ?j ajt.
  • Los supuestos necesarios para derivar la
    generalización del procedimiento de Heckman para
    paneles son.

25
Paneles No Balanceados
  • Supuesto W.1
  • (a) La ecuación de selección está dada por (W2)
    con todos sus supuestos
  • (b) E(ujt Xj, vjt) E(ujt vjt) ?t vjt,
    t1,2,,T y
  • (c ) E(cj Xj, vjt) L(cj 1, Xj, vjt).
  • El supuesto (b) es estándar y sigue de asumir
    normalidad conjunta de (ujt, vjt) como en Heckman
    (1976).

26
Paneles No Balanceados
  • El supuesto (c ) implica que
  • E(cj Xj, vjt) Xj ? ?t vjt
  • Usando la ecuación (W2) y la ley de expectativas
    iteradas tenemos
  • E(cj Xj) Xj ? ?t E(vjt xj) Xj ?.
  • Tomando esperanzas en (W1) tenemos

27
Paneles No Balanceados
  • Condicionando en sjt1, tenemos
  • Donde la última igualdad se sigue del teorema
    20.4 de Greene.
  • Por lo tanto una estimación consistente de ? se
    obtiene como

28
Paneles No Balanceados
  • (1) Para cada t estime un modelo Probit
  • Pr(sjt1 Xj) ?(Xj ?t)
  • calcule la inversa del cociente de Mills,
    ,
  • para todo j y t.
  • (2) Use POLS en la muestra seleccionada (sjt1) y
    estime
  • Donde d2t a dTt son dummies temporales.

29
Paneles No Balanceados
  • El modelo anterior es el más general, uno puede
    suponer que ?t? es constante en el tiempo. En
    este caso
  • (1) Para cada t estime un modelo Probit
  • Pr(sjt1 Xj) ?(Xj ?t)
  • calcule la inversa del cociente de Mills,
    ,
  • para todo j y t. Defina el vector de
  • dimensión 1x(1TKKT)

30
Paneles No Balanceados
  • (2) Aplique POLS a
  • Lo que da

31
Paneles No Balanceados
  • (3) Estime la varianza asintótica de los
    estimadores, , como sigue Primero
    defina los residuos,
  • Defina la matriz
  • Donde
  • es una matriz de dimensión
    (1TKKT)xT(1TK).

32
Paneles No Balanceados
  • Cada cero en la primera fila de Gjt es de
    dimensión (1TKK)x(1TK), y cada cero en la
    segunda fila de la matriz es de dimensión
    Tx(1TK). La matriz Zjt está ubicada a partir de
    la columna t-ésima y es de dimensión Tx(1TK).
  • Cada cero en Zjt es de dimensión 1x(1TK).

33
Paneles No Balanceados
  • Para cada t, defina como el vector (1TK)x1
    igual a menos la inversa de la matriz Hesiana
    promedio estimada multiplicada por la derivada de
    la función del logaritmo de verosimilitud del
    modelo Probit para la observación j.
  • Construya el vector de dimensión T(1TK)x1
    stacking

34
Paneles No Balanceados
  • La matriz  viene dada por
  • Además, para cada j1, 2, ..., N defina
  • Un estimador consistente de B es

35
Paneles No Balanceados
  • Finalmente la varianza asintótica de los
    estimadores del modelo viene dada por
  • Y los desvíos estándar asintóticos se obtienen
    con la raíz cuadrada de los elementos de la
    diagonal de esta matriz.

36
Paneles No Balanceados
  • Remark 1. La corrección propuesta por Wooldridge
    requiere que se cumpla el supuesto de exogeneidad
    estricta de los regresores (condicional a los
    efectos no observables). En particular este
    supuesto es necesario para que W1.(c) se cumpla.
  • Si las variables en la ecuación de interés fueran
    secuencialmente exógenas, el conjunto de
    variables válidas en la proyección lineal de cj
    variaría en el tiempo.

37
Paneles No Balanceados
  • Sin embargo, si el conjunto de variables válidas
    cambia en el tiempo, los coeficientes para los
    rezagos y adelantos de las variables explicativas
    en la proyección lineal de cj variarán en el
    tiempo invalidando W.1(c).
  • Esto significa que no se puede identificar en
    forma separada a los estimadores de ? y ?.

38
Referencias
  • Nijman T. y M. Verbeek (1992) Nonresponse in
    panel data the impact on estimates of a life
    cycle consumption function, Journal of Applied
    Econometrics, 7, pp 243-257.

  • GO BACK

39
Truncamiento Incidental
  • Suponga que y y z tienen una distribución
    bivariada con correlación ?. Nosotros estamos
    interesados en la distribución de y dado que z
    excede un determinado valor. Esto es, la función
    de densidad conjunta de y y z es

40
Truncamiento Incidental
  • Teorema 20.4 (Greene, 1997, Cap. 20, página 975)
    Si y y z tienen una distribución normal bivariada
    com medias ?y y ?z, desviaciones estándar ?y y ?z
    y correlación ?, entonces

41
Truncamiento Incidental
  • En economía el caso emblemático es el modelo de
    oferta de trabajo de las mujeres (Gronau, 1974
    Heckman, 1976). Este modelo consiste de dos
    ecuaciones, una ecuación de salarios que
    representa la diferencia entre el salario de
    mercado de una persona y su salario de reserva en
    función de características tales como la edad,
    educación, número de hijos etc.

42
Truncamiento Incidental
  • La segunda ecuación es una ecuación de horas
    deseadas de trabajo que depende del salario, de
    la presencia de hijos pequeños, del estado civil,
    etc.
  • El problema del truncamiento es que en la segunda
    ecuación observamos las horas reales solo si la
    persona está trabajando. Esto es, solo si el
    salario de mercado excede al salario de reserva.
    En este caso se dice que la variable horas en la
    segunda ecuación está incidentalmente truncada.

43
Truncamiento Incidental
  • Para poner este ejemplo en un marco general de
    análisis, digamos que la ecuación que determina
    la selección muestral es
  • y la ecuación de interés es
  • La regla es que yi es observada solo cuando zi
    es mayor a cero. Asumamos que ui y ?i tienen
    distribución normal bivariada con medias cero y
    correlación ?.

44
Truncamiento Incidental
  • Aplicando el teorema 20.4

45
Truncamiento Incidental
  • Por lo tanto
  • Está claro de este desarrollo que estimar por OLS
    la ecuación de horas, solo con los datos
    observados, produce estimadores inconsistentes de
    ? por el argumento estándar de variables
    omitidas.

46
Truncamiento Incidental
  • Heckman (1979) diseñó un método de estimación en
    dos etapas.
  • (1) Estime una ecuación probit para obtener
    estimaciones de ?. Para cada observación en la
    muestra seleccionada calcule
  • (2) Estime por OLS ? y ?? en la regresión de y
    sobre x y .
  • GO
    BACK

47
Referencias
  • Greene, W. (1997) Econometric Analysis,
    Prentice Hall, Tercera Edición.
  • GO
    BACK

48
Referencias
  • Gronau, R. (1974) Wage comparisons A
    selectivity bias, Journal of Political Economy,
    82, pp. 1119-1155.
  • Heckman, J. (1976) The common structure of
    statistical models of truncation, sample
    selection, and limited dependent variables and a
    simple estimator for such models, Annals of
    Economic and Social Measurement, 5, pp. 475-492.
  • GO
    BACK

49
Referencias
  • Heckman, J. (1979) Sample selection bias as a
    specification error, Econometrica, 47, pp.
    153-161.

  • GO BACK

50
Referencias
  • Chamberlain, G. (1980) Analysis of covariance
    with qualitative data, Review of Economic
    Studies, 47, pp. 225-238.
  • GO BACK

51
Referencias
  • Wooldridge, J. (1995) Selection corrections for
    panel data models under conditional mean
    independence assumptions, Journal of
    Econometrics, 68, pp. 115-132.
  • GO
    BACK

52
Modelo Probit
  • Denotemos por ?() y por ?() a las funciones de
    densidad y de distribución acumulada de una
    normal estándar.
  • La función de verosimilitud para el modelo Probit
    en cada t es
  • Donde Yj es una variable binaria que adopta el
    valor 1 si j está en la muestra seleccionada

53
Modelo Probit
  • Y su logaritmo natural es
  • Las condiciones de primer orden son

54
Modelo Probit
  • La matriz de información de Fisher es
  • Por lo tanto , t1, 2,
    ..., T.
  • Donde es de dimensión (1TK)x1 es
    de dimensión (1TK)x(1TK) y es de
    dimensión (1TK)x1.
  • GO
    BACK

55
Supuestos
  • Supuesto W.1
  • (a) La ecuación de selección está dada por (W2)
    con todos sus supuestos
  • (b) E(ujt Xj, vjt) E(ujt vjt) ?t vjt,
    t1,2,,T y
  • (c ) E(cj Xj, vjt) L(cj 1, Xj, vjt).

  • GO BACK

56
Supuestos
  • El supuesto (c ) implica que
  • E(cj Xj, vjt) Xj ? ?t vjt
  • GO
    BACK
Write a Comment
User Comments (0)
About PowerShow.com