Title: TRATAMIENTO PREVIO DE DATOS
1TRATAMIENTO PREVIO DE DATOS
Condicionantes de partida
- El análisis cuantitativo precisa de la
disponibilidad de un conjunto amplio de
mediciones homogéneas de un fenómeno económico.
(serie) - Estas series deben ser los más largas posibles y
no presentar discontinuidades. - Habitualmente necesitamos disponer de la
información lo más actual posible.
Situaciones reales
- Las series estadÃsticas a menudo incorporan
cambios metodológicos y perfeccionamientos que no
las hacen homogéneas. - Podemos encontrarnos con datos no disponibles,
bien intermedios o bien actualizados.
2TRATAMIENTO PREVIO DE DATOS
Cambios metodológicos en las series estadÃsticas.
- La situación más habitual que nos podemos
encontrar son los cambios de base en series de
tipo INDICE. - En el caso de las Cuentas Nacionales nos
encontramos adicionalmente con cambios
metodológicos unidos a cambios de base contable.
Sistema de cuentas nacionales
Año Base 1970 1980 1986 1995 2000
MetodologÃa CNE-70 (No homogénea) Sec-79 Sec-79 S
ec-95 Sec-95 (Ind. Encadenados)
3TRATAMIENTO PREVIO DE DATOS
Cambios metodológicos en las series estadÃsticas.
- Si no se han producido cambios metodológicos y
únicamente se trata de un cambio de base (en una
serie en Ãndices) se podrán recalcular las series
disponibles en una base anterior y expresarlas en
términos de la nueva base.
Unicamente necesitamos disponer de la serie en la
base antigua (80) incluyendo el valor de nuevo
año base (90) en la base antigua (Ind9080)
4TRATAMIENTO PREVIO DE DATOS
Cambios metodológicos en las series estadÃsticas.
- Si existen cambios metodológicos el enlace de las
series es bastante más complejo ya que tendrÃamos
que disponer de los datos originales y rehacer
las series con la nueva metodologÃa. - Habitualmente no se dispone de esta información y
tendremos que acudir a enlaces aproximados en
base a coeficientes correctores o manteniendo las
tasas de variación, siempre que se disponga de un
dato común.
5TRATAMIENTO PREVIO DE DATOS
Cambios metodológicos en las series estadÃsticas.
- Un problema que puede plantearse es la
disponibilidad de varios años comunes, en cuyo
caso el coeficiente corrector no es único.
- Las alternativas que se nos plantean son varias
- Utilizar sólo el primero disponible
- Utilizar una media (si es mas o menos constante)
- Estimar la dinámica del coeficiente.(p.e. Media
móvil)
6TRATAMIENTO PREVIO DE DATOS
Cambios metodológicos en las series estadÃsticas.
- Un segundo problema a tratar en los enlaces de
cambios metodológicos serÃa la no disponibilidad
de ningún punto común.
- Ante esta circunstancia una primera aproximación
consistirÃa en respetar las tasas de crecimiento
observadas en cada base y estimar la evolución
(tasa de crecimiento) en el punto de corte.
- Una estimación sencilla consistirÃa en interpolar
linealmente la tasa de variación del punto de
corte, calculando la media entre las tasa previa
y la posterior.
7TRATAMIENTO PREVIO DE DATOS
Cambios metodológicos en las series estadÃsticas.
- El problema más complejo ante un cambio
metodológico surge cuando existen a su vez
restricciones entre varias variables a enlazar.
P.e Corrientes, constantes y deflactores, PIB
ofertaPIB demanda etc.
- Ante estas circunstancias se suele primar un
enlace, o varios, y obtener los otros a partir
de la restricción, comprobando que no se aleja en
exceso de la realidad observada.
8TRATAMIENTO PREVIO DE DATOS
Existencia de datos perdidos
- En algunas ocasiones se nos presente el problema
de la inexistencia de datos, bien por que no se
han realizado las mediciones, o bien porque no
somos capaces de localizar la fuente estadÃstica.
- En estos casos podemos realizar una estimación
simple mediante la interpolación lineal, o bien
mediante la utilización de una tasa media
acumulada.
9TRATAMIENTO PREVIO DE DATOS
Agregaciones de series, reducción de frecuencia.
- A menudo nos encontramos casos en los que las
series que queremos analizar de forma conjunta
presentan periodicidades distintas. (frecuencias).
- La norma general consistirÃa en utilizar las
series en la frecuencia que presenta menor
periodicidad, ya que siempre es posible
agregarinformación, es decir reducir la
frecuencia.
- Dependiendo del tipo de información contenida la
agregación se realizará por suma, media, o por
último dato.
10TRATAMIENTO PREVIO DE DATOS
Desagregación de series, aumento de frecuencia.
- En algunas ocasiones nos interesa el análisis de
las series con la frecuencia más alta posible, a
pesar de que alguna de las variables sólo este
disponible en frecuencias más bajas.
- Ante estas circunstancias debemos optar por
desagregar la variable de frecuencia más baja,
aumentando su frecuencia.
- El problema fundamental en estas circunstancias
se suele presentar por el cumplimiento de la
restricción de agregación. (la nueva serie debe
ser tal que al agregarla nos reproduzca la serie
original).
11TRATAMIENTO PREVIO DE DATOS
Desagregación de series, aumento de frecuencia.
- Entre las distintas propuestas metodológicas para
aumentar las frecuencia de una serie el método de
Suavizado de Boot,Feibes y Lisman en uno de los
más sencillos.
- Se trata de minimizar la suma de diferencias
cuadráticas entre cada par de observaciones
sucesivas sujeto a la restricción de que la suma
de dichas observaciones sea el dato agregado.
12TRATAMIENTO PREVIO DE DATOS
Desagregación de series, aumento de frecuencia.
Suavizado de Boot, Feibes y Lisman
- La solución al problema de minimización se
realiza mediante el lagrangiano
13TRATAMIENTO PREVIO DE DATOS
Desagregación de series, aumento de frecuencia.
Utilización de indicadores CHOW-LIN
- Una alternativa al método de suavizado consiste
en la utilización de indicadores o variables
proxi de alta frecuencia. (Para el caso
trimestral Xqtj)
- Se parte de la estimación de una regresión entre
la variable objetivo (Yt) y la proxi anualizada
Xqt.
- A continuación se obtiene la variable de alta
frecuencia (trimestralizada) aplicando los
coeficientes estimados a los valores de alta
frecuencia de la variable proxi.
14TRATAMIENTO PREVIO DE DATOS
Desagregación de series, aumento de frecuencia.
Utilización de indicadores CHOW-LIN
- El cumplimiento de la restricción longitudinal se
garantiza agregando al valor obtenido el error de
la estimación en baja frecuencia distribuido
entre los distintos periodos.
- En la alternativa más simple y asumiendo un ruido
blanco en la perturbación de la regresión de baja
frecuencia el coeficiente de distribución del
error serÃa igual a 1/j. (para el caso trimestral)
15TRATAMIENTO PREVIO DE DATOS
Desagregación de series, aumento de frecuencia.
Utilización de indicadores CHOW-LIN
- Si se detecta algún tipo de comportamiento
anómalo en la matriz de varianzas-covarianzas de
la perturbación aleatoria, utilizarÃamos el
estimador de Aitkien para determinar los valores
de los parámetros ?.
- El valor trimestral de la variable objetivo se
obtendrÃa aplicando los coeficientes estimados al
valor del indicador trimestral y añadiéndole el
valor del error ponderado por la matriz de
varianzas-covarianzas, ampliada a rango
trimestral.
16TRATAMIENTO PREVIO DE DATOS
Desagregación de series, aumento de frecuencia.
Especificaciones alternativas de la matriz de
var-cov.
- La diferencia fundamental entre las distintas
aproximaciones se centra en la estructura asumida
para las perturbaciones del modelo trimestral
subyacente. - Ruido blanco Chow y Lin (1971)
17TRATAMIENTO PREVIO DE DATOS
Desagregación de series, aumento de frecuencia.
Especificaciones alternativas de la matriz de
var-cov.
- Paseo aleatorio Fernández (1981)
18TRATAMIENTO PREVIO DE DATOS
Desagregación de series, aumento de frecuencia.
Especificaciones alternativas de la matriz de
var-cov.
19TRATAMIENTO PREVIO DE DATOS
Desagregación de series, aumento de frecuencia.
Especificaciones alternativas de la matriz de
var-cov.
El problema fundamental es estimar ?. Di fonzo y
Filosa proponen su estimación a partir de la
relación con el coeficiente anual ?a