Title: Diapositiva 1
1UNIVERSIDAD NACIONAL MAYOR DE SAN
MARCOS Facultad de Ciencias Económicas Unidad de
Postgrado MAESTRIA EN ECONOMIA CON MENCION EN
GESTION Y POLITICA PUBLICA
COEFICIENTE DE DETERMINACION ANALISIS DE
VARIANZA PREDICCION P VALUE JARQUE VERA
RESET RAMSEY CHOW RESIDUOS RECURSIVOS CUSUM
Mag. Renán Quispe LLanos
2011
2Ejemplo
10
3y
x
ß
4(No Transcript)
5ESTIMACION DE LA VARIANZA DEL TERMINO DE
PERTURBACION
6Reemplazando en la fórmula tenemos
Calculando Varianza
(
)
2
s
9209
.
40
975757
.
0
9375
.
41
b
1
(
)
2
s
00127
.
0
0000303
.
0
9375
.
41
b
2
s
3969
.
6
ˆ
b
1
s
0356
.
0
ˆ
b
2
7CONSTRUCCION DE INTERVALOS PARA ?I
Para un nivel de significación del 5 observando
en la tabla t de student t(n-k)?/2 t
(10-2)0.05/2 t8,0.025 2.306
8Otra forma de expresarlo con prob.
P(0.4268??2 ?0.5919)1-0.050.95
Dado un coeficiente de confianza del 95 en el
I.p si se construye cien intervalos repetidos con
los límites siguientes 0.4268 y 0.919, en el 95
de ellos estarían verdadero parámetro poblacional.
9COEFICIENTE DE DETERMINACION (R2)
Es un indicador de la bondad de ajuste de la
línea de regresión que mide la proporción de la
variación total en la variable dependiente Y, que
se explica o se debe a la variación de la
variable independiente X.
10Planteada la relación inicial la misma se
mantiene cuando se establece relaciones a partir
de las sumatorias de sus desviaciones
cuadráticas. Por un proceso matemático particular
se da
SCT SCR SCE
SCT Variación total del Yi observado con
respecto a la media muestral. La suma total de
los cuadrados.
11SCR Variación residual o no explicada de los
valores de Y con respecto a la línea de
regresión. Suma de los cuadrados residuales
SCE Variación de los valores estimados Yi con
respecto a su media. Suma de los cuadrados
Explicados
12PROPIEDADES 1. Es una cantidad no negativa 2.
Sus límites son Es decir que R varía entre
cero y uno R21 cuando el ajuste es perfecto, es
decir los valores observados coinciden
perfectamente con la recta estimada R2?0 es
decir que no hay relación entre la variable
dependiente y los variables explicativas. Este
R2 no mide el grado de asociación entre x e y,
para lo cual se acude a otro indicador
13COEFICIENTE DE CORRELACION
Es una medida de asociación lineal entre dos
variables
Poblacional Muestral
y
14- PROPIEDADES
- Sus límites son
- Es de naturaleza simétrica, es decir el
coeficiente de correlación entre X y Y (rxy) es
igual al coeficiente se correlación entre Y y X
(ryx) - Si X, Y son estadísticamente independientes y el
coeficiente de correlación es cero, pero si r0
no implica necesariamente independencia. - Es una medida de asociación lineal, es decir mide
la asociación lineal entre dos variables
.Negativa(-1) o positiva (1)
15COEFICIENTE DE DETERMINACION MULTIPLE CORREGIDO
En la medida que el numero de variables
indepencientes se incrementa, se divide a cada
uno de la sumatorias cuadráticas entre sus grados
de libertad, obteniendo finalmente un cociente de
varianzas.
16Ejemplo
17Continuando con el ejemplo y remplazando en (1)
En (2)
18ANALISIS DE VARIANZA
El análisis de varianza tiene por finalidad
investigar la explicación conjunta de todas las
variables explicativas intervinientes en el
modelo, a partir del estudio de los componentes
de la variabilidad total. SCT SCR SCE De
donde se construye un estadístico de frecuencia
conocido
19Planteamos la siguiente tabla
F (valor calculado)
20Planteamiento de Dócima de Hipótesis H0 ?1
?2 ?k 0 H1 ?1 ? 0, ?2 ? 0 ?k ?
0 Bajo el enfoque de la prueba de
significancia, se construye la región crítica de
la siguiente manera R.C. F gt Fk-1, n-k
(tabla de la F)
21Del ejemplo del modelo de Ingreso-Consumo, se
realiza los respectivos cálculos, para hallar el
estadístico F
El F calculado, se compara con el de la tabla
Entonces se rechaza la hipótesis nula, es decir
que el Consumo es explicado por la variable
Ingreso.
22ANALISIS DE VARIANZA PARCIAL
Entonces (que se
compara con el de la tabla)
23Docima de Hipótesis H0 ?r1 ?r2......?s
0 H1 ?r1 ? ?r2 ? ..... ? ?rs ? 0 Bajo el
enfoque de la prueba de significancia, se
construye la región crítica de la siguiente
manera R.C. FC gt Fs,n-(rs) (tabla)
24Ejemplo Sea los datos sobre consumo privado y
sus variables explicativas respectivas.
Y X1 X2 X3
Año Consumo Privado YND Precios Relativos Tasas de Interés
1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1785 1849 1909 1987 2122 2210 2244 2254 2082 2131 2236 2356 2376 2167 2209 2296 2593 2839 2501 2344 2401 2414 2669 2889 2807 2817 2755 2723 3139 3335 3442 3461 2925 3012 3060 3419 3800 3452 98.4 98.4 98.4 100.5 104.0 104.1 103.0 101.4 101.7 100.0 99.7 100.2 96.7 96.4 94.4 92.0 95.5 97.4 97.8 3.5 1.6 4.9 -3.9 -8.3 -11.9 -2.3 -13.8 -30.0 -17.0 -14.6 -6.1 -6.5 -27.6 -21.2 -34.7 -39.9 -41.5 -88.4
25Para el modelo de consumo Ingreso los
estimadores son
C ?1 ?2YND C 528.78877 0.56 YND tc
(2.84715) (9.16902)
R2 83.2 , (dato 4000) F 84.05
Incorporando las variables precios (PR) y tasa
de interés (TI) C ?1 ?2YND ?3PR ?4IT C
175.00 0.4966YND 5.0862PR 2605IT
(6.8825) (0.6418)
(6.0295) t19-4, 0.05/22.131 La tabla de
análisis de varianza será
26Entonces
(que se compara con el de la tabla)
27F2,15 0.05 3.68 (tabla) Dado que FC
1.877 lt F2,15 0.05 3.68. Se concluye que la
incorporación de las variables precios relativos
y la tasa de interés general no mejoran la
explicación del modelo estando ya incorporada la
variable ingreso disponible.
28p value
- Es el valor exacto de la probabilidad, obtenida a
partir de la información, el cual nos permite
rechazar o no la hipótesis nula (dado un nivel de
significancia) sin necesidad de recurrir al uso
de tablas. - Si el p value lt a 1 ó 5, se rechazará la
hipótesis nula. - Si el p value gt a, se aceptará la hipótesis
nula. - a Nivel de significación
29p value
Distribución t
5 de área a
Zona de Aceptación
p value
t
0 tc
Distribución F
5 de área a
Zona de Aceptación
p value
F
0
Fc
30Por ejemplo, en el modelo Yt ß1 ß2X1t
ß3X2t tenemos las siguientes salidas
Dependent Variable Y Method Least Squares Sample 1991 1995 Included observations 5 Dependent Variable Y Method Least Squares Sample 1991 1995 Included observations 5 Dependent Variable Y Method Least Squares Sample 1991 1995 Included observations 5 Dependent Variable Y Method Least Squares Sample 1991 1995 Included observations 5 Dependent Variable Y Method Least Squares Sample 1991 1995 Included observations 5
Variable Coefficient Std. Error t-Statistic Prob.
C 4.000000 4.474930 0.893869 0.4657
X1 2.500000 0.866025 2.886751 0.1020
X2 -1.500000 1.369306 -1.095445 0.3876
R-squared 0.946429 Mean dependent var Mean dependent var 4.000000
Adjusted R-squared 0.892857 S.D. dependent var S.D. dependent var 2.645751
S.E. of regresión 0.866025 Akaike info criterion Akaike info criterion 2.833904
Sum squared resid 1.500000 Schwarz criterion Schwarz criterion 2.599567
Log likelihood -4.084760 F-statistic F-statistic 17.66667
Durbin-Watson stat 1.666667 Prob(F-statistic) Prob(F-statistic) 0.053571
La probabilidad asociada (p value) tanto para el
estadístico t, como para la prueba F, son
superiores a 0.05 ? Se acepta la hipótesis nula
de significancia individual y significancia
conjunta, respectivamente
31El estadístico Jarque Bera.- Determina como se
encuentra afectado su valor por la presencia de
un mayor apuntamiento (mayor a 3) o menor
asimetría (cercano a cero) de las
perturbaciones. A significa asimetría y C
apuntamiento o curtosis Hipótesis H0 Las
perturbaciones tienen una distribución normal H1
Las perturbaciones no tienen una distribución
normal
32El estadístico Jarque Bera.- Permite verificar la
normalidad de los residuos. La Ho es que los
residuos se distribuyen normalmente.
La probabilidad asociada al estadístico
Jarque-Bera es mayor al 5, entonces no se puede
rechazar la Ho de normalidad de los residuos.
33Ejemplo (pregunta del examen)
La probabilidad asociada al estadístico
Jarque-Bera es mayor al 5, entonces no se puede
rechazar la Ho de normalidad de los residuos.
34Test de Reset de Ramsey
- Se realiza en dos etapas
- 1º estima en modelo sujeto a análisis en su forma
original - 2º se toma la serie estimada por los parámetros
de la regresión anterior y se anexan sus
potenciales enteras a la misma regresión como
parámetros auxiliares - Estadístico de prueba
- H0 El modelo está correctamente especificado
- H1 El modelo no está correctamente especificado
35Ejemplo
- En un modelo sobre el fondo Afuture (Yt) en
función a las tasas anuales de retorno (Xt),
obtenemos el test de Ramsey - H0 El modelo está correctamente especificado
- H1 El modelo no está correctamente especificado
- El test de Reset Ramsey indica que añadiendo 2
términos al test Y2, Y3 el valor del
estadístico F es 1.16 y la probabilidad
asociada al error de rechazar la hipótesis nula
cuando es verdadera es de 35.99 mayor al 5
por lo tanto se acepta que el modelo está
correctamente especificado.
Ramsey RESET Test Ramsey RESET Test Ramsey RESET Test Ramsey RESET Test
F-statistic 1.164495 Probability 0.359856
Log likelihood ratio 3.066156 Probability 0.215870
36Test de Chow (Contraste de Cambio Estructural)
- El modelo restringido (MR) es
- El modelo sin restringir (MSR) es
- El estadístico F
- H0 Ausencia de cambio estructural
- H1 Presencia de cambio estructural
- SRR suma residual restringida es la que
proviene de la estimación del modelo restringido
(MR) - SR1 y SR2 suma residual sin restringir es el
agregado de las sumas residuales de cada una de
las regresiones de las submuestras
37Ejemplo (pregunta del examen)
- Probamos la posibilidad que exista un quiebre
estructural en el año 1996 - Rechazamos la hipótesis de que no hay cambio
estructural al 95 de confiabilidad. Por lo
tanto, concluimos que en 1996 se produjo un
cambio estructural.
Chow Breakpoint Test 1996 Chow Breakpoint Test 1996 Chow Breakpoint Test 1996
F-statistic 6.936682 Probability 0.043625
Log likelihood ratio 24.85794 Probability 0.000054
38Residuos Recursivos (Contraste de Estabilidad)
- Se obtienen a partir de una estimación recursiva
de los parámetros ? del modelo - H0 Los parámetros ? son estables en el tiempo
- H1 Los parámetros ? no son estables en el tiempo
39Residuos Recursivos
- Esquemáticamente el proceso se pude describir a
partir del siguiente gráfico
40Contraste de Suma Acumulada (Test Cusum)
- Consiste en la acumulación progresiva de los
residuos recursivos que posteriormente se
normalizan dividiéndolos entre la estimación
insesgada de la desviación típica de la
perturbación (S) - r k1, k2, ... , n
- Donde
- Debe oscilar entre
- H0 Los parámetros ? son estables en el tiempo
- H1 Los parámetros ? no son estables en el tiempo
41Contraste de Suma Acumulada (Test Cusum)
- La representación gráfica de este contraste
dibujaría los residuos recursivos sobre el
gráfico siguiente
Wr
k
n r
42- Ejemplo (pregunta del examen)
- El estadístico CUSUM se mantiene dentro de las
bandas de confianza, con lo cual se puede afirmar
que los parámetros son estables a lo largo del
período de análisis en un 95 de confianza.
43Contraste de Suma Acumulada de Cuadrados (Test
Cusum2)
- Utiliza la suma acumulada del cuadrado de los
residuos recursivos (numerador) y la Suma de
Cuadrados de la totalidad de los Residuos
Recursivos (denominador) - r k1, k2, ... , n
- El valor esperado del estadístico oscila entre
cero y uno así, E(Sr) 0 cuando - r k, y, cuando r n, E(Sr) 1.
44Contraste de Suma Acumulada de Cuadrados (Test
Cusum2)
45- Ejemplo (pregunta del examen)
- El estadístico CUSUM2 se mantiene dentro de las
bandas de confianza, se afirma que los parámetros
son estables a lo largo del período de análisis
en un 95 de confianza.
46(No Transcript)
47PREDICCION Modelo Modelo estimado A.
Predicción Puntual de
La predicción puntual es la misma para un valor
particular como para el valor promedio de la
variable
Las desviaciones standart son diferentes Para el
valor promedio es Para el valor particular es
48 B. Intervalo de Confianza de una predicción
(aNivel de significancia) Para el valor
promedio Para un valor particular Con
n-k g.l. y con un nivel de significancia ?
49Ejemplo Sea los datos sobre consumo privado (y)
y sus variables explicativas respectivas X1
Ingreso disponible (YND), X2 precios relativos
(PR) y X3 tasas de interés (IT). El modelo con
las variables Y y X1 será
C ?1 ?2YND
C 528.78877 0.56YND
tc (2.84715) (9.16902)
50R2 83.2 , (YNDt1 4000)
El Intervalo de Confianza para el valor
promedio es
dado t19-2,0.05/22.093 Entonces 2784.
5 ? 2.093(78.68) 261982, 294917
51Error de Predicción se define como la diferencia
entre el valor de la variable a predecir y la
predicción obtenida las fuentes del error de
predicción son a. El error en la estimación del
vector ß b. El error en la predicción del vector
Xn1 c. El error estocástico inherente al
modelo,
52El coeficiente de Theil (U).- Fórmula de cálculo
53El coeficiente de Theil (U).- Mide la calidad del
modelo para predecir. Oscila entre 0 y 1. Si U
0, existe un ajuste perfecto y el modelo es bueno
para predecir. Si U 1, el modelo es muy malo
para predecir.
En este caso el coeficiente de Theil es 0.059, es
pequeño, por lo tanto el modelo es bueno para
predecir.
54Ejemplo (pregunta del examen)
En este caso el coeficiente de Theil es 0.0118,
es pequeño, por lo tanto el modelo es bueno para
predecir.