Title: Diapositiva 1
1DISTRIBUCION DEL EMPLEO EN PAISES EUROPEOS Se
dispone de 26 observaciones de porcentajes de
empleo en 9 sectores económicos. Cada observación
corresponde a un país de Europa. Cada sector es
una variable Agr agricultura Min -
minería Ind industria Ene energía Con
construcción SI servicios industriales Fin
finanzas Ser servicios TC transportes y
comunicaciones El objetivo de este estudio es
agrupar los países de acuerdo a estas variables.
2Los datos son los siguientes. Se observa que
algunas variable pesan mucho más que otras.
Fuente Daniel Peña Análisis de Datos
Multivariantes, ed. Thomson.
3Se aplicó el método de Análisis de Conglomerados
Jerárquico Aglomerativo, utilizando Minitab. La
distancia entre elementos es la distancia
eucliudea, y entre conglomerados, la distancia
promedio. Todos los datos corresponden a
porcentaje. Se desea que influyan más aquellos
rubros en que los porcentajes de empleo son
mayores. Por lo tanto no se estandarizaron las
variables.
4El dendograma correspondiente es el siguiente
5En base al dendograma se pueden identificar los
cuatro conglomerados 1 - Bel, RU, Din, Sue, Lux,
Nor, Fra, Fin, Ita, PB, Aus, Sui. 2 - Irl, Por,
Pol, Rum, Esp, Bul, Hun, Che. 3 - Gre, Yug 4
Tur Si se divide en más de cuatro conglomerados,
no resulta fácil hacer la separación, pues
aparecen países en conglomerados distintos que
estarían a distancia muy pequeña.
6El conglomerado 1 corresponde a países de Europa
central y norte, todos con un alto nivel de
desarrollo. El conglomerado 2 corresponde a
países de la antigua Europa Oriental, más
Irlanda, Portugal y España. El conglomerado 3
está formado por Grecia y Yugoeslavia, países con
más desarrollo agrícola que industrial. El
conglomerado 4 está formado por Turquía, con
características similares a las del conglomerado
3, pero más acentuadas.
7La tabla siguiente muestra los promedios de cada
variable, por conglomerado y global.
Estos valores se muestran en el gráfico que
sigue.
8Se ve que las variables que mejor definen los
grupos son Agricultura, Servicios Industriales,
Finanzas y Servicios. De estas, Agricultura y
Servicios están entre las que tienen porcentajes
más altos, en promedio, por lo tanto pesan
más. Industria pesa más que todas, separa bien
los grupos 3 y 4, pero no 2 de 3.
9Cada uno de los gráficos siguientes corresponden
a una variable. En cada uno se representan los
valores individuales de los países, agrupados por
conglomerado.
10Agricultura
Esta variable separa muy bien los cuatro
conglomerados, y es una de las variables que más
pesa, junto con Industria y Servicios.
11Minería
Luxemburgo aparece distante de su grupo en la
variable Minería, sin embargo esta variable pesa
poco en el análisis.
12Industria
La variable Industria tiene un valor menor para
los países de los grupos 3 y 4.
13Energía
La variable Energía sólo deja a Turquía por
debajo, confundiéndose los demás grupos. Pero
esta variable pesa muy poco.
14Construcción
Lo mismo pasa con la variable Construcción, sólo
que además deja distantes a los dos integrantes
del tercer grupo.
15Servicios Industriales
Servicios Industriales deja por encima de los
demás grupos al conglomerado 1, de los países con
mayor nivel de desarrollo. Irlanda y Portugal,
del conglomerado 2, quedan por encima de su grupo.
16Finanzas
En la variable Finanzas, sobresalen Yugoslavia y
España, por sobre sus respectivos grupos. Italia
queda por debajo de su grupo.
17Servicios
En servicios, los grupos 3 y 4 están bajo los
otros dos grupos. De estos últimos, la mayoría
del grupo 1 quedan sobre los del grupo 2.
18Transporte y Comunicación
En transporte y comunicación, los grupos 1 y 2 no
difieren. Turquía queda muy por debajo, y en el
grupo 3, difieren los dos países, quedando
Yugoslavia muy por debajo.
19Para complementar lo anterior, se hizo un
análisis de Componentes Principales, para
representar los países con un número menor de
variables. Resultando que las cargas de las dos
primeras componentes explican el 83.2 y el 11.1
de la varianza, con lo que acumulan un 94.3
entre las dos.
20Las cargas de las primeras dos componentes son
las siguientes, destacando las que son mayores
que 0.2 Variable CP 1 CP2 Agr
-0.893 0.062 Min -0.007
-0.083 Ind 0.231 -0.750 Ene
0.008 -0.012 Con 0.057
-0.117 SI 0.207 0.178 Fin
0.038 0.101 Ser 0.316
0.609 TC 0.046 0.017
21La primera componente se puede interpretar como
una comparación de Industria, Servicios
Industriales y Servicios versus Agricultura. La
segunda componente puede interpretarse como una
comparación de Servicios versus Industria. El
siguiente gráfico, del plano principal,
representa los scores de los países, en las
nuevas variables CP1 y CP2.
22La primera componente, que explica el 83.2 de la
varianza, y que corresponde a una comparación
entre lo relacionado a industria y servicios, con
agricultura, separa claramente los cuatro
conglomerados. No así la segunda, que sólo separa
el conglomerado 3 del 4.
23Finalmente se muestra un mapa de Europa
destacándose los cuatro conglomerados. Los
países mostrados en gris no se consideraron en el
estudio.
24Distribución geográfica de los conglomerados de
países
Conglomerado
1 2 3 4
25Fin