Title: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
1TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
Variable característica de cada sujeto (cada
caso) de una base de datos. Se denomina
variable precisamente porque varía de sujeto
a sujeto. Cada sujeto tiene un valor para cada
variable.
El proceso de definir y medir las variables es
crucial.
Si se realiza una definición incorrecta o se mide
mal todos los análisis posteriores, así como las
conclusiones a las que se llegue, serán
incorrectas.
El tipo de variable afecta al tipo de análisis
que se puede realizar. Los métodos estadísticos
utilizados dependen del tipo de variable.
2TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
- VARIABLES CONTINUAS Y DISCRETAS
- VARIABLE TEMPORAL, TRANSVERSAL Y DATOS DE PANEL
- VARIBLE CUALITATIVA Y CUANTITATIVA
- NOMINAL
- ORDINAL
- INTERVALO
- RAZÓN
3TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
- VARIABLES CONTINUAS Y DISCRETAS
- VARIABLE TEMPORAL, TRANSVERSAL Y DATOS DE PANEL
Discretas el número de valores posibles entre
dos valores dados es finito (se cuenta).
Continua el número de valores posibles entre dos
valores dados es infinito (se mide).
Temporal valores a lo largo del tiempo referidos
a un sujeto. Transversal valores en un momento
del tiempo referido a varios sujetos. Datos de
Panel Valores referidos a varios sujetos a lo
largo del tiempo.
4TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
- VARIBLE CUALITATIVA Y CUANTITATIVA
Cualitativa (no paramétrica) Los valores son
categorías. Las categorías son valores
diferentes por una cualidad, no por una cantidad.
Cuantitativa (paramétrica) Los valores de la
variable son números . Cada valor posible es
menor o mayor que otro valor.
5TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
La escala nominal identifica la pertenencia de un
elemento a un grupo o a otro. Sólo se puede
saber sobre I y J, si xi xj o xi ? xj. Ej.
Variable Sexo. 0Hombre, 1Mujer En la escala
ordinal los números asignados a la variable
sirven para establecer un determinado orden entre
personas u objetos. Además de la información de
la escala nominal, se conoce si xi gt xj o xi lt
xj. Ej. Variable Preferencias. 1Nada, 2
Poco, 3 Algo, 4Mucho
6TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
En la escala de intervalo asigna números que
permiten establecer la diferencia entre los
distintos objetos. Además de lo anterior podemos
saber que si I es mayor que J, I es xi - xj más
grande que J. Ej. Variable Temperatura. 0º No
indica ausencia de temperatura. 30º no implica el
doble de calor que 15º. Con la escala de razón
es posible hablar del número de veces que un
objeto o persona es mayor que otra. Además de lo
anterior se puede saber que si I es mayor que J,
I es xi / xj veces superior a J. Ej. Variable
Ingresos. 0 indica ausencia de ingresos. 1.000
es el doble de salario que 500 .
7TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
Definición Medidas de Tendencia Central Medidas de Dispersión Gráficos
Nominal Categorías NO ordenadas Moda Ninguna Sectores o barras
Ordinal Categorías ordenadas Moda y Mediana Mín / Máx / Rango Amplitud Intercuartil Sectores o barras
Escala (Intervalo, Razón) Valores numéricos o magnitud métrica Moda, Mediana y Media Mín / Máx / Rango Amplitud Intercuartil Desviación típica / Varianza Histogramas, Gráficos de Cajas, etc.
8TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
- IMPORTACIÓN DE DATOS A EXCEL
http//www.ine.es
Inebase / Sociedad / Mercado Laboral / ETCL.
Encuesta Trimestral de Coste Laboral Resultados
detallados Principales series desde trimestre
1T/2000 Tabla 1.2 Principales series de ETCL por
comunidad autónoma, periodo, componentes del
coste y unidad de medida.
Selección Componente del Coste (Coste total por
trabajador, Coste total por hora) Comunidades
Autónomas (Total, todas las CC.AA.) Periodo
(Todos) Unidad de medida (Euro)
Filas Columnas Componente del
Coste Periodo Comunidades Autónomas Unidad de
medida
9TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
- IMPORTACIÓN DE DATOS A EXCEL
http//www.anuarieco.lacaixa.comunicacions.com
10TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
- IMPORTACIÓN DE DATOS A EXCEL
http//www.meh.es
Estadísticas e Informes / Presupuestos y Cuentas
Públicas / Sector Público Español / Base de datos
económicos del sector público español
(BADESPE) Base de datos económicos del sector
público español (BADESPE) Financiación
Autonómica Cuadros Resúmenes Por Comunidades y
Ciudades Autónomas FINANCIACIÓN AUTONÓMICA
(Excel)
11TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
- IMPORTACIÓN DE DATOS A EXCEL
http//biblioteca.uam.es/cdestadistica/informacion
bibliografica.html
SABI/ Nombre de Empresa / Exportar (Excel)
12TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
I. Valores Perdidos o Ausentes cuando para una
variable no se dispone de todos los datos para
cada sujeto.
- Soluciones a Datos Perdidos
- A. Eliminar todos los casos con valores perdidos.
- B. Imputar un valor estimado.
- B.1. Imputación de los valores medios Se
sustituyen los valores ausentes por los valores
medios de la variable. - B.2. Imputación mediante regresión Se realiza
una regresión siendo la variable dependiente la
que posee valores perdidos y como independientes
el resto de variables que posean todos los datos.
Los datos imputados son las predicciones
calculadas en la regresión.
13TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
II. Valores Atípicos - Outliers Aquellos casos
que alguna variable toma valores extremos que
difieren del comportamiento del resto de la
muestra. Consecuencias - Distorsionan los
resultados - Suelen afectar a la normalidad.
Causas - Errores en los datos (recogida e
introducción). - Errores intencionados por parte
del encuestado. - Errores de muestreo (introducir
en la muestra un individuo que no pertenece a la
población) - Outliers verdaderos casos que
pertenecen a la población objeto de estudio y que
realmente difieren del resto por la variabilidad
inherente
14TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
II. Valores Atípicos - Outliers
Detección de valores atípicos - Considerar
atípicos aquellos casos cuyos valores
estandarizados (media 0 y desviación típica
1) superen el siguiente umbral (k) - Nlt80
k2,5 - Ngt80 k gt 3 - Si la variable sigue una
distribución normal k3
15TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
II. Valores Atípicos - Outliers
- Si es un outlier verdadero o no se puede
descartar que no lo sea - Algunos autores consideran correcto su
eliminación para que los análisis reflejen la
tendencia mayoritaria de la población. - - Otros consideran que la eliminación no se debe
realizar - - Suavizar su influencia con transformaciones.
- - Utilizar contrastes no paramétricos.
16TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
http//www.ine.es
Inebase / Sociedad / Educación / Avance de la
Enseñanza Universitaria
17TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
18TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
19TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
20TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
21TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
22TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
23TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.
24TEMA 3 TRATAMIENTO DE DATOS EN MS. EXCEL (I)
I. Importación y organización de diversas bases
de datos en Excel. Variables, Escala de
Medición y Problemas con los Datos.