Title: 1. An
11. Análisis de datos.2. Análisis de datos
bivariantes.3. Correlación y regresión.4.
Series temporales y números índice.5.
Probabilidad.6. Variables aleatorias.7. Modelos
discretos.8. Modelos continuos.9. Variables
aleatorias multidimensionales la distribución
normal bivariante.
Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Programa de la asignatura
Organización de la asignatura
Clases teóricas y clases prácticas de ordenador.
Se valorará positivamente la asistencia a las
clases prácticas. Las prácticas se realizarán en
aulas informáticas en horarios preestablecidos.
Se utilizará el programa STATGRAPHICS.
Profesora Mónica Catalán Reyes
2Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Organización de las prácticas
Las prácticas de la asignatura serán realizadas
con el paquete estadístico Statgraphics. En la
biblioteca se puede conseguir un CD con una
versión para estudiantes. El mínimo de prácticas
en ordenador son 5
- Análisis de datos Univariante- Análisis de
datos Bivariante- Regresión- Distribuciones
(generación de datos por simulación)- Series
temporales.
Evaluación de la asignatura
La evaluación de la asignatura será el examen
final. Se contara positivamente la entrega de un
trabajo y ejercicios, estas dos tareas sumarán
como máximo 0,5 puntos a la nota del examen. El
trabajo consistirá en analizar una base de datos
con dos variables cuantitativas. Realizar el
análisis por separado de las variables
(univariante) y el conjunto (bivariante) hasta el
ajuste de un modelo de regresión.
Profesora Mónica Catalán Reyes
3Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Bibliografía
- PEÑA, D. y ROMO, J. Introducción a la
Estadística para las Ciencias Sociales. McGraw
Hill, New York, 1997. - PEÑA, D. Estadística. Modelos y Métodos,
segunda edición, Alianza Universidad Textos,
Madrid, 2001.
Bibliografía Complementaria
- MOORE, D. S. The Basic Practice of Statistics,
segunda edición, Freeman and Co., 2000. - - NEWBOLD, P. Statistics for business and
economics, cuarta edición, Prentice Hall,
Englewood Cliffs, 1996.
Profesora Mónica Catalán Reyes
4Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Introducción
El objetivo del curso es la Introducción a los
conceptos fundamentales del Análisis de Datos y
de la Probabilidad. Qué es la estadística? Es
una poderosa herramienta para generar
conocimiento que ha experimentado un gran
desarrollo a lo largo del tiempo. En qué áreas
se aplica la estadística? Actualmente se aplica
en todas las áreas del saber, por ejemplo en
Sociología, Educación, Psicología,
Administración, Economía, Medicina, Ciencias
Políticas, entre otras. Ejemplos de su
aplicación son 1) En Administración de
Empresas la estadística se utiliza para evaluar
un producto antes de comercializarlo. 2) En
Economía para medir la evolución de los precios
mediante números índice o para estudiar los
hábitos de los consumidores a través de encuestas
de presupuestos familiares.
5Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Introducción
Ejemplos de su aplicación son 3) En Ciencias
Políticas para conocer las preferencias de los
electores antes de una votación mediante sondeos
y así orientar las estrategias de los
candidatos. 4) En Sociología para estudiar las
opiniones de los colectivos sociales sobre temas
de actualidad. 5) En Psicología para elaborar
las escalas de los test y cuantificar aspectos
del comportamiento humano (por ejemplo los test
que se aplican a los candidatos para un cargo en
una empresa). 6) En Medicina uno entre muchos
usos de la estadística, es para determinar el
estado de salud de la población. En general en
las Ciencias Sociales, la estadística se emplea
para medir las relaciones entre variables y hacer
predicciones sobre ellas.
6Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Introducción
Etapas de un estudio estadístico Un análisis
estadístico se lleva a cabo siguiendo las etapas
habituales en el llamado método científico cuyas
etapas son
- Planteamiento del problema consiste en definir
el objetivo de la investigación y precisar el
universo o población. - Recogida de la información consiste en
recolectar los datos necesarios relacionados al
problema de investigación. - Análisis descriptivo consiste en resumir los
datos disponibles para extraer la información
relevante en el estudio. - Inferencia estadística consiste en suponer un
modelo para la población e interpretación de los
datos a la luz del modelo para obtener
conclusiones generales. - Diagnóstico consiste en verificar la validez de
los supuestos del modelo que nos han permitido
interpretar los datos y llegar a conclusiones
sobre la población
7Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Introducción
Esquema de las etapas de un estudio estadístico
DATOS
AREA DE INTERES
ORGANIZAR Y RESUMIR
ESTADÍSTICA DESCRIPTIVA
(Tablas, Gráficos, Medidas Descriptivas, etc.)
- Tema de Investigación
- Antecedentes Previos
- Objetivos
- Preguntas de Investigación
- Posibles Hipótesis
- Unidad de Análisis
- Población
- Variables
INTERPRETACIÓN
Muestra
Población o Muestra?
INFERENCIA ESTADÍSTICA
Población
CONCLUSIONES
Probabilidad
INFORMACIÓN
8Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Introducción
Ejemplos de algunos problemas a estudiar
1) Se quiere estudiar si en cierto colectivo
existe discriminación salarial debida al sexo de
la persona empleada. 2) Se quiere determinar el
perfil de los trabajadores en términos de
condiciones económicas y sociales en diferentes
comunidades. 3) Se quiere estudiar el consumo de
las personas de una zona determinada en cuanto a
vestuario, alimentación, ocio y vivienda. 4) Se
quiere determinar las tallas estándar en
vestuario para mujeres españolas. 5) Se quiere
determinar el tiempo que dedican al trabajo y a
la familia los trabajadores de distintas empresas
del país. 6) Se quiere determinar el perfil
sociodemográfico de los estudiantes de una
Universidad. 7) Se quiere estudiar el gasto en
teléfono móvil mensual de los estudiantes de una
Universidad, y si éste tiene alguna relación con
su edad u otras características.
9Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Introducción
Ejemplos de algunos problemas a estudiar
1) Se quiere estudiar si en cierto colectivo
existe discriminación salarial debida al sexo de
la persona empleada. 2) Se quiere determinar el
perfil de los trabajadores en términos de
condiciones económicas y sociales en diferentes
comunidades. 3) Se quiere estudiar el consumo de
las personas de una zona determinada en cuanto a
vestuario, alimentación, ocio y vivienda. 4) Se
quiere determinar las tallas estándar en
vestuario para mujeres españolas. 5) Se quiere
determinar el tiempo que dedican al trabajo y a
la familia los trabajadores de distintas empresas
del país. 6) Se quiere determinar el perfil
sociodemográfico de los estudiantes de una
Universidad. 7) Se quiere estudiar el gasto en
teléfono móvil mensual de los estudiantes de una
Universidad, y si éste tiene alguna relación con
su edad u otras características.
10Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Resumen de algunos conceptos planteados en la
Introducción
- VARIABLE es lo que se va a medir y representa
una característica de la UNIDAD DE ANÁLISIS. - QUIÉNES VAN A SER MEDIDOS? Los sujetos u
objetos o Unidades de Análisis de una Población o
una Muestra
- POBLACIÓN Es el total de unidades de análisis
que son tema de estudio.
- MUESTRA Es un conjunto de unidades de análisis
provenientes de una población.
Población Las personas que trabajan en
empresas de comunicación
Muestra
Muestra 60 trabajadores de empresas de
comunicación Unidad de análisis Trabajador de
empresa de comunicación Variables sexo, edad,
salario, Nº de horas de trabajo, etc.
Mónica Catalán Reyes-2007
11Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Resumen de algunos conceptos planteados en la
Introducción
- Problema de Investigación
- Antecedentes Previos
- Objetivo
- Preguntas de Investigación
- Posibles Hipótesis
- Unidad de Análisis
- Población
- Variables
Respuesta al problema de investigación INFORMACIÓN
Herramientas Estadísticas
Mónica Catalán Reyes-2007
12Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
ACTIVIDAD 1
Vamos a trabajar en los siguientes problemas de
investigación 6) Se quiere determinar el perfil
sociodemográfico de los estudiantes de una
Universidad y 7) Se quiere estudiar el gasto en
teléfono móvil mensual de los estudiantes de una
Universidad, y si éste tiene alguna relación con
su edad u otras características.
Definir Población bajo estudio, unidad de
análisis, variables de interés.
13Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
El total de elementos de la población serán N y
los de la muestra n
MUESTRA
La muestra se genera a través de algún tipo de
muestreo
PROBABILISTICO
NO PROBABILISTICO
- Todas las unidades de la población tienen
alguna probabilidad de ser seleccionadas. - Para
obtener la muestra se requiere tener
identificados los elementos de la
población. - Los elementos de la población se
identifican a través de un listado de elementos,
denominado marco muestral. - Para obtener una
muestra se requiere de datos previos acerca de la
población. - Una de sus ventajas es que puede
medirse el tamaño del error en las predicciones.
Muestreo aleatorio simple Muestreo
sistemático Muestreo estratificado
Mónica Catalán Reyes-2004
14Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
El total de elementos de la población serán N y
los de la muestra n
MUESTRA
La muestra se genera a través de algún tipo de
muestreo
PROBABILISTICO
NO PROBABILISTICO
- - Este tipo de muestra también se denomina
muestra dirigida. - Suponen un procedimiento de selección informal y
un poco arbitrario. - La elección de los elementos no depende de la
probabilidad, sino de causas relacionadas con las
características del investigador. - Son utilizadas en algunas investigaciones y a
partir de ellas se hacen inferencias hacia la
población. - La muestra dirigida selecciona sujetos típicos,
con la esperanza de que serán casos
representativos de una población determinada.
Muestra de sujetos voluntarios Muestra de
expertos Muestra de sujetos-tipo Muestra por
cuotas
15Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Variable corresponde a la característica de la
Unidad de Análisis
TIPOS DE VARIABLES
Variables Cualitativas
Variables Cuantitativas
ORDINAL
NOMINAL
CONTINUA
DISCRETA
Tipos de escala Intervalo o Razón
Característica o cualidad cuyas categorías no
tienen un orden preestablecido. Ejemplos Sexo,
Deporte Favorito, etc.
Toma valores enteros Ejemplos Número de Hijos,
Número de empleados de una empresa, Número de
asignaturas aprobadas en un semestre, etc.
Toma cualquier valor dentro de un intervalo
Ejemplos Peso (escala de Razón) Estatura
(escala de Razón) Temperatura (Escala de
Intervalo), etc.
Característica o cualidad cuyas categorías tienen
un orden preestablecido. Ejemplos Calificación
(S, N, A) Grado de Interés por un tema, etc.
Escala de Razón Tiene un cero absoluto, el
cambio de unidad de medida no afecta la
descripción de la variable. Escala Intervalo
Tiene un cero arbitrario y al cambiar de unidad
de medida cambia la descripción de la variable.
Unidad de Medida Gramos o Kilos para la variable
Peso Grados C o F para Temperatura
16Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Frecuencia desde un conjunto de unidades,
corresponde al Número o Porcentaje de veces que
se presenta una característica.
Variable Cuantitativa
Variable Cualitativa
Variable Cualitativa
Variable Cuantitativa
NOMINAL
CONTINUA
NOMINAL
CONTINUA
ORDINAL
ORDINAL
DISCRETA
DISCRETA
Frecuencia Absoluta (F)
Frecuencia Relativa (f)
TIPO FRECUENCIA
Frecuencia Absoluta Acumulada (FAA)
Frecuencia Relativa Acumulada (fra)
17Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Problema de Investigación Se quiere establecer
el perfil de las industrias de conserva en
función de algunas características. Unidad de
Análisis Industria de Conserva Población
Industrias de Conservas del país
EJEMPLO
Variables - Tipo de Industria se clasifica en
industria tipo A, B, C o D. (cualitativa
nominal) - Nº de Empleados se refiere al número
de empleados en las líneas de producción.
(cuantitativa discreta) - Superficie se refiere
a los metros cuadrados (unidad de medida)
disponibles para las áreas de producción.
(cuantitativa continua) - Calificación
calificación realizada por una institución
pública sobre cumplimiento de ciertos estándares
(Muy Bien, Bien, Regular, Mal). (cualitativa
ordinal)
Datos
18Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Problema de Investigación Se quiere establecer
el perfil de las industrias de conserva en
función de algunas características. Unidad de
Análisis Industria de Conserva Población
Industrias de Conservas del país
EJEMPLO
TABLAS DE FRECUENCIA
(2)
(1)
(3)
(4)
19Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Problema de Investigación Se quiere establecer
el perfil de las industrias de conserva en
función de algunas características. Unidad de
Análisis Industria de Conserva Población
Industrias de Conservas del país
EJEMPLO
1) Titulo General
Elementos que observamos en las TABLAS
2) Titulo por columna/fila
Auto-explicativa
3) Frecuencias
4) Fuente
Tabla 1 Distribución de las Industrias de
Conservas de acuerdo a Tipo de Industria
desde tabla de frecuencias (1)
Fuente Informe 2006, Ministerio de Industria y
Energía
20Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Pregunta Cómo se construye una tabla cuando la
variable es Cuantitativa (x)?
- 1) Determinar el número de clases o intervalos
(k) (C1, C2, ..., Ck) - Total de unidades de análisis (n)
- Regla de Sturges k 1 3,3 logn
- 2) Determinar amplitud del intervalo
- - Valor mínimo que toma la variable en el grupo,
min(xi) i1, 2,...,n. - Valor máximo que toma la variable en el grupo,
max(xi) i1, 2,...,n. - Rango max(xi)-min(xi) R
- Amplitud (R1)/k a
- 3) Construir los intervalos Límite inferior y
Limite superior de cada intervalo - LIj Límite inferior de la clase j, j1, 2,...,k
- LSj Límite superior de la clase j, j1, 2,...,k
- LI1 min(xi)-(1/2)
- LS1 LI1 a
- LI2 LS1
- LS2 LI2 a
- .....
21Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Respuesta Confeccionar la tabla aplicando el
procedimiento anterior
Elementos de una tabla de frecuencia cuando la
variable es continua (x)
LI1 LS1
LI2 LS2
LIk LSk
aj (LSj LIj))
cj (LIj) LSj )/2
22Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Ejercicio confección de una tabla de frecuencia
para una variable continua
Los datos corresponden a la edad de los hijos de
los trabajadores de una empresa
Realice la siguiente actividad
- Construya un Diagrama de Tallo y Hoja
- Cuál es la variable? Cuál es la Unidad de
análisis? Cuánto vale n? Cuál es el rango de
la variable?. - Sobre una Tabla de frecuencia Cuántos
intervalos podría construir? Cuál es la
amplitud de cada intervalo? Cuántas medidas de
frecuencia puede obtener para cada intervalo?. - Construir tabla de frecuencia para la variable
Intervalos, centro de clase, amplitud,
frecuencias.
Datos ordenados de menor a mayor
Diagrama de Tallo y Hoja permite organizar los
datos de una variable medida sobre un conjunto de
individuos. Su utilidad viene dada cuando no
contamos con herramientas automáticas para
ordenar los datos.
Mónica Catalán Reyes-2004
23Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
1. Gráfico de Sectores Circulares (de Torta)
TIPOS DE GRÁFICOS
24Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
TIPOS DE GRÁFICOS
2. Gráfico de Barras
- Este tipo de gráfico se utiliza generalmente para
representar la frecuencia de las categorías de
una variable cualitativa. - Cuando una variable es cuantitativa se puede
utilizar este tipo de gráfico sólo si la variable
se ha transformada en categorías. - Hay distintas versiones de estos gráficos (por
ejemplo en Excel), y en algunos casos son muy
útiles para describir el comportamiento de una
variable en distintos grupos.
25Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
TIPOS DE GRÁFICOS
3. Histograma
Histograma Distribución de los hijos de
trabajadores de la empresa de acuerdo a edad
- Histograma
- - Permite la representación de la frecuencia de
una variable Cuantitativa. - El eje x se refiere a la variable.
- El eje y se refiere a la frecuencia (Nº , ).
- Cada barra representa la frecuencia de la
variable en la población en estudio (o la
muestra). - El histograma se puede construir desde los datos
de la tabla de frecuencia de la variable en
estudio.
Nº
edad
Ejemplo En el gráfico se puede observar el número
de hijos de menor edad (7-8 años), las de mayor
edad (13-14 años) y además que la mayoría de
hijos de los trabajadores están entre los 10 y 12
años.
26Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
TIPOS DE GRÁFICOS
5. Polígono de Frecuencia
Distribución de los hijos de trabajadores de la
empresa de acuerdo a edad
- Esta representación se basa en el Histograma.
- Sólo es útil para variables cuantitativas.
- El eje x se refiere a la variable.
- El eje y se refiere a la frecuencia (Nº , ).
- Los puntos que permiten la unión de las líneas
representa el centro de clase (o marca de clase).
edad
Nº
27Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
TIPOS DE GRÁFICOS
5. Diagrama de Caja
Edad de las personas que se realizaron
angioplastía entre 1980 y 2000
- Permite identificar gráficamente la media, los
percentiles 25 y 75, mínimo y máximo de una
variable. - Sólo es útil para variables cuantitativas.
- El eje x permite identificar la poblacion en
estudio. - El eje y representa los valores de la variable
en estudio.
28Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
TIPOS DE GRÁFICOS
5. Diagrama de Caja
Edad de las personas que se realizaron
angioplastía entre 1980 y 2000
máximo
Percentiles 75
media
- Permite identificar gráficamente la media, los
percentiles 25 y 75, mínimo y máximo de una
variable. - Sólo es útil para variables cuantitativas.
- El eje x permite identificar la poblacion en
estudio. - El eje y representa los valores de la variable
en estudio.
media
Percentil 25
mínimo
29Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
TIPOS DE GRÁFICOS
5. Diagrama de Caja
Edad de las personas que se realizaron
angioplastía entre 1980 y 2000
máximo
Medidas Descriptivas Mujeres Hombres
N 584 1473
Media (o promedio) 63,3 59,2
Varianza 109,6 111,9
Desv.Típica (o Desv. Estándar) 10,5 10,6
Coeficiente Variación 0,2 0,2
Mínimo 25 23
Percentil 25 57 52
mediana 64 59
Percentil 75 70 67
Máximo 93 92
Moda 66 56
Percentiles 75
media
media
Percentil 25
mínimo
30Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
TIPOS DE GRÁFICOS
6. Otros
31Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
TIPOS DE GRÁFICOS
OBSERVACIONES El Tipo de Gráfico seleccionado
va a depender de la variable en estudio. El
Gráfico debe contener un Título General y la
identificación de cada eje (variable en estudio y
frecuencia). En ocasiones resulta más
ilustrativo un gráfico que una tabla de
frecuencia. Al igual que las tablas, los
gráficos deben ser auto-explicativos.
32Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
NOTACION
Variables Cuantitativas
OBSERVACIONES El Tipo de Gráfico seleccionado
va a depender de la variable en estudio. El
Gráfico debe contener un Título General y la
identificación de cada eje (variable en estudio y
frecuencia). En ocasiones resulta más
ilustrativo un gráfico que una tabla de
frecuencia. Al igual que las tablas, los
gráficos deben ser auto-explicativos.
33Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
- Media Aritmética (Promedio)
- Mediana
- Moda
MEDIDAS DE TENDENCIA CENTRAL
Datos Cuantitativos
Datos Cuantitativos ordenados de menor a mayor
Mediana
Media Aritmética o Promedio
Si n es impar
Si n es par
Moda
Datos Cualitativos y Cuantitativos
34Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
- Percentil (ejemplo 25, 50, 75)
- Decil (ejemplo 4, 5, 8)
- Cualtil (ejemplo 1, 2, 3)
Percentiles, Deciles o Cuartiles
Percentil, Decil o Cuartil corresponde al valor
que toma la variable (cuantitativa), cuando los n
datos están ordenados de Menor a Mayor
El Percentil va de 1 a 100 El percentil 25
(25/100) es el valor de la variable que reúne al
menos el 25 de los datos Ejemplo Si N80, el
25 de 80 es 20 por lo tanto, se busca el dato
que este en la posición 20. Si
N85, el 25 de 85 es 21,25 por lo tanto se
busca el dato que este en la posición 22.
El Decil va de 1 a 10 El Decil 4 (4/10) es el
valor de la variable que reúne al menos el 40 de
los datos Ejemplo Si N80, el 40 de 80 es 32
por lo tanto, se busca el dato que este en la
posición 32. Si N85, el 40 de
85 es 34 por lo tanto se busca el dato que este
en la posición 34.
El Cuartil va de 1 a 4 El Cuartil 3 (3/4) es el
valor de la variable que reúne al menos el 75 de
los datos Ejemplo Si N80, el 75 de 80 es 60
por lo tanto, se busca el dato que este en la
posición 60. Si N85, el 75 de
85 es 63,75 por lo tanto se busca el dato que
este en la posición 64.
35Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
- Rango
- Varianza
- Desviación Estándar
MEDIDAS DE DISPERSIÓN
Varianza
Datos Cuantitativos
Rango
Desviación Estándar
Comparación entre Variables Se refiere al
comportamiento de las variables cuantitativas en
un grupo. Por ejemplo Si se tiene un conjunto de
personas a las que se les mide Estatura, Peso,
Edad Entre estas variables cuál presenta mayor
variación?
Coeficiente de Variación
36Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
- Asimetría
- Kurtosis o Apuntamiento
Otras medidas o Coeficientes
Además de la posición y la dispersión de los
datos, otra medida de interés en una distribución
de frecuencias es la simetría y el apuntamiento o
kurtosis.
Si CA0 si la distribución es simétrica alrededor
de la media. Si CAlt0 si la distribución es
asimétrica a la izquierda Si CAgt0 si la
distribución es asimétrica a la derecha
Coeficiente de Asimetría
- Si CAp3 la distribución se dice normal
(similar a la distribución normal de Gauss) y
recibe el nombre de mesocúrtica. - Si CApgt3, la
distribución es más puntiaguda que la anterior y
se llama leptocúrtica, (mayor concentración de
los datos en torno a la media). - Si CAplt3 la
distribución es más plana y se llama platicúrtica.
Coeficiente de Apuntamiento
37Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
- Asimetría
- Kurtosis o Apuntamiento
Otras medidas o Coeficientes
Ejemplos
38Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
- Asimetría
- Kurtosis o Apuntamiento
Otras medidas o Coeficientes
Ejemplos
Histograma
Medidas descriptivas
Datos
Media 3,9
Error típico 0,30
Mediana 4
Moda 4
Desviación estándar 1,67
Varianza de la muestra 2,78
kurtosis -0,43
Coeficiente de asimetría -0,02
Rango 6
Mínimo 1
Máximo 7
Cuenta 30
1 4 4
1 4 4
1 4 5
2 4 5
2 4 6
2 4 6
2 4 6
3 4 6
3 4 7
4 4 7
39Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Rango Intercuatilico (RI) es la diferencia
entre el tercer y el primer cuartil RIC3-C1
Del ejemplo anterior se tiene que
Q1C13 y Q3C35 por lo tanto RI 5-32
- Comparación de la Media y la Mediana Robustez
- Los datos atípicos son datos extremos o lejanos
de la mayoría de las observaciones. - La media y la mediana tienen un comportamiento
diferente frente a los datos atípicos - La media en su calculo considera todos los datos,
incluyendo los datos atípicos. - La mediana es una medida que se ve poco afectada
por los datos atípicos, no los considera en su
calculo dado que separa los datos. - Sobre la base de lo anterior, la mediana es una
medida robusta en comparación con la media.
40Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Media, Desviación típica, Coeficientes de
Asimetría y Apuntamiento para datos Agrupados
(tabla de frecuencias)
2) La Desviación típica para datos agrupados esta
dada por
Tabla de frecuencia (para variable cuantitativa)
n1
f1
n2
f2
3) El Coeficiente de Asimetría para datos
agrupados esta dado por
fk
nk
Sea cj la marca de clase (o centro de clase) y fj
la frecuencia relativa de la clase j, donde j1,
2,, k.
1) La Media para datos agrupados es igual a la
suma de los productos de las marcas de clase por
sus frecuencias relativas, de la forma
4) El Coeficiente de apuntamiento para datos
agrupados esta dada por
41Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Media, Desviación típica, Coeficientes de
Asimetría y Apuntamiento para datos Agrupados
(tabla de frecuencias)
Tabla de frecuencia (para variable cuantitativa)
5) La Mediana para datos agrupados es igual a la
clase o intervalo que concentra al menos el 50
de los datos. Para esto se observan las
frecuencias relativas acumuladas
n1
fa1
FA1
f1
n2
f2
FA2
fa2
fk
nk
6) El cuartil 1 (Q1 o C1) para datos agrupados es
igual a la clase o intervalo que concentra al
menos el 25 de los datos. Observar las
frecuencias relativas acumuladas.
Sea cj la marca de clase (o centro de clase), fj
la frecuencia relativa de la clase j, donde j1,
2,, k. Sea Faj la frecuencia absoluta acumulada
de la clase j y faj la frecuencia relativa
acumulada de la clase j, donde j1, 2,, k.
6) El cuartil 3 (Q3 o C3) para datos agrupados es
igual a la clase o intervalo que concentra al
menos el 75 de los datos. Observar las
frecuencias relativas acumuladas.
Se pueden obtener percentiles y deciles
42Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Descripción de 2 variables cualitativas
Distribución conjunta
Problema Interesa estudiar cual es el principal
medio de transporte preferido por un grupo de
personas a la hora de dirigirse al centro
comercial. Para esto se consultó a cada persona
sobre la actividad a la que se dedicaba y el
medio de transporte preferido.
Tabla 1 Actividad
Transporte Estudia Pensionado Trabaja
Autobus 5 7 0
Bicicleta 3 3 2
Caminar 2 5 2
Coche 5 4 5
Metro 6 7 4
Transporte Nº
Autobus 12 20,0
Bicicleta 8 13,3
Caminar 9 15,0
Coche 14 23,3
Metro 17 28,3
TOTAL 60 100
Actividad Nº
Estudia 21 35,0
Pensionado 26 43,3
Trabaja 13 21,7
TOTAL 60 100
43Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Descripción de 2 variables cualitativas
Distribución conjunta Nº de personas
Tabla 2 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
Bicicleta 3 3 2 8
Caminar 2 5 2 9
Coche 5 4 5 14
Metro 6 7 4 17
TOTAL 21 26 13 60
Actividad confeccionar tabla con porcentajes
respecto del total de personas (n60)
44Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Descripción de 2 variables cualitativas
Distribución conjunta Nº de personas y
respecto de tipo de Transporte
Tabla 3 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
41,7 58,3 0 100
Bicicleta 3 3 2 8
37,5 37,5 25 100
Caminar 2 5 2 9
22,2 55,6 22,2 100
Coche 5 4 5 14
35,7 28,6 35,7 100
Metro 6 7 4 17
35,3 41,2 23,5 100
TOTAL 21 26 13 60
35 43,3 21,7 100
45Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Descripción de 2 variables cualitativas
Distribución conjunta Nº de personas y
respecto de tipo de Actividad
Tabla 4 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
23,8 26,9 0 20
Bicicleta 3 3 2 8
14,3 11,5 15,4 13,3
Caminar 2 5 2 9
9,5 19,2 15,4 15
Coche 5 4 5 14
23,8 15,4 38,5 23,3
Metro 6 7 4 17
28,6 26,9 30,8 28,3
TOTAL 21 26 13 60
100 100 100 100
46Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
- Resumen análisis de frecuencia de 2 variables
cualitativas - Si tenemos dos variables cualitativas podemos
construir una tabla de doble entrada con las
frecuencias absolutas Fij, donde i1, 2,, m y
j1, 2,, k. - La frecuencia relativa conjunta se obtiene
dividiendo cada Fij por n y se escribe fij. - La distribución marginal de la 1ª variable se
obtiene calculando -
i1,2,,m - La distribución marginal de la 2ª variable se
obtiene calculando -
j1,2,,k - La distribución condicionada se refiere a
estudiar la distribución de una variable dado un
nivel o categoría de la otra variable.
47Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Descripción de 2 variables cuantitativas
Distribución conjunta
Problema Interesa estudiar el numero de piezas
que se le cambiaron a las máquinas que fallaron
un número determinado de veces en un año. Para
esto se tiene el registro de una partida de 104
máquinas que presentaron fallas en una región.
Nº fallos
Nº piezas 1 2 3 Total
0 4 5 2 11
1 2 8 6 16
2 3 9 4 16
3 2 6 12 20
4 5 15 21 41
Total 16 43 45 104
- Calcular lo siguiente
- Distribución relativa conjunta
- Distribución del número de fallos condicionada a
3 piezas. - La media del numero de fallos
- La media del numero de piezas
- La media del numero de fallos condicionada a las
2 piezas
Nº piezas Nº máquinas
0 11
1 16
2 16
3 20
4 41
Total 104
Nº fallas Nº maquinas
1 16
2 43
3 45
Total 104
48Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Descripción de 2 variables cuantitativas
Solución
Problema Interesa estudiar el numero de piezas
que se le cambiaron a las máquinas que fallaron
un número determinado de veces en un año. Para
esto se tiene el registro de una partida de 104
máquinas que presentaron fallas en una región.
Distribución relativa conjunta
x y Nº fallos
Nº piezas 1 2 3 Total
0 0,038 0,048 0,019 0,106
1 0,019 0,077 0,058 0,154
2 0,029 0,087 0,038 0,154
3 0,019 0,058 0,115 0,192
4 0,048 0,144 0,202 0,394
Total 0,154 0,413 0,433 1
Media Nº de piezas2,62
Media de fallos2,28
distribución del numero de fallas condicionada a 3 piezas distribución del numero de fallas condicionada a 3 piezas distribución del numero de fallas condicionada a 3 piezas distribución del numero de fallas condicionada a 3 piezas distribución del numero de fallas condicionada a 3 piezas
Nº fallos
Nº piezas 1 2 3 Total
x3 0,1 0,3 0,6 1
la media de fallos condicionada a 3 piezas es la media de fallos condicionada a 3 piezas es la media de fallos condicionada a 3 piezas es la media de fallos condicionada a 3 piezas es 2,50
- Calcular lo siguiente
- Distribución relativa conjunta
- Distribución del número de fallos condicionada a
3 piezas. - La media del numero de fallos
- La media del numero de piezas
- La media del numero de fallos condicionada a las
2 piezas
Nº piezas 1 2 3 Total
x2 0,1875 0,5625 0,25 1
la media de fallos condicionada a 2 piezas es la media de fallos condicionada a 2 piezas es la media de fallos condicionada a 2 piezas es la media de fallos condicionada a 2 piezas es 2,06
Cov(x,y) (0. 1 .0,038 0. 2 .0,048 4. 3
.0,202)- 2,62.2,28 6,19-5,96 0,23
49Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Descripción de 2 variables cuantitativas
- Si se tienen 2 variables cuantitativas discretas
que se miden a un conjunto de unidades se puede
construir - Tablas de doble entrada de frecuencias a
absolutas y de frecuencias relativas. - Distribución marginal de cada variable.
- Distribución de una variable condicionada a una
categoría de la otra.
Distribución conjunta
Frecuencia Absolutas
Frecuencia Relativas
Medidas que se pueden calcular
Covarianza de x con y
Media o promedio de x y de y
Desviación típica de x y de y
Correlación de x con y
50Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Ejemplo 1 Sobre los datos que se tienen para el
curso Aplicar todo lo visto hasta ahora sobre
estadística descriptiva, no olvide identificar el
problema, la unidad de análisis, las variables en
estudio (definición de cada una de ellas donde se
identifique la unidad de medida para las
variables cuantitativas y las categorías de las
variables cualitativas).
51Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Datos Cuantitativos
MEDIDAS DE ASOCIACIÓN LINEAL
Recordemos que Hasta ahora hemos estudiado las
medidas tendencia central (Media, Mediana, Moda)
y dispersión (Varianza y Desviación Estándar)
para una Variable Cuantitativa (x).
Covarianza
Es una medida de Variabilidad Conjunta entre dos
variables (x1 , x2) o bien (x , y)
Si Cov(x,y) es positiva la asociación entre x e
y es directamente proporcional, es decir que
cuando x aumenta y también aumenta y
viceversa. Si Cov(x,y) es negativa la asociación
entre x e y es inversamente proporcional, es
decir que cuando x aumenta y disminuye y
viceversa. Si Cov(x,y) es cero no existe
asociación entre x e y.
52Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Datos Cuantitativos
MEDIDAS DE ASOCIACIÓN LINEAL
Se refiere al grado de asociación entre dos
variables (x1 , x2) o bien (x , y)
Correlación
Coeficiente de Correlación de Pearson (r) Mide
el grado de Asociación Lineal entre dos variables
Cuantitativas
Si r es positivo la asociación entre x e y es
directamente proporcional, es decir que cuando x
aumenta y también aumenta y viceversa. Si r1
la asociación lineal es perfecta. Si r es
negativo la asociación entre x e y es
inversamente proporcional, es decir que cuando x
aumenta y disminuye y viceversa. Si r-1 la
asociación lineal es perfecta. Si r es cero no
existe asociación entre x e y.
53Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
EJEMPLO Representación gráfica de las variables
x e y
r1
r-1
54Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Datos Cuantitativos
REGRESION LINEAL SIMPLE
Objetivo 2 Estudiar si los valores de una
variable pueden ser utilizados para predecir el
valor de la otra
Objetivo 1 Determinar si dos variables están
asociadas y en qué sentido se da la asociación.
Determinar si existe relación entre las variables
x e y Coeficiente de Correlación
Estudiar la dependencia de una variable respecto
de la otra Modelo de Regresión
Términos Variable Respuesta (variable
dependiente) Variable Explicativa (variable
Independiente) Relación Lineal (modelo
lineal) Parámetros (intercepto y
pendiente) Intercepto (respuesta media) Pendiente
(efecto de la variable explicativa sobre la
respuesta) Error (residuo)
55Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Datos Cuantitativos
REGRESION LINEAL SIMPLE
Notación Variable Respuesta y Variable
Explicativa x Modelo de Regresión Lineal Simple
yi??xiei Intercepto ? Pendiente ? Error e
Modelo Estimado (recta de regresión)
Método de Estimación Mínimos Cuadrados
Residuos o Errores
56Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
REGRESION LINEAL SIMPLE
MODELO DE REGRESIÓN LINEAL SIMPLE yi??xiei
ERRORES
DATOS
MODELO ESTIMADO
Desviación típica residual sr Representa la
variabilidad promedio de los datos observados con
relación a la recta de regresión.
ESTIMADORES
57Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
REGRESION LINEAL SIMPLE
Una Variable Respuesta (y) una Variable
Explicativa (x)
MODELO ESTIMADO
MODELO DE REGRESIÓN LINEAL SIMPLE yi??xiei
Desviación típica residual sr Representa la
variabilidad promedio de los datos observados con
relación a la recta de regresión.
y
Recta estimada
x
58Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
REGRESION LINEAL SIMPLE
EJEMPLO Aplicación del Modelo de Regresión
Lineal Simple
Problema 1 Se cuenta con las mediciones sobre la
edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de
relación entre la talla del niño y su edad.
59Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
REGRESION LINEAL SIMPLE
EJEMPLO Aplicación del Modelo de Regresión
Lineal Simple
Problema 1 Se cuenta con las mediciones sobre la
edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de
relación entre la talla del niño y su edad.
- Interpretación de los resultados
- - Existe asociación o dependencia entre la Talla
del niño y la edad (r0,88) a medida que la edad
aumenta la talla aumenta. - Desde los resultados del modelo de regresión
lineal simple, se tiene que la talla media de un
niño es de 53,64 cm. Cuando la edad del niño
(meses) aumenta en una unidad la talla se
incrementa en 2,44 cm.
60Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
REGRESION LINEAL SIMPLE
EJEMPLO Aplicación del Modelo de Regresión
Lineal Simple
Problema 1 Se cuenta con las mediciones sobre la
edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de
relación entre la talla del niño y su edad.
De acuerdo al coeficiente de determinación, el
modelo ajustado a los datos es adecuado (R2
cercano a 1)
61Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Algunos Gráficos que se observan en Regresión
Histograma para la variable Talla (y)
Diagrama de Dispersión Edad (x) v/s Talla (y)
Recta de regresión estimada
Histograma para los errores (e)
- La media de los errores o residuos es cero.
- La desviación típica residual, representa la
variabilidad promedio de los datos observados con
relación a la recta de regresión.
62Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
- Correlación y causalidad
- Si el coeficiente de correlación entre dos
variables es alto (cercano a -1 o a 1), indica
que estas dos variables toman valores que están
relacionados entre si, pero no permite concluir
una relación causal entre esas variables. - Ejemplo se tienen dos variables el número de
matrimonios mensual en una ciudad y la
temperatura promedio mensual en un periodo
determinado. El coeficiente de correlación entre
estas dos variables es igual a 0,70. - Las dos variables muestran una asociación, pero
no podemos pensar que el número de matrimonios
aumente con la temperatura, ni que una ola de
calor produzca mayor numero de matrimonios. - A este tipo correlación se denomina correlación
espuria.
63Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Programa de la asignatura
1. Análisis de datos.2. Análisis de datos
bivariantes.3. Correlación y regresión.4.
Series temporales y números índice.5.
Probabilidad.6. Variables aleatorias.7. Modelos
discretos.8. Modelos continuos.9. Variables
aleatorias multidimensionales la distribución
normal bivariante.
64Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Series Temporales
- Introducción
- Clasificación de las series temporales (serie
estacionaria y serie no estacionaria) - Descomposición básica de una serie temporal
(tendencia, estacionalidad, componente irregular) - Análisis de la tendencia (método de la tendencia
determinista, método de la tendencia evolutiva y
método de diferenciación de la serie) - Análisis de la estacionalidad (tabla de doble
entrada, coeficiente de estacionalidad y
desestacionalización de la serie)
Resumen de conceptos involucrados Una serie
temporal puede ser estacionaria o no
estacionaria. Una serie temporal esta compuesta
por la tendencia (creciente o decreciente), la
estacionalidad y un componente irregular. El
análisis de la tendencia se puede realizar a
través del método de la tendencia determinista
(recta de regresión), método de la tendencia
evolutiva (media móvil de orden tres y de orden
cinco) y método de diferenciación de la serie. En
el análisis de estacionalidad se organizan los
datos en una tabla de doble entrada, se calculan
coeficientes de estacionalidad y se realiza una
desestacionalización de la serie.
65Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Series Temporales
1.- Introducción Una serie temporal corresponde
a una variable registrada a lo largo del tiempo.
La variable será de tipo cuantitativa y la
unidad de tiempo estará dado según el registro de
esa variable, este puede ser cada hora,
diariamente, semanalmente, mensualmente,
anualmente, etc. El análisis de series
temporales tiene como fin explicar la evolución
de una variable en el tiempo y prever sus valores
futuros.
- Ejemplos
-
- El ingreso diario de pacientes a la unidad de
emergencia de un hospital la variable es el
número de pacientes que ingresan y la unidad de
tiempo es diariamente. - En un supermercado se tienen las ventas semanales
de un producto determinado la variable es el
número de ventas del producto y la unidad de
tiempo es semanalmente. - Una empresa estudia la tasa de ausentismo laboral
mensual en un periodo de 10 años La variable es
la tasa de ausentismo y la unidad de tiempo es
mensualmente. - En un país se realiza un estudio sobre la
proporción de mujeres que ingresan a la
universidad sobre el total de ingresos anuales
desde el año 1980 a 2006 la variable es la
proporción de mujeres y unidad de tiempo es
anualmente.
66Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Series Temporales
- Representación gráfica de una serie temporal
- La representación gráfica principal de una serie
de tiempo es por medio de un gráfico temporal. -
- El gráfico temporal se construye situando los
valores que toma la serie en el eje de las
ordenadas (eje y) y los instantes temporales
correspondientes en el eje de las abscisas (eje
x). - En el cuadro 1 se puede observar 4 tipos de
series para distintas variables medidas en las
unidades de tiempo correspondiente. - Serie A Número de reclamaciones semanales
presentadas en el servicio de atención al cliente
de una empresa de servicios (30 semanas). - Serie B Número de Ventas cuatrimestrales de un
nuevo producto (30 cuatrimestres correspondiente
a 7 años y medio) - Serie C Número de pasajeros mensuales
transportados por avión en vuelos internacionales
(144 meses correspondiente a 12 años). - Serie D Precio diario de una acción en dólares
(100 días).
67Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Series Temporales
Cuadro 1 Grafico temporal para la serie A, serie
B, serie C y serie D.
68Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Series Temporales
- 2.- Clasificación de las series temporales
- Las series temporales se clasifican inicialmente
en dos grupos, serie estacionaria y serie no
estacionaria. - SERIE ESTACIONARIA
- En esta serie la media y la variabilidad son
constantes en el tiempo. - En el gráfico temporal se observa que los
valores que toma la serie tienden a oscilar
alrededor de una media constante, y la
variabilidad de la serie respecto de la media
permanece también constante en el tiempo. - Para este tipo de serie tiene sentido calcular
la media y la desviación estándar (o típica) y
construir un histograma. - Un ejemplo se observa en cuadro 2 y cuadro 3.
69Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Series Temporales
2.- Clasificación de las series temporales Las
series temporales se clasifican inicialmente en
dos grupos, serie estacionaria y serie no
estacionaria. SERIE ESTACIONARIA
Cuadro 2 Grafico de una serie temporal
estacionaria.
Cuadro 3 Histograma de una serie temporal
estacionaria.
70Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Series Temporales
- 2.- Clasificación de las series temporales
- Las series temporales se clasifican inicialmente
en dos grupos, serie estacionaria y serie no
estacionaria. - SERIE NO ESTACIONARIA
- En esta serie la media y/o la variabilidad
cambian a lo largo del tiempo. - El cambio de la media se traduce en la presencia
de una tendencia a crecer o decrecer, por lo que
la serie no tiende a oscilar alrededor de un
valor constante o de referencia. - Este tipo de series son dinámicas o evolutivas.
- Una serie no estacionaria puede ser estacional,
es decir, que la serie tiene una pauta de
evolución que se repite de un año a otro. - Es importante destacar que por definición, una
serie anual no puede ser nunca estacional, sin
embargo las series mensuales o diarias pueden
presentar estacionalidad, debida al mes o al día. - Ejemplos de series estacionarias se observan en
el cuadro 4.
71Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Series Temporales
2.- Clasificación de las series temporales Las
series temporales se clasifican inicialmente en
dos grupos, serie estacionaria y serie no
estacionaria.
Cuadro 4 Gráfico temporal para la serie B, serie
C y serie D.
La serie B y la serie D son no estacionales.
La serie C es estacional tiene una pauta de
evolución que se repite
72Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Series Temporales
- 3.- Descomposición básica de una serie temporal
- Los métodos descriptivos clásicos pueden
aplicarse a series temporales estacionarias, pero
no para las no estacionarias. - Una serie no estacionaria presenta unas
características que permiten descomponerla. En
éstas se puede identificar una tendencia
constante o no constante y también se puede
observar la estacionalidad. - La descripción de una serie temporal supone que
la serie observada es la suma de tres componentes
distintos
- La tendencia que se identifica con un movimiento
suave de la serie a largo plazo. Es una pauta
regular que evoluciona lentamente en el tiempo
creciendo o decreciendo, tal como se observa en
el cuadro 5. - La estacionalidad que son movimientos de
oscilación dentro del año, tal como se observa en
el cuadro 6. - El irregular que incluye las variaciones
aleatorias alrededor de los componentes
anteriores.
73Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Series Temporales
2.- La estacionalidad
3.- Descomposición básica de una serie temporal
Tendencia, Estacionalidad y componente Irregular
1.- La tendencia
Cuadro 5 Gráfico temporal para series con
tendencia creciente y decreciente.
74Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Series Temporales
3.- Descomposición básica de una serie temporal
Tendencia, Estacionalidad y componente Irregular
2.- La estacionalidad
Cuadro 6 Gráfico temporal de la serie C que es
creciente y presenta estacionalidad (en los meses
de enero de cada año hay menor Nº de pasajeros
que en julio)
75Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Series Temporales
3.- Descomposición básica de una serie temporal
Tendencia, Estacionalidad y componente Irregular
La serie temporal no estacionaria se puede
escribir como
Valor observado tendencia estacionalidad
irregular
donde Tt es la tendencia, St es la estacionalidad
e It el componente irregular.
76Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Series Temporales
- 4.- Análisis de la tendencia
- Para analizar la tendencia de una serie
partiremos del supuesto que la serie no tiene
estacionalidad (la estacionalidad se verá más
adelante). - Es decir, la serie a analizar es no
estacionaria, no tiene estacionalidad, puede
presentar una tendencia creciente o decreciente y
posee un componente aleatorio irregular, esto se
representa por el siguiente esquema
Valor observado tendencia irregular
- Para calcular la tendencia se puede plantear una
hipótesis sobre la forma de Tt tenemos dos
casos - Suponer que Tt es una función determinista del
tiempo, por ejemplo una línea recta. Bajo este
supuesto estudiaremos un método de tendencia
determinista. - Suponer que Tt es una función no determinista
desconocida, pero que evoluciona suavemente a lo
largo del tiempo. Bajo este supuesto estudiaremos
un método de tendencia evolutiva.
M1
M2
Un método más general consiste en no hacer
ninguna hipótesis sobre la forma de la ecuación
de la tendencia a corto plazo y suponer que la
tendencia evoluciona lentamente en el tiempo, de
manera que en el instante t debe ser próxima a la
tendencia en el instante t-1. Para esto
estudiaremos un método de diferenciación de la
serie que elimina la tendencia de la serie.
M3
77Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Series Temporales
4.- Análisis de la tendencia
M1 Método de tendencia determinista Representamo
s la tendencia de una serie temporal por una
línea recta. La ecuación de la recta se calculará
mediante una ecuación de regresión donde la
variable dependiente es la serie observada y la
variable explicativa es el tiempo.
Considerando
El objetivo es obtener la tendencia y
posteriormente el componente irregular. La
tendencia en t esta dada por la siguiente
ecuación de regresión
Donde a y b son constantes a determinar y t es la
variable tiempo.
Para obtener la pendiente (b) y el intercepto (a)
de la recta, se debe calcular lo siguiente
La componente irregular estará dada por
La tendencia estará dada por
78Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Series Temporales
4.- Análisis de la tendencia
M1 Método de tendencia determinista Los datos
se organizarán de la siguiente forma
Datos observados Datos observados Datos a estimar Datos a estimar
t xt Tt It
1 x1 T1 I1
2 x2 T2 I2
3 x3 T3 I3
N xN TN IN
La componente irregular estará dada por
La tendencia estará dada por
79Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Series Temporales
4.- Análisis de la tendencia
M1 Método de tendencia determinista Ejemplo
Para la Serie B, presentada en el cuadro 1,
correspondiente a las ventas cuatrimestrales de
un nuevo producto, se realiza un análisis de la
tendencia mediante la recta de regresión.
Recordar que esta serie no es estacionaria y se
analiza bajo el supuesto que no tiene
estacionalidad.
donde xt venta, Tt tendencia e It es el
componente irregular o residuo en el tiempo t.
- La tendencia se estima mediante un modelo de
regresión
- La variable tiempo (t ) toma los valores del 1
al 30.
- La media para el tiempo es
- La varianza para el tiempo es
- La media de la serie de ventas es
- La covarianza entre la serie de ventas y la
variable t es
- La pendiente de la recta de regresión es
- El intercepto de la recta de regresión es
- La tendencia estimada esta dada por
- Los residuos o componente irregular están dados
por
80Introducción a la Estadística Licenciatura en
administración y dirección de Empresas (LADE)
UC3M-2007
Series Temporales
4.- Análisis de la tendencia
M1 Método de tendencia determinista Ejemplo
Para la Serie B, presentada en el cuadro 1,
correspondiente a las ventas cuatrimestrales de
un nuevo producto, se realiza un análisis de la
tendencia mediante la recta de regresión.
Recordar que esta serie no es estacionaria y se
analiza bajo el supuesto que no tiene