Title: Curso de Estad
1Curso de Estadística Básica
SESION 1 INTRODUCCIÓN A LA ESTADÍSTICA
M. en C. José Gonzalo Lugo Pérez
2Objetivo
- Crear una imagen inicial del campo de la
estadística así como introducir y comprender los
términos básicos aplicados en su estudio.
3Agenda Sesión 1
- Introducción a la Estadística
- Términos básicos
- Recolección de datos
- Comparación entre la probabilidad y la
estadística - Proceso estadístico
4Qué es la estadística?
- Diccionario de la Real Academia Española
- Estudio de los datos cuantitativos de la
población, de los recursos naturales e
industriales, del tráfico o de cualquier otra
manifestación de las sociedades humanas. - Conjunto de estos datos.
- Rama de la matemática que utiliza grandes
conjuntos de datos numéricos para obtener
inferencias basadas en el cálculo de
probabilidades.
5Qué es la estadística?
- Medio para recolectar y representar grandes
cantidades de información - Medio para tomar decisiones de frente a la
incertidumbre
6(No Transcript)
7Qué es la estadística?
- Ciencia de recolectar, describir e interpretar
datos
8Caso
- Ocupar un asiento incómodo durante largos
periodos no es gracioso. Ocupar su sitio en el
asiento de un avión cuando se es más grande que
el promedio de la gente, puede ser verdaderamente
penoso.
9(No Transcript)
10Ejercicio
- Quién fue encuestado?
- Cuántos fueron encuestados?
- Explique el significado de Asientos estrechos en
aviones 99 - Porqué se han reportado porcentajes tan elevados?
11Ejercicio
- Determine cuál de las siguientes proposiciones es
de naturaleza descriptiva y cuál es inferencial. - Lo que menos agrada al 99 de todos los viajeros
robustos y altos son los asientos estrechos de
los aviones. - Lo que menos agrada al 99 de los 10 000 clientes
de la King-Size Co. Son los asientos estrechos de
los aviones.
12Términos Básicos
- Población
- Muestra
- Variable
- Dato
- Datos
- Experimento
- Parámetros
- Estadística
13Población
- Es la colección o conjunto de individuos, objetos
o eventos cuyas propiedades serán analizadas.
- Ejemplo de población bien definida
- Todos los estudiantes que han asistido alguna
vez a una universidad mexicana - El conjunto de trabajadores de la industria
entre 20 y 40 años en el Estado de Querétaro
14Muestra
- Es un subconjunto de la población
- Una muestra consta de los individuos, objetos o
medidas seleccionados de la población por el
recolector de la muestra
15Variable
- Característica de interés sobre cada elemento
individual de una población o muestra - Ejemplo La edad de un estudiante que ingresa a
la universidad, el color de su cabello, su
estatura y su peso
16Dato
- Valor de la variable asociada a un elemento de
una población o muestra. Este valor puede ser un
número, una palabra o un símbolo - Ejemplo José Hernández ingresó a la universidad
a la edad de 23 años, su cabello es café,
mide 1.80m y pesa 83 kg. Estas cuatro piezas
de datos son los valores de las cuatro variables
aplicadas a José Hernández.
17Datos
- Conjunto de valores recolectados para la variable
de cada uno de los elementos que pertenecen a la
muestra - Ejemplo El conjunto de 25 estaturas recolectadas
de 25 estudiantes.
18Experimento
- Actividad planeada cuyos resultados producen un
conjunto de datos - El experimento incluye las actividades para
seleccionar los elementos y obtener los valores
de los datos
19Parámetro
- Valor numérico que resume todos los datos de una
población completa. Es un valor que describe a
toda la población. - Ejemplo La edad promedio en el momento de
admisión de todos los estudiantes que han
asistido alguna vez a una universidad o la
proporción de estudiantes que tenían más de 21
años de edad cuando ingresaron a la universidad.
20Estadística
- Valor numérico que resume los datos de la
muestra. Es un valor que describe una muestra.
Casi todas las estadísticas muestrales se
determinan con ayuda de fórmulas y suele
asignárseles denominaciones simbólicas. - Ejemplo La estatura promedio encontrada al
utilizar el conjunto de 25 estaturas es un
ejemplo de una estadística muestral.
21Determinar los términos básicos...
- Una estudiante de estadística está interesada en
determinar algo sobre el promedio del valor en
pesos de los automóviles que pertenecen al cuerpo
docente de nuestra universidad. - Cada uno de los ocho términos descritos pueden
identificarse en esta situación
22Determinar los términos básicos...
- La población es la colección de todos los
automóviles que pertenecen a todos los miembros
del cuerpo docente de la universidad. - Una muestra es cualquier subconjunto de esa
población. Por ejemplo, una muestra serían los
automóviles que pertenecen a los profesores del
departamento de matemáticas. - La variable es el valor en pesos de cada
automóvil individual. - Un dato podría ser el valor en pesos de un
automóvil en particular. El automóvil del
profesor Juan Pérez está valuado en 100,000
pesos - Los datos serían el conjunto de valores que
corresponden a la muestra obtenida (100,000
148,000 30,000 23,000...) - El experimento serían los métodos aplicados para
seleccionar los automóviles que integren la
muestra y determinar el valor de cada automóvil
de la muestra. Podría efectuarse preguntando a
cada miembro del departamento de matemáticas o de
otras maneras. - El parámetro sobre el que se está buscando
información es el valor promedio de todos los
automóviles de la población. - La estadística que se encuentre es el valor
promedio de todos los automóviles de la muestra.
23Variable
Cualitativa
Cuantitativa
Variable que clasifica o describe un elemento de
una población. Las operaciones aritméticas como
sumar y obtener promedios no son significativas
para datos que resultan de una variable
cualitativa
Variable que cuantifica un elemento de una
población. Las operaciones aritméticas como sumar
y obtener promedios sí son significativas para
datos que resultan de una variable cuantitativa
24Ejercicio 1
- Un fabricante de medicamentos está interesado en
la proporción de personas que padecen
hipertensión (presión arterial elevada) cuya
condición pueda ser controlada por un nuevo
producto desarrollado por la empresa. Se condujo
un estudio en el que participaron 5000 personas
que padecen de hipertensión, y se encontró que
80 de las personas pueden controlar su
hipertensión con el medicamento. Suponiendo que
las cinco mil personas son representativas del
grupo con hipertensión, conteste las siguientes
preguntas - Cuál es la población?
- Cuál es la muestra?
- Identifique el parámetro de interés
- Identifique la estadística y proporcione su valor
- Se conoce el valor del parámetro?
25Ejercicio 2
- Un técnico de control de calidad selecciona
piezas ensambladas de una línea de montaje y
registra la siguiente información sobre cada
pieza - A defectuosa o no defectuosa
- B el número de identificación del trabajador que
ensambló la pieza. - C el peso de la pieza.
- cuál es la población?
- La población es finita o infinita?
- cuál es la muestra?
- Clasifique las respuestas para cada una de las
tres variables como datos de atributo o
cuantitativos.
26Ejercicio 3
- Identifique las siguientes expresiones como
ejemplos de variables de atributos (cualitativas)
o variables numéricas (cuantitativas) - La resistencia a la rotura de un tipo de cuerda
dado - El color de cabello de los niños que se presentan
a una audición para la revista musical Annie - El número de señales de alto que hay en
poblaciones con menos de quinientos habitantes - Si un grifo es o no defectuoso
- El número de reactivos contestados correctamente
en una prueba estandarizada - El tiempo necesario para contestar una llamada
telefónica en cierta oficina de bienes raíces.
27Recolección de Datos
- Definir los objetivos de la investigación o del
experimento. - Ejemplos comparar la eficacia de un nuevo
medicamento con la eficacia del medicamento
normal estimar el ingreso familiar medio en
algún municipio. - Definir la variable y la población de interés.
- Ejemplos duración del tiempo de recuperación de
los pacientes que sufren alguna enfermedad
particular ingreso total de los hogares en algún
municipio. - Definir los esquemas para recolectar y medir los
datos. - Esto incluye los procedimientos de muestreo, el
tamaño de la muestra y el instrumento de medición
(cuestionario, por teléfono, etc.) de los datos. - Determinar las técnicas idóneas para realizar el
análisis de datos descriptivas o inferenciales.
28Nota
- A menudo ocurre que un analista se encuentra con
datos ya recolectados, tal vez, incluso,
recolectados para otros fines, lo cual
imposibilita determinar si los datos son buenos
o no. Es mucho mejor recolectar los datos
propios. - A continuación se describe la población y la
variable de interés para una investigación
específica - La oficina de inscripciones de nuestra
universidad desea estimar el costo promedio
actual de los libros de texto por semestre, por
estudiante. La población de interés es la
matrícula estudiantil actual, y la variable es
la cantidad total gastada en libros de texto
por cada estudiante en este semestre.
29Métodos para recolectar datos
- Se controla o modifica el entorno y se observa el
efecto sobre la variable bajo estudio.
Experimento
- Los datos se obtienen al muestrear alguna parte
de la población de interés. - No se modifica el entorno
Encuesta
30Marco Muestral
- Es una lista de los elementos que pertenecen a la
población de la cual se obtendrá la muestra.
31Diseño de la Muestra
- Es importante que el marco muestral sea
representativo de la población. Una vez
establecido, se procede a la selección de los
elementos de la muestra. Este proceso de
selección se denomina Diseño de la Muestra. Este
se clasifica en dos categorías - Muestreo de Juicio (o de Selección intencional)
- Muestreo probabilístico
32Muestreo de Juicio (o de Selección intencional)
- Las muestras son elegidas con base en el hecho de
que son típicas
33Muestreo Probabilístico
- Son muestras en que los elementos a seleccionar
se obtienen con base en la probabilidad. Cada
elemento de una población tiene cierta
probabilidad de ser elegido como parte de la
muestra. Uno de los métodos más comúnmente
utilizado para recolectar datos es el muestreo
aleatorio.
34Muestreo Aleatorio
- Una muestra es seleccionada de modo que todos los
elementos de la población tienen la misma
probabilidad de ser elegidos. De igual manera,
todas las muestras de tamaño n tienen la misma
probabilidad de ser elegidas. Las muestras
aleatorias se obtienen por muestreo con
reemplazamiento en una población finita o por
muestreo sin reemplazamiento en una población
infinita.
35Ejemplo
- El señor Hernández quien trabaja en la oficina de
inscripciones, ha obtenido un listado por
computadora de la matrícula de tiempo completo
para este semestre. Hay 4265 nombres de
estudiantes en la lista. El señor Hernández
numeró los nombres de los estudiantes como 0001,
0002, 0003, etc., hasta 4265 luego, usando
números aleatorios de cuatro cifras, identificó
una muestra 1288, 2177, 1952, 2463, 1644, 1004,
etc.
36Ejercicio 4
- Considere una población simple que consta sólo de
los números 1, 2 y 3 (una cantidad ilimitada de
cada uno). Hay nueve muestras distintas de tamaño
dos que pueden obtenerse de esta población
(1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1),
(3,2), (3,3). - Explique porqué la lista anterior de muestras
representa todas las posibles muestras aleatorias
de tamaño dos que pueden extraerse aleatoriamente
de la población 1, 2, 3. - Si la población consta de los números 1, 2, 3 y
4, enumere todas las muestras de tamaño dos que
pueden elegirse. - Si la población consta de los números 1, 2 y 3,
enumere todas las muestras de tamaño tres que
pueden elegirse - Si la población consta de los números 1, 2, 3 y
4, enumere todas las muestras de tamaño tres que
pueden elegirse
37Probabilidad vs Estadística
La probabilidad es el vehículo de la estadística
38Ejercicio 5
- Clasifique cada una de las siguientes
afirmaciones como problema de probabilidad o de
estadística. - Determinar si un nuevo medicamento reduce el
tiempo de recuperación de cierta enfermedad. - Determinar la posibilidad de obtener cara
cuando se lanza una moneda - Determinar el tiempo de espera necesario para
pagar y salir de una tienda - Determinar la posibilidad de obtener una mano de
veintiuno - Determinar cuánto tiempo es necesario para
manejar un sondeo telefónico típico en una
oficina de bienes raíces - Determinar la duración de la vida de los focos de
100 watts producidos por una empresa - Determinar la posibilidad de extraer una bola
azul de un tazón que contiene 15 bolas, de las
cuales 5 son azules. - Determinar la resistencia al corte de los
remaches recientemente adquiridos por una
compañía para construir aviones.
39El proceso estadístico
Determinar lo que se quiere saber
Analizar las estadísticas. Determinar lo que
indican sobre la población
Recolectar datos
Análisis de datos