Title: Ing. Juan Trejo Bed
1MUESTREO BÁSICO
2MUESTREO ALEATORIO SIMPLE (M.A.S.)
3MUESTREO ALEATORIO SIMPLE (M.A.S.)
- Método de selección de la muestra en un paso
- El marco muestral debe ser una lista completa
- Cada unidad tiene la misma probabilidad de
selección - Esta probabilidad es p n/N
- donde n es el tamaño de la muestra
- y N es el tamaño de la población
- Cada muestra (de n) tiene la misma probabilidad
de selección
4Muestreo Aleatorio Simple
- Población N 54 viviendas
- Muestra n 18
- Fracción muestral p n / N 18 / 54 1/3
- Cada vivienda tiene probabilidad de selección 1/3
- Se seleccionan 18 números aleatorios entre 1 y 54
- Se seleccionan las viviendas correspondientes
5Muestreo Aleatorio Simple
San José
San Luis
Av 28 de Julio
Av. circunvalación
San Pablo
San Carlos
San Ricardo
San Roberto
San Benito
Santo domingo
San Pedro
6Muestreo Aleatorio Simple
San José
San Luis
Av. 28 de Julio
Av Circunvalación
San Pablo
San Carlos
San Ricardo
San Roberto
San Benito
Santo Domingo
San Pedro
7Muestreo Aleatorio Simple
San José
San Luis
Av. 28 de Julio
Av Circunvalación
San Pablo
San Carlos
San Ricardo
San Roberto
San Benito
Santo Domingo
San Pedro
8Muestreo Aleatorio Simple
- Ventajas del MAS
- Sencillez conceptual
- Necesita como marco muestral sólo una lista de
todos los elementos de la población - Es fácil calcular las estimaciones de valores
poblacionales - Es fácil calcular las estimaciones de precisión
(varianza muestral)
9Muestreo Aleatorio Simple
- Desventajas del MAS
- Tedioso eligir todos los números aleatorios si n
es grande - No utiliza información auxiliar sobre la
población - Necesita una lista completa de los elementos de
la población - Puede tener baja precisión comparado con otros
métodos
10Muestreo Aleatorio Simple
- El MAS se puede realizar
- Con reposición (MASCR)
- Sin reposición (MASSR)
11Muestreo Aleatorio Simple
- MASCR
- Seleccionar una unidad
- Reemplazarla en la población
- Seleccionar otra, de la población completa
- Continuar hasta obtener una muestra de tamaño n
- Se puede seleccionar la misma unidad más que una
vez
12Muestreo Aleatorio Simple
- MASSR
- Seleccionar una unidad
- Sacarla de la población
- Seleccionar otra unidad de las que quedan y
sacarla - Continuar hasta obtener n unidades distintas
- Cada unidad puede estar incluida una sola vez
- Es más eficiente que el MASCR
- Se usa en la práctica
13Ejemplo del MAS
- Encuesta de las empresas sobre Gastos en insumos
- Población de seis empresas (N 6)
- Propósito estimar gastos para compras de insumos
- Presupuesto permite sólo una muestra de dos
empresas (n 2)
14Ejemplo del MAS
- Población completa
- Empresa Gastos
- 1 26,000
- 2 470,000
- 3 63,800
- 4 145,000
- 5 230,000
- 6 12,500
- Total 947,300
15- Muestras Gastos Estimación
- posibles observados del total
- (1,2) 496,000 1,488,000
- (1,3) 89,800 269,400
- (1,4) 171,000 513,000
- (1,5) 256,000 768,000
- (1,6) 38,500 115,500
- (2,3) 533,800 1,601,400
- (2,4) 613,000 1,845,000
- (2,5) 700,000 2,100,000
- (2,6) 482,500 1,447,500
- (3,4) 208,800 626,400
- (3,5) 293,800 881,400
- (3,6) 76,300 228,900
- (4,5) 375,000 1,125,000
- (4,6) 157,500 472,500
- (5,6) 252,500 727,500
- 15 muestras posibles promedio 947,300/6
insesgado
16- ESTIMACION DEL TAMAÑO DE MUESTRA - MAS
-
- VARIABLES CUANTITATIVAS
-
Elementos para calcular un tamaño de muestra
- Información anterior de promedios y varianzas de
variables relacionadas con la investigación
(Censos, encuestas, pilotos).
- Elegir un nivel de confianza ( 90, 95,
99) . Generalmente para estudios
macroregionales, regionales, locales se elige
95. Es decir Z K
1.96 (abscisa de la distribución Normal)
3. Decidir sobre el margen de error (e ) que
estamos dispuestos a tolerar (Error máximo
permisible Error Absoluto aceptado).
( e d . ? Donde d Error Relativo
Aceptado).
4. Tamaño de la Población ( N )
17Fórmula para estimar el tamaño de la muestra
(M.A.S.)
e Margen de error. Es el error absoluto del
Promedio Poblacional ( e d . ? ) d Es el
error relativo aceptado (precisión)
18MUESTREO ALEATORIO PARA PROPORCIONES VARIABLES
CUALITATIVAS O DE ATRIBUTOS
POBLACIÓN (N)
X
?
? Número de elementos en la población, que
tienen alguna característica o atributo, o que
caen dentro de alguna clase.
ESTIMADOR DE LA PROPORCION POBLACIONAL
Proporción muestral
n
Estimador del Total de Clase Poblacional
19- VARIANZA DE LA PROPORCION Y DEL TOTAL DE CLASE
MUESTRALES - MAS - En el muestreo aleatorio sin reposición las
varianzas de la - Proporción muestral y del Estimador del Total de
Clase están dadas respectivamente por
VARIANZA DE LA PROPORCION MUESTRAL
VARIANZA DEL ESTIMADOR DEL TOTAL DE CLASE
donde es la tasa muestral o fracción de
muestreo
20- ESTIMACION DEL TAMAÑO DE MUESTRA - MAS
- (VARIABLES CUALITATIVAS O DE ATRIBUTOS)
- Tenemos que
Tal que, el error de estimación no debe ser mayor
que un valor dado e ( ERROR MAXIMO PERMISIBLE
O ERROR ABSOLUTO ACEPTADO)
e d.P d error relativo aceptado (precisión)
21ERROR RELATIVO ACEPTADO
COEFICIENTE DE VARIACIÓN
PRECISION Error Máximo Permisible () d NIVEL DE CONFIANZA ( ) NIVEL DE CONFIANZA ( ) NIVEL DE CONFIANZA ( )
PRECISION Error Máximo Permisible () d Z 1.645 90 Z 1.96 95 Z 2.38 98
10 74
7 152
5 296
1 890
- MODELO DE MATRIZ PARA ESTIMAR EL TAMAÑO DE
MUESTRA
22ERROR RELATIVO ACEPTADO
COEFICIENTE DE VARIACIÓN
PRECISION Error Máximo Permisible () d NIVEL DE CONFIANZA ( ) NIVEL DE CONFIANZA ( ) NIVEL DE CONFIANZA ( )
PRECISION Error Máximo Permisible () d Z 1.645 90 Z 1.96 95 Z 2.38 98
10 53 74 105
7 107 152 214
5 210 296 418
2 325 890 1370
- MODELO DE MATRIZ PARA ESTIMAR EL TAMAÑO DE
MUESTRA
23 24QUÉ ES UN MUESTREO SISTEMATICO?
- Es otro muestreo que también le asigna igual
probabilidad de inclusión uniforme para todos,
como el simple al azar. - Nuevamente esta probabilidad es n/N.
- Es conveniente por su simplicidad ya que se
necesita sólo un número aleatorio. - Fácil de seleccionar en campo o durante el
operativo - Se logra en general una muestra más
representativa de la población.
25QUÉ ES UN MUESTREO SISTEMATICO? (cont.)
- No es necesario conocer el tamaño de la población
N si se conoce la fracción de muestreo. - Origina muestras bien dispersas desde el punto de
vista geográfico. - Se emplea generalmente en las últimas etapas en
diseños en varias etapas o más complejos.
26Cómo se selecciona una muestra sistemática?
- Paso 1 Fijar el tamaño de la muestra, n.
- Paso 2 Determinar un paso o intervalo,IN/n.
- Seleccionar un número al azar entre 1 y I sea
ese número igual a k. - Seleccionar las unidades k, kI, k2I, k3I,
k4I,...... Hasta llegar a completar las n
necesarias.
27Cómo se selecciona una muestra
sistemática?(cont.)
- Muestreo Sistemático Circular, útil cuando n
no es múltiplo de N.
28MUESTREO SISTEMATICO Ejem. 1
- Población de tamaño N 30, muestras posibles
sistemáticas de tamaño n 6. - Intervalo selección k N / n 30/6 5
- Muestras posibles de tamaño n 6
- 1ra muestra 1 6 11 16 21
26 - 2da muestra 2 7 12 17 22
27 - 3ra muestra 3 8 13 18 23
28 - 4ta muestra 4 9 14 19 24
29 - 5ta muestra 5 10 15 20 25 30
29Ejem. 2 Seleccionar muestra de n 20 empresas
de lista de N 500 empresas
- Esto significa que 1 de cada 25 empresas de la
población se seleccionará - Utilizando al azar seleccionamos un número
entre 1 y 25. - Suponga que el seleccionado es 7.
- Entonces la 1ra empresa. selecc. es el 7.
- Las otras 19 empresas de la muestra se obtienen
sumando al 7 el intervalo de selección 25. - Es decir 07, 32, 57 , ..........
30Ejem.2 La muestra de n 20 empresas
seleccionadas de N 500 empresas es
- 07 32 57 82 107
- 132 157 182 207 232
- 257 282 307 332 357
- 382 407 432 457 482
- Una ventaja del método sistemático es que la
muestra se distribuye por igual en los diversas
empresas. - Una M.A.S. tomada de la población no posee esta
propiedad.
31Muestreo Estratificado Aleatorio (M.E.A.)
32Muestreo estratificado
- Proceso de división de la población en grupos
homogeneos llamados estratos, para luego
seleccionar muestras independientes en cada
estrato - Variables de estratificación pueden ser
geográficas o no-geográficas - Estratificación se limita a los elementos de
información disponibles en el marco muestral
33RAZONES PARA LA ESTRATIFICACION
- Protegernos contra la posibilidad de obtener una
mala muestra.
2. La estratificación se utiliza para disminuir
las varianzas de los estimadores ( disminuir la
varianza para obtener estimaciones más precisas)
3. Se pueden formar estratos para aplicar
diferentes métodos y procedimientos de
muestreo dentro de cada estrato. (Selección de la
muestra y procedimientos de recojo de
información).
4. Los estratos pueden establecerse para dar
resultados a nivel de DOMINIOS DE ESTUDIO
(Nivel de inferencia)
34MUESTREO ALEATORIO ESTRATIFICADO ( MAE )
POBLACION
ESTRATOS
ESTRATO 1 (Empresas grandes)
N1
n1
ESTRATO 2 (Empresas medianas)
N2
n2
ESTRATO 3 (Empresas pequeñas)
N3
n3
35Muestreo estratificado
36Ejemplo 1 de M.E.A.Estratificacion de usuarios
de la empresa EDELNOR (parte de Lima)
37ESTRATIFICACION DE LA POBLACION DE 267,694
CLIENTES (EDELNOR)
Nº de estrato ESTRATOS (Sub-estaciones transformación) Nº de clientes (Tamaño del estrato) de clientes (Poderación del estrato)
h 1 Canto Grande N1 57,241 W1 21.4
h 2 Jicamarca N2 37,932 W2 14.2
h3 Mirones N3 41,157 W3 15.4
h4 Santa Rosa N4 66,440 W4 24.8
h5 Tacna N5 64,924 W5 24. 2
TOTAL N 267,694 100.0
38MUESTRA DE 500 CLIENTES DE LA POBLACION DE
267,694 CLIENTES (EDELNOR)
Nº de estrato ESTRATOS (Sub-estaciones transformación) de clientes (Poderación del estrato) Nº de clientes (Tamaño del estrato)
h 1 Canto Grande W1 21.4 n1 107
h 2 Jicamarca W2 14.2 n2 71
h3 Mirones W3 15.4 n3 77
h4 Santa Rosa W4 24.8 n4 123
h5 Tacna W5 24.2 n5 122
TOTAL 100.0 n 500
39RESULTADOS MUESTRALES DE 500 CLIENTES promedio
muestral mensual y desviación estándar de consumo
por estratos
N ESTRATOS Clientes nh Media Desviación estándar sh
1 Canto Grande 107 1,200 10,000
2 Jicamarca 71 800 6000
3 Mirones 77 3,000 30,000
4 Santa Rosa 123 2,350 25000
5 Tacna 122 2,100 20,000
TOTAL 500 2,000 22,000
40- AFIJACION DE LA MUESTRA
- Se da el nombre de afijación al reparto,
asignación o distribución de la muestra (n) entre
los diferentes estratos. Tal que
1. AFIJACION PROPORCIONAL
41- 2. AFIJACION DE NEYMAN ( O DE MINIMA VARIANZA)
- La afijación de Neyman o afijación de mínima
varianza, consiste en determinar los valores de
nh de forma que para un tamaño de muestra (n)
fijo, la varianza sea mínima.
42- 3. AFIJACION DE OPTIMA
- La afijación de óptima, consiste en minimizar la
varianza para un coste fijo. Es decir,
minimizar con la condición de que
NOTA Cuando Ch constante ? h, la Afijación
Optima coincide con la Afijación de Neyman
43Muestreo por conglomerados
44Muestreo por conglomerados
- Es un proceso de muestreo en dos pasos
- Agrupar la población en conglomerados que se
pueden identificar en mapas y en el terreno - Seleccionar una muestra de conglomerados y
entrevistar todos los elementos de aquellos
45Muestreo por conglomerados
- Conglomerados pueden ser agrupaciones naturales o
artificiales - Posiblemente disponibles de fuentes como el Censo
(manzanas, etc.) - Los que diseñan la encuesta tal vez tengan que
conformarlos
46Muestreo por conglomerados
- Se entiende la población como jerarquía de
unidades - personas viven en viviendas
- viviendas constituyen manzanas
- muchas manzanas hacen una ciudad
47 48- Muestra por conglomerados
49Muestreo por conglomerados
- Ventajas
- Se pueden utilizar aun cuando no haya lista de
unidades de la población - Para entrevistas personales, el tiempo y costo de
viajes se reduce muchísimo, sobre todo para
poblaciones rurales - Se necesita sólo una lista de conglomerados
- O la posibilidad de construirla
50Muestreo por conglomerados
- Desventajas
- Tendencia de unidades vecinas de ser semejantes
reduce la precisión - Dado n fijo, sería menos eficiente
- Pero si se consideran los costos en el terreno,
la posibilidad de aumentar n implica menor
pérdida de precisión en la práctica
51MUESTREO POR CONGLOMERADOS
- En el muestreo por conglomerados, los elementos
individuales de la población sólo pueden
participar en muestra si pertenecen a un
conglomerado (UPM) incluido en la muestra. - La UPM no es igual a la unidad de observación
(USM), y hay que tomar en cuenta los dos tamaños
de unidades experimentales al calcular los
errores muestrales de las muestras por
conglomerados.
52 PORQUE USAR MUESTREO POR CONGLOMERADOS ?
- La construcción de una lista de unidades de
observación para el marco de muestreo puede ser
difícil, cara e imposible. - La población podría estar muy dispersa
geográficamente o aparecer en cúmulos naturales,
como las escuelas, hospitales, manzanas,
familias. - El muestreo por conglomerados se utiliza en la
práctica debido a que es más barato y conveniente
obtener muestras por conglomerados que al azar
entre la población.
53MUESTREO POR CONGLOMERADOS
- La población está particionada en N conjuntos
que llamaremos Conglomerados - No se cuenta con una lista de unidades de la
población, pero se tiene una lista de los
conglomerados. - La forma de obtener una muestra consiste en
escoger n conglomerados, y en cada uno de ellos
se observan todas las unidades de población que
estaban en cada conglomerado selecionado. - Este procedimiento de obtener la muestra se
denomina muestreo por conglomerados.
54MUESTREO POR CONGLOMERADOS Ejemplo
- Número de niños por manzana
- Las 3510 manzanas de una ciudad se localizan en
90 poblados (urbanizaciones, AAHH y conjuntos
habitacionales). - El número de manzanas en las diferentes
urbanizaciones, AA.HH., C.H. no es el mismo . - Se selecciona una muestra aleatoria simple de 15
poblados y se determina el de niños por manzana.
55MUESTREO POR CONGLOMERADOS Ejemplo3
- Promedio de Niños por manzana 12.24
- La estimación de la varianza del promedio de
niños es de 0.5854 - El Error Muestral absoluto de la estimación de la
varianza del promedio de niños por manzana es la
Raíz cuadrada de 0.5854. Es decir - Error muestral 0.7651 niños por manzana
- Error muestral relativo .7651/12.24
- 6.25