Introduccion ILI280 - PowerPoint PPT Presentation

About This Presentation
Title:

Introduccion ILI280

Description:

Se toma una muestra de cinco pernos y se mide su largo ... Los pernos medidos se dejan a un lado y se toma otra muestra de cinco pernos. ... – PowerPoint PPT presentation

Number of Views:57
Avg rating:3.0/5.0
Slides: 39
Provided by: sergioanto1
Category:

less

Transcript and Presenter's Notes

Title: Introduccion ILI280


1
CapĆ­tulo 1 IntroducciĆ³n II- 2001
2
  • QuĆ© es la estadĆ­stica ?
  • Ciencia dedicada al estudio sistemĆ”tico de los
    datos
  • Transforma datos en informaciĆ³n
  • Contribuye a la generaciĆ³n de conocimiento
  • Historia de la estadĆ­stica
  • Como ciencia de Estado (2600 A.C.)
  • Como cĆ”lculo de probabilidades (siglo XVIII)
  • Rol de la estadĆ­stica
  • Proporcionar mĆ©todos para evaluar y juzgar la
    teorĆ­a y la realidad

3
  • USOS
  • Ciencias naturales
  • Ciencias econĆ³micas
  • Ciencias polĆ­ticas y sociales
  • Ciencias mĆ©dicas etc.
  • ABUSOS
  • Encuestas de opiniĆ³n
  • ƍndices econĆ³micos
  • PronĆ³sticos

4
La EstadĆ­stica en la era de la InformaciĆ³n Destrez
as lectoras para la sociedad del Conocimiento
EL PENSAMIENTO ESTADƍSTICO El pensamiento
estadĆ­stico algĆŗn dĆ­a serĆ” parte del ciudadano
eficiente, y tan necesario como la habilidad para
leer y escribir
W. H. WELLS
5
DATOS
MODELOS
HECHOS
TEORƍAS
FENƓMENOS
INTUICIONES
6
Dos ejemplos de investigaciones estadĆ­sticas
CĆ³mo diseƱar un equipo de mantenimiento
CĆ³mo aumentar el rendimiento de un proceso
PREGUNTA
MODELO
  • Variables
  • - NĆŗmero de averĆ­as (x1)
  • - Tiempo reparaciĆ³n (x2)
  • HipĆ³tesis las averĆ­as
  • Se producen independientemente
  • La probabilidad de no averĆ­a disminuye
    exponencialmente con el tiempo
  • HipĆ³tesistiempo reparaciĆ³n
  • Depende de muchos pequeƱos factores
  • Variables
  • - Rendimiento en (y)
  • - Temperatura x1
  • - ConcentraciĆ³n x2
  • HipĆ³tesis
  • El rendimiento aumenta en promedio linealmente
    con la temperatura y la concentraciĆ³n
  • Para valores fijos de x1 y x2 el rendimiento
    varĆ­a aleatoriamente alrededor de su valor medio

7
RECOLECCIƓN DE INFORMACIƓN
Muestreo de mƔquinas para estudiar sus averƭas y
tiempo de reparaciĆ³n
DiseƱo de un experimento que se varƭen x1 y x2
y se mida y
ESTIMACIƓN PARƁMETROS
  • Estimar
  • ? , tasa media de averĆ­as
  • ? , tiempo medio de reparaciĆ³n
  • ? , variabilidad en el tiempo de reparaciĆ³n
  • Estimar
  • El efecto de la temperatura (b) y el de la
    concentraciĆ³n (c) sobre el rendimiento
  • Variabilidad experimental

CONTRASTES DE SIMPLIFI- CACIƓN
Tienen todos los tipos de mƔquinas el mismo ?
? Los tipos de averĆ­as, el mismo ? y ? ?
Es el efecto de la temperatura y concentraciĆ³n
idƩntico (bc ) ?
CRƍTICA DEL MODELO
Es cierta la independencia entre las
averĆ­as? Son la variabilidad de x1 y x2 en la
muestra consistentes con las hipĆ³tesis ?
Es la relaciĆ³n entre y (x1 , x2) lineal? Es la
variabilidad de y para x1, x2 fijos, independ. de
los valores concretos de x1, x2 ?
8
Problema real
Planteamiento del problema Objetos y medios
Modelos Estadƭsticos (CƔlculo de probabilidades)
RecolecciĆ³n de informaciĆ³n muestral (TĆ©cnicas de
muestreo diseƱo de experimentos)
DepuraciĆ³n de los datos (AnĆ”lisis de datos)
EstimaciĆ³n de los parĆ”metros (TeorĆ­a de la
estimaciĆ³n)
9
Contrastes de SimplificaciĆ³n (Contrastes de
hipĆ³tesis)
Crƭtica y Diagnosis del Modelo (AnƔlisis de datos)
Es un modelo adecuado ?
Nuevo Conocimiento
Previsiones
Decisiones
10
La estadĆ­stica en el nuevo mundo Era Industrial
Era de la informaciĆ³n GestiĆ³n
del Conocimiento
InformaciĆ³n
Datos
EstadĆ­stica
  • Problemas que resuelve la EstadĆ­stica
  • AnĆ”lisis de datos (Data Mining)
  • VerificaciĆ³n de hipĆ³tesis (DSS)
  • Patrones de Reconocimiento
  • Procesamiento de ImĆ”genes

11
Muestreo
  • Costo reducido
  • Mayor rapidez
  • Mayor posibilidad (Sistemas complejos)
  • APLICACIONES
  • Mercadotecnia
  • AnĆ”lisis de ImĆ”genes
  • Modelos de SimulaciĆ³n

12
TeorĆ­a de muestreo
  • PoblaciĆ³n finita
  • PoblaciĆ³n infinita

Muestreo
ProbabilĆ­stico
No ProbabilĆ­stico
  • DefiniciĆ³n del conjunto de muestras
  • AsignaciĆ³n de Probabilidad ( ?i )
  • SelecciĆ³n ( ?i )
  • EstimaciĆ³n

13
Medidas de Probabilidad
  • Probabilidad una medida de la certidumbre
  • La confiabilidad de una Inferencia
  • AproximaciĆ³n frecuentista - A Priori
  • Pr (Ai) n/N
  • n nĆŗmero de todas las posibles formas en que
    Ai puede ser observado
  • N nĆŗmero total de posibles resultados
  • AproximaciĆ³n Subjectiva
  • Una OpiniĆ³n de Experto

14
PoblaciĆ³n
  • Conjunto de elementos u objetos - que obedecen a
    reglas de pertenencia definidas por el observador
    - de los cuales se desea conocer ciertos
    parƔmetros de comportamiento caracterƭsticos de
    la PoblaciĆ³n.
  • Cada sujeto o elemento de la PoblaciĆ³n es una
    observaciĆ³n. Cada uno es una incognita en el
    sentido que puede tener uno de los tantos valores
    posibles de observar de cierta caracterĆ­stica.
  • La PoblaciĆ³n puede ser
  • Finita si los elementos son contables
  • Infinita si los elementos son enumerables

15
PoblaciĆ³n DefiniciĆ³n
La TeorĆ­a de Muestreo pretende desarrollar
mƩtodos para obtener un conocimiento adecuado de
ciertas caracterĆ­sticas de una PoblaciĆ³n,
mediante el estudio de un nĆŗmero reducido de
elementos u objetos representativos de dicha
PoblaciĆ³n
16
Planes de Muestreo
  • Muestreo Aleatorio Simple
  • Muestreo Estratificado Aleatorio
  • Muestreo SistemĆ”tico
  • Muestreo por Conglomerado
  • Muestreo MĆŗltiple

17
Muestreo
  • Experimento Un proceso de ObservaciĆ³n
  • Evento Simple Un Resultado de un experimento
    que no puede ser descompuesto
    -Mutuamente Excluyente
    -IdƩntica Posibilidad
  • Espacio Muestral El conjunto de todos los
    resultados posibles
  • Evento A El conjunto de todos los eventos
    simples que pertenecen al resultado A

18
Espacio Muestral
  • Conjunto de todos los resultados u observaciones
    que se pueden observar al realizar un experimento
  • Puede ser
  • Discreto
  • Continuo

Sea n TamaƱo de la Muestra
N TamaƱo de la PoblaciĆ³n
Si i 1, 2, .... todas las muestras
posibles Si se denomina el Espacio Muestral o
Universo
19
ClasificaciĆ³n de MĆ©todos de Muestreo
  • 1.- Por la Forma de Considerar un Evento
  • Sin ReposiciĆ³n
  • Con ReposiciĆ³n
  • 2.- Por la Forma de Tomar la Muestra
  • Juicio
  • Aletaroria - Simple
  • - SistemĆ”tica
  • - Estratificada
  • - Conglomerados
  • 3.- Por el nĆŗmero de Muestras
  • Simple
  • MĆŗltiple

20
Muestreo Aleatorio
  • Conjunto de observaciones tomadas de una
    PoblaciĆ³n.
  • Se dice que la muestra es aleatoria cuando la
    manera de selecciĆ³n de cada elemento de la
    poblaciĆ³n tiene igual oportunidad de ser
    seleccionado.
  • El mĆ©todo de selecciĆ³n es decisivo en las
    conclusiones que se pueden obtener de la muestra.

21
Tipo de Variable
Tanto en la escala intervalar como en la de razĆ³n
es posible distinguir dos tipos de variables
aleatorias Variables Discretas una que puede
tomar sus valores de un conjunto de puntos
aislados (subconjunto de valores en R) Variables
Continuas una que puede tomar sus valores en un
conjunto donde todos sus elementos son puntos de
acumulaciĆ³n (un intervalo en R). Siempre es
posible tratar una variable continua como
discreta mediante la construcciĆ³n de intervalos
de clase representando cada uno de los
intervalos por su valor medio denominado marca
de clase Variables CategĆ³ricas o
Cualitativas Variables Cuantitativas
22
EstimaciĆ³n
ParƔmetro Medida para describir alguna
caracterĆ­stica de los elementos de una PoblaciĆ³n,
tal como Valor Esperado, Moda o Varianza
poblacional. Estos guarismos son valores
verdaderos, pero deconocidos. EstadĆ­stica (
EstadĆ­grafo) Medida para describir una
caracterĆ­stica de la Muestra, tal como Promedio,
Varianza o Moda muestral. Estos valores son
calculados a partir de la Muestra, pero son
valores aproximados de los parƔmetros que
representan
23
Muestreo Aleatorio Simple M.A.S.
  • Es un mĆ©todo de selecciĆ³n de n unidades sacadas
    de N, de tal manera que cada una de las muestras
    C(N,n) tiene la misma probabilidad de ser
    escogida.
  • En la prĆ”tica un m.a.s. es sacado unidad por
    unidad
  • Las unidades de la poblaciĆ³n son numerados
  • del 1 al N.
  • A continuaciĆ³n son seleccionados n nĆŗmeros
  • aleatorios entre 1 y N, ya sea de tablas o de
    una
  • urna como en la loterĆ­a

24
Muestreo Estratificado Aleatorio
Se emplea cuando la poblaciĆ³n estĆ” agrupada en
pocos estratos, cada uno de ellos con muchos
individuos. Consiste en sacar un m.a.s. de
cada uno de los estratos. Los Estratos, por lo
general, son de diferente tamaƱo la muestra, por
consiguiente, para ser representativa debe
contener elementos de cada estrato en forma
proporcional a la poblaciĆ³n. (Esto se llama
afijaciĆ³n proporcional, la que no siempre resulta
ser la mƔs conveniente por cuanto los costos de
muestreo en cada uno de los estratos pueden ser
distintos).
25
Muestreo SistemƔtico
  • Se utiliza cuando las unidades de la poblaciĆ³n
    estĆ”n, de algĆŗn modo, totalmente ordenadas. Para
    seleccionar una muestra se aprovecha la
    ordenaciĆ³n de las unidades.
  • Para seleccionar una muestra de tamaƱo n
  • se divide la poblaciĆ³n en n subpoblaciones
  • de tamaƱo K N/n
  • se toma una unidad al azar de la primera
  • subpoblaciĆ³n y
  • de ahĆ­ en adelante cada k-Ć©sima unidad.
  • Si n1 es la unidad seleccionada de la primera
    poblaciĆ³n, entonces las siguientes observaciones
    serĆ”n n2 ? n1K, n3 ? n2K Ć³ n12K

26
Muestreo por Conglomerado
Se emplea cuando la poblaciĆ³n estĆ” dividida en
grupos pequeƱos. Consiste en obtener una m.a.s.
de algunos grupos y luego censar cada uno de
estos. Hay dos razones para principales para la
extensa aplicaciĆ³n de estos planes de muestreo
falta de una lista confiable de elementos en la
poblaciĆ³n y consideraciones del tipo econĆ³mica.
27
Muestreo por MĆŗltiple (doble)
  • La muestra se toma en dos pasos
  • en el primero se selecciona la muestra de
  • unidades primarias y
  • en la segunda se selecciona una muestra de
  • elementos a partir de cada unidad primaria
  • escogida

28
Ejemplo 1
  • Se tienen 2000 pernos en una urna
  • El largo de cada perno puede estar entre 99,5 y
    100,5 mm
  • Se toma una muestra de cinco pernos y se mide su
    largo
  • Cada observaciĆ³n es una variable aleatoria
    continua. Todas obedecen a la misma distribuciĆ³n
    y son independientes entre si
  • Los pernos medidos se dejan a un lado y se toma
    otra muestra de cinco pernos. De continuar asĆ­ a
    habrĆ” observado toda la poblaciĆ³n
  • Hacer un grĆ”fico de barras histograma con la
    frecuencia que aparece cada nĆŗmero
  • Variable Aleatoria ? Continua
  • PoblaciĆ³n ? Finita
  • Espacio Muestral ? Finito

29
Ejemplo 2
  • Se tiene 2000 pernos en una urna
  • El largo de cada perno puede estar entre 99,5 y
    100,5 mm
  • Se toma una muestra de cinco pernos y se mide su
    largo
  • Cada observaciĆ³n es una variable aleatoria
    continua. Todas obedecen a la misma distribuciĆ³n
    y son independientes entre si
  • Por pernos medidos se devulven a la urna y se
    toma otra muestra de cinco pernos. El experimento
    se puede repetir indefinidamente, porque siempre
    existirƔn 2000 pernos en la urna
  • Variable Aleatoria ? Continua
  • PoblaciĆ³n ? Finita
  • Espacio Muestral ? Infinito

30
EstƔticos
DinƔmicos
y ? u (Primera parte)
Extrapolativos
y ? ? yt-1 ut (Quinta parte)
Explicativos
y ? ? x u (Tercera y cuarta parte)
y ? ? x ? yt-1 ut (Quinta parte)
31
MĆ©todos EstadĆ­sticosenDATA MINING
32
Knowledge Discovery in Data Bases (KDD)
Es un proceso de identificaciĆ³n de patrones
vĆ”lidos, innovativos, potencialmente Ćŗtiles, no
explĆ­citos y comprensibles a partir de los datos.
33
KDD
Etapas del KDD 1. Data Selection 2. Cleaning 3.
Enrichment 4. Coding 5. Data Mining 6. Reporting
34
KDD
35
Data Mining (DM)
Etapa de reconocimiento de patrones, a travƩs de
algoritmos automƔticos o semiautomƔticos de
grandes bases de datos con el objeto de apoyar a
la toma de decisiones dentro de una organizaciĆ³n.
36
Algoritmos en DM
  • Existen diversos algoritmos en Data Mining los
    que se pueden clasificar
  • Machine Learning
  • Pattern Recognition
  • Actividades de Data Mining
  • PreparaciĆ³n de los datos
  • AplicaciĆ³n de algoritmos de DM
  • AnĆ”lisis de datos

37
DM
  • Algoritmos de DM
  • AsociaciĆ³n de datos (ANN)
  • Pattern recognition (Time Series)
  • Clustering
  • ClasificaciĆ³n
  • RegresiĆ³n
  • PronĆ³sticos

38
Aplicaciones de DM
  • EnergĆ­a Apoyo a la toma de decisiones en plantas
    energƭa elƩctrica (centro de despacho de cargas)
  • Medicina Mejora de diagnĆ³sticos y asignaciĆ³n
    de tratamientos en base a reconocimiento de
    patrones.
  • Marketing informaciĆ³n demogrĆ”fica y sistemas
    geo-referenciados, patrones de compra,
    segmentaciĆ³n de mercados.
  • Finanzas predicciĆ³n de valores y riesgo en el
    mercado de opciones.
Write a Comment
User Comments (0)
About PowerShow.com