Title: CYTED Reunin de Anual 2006 Proyecto 606PI0294
1CYTED Reunión de Anual 2006 Proyecto 606PI0294
David Sol, Tecnológico de Monterrey, Campus Puebla
Integración y Minado de datos geoespaciales,
Base para la interfaz y la visualización de datos
geoespaciales
2Participantes
- Antonio Razo, Informática y GeoSistemas GML y
Tecnologías de Interoperabilidad y Visualización - Genoveva Vargas, CNRS Visitante en México
Integración de datos y aplicaciones distribuidas - Alberto Oliart, Tecnológico de Monterrey Campus
Puebla Especificación formal - Alfredo Sánchez Huitrón, Universidad de las
Américas Servicios digitales geográficos - Manuel Pech, Tecnológico de Chetumal, Minería de
datos - David Sol Tecnológico de Monterrey Campus
Puebla Indexación, minería de datos geoespaciales
3Contexto
- Problema de integración
- Antes aplicaciones independientes
- Ahora necesidad de integración, estándares
- Problemas de existencia de datos
- Disponibilidad de datos técnica y social
- Integración por áreas de interés
- Concentración
- Regulación
- Minado de bases de datos geoespaciales
4Objetivo
- Crear una infraestructura que permita la
interoperabilidad y buen uso de datos geográficos
Servidor
Servidor
Datos
Datos
5Para
- Integrar datos y enriquecer la información
- Estados, Municipios, Organizaciones
- Ofrecer servicios para dominios más específicos
como - Desarrollo sustentable
- Transportes
- Prevención de desastres
- Salud
- Desarrollo Empresarial
- Cuidado del medio ambiente
6Problemática
- Alto costo en licencias de productos comerciales
- Datos Heterogéneos
- Escasez de Datos
- Falta de un esquema nacional de datos
- Necesidad de servicios más completos
7Propuestas de Solución (Código Abierto)
- Uso de tecnologías de código abierto, es decir
código que se distribuye bajo una licencia que
garantiza el derecho de leer, distribuir,
modificar y usar el software gratis
http//www.opensource.org - Acelerar el desarrollo GIS
- Productos de calidad en constante desarrollo y
con buena documentación y soporte técnico - Se basan en estándares internacionales (OpenGIS)
- La economía del código abierto se basa en
servicios a la medida y consultoría
8Marco de Interoperabilidad (GML, Formato abierto)
- Lenguaje de Marcado Geográfico (OpenGIS), es una
gramática XML definida en un Esquema XML para el
modelado, transporte y almacenamiento de
información geográfica - Representa la información geográfica en forma de
texto
9Modelo de dato geográfico
10Situación Actual de GML
- Es más que OGC Simple Features (version 2.X) y
además conforme a ISO (19100 series). - Representa fenómenos geoespaciales manejando
features con geometrías en 3D, topología 2D,
features con propiedades temporales, features
dinámicos, coberturas, observaciones - Representa sistemas de referencia espacial y
temporal, unidades de medición - Usa sistemas de referencia, unidades e
información sobre estándares en la representación
de fenómenos geoespaciales, observaciones y
valores - Representa estilos por defecto para visualización
de features y coberturas
11GML en el mundo
- La Agencia Nacional de Mapas del Reino Unido
adoptó desde hace varios años GML como un medio
para almacenar y distribuir la información
geográfica de toda Inglaterra. Actualmente están
migrando sus datos a GML 3 y compañías como
Galdos manejan el formato en base a los esquemas
desarrollados por dicha agencia.
http//www.ordnancesurvey.co.uk/ - GML También se ha convertido en clave para la
estandarización del desarrollo de
Infraestructuras de Datos Geoespaciales de Canadá
12Infraestructura de de Datos Geoespaciales de
Canadá
- Geoconnections es la iniciativa Canadiense
dirigida por Recursos Naturales de Canadá, la
cual coordina un proyecto para hacer la
información geoespacial de Canadá accesible por
internet. La cual tiene dos tareas principales - Facilitar la creación de la Infraestructura de
Datos Geoespaciales de Canadá (CGDI), la cual
armonizará las bases de datos geoespaciales de
Canadá y las hará accesibles en la Web. - Coordinar las investigaciones y desarrollos de
los socios federales, provinciales, territoriales
y del sector privado y de las universidades que
están creando los estándares, protocolos,
procedimientos de acceso y mantenimiento a las
colecciones de datos geoespaciales de Canadá.
http//www.geoconnections.org
13IDEMex
- La Infraestructura de Datos Espaciales de México
(IDEMex) se refiere al concepto sistémico que
permite ordenar y facilitar la participación
interinstitucional bajo esquemas de
administración eficiente y aprovechamiento óptimo
de los recursos para la generación de datos e
información geográfica. Con esta noción, una IDE
se refiere al conjunto de recursos, normas,
tecnologías, políticas, marcos legal,
administrativo y organizacional, necesarios para
la efectiva creación, recopilación, manejo,
acceso, distribución, compartición y uso de datos
espaciales en el país. - FGDC como marco de construcción de IDEMex
- INEGI, SEMARNAT, CENAPRED
14Conclusión Integración
- El consorcio OpenGeoSpatial trabaja en el
desarrollo de varias especificaciones que son
críticas para el desarrollo de futuros sistemas
espaciales distribuidos. Estas especificaciones
incluyen interfaces para - Consultar features geoespaciales, WFS
- Describir estilos de mapas
- Consulta y generación de mapas
- Definición y consulta de transformación de
coordenadas - Consultas geo-codificadas y de revistas
electrónicas - Anotaciones de imágenes y mapas
- Cada una de estas especificaciones se pueden
describir en GML.
15Descubrimiento de Conocimiento en Bases de Datos
(KDD)
- Se define como la extracción no trivial de
información implícita, previamente desconocida y
potencialmente útil a partir de datos
generalmente almacenados en grandes bases de
datos. - Es un proceso interactivo e iterativo que
involucra varias fases.
16KDD Process
17Minería de Datos
- La fase del minado de datos es el núcleo del
proceso. - Minería de datos consiste en la aplicación de
algoritmos de análisis y descubrimiento que, bajo
parámetros aceptables de eficiencia
computacional, producen un conjunto particular de
patrones a partir de los datos mismos.
18Minería de Datos Espaciales
- Los datos espaciales son datos describiendo
fenómenos producidos en, sobre ó bajo la
superficie terrestre. - La minería de datos espaciales se centra en el
descubrimiento de conocimiento implícito y
previamente desconocido en datos espaciales
almacenados en bases de datos espaciales.
19Grafos para la Representación de Capas
GeoEspaciales
20Grafos para la Representación de Capas
GeoEspaciales
21Minería de DatosEjemplos con el Padrón de 1777
- La mayor parte de la población que habita 150
metros alrededor de la iglesia representativa en
la parroquia El Sagrario(65), no declaró su
pertenencia a ningún grupo étnico. Esto
significa, en términos de Demografía Histórica,
una factible disolución del estamento racial para
la conformación de grupos o clases, en favor del
cohesionamiento por factores diferentes a éste,
tales como, el ingreso en el trabajo, tipo de
redes familiares (cómo viven y con quién viven),
niveles de consumo y tipo de vivienda.
22Minería de DatosEjemplos con el Padrón de 1777
- Características de la población que habita en un
rango de 50 metros a ambos lados del río. Existe
una modificación en el criterio de los barrios
San francisco, El Alto Xonaca, Los Remedios y por
el lado Poniente, San José, El Sagrario y El
Carmen. Existe predominancia de asentamientos
Mestizos y casi en la misma proporción de
Españoles. Esto sugiere que fungieron como
intermediarios entre el grupo de Españoles e
Indefinidos en el lado Poniente y con el de
Indígenas en el lado Oriente.
23Arquitectura General
24Gracias por su Atención
-
- http//www.davidsol.org
- dsol_at_itesm.mx