Title: Manejo de colecciones de datos cient
1Manejo de colecciones de datos cientÃficos en la
Web
- I Jornadas de Divulgación de TecnologÃas de
Información y Comunicaciones y el Desarrollo
SostenibleDTIC-UCVCaracas Julio 2005
Rodrigo Torréns, Zulay Méndez, Magdiel Ablan,
Rigoberto Andressen
Universidad de Los Andes, Centro Nacional de
Cálculo CientÃfico, Parque Tecnológico de Mérida
2Introducción
- Comentarios iniciales sobre
- Manejo de colecciones de datos en Venezuela
- Red de Estaciones Bio-climáticas de Mérida
- ECO-RED Venezuela
- Red ILTER (International Long Term Ecological
Research Network)
3Los datos producto de una investigación cientÃfica
- Los datos que yo necesito, existen?
- Dónde están?
- Cómo los obtengo?
Uso de tecnologÃas de información para
- Ubicar
- Accesar
- Recuperar
- Compartir
- datos
4Objetivos
Para lograr el Uso secundario y a largo plazo
de colecciones de datos cientÃficos
Se debeUbicar y recuperar informaciónGarantiz
ar permanencia de los datos en el tiempo
Herramientas organizativas y tecnológicas que
pueden hacer esto posible
5Herramientas
Herramientas organizativas y tecnológicas que
pueden hacer esto posible
6- " Datos sobre los datos " .
- "Nivel superior de la información, o
instrucciones que describen el contenido,
contexto, calidad, estructura, y accesibilidad
de una colección de datos especÃfica" (J.K.
Michener 1997).
Metadatos como parte de los datos
Metadatos externos al recurso de información
Meta-metadatos (colecciones de metadatos)
7- Preguntas que se deberÃan poder responder usando
metadatos - Qué datos describe una colección de datos
cientÃficos? - Quien produjo la colección?
- Porqué fue creada la colección?
- Cómo fue creada la colección?
- Cuan confiables son los datos. Qué problemas
persisten en la colección? - Cómo alguien puede obtener una copia de la
colección? - Quien escribió los metadatos?
8Ejemplos de metadatos y de comunidades que usan
metadatos
Muestra datos NBIIhttp//www.nbii.gov/
Documentación de datos geoespaciales (estándar
FGDC) http//cndg.clearinghouse.gub.uy
9Ejemplos de metadatos y de comunidades que usan
metadatos
Documentación de datos geoespaciales (Interfaz a
Clearinghouse FGDC y GCMD Data Documenter)
10Algunos de los estándares para metadatos
geoespaciales, biológicos y ambientales más
usados
- Â
- FGDC-CSDGM. Content Standard for Digital
Geospatial Metadata. Federal Geographic Data
Committe (1994) Datos geoespaciales.
www.fgdc.gov - FGDC-NBII. Perfil Biológico de FGDC. BiologÃa y
ciencias naturales. www.nbii.gov. - Global Change Master Directory Interchange Format
DIF. (1993) Ciencias de la Tierra.
gcmd.gsfc.nasa.gov - Darwin Core (DwC). Colecciones de Historia
Natural. - Descriptores para Metadatos no-geoespaciales.
NCEAS-LTER (1997) Datos ecológicos. Base del
estándar EML. lternet.washington.edu
11Manejo de colecciones de datos cientÃficos.
Algunas experiencias locales
Red de Estaciones Ecológicas de Venezuela
(ECORED)
Red de Estaciones Bioclimáticas del Estado
Mérida (redbc)
12Justificación
- Dificultades que existen en Venezuela para ubicar
y usar colecciones de datos bio-climáticos. - Interés de organizaciones, instituciones y
personas que tienen datos históricos los cuales
desean preservar o compartir para su uso a largo
plazo. - Necesidad de implementar un sistema de
información que permita realizar análisis y
descubrir correlaciones entre diferentes
conjuntos de información, que ayuden a la toma de
decisiones e investigación cientÃfica.
13Objetivos principales
- Manejo, identificación, y preservación en el
tiempo, de recursos de información relacionados
con la biologÃa y el clima usando estándares
internacionales de formato y contenidos. - Generación de un Sistema de Información a través
del Web que permita el facil acceso de
investigadores, productores y organizaciones que
necesiten la información producida por la red de
estaciones.
14Objetivos secundarios
- Mantener en el tiempo las colecciones de datos y
desarrollar mecanismos de almacenamiento,
catalogación y distribución de la información
generada. - Realizar permanentemente labores de
identificación de nuevas fuentes de información
que puedan incorporarse a las colecciones
existentes. - Concientizar a los cientÃficos sobre la
importancia de la preservación de los datos
generados en sus investigaciones.
15Estaciones de la redbc
- Estación INIA-Chama, Sur del Lago de Maracaibo
- Estación Ciplat, Sur del Lago de Maracaibo
- Estación La Hechicera, Mérida
- Estación Mucujún, Mérida
- Estación Santa Rosa, Mérida
- Estación San Juan, Mérida
16- Centro Internacional del Plátano (CIPLAT)
- Instituto Nacional de Investigaciones AgrÃcolas
(INIA)- Chama, Sur del Lago - Instituto de Ciencias Ambientales y Ecológicas
(ICAE) de la ULA - Instituto de Investigaciones Agropecuarlas de la
ULA (IIAULA)
17Funcionamiento de la redbc
Sistema de Información Bioclimático basado en el
web
- Ubicación de caracterÃsticas de colecciones de
datos. - Utilización de tecnologÃas Internet-Web, que
aceleran y facilitan grandemente el proceso de
captura, actualización y difusión de la
información bio-climática, permitiendo varios
niveles de acceso y recuperación de dicha
información. - Actualmente sólo se proveen datos sin procesar
(archivos de datos provenientes de las estaciones
meteorológicas) y sus respectivos metadatos. En
el futuro se podrá acceder a información
previamente procesada (gráficos, tablas, etc). - Libre acceso a colecciones de datos (datasets)
producidos por miembros de la red y (en lo
posible) por cualquier persona o institución que
los necesite.
18Funcionamiento de la redbc
Sistema de manejo de datos
Datos llegan por varias vÃas (enviados por
gerentes locales de información) -E-mail
-Web-CD-Entregas personales Gerentes
Centrales de información los procesan de ser
necesario y los publican en Internet
19Ejemplo Colección de datos Estación Chama
Es
20Ejemplo Colección de datos Estación Chama
Formato de metadatos
- html
- xml (EML Ecological Metadata Language)
- txt
- Presentación de datos
- Datos originales (sin procesar)
- Datos ordenados (Por año y por mes)
Enlace
21Ejemplo Colección de datos Estación Chama
Metadatos xml (EML) (para intercambio con otros
sistemas y procesamiento automático)
22Ejemplo Colección de datos Estación Chama
Interfaces Web Datos originales
23Ejemplo Colección de datos Estación Chama
Datos originales
Datos sin procesar, tal como vienen de los
instrumentos o cientÃficos que los capturan
24Ejemplo Colección de datos Estación Chama
Datos ordenados
Datos con algún tipo de procesamiento
25Ejemplo Consulta en KNB
Datos enviados a KNB
http//knb.ecoinformatics.org
26Afiliarse a la redbc
- Contactar por e-mail o teléfono al Proveedor de
metadatos
Documentar los datos
Llenar Planilla de documentación de datos
proporcionada por el gerente central de
información. Se pueden configurar planillas de
diferentes tipos Web, Word, txt, etc.
27- Escaso conocimiento de la importancia de la
preservación y posibilidades de uso secundario de
los datos. - Poca disposición de los cientÃficos para
compartir los datos. - Poca receptividad para aportar metadatos que
documenten las colecciones de datos. - Confusiones que tienen que ver con los derechos
de propiedad y uso de los datos. - Información incorrecta sobre la calidad y
cantidad de información que dicen poseer algunas
instituciones (entorpece la investigación). - Bajo interés por parte de algunos gerentes de
información local en publicar sus colecciones de
datos (retardo en envÃo de datos-pérdida de
información). - Algunos gerentes locales no disponen de conexión
a internet. - Costos de los instrumentos de captura de datos.
- No existe la figura de gerente local de
información.
28- Usos futuros
- Redes de manejo de conocimientos basadas en datos
y metadatos (intención de KNB) - Acceso a herramientas analÃticas "en-lÃnea" para
integrar varias herramientas como SAS, MATLAB,
etc. con acceso a datos de red de cientÃficos
(LTER) - Herramientas para producir formas alternativas de
metadatos que permitan a cualquier sitio
participar fácilmente en otras bases de datos
internacionales y Clearinghouses de datos (FGDC,
GCMD, NBII, etc.)
29- Clearinghouse Federal Geographic Data Commite
(FGDC,NBII)http//www.fgdc.gov/clearinghouse/ - Global Change Master Directory (GCMD,
DIF)http//gcmd.gsfc.nasa.gov - Long Term Ecological Research Network (LTER,
EML)http//lternet.edu - Knowledge Network of Biocomplexity
- http//knb.ecoinformatics.org
- National Center for Ecological Analysis and
Synthesiswww.nceas.gov
30www.cecalc.ula.ve/redbc/