Title: GLOBAL BIODIVERSITY
1GLOBALBIODIVERSITY
INFORMATIONFACILITY
A tecnologia da Informação e o GBIF
Francisco Pando Data Digitalization
Workshop Braga, 5 a 7 de Julho, 2006
WWW.GBIF.ORG
2Sumario
- Objetivo y visión de GBIF
- Red de datos
- Esquemas de datos
- Puntos y nombres
- Protocolos
- Registro de bases de datos
- Portales
- Estrategias, opciones e implementaciones para
compartir datos
3Objetivo de GBIF
GBIF se propone hacer accesible por Internet toda
la información disponible sobre los organismos
vivos conocidos a nivel mundial Otra manera de
verlo se propone cambiar la cultura de mi dato
es mio, mira mis resultados (en ciencia y en
gestión) datos de todos para todos
4Modelo de datos redes centralizadas
5Red de datos distribuidos
Figure 4. Diagram showing the complexity of
integrating data from biological collections
6Los elementos de la red
Figure 5. GBIF Network major classes of
nodes GBIF is responsible for running the
network, establishing standards, and developing
tools. The portal is the hub for the development
of any service that must be centralized such as
the registry of metadata and for serving data
from the biodiversity data index to the end user.
7Más en detalle
- Protocol
- Provider
- Portal
- Registry
8Tecnologias usadas
- XML data exchange based on Providers, Services
and Biodiversity Data Records - UDDI registry for technical (access) metadata
- Descriptive metadata retrieved through service
interfaces - Specimen/observation exchange using DiGIR-Darwin
Core or BioCASE-ABCD - Taxonomic name data from Catalogue of Life
(annual checklist for first release, moving to
service-based approach as possible) - Java (and JSP) components being developed
centrally for GBIF Portal - Current portal development using Tomcat, Xerces,
Log4J, MySQL - Components to be packaged for reuse as
appropriate
9Mapeo de datos
10Esquemas datos
- Darwin Core
- Sencillo (50 elementos)
- La unidad es el registro
- 500 bases de datos www.gbif.net
- ABCD
- Contenido elaborado y detallado (500 elementos)
- La unidad es el archivo
- 170 bases de datos en www.gbif.net
11La base para el acceso unificado
- Perfil común
- Cada base de datos se traduce a un perfil
común, que es una tabla con una lista
estandarizada de campos que se pueden consultar
de manara uniforme - Estándares
- Darwin Core
- ABCD Schema
- www.tdwg.org
12Darwin Core, desarrollos en curso
13Darwin Core, extensiones
14Integración de nombres y especímenes
15Protocolos
- DIGIR para Darwin Core
- Biocase para ABCD
16Vida despues de DIGIR
- TAPIR
- http//www.gbif.org/News/NEWS1129877273
- http//ww3.bgbm.org/protocolwiki/
- Unificar protocolos de la red de datos de GBIF
- Expansión del registro (UDDI), soporte para redes
temáticas, portales nacionales, extensiones de
Darwin core - Toolkit para portales de datos en desarrollo
17Registro
- A tener en cuenta
- Un nombre caracteristico
- Una descrición que oriente al usuario
- Condiciones de uso adicionales
- Como citar el uso de este recurso
18Portales de GBIF
- Portal actual (prototipo)
- Portal para nodos
- Nuevo portal (en desarrollo)
19Portal actual (prototipo)
20Portal actual (prototipo)
Occurrence Detail
Georeferenced records
Countries from which species is recorded
Download records
Data resources with specimens or observations
21Portal para Nodos
- En desarrollo
- Para que los nodos puedan servir
- Datos de las colecciones de su ámbito (país)
- Datos relevantes para su ámbito
- Adaptable a sus necesidades (idioma, nombres
comunes,) - Proporcionar una ayuda para que los nodos puedan
servir a sus comunidades
22Nuevo portal
- Estilo www.biologybrowser.com
- Web services
- API interfaz
- Servicios añadidos de indexado y validación
23Portalarchitecture(new versionD. Hobern)
Clients
Mirrored access
Web applications
Synchronised data stores
Data despatcher
Interpretation and validation
Resource crawler
Data resources
24Más o menos claro?
- Protocol
- Provider
- Portal
- Registry
25Estandares para la integración de datos y la
iinteroperabilidad
http//www.tdwg.org/standrds.html
26- Turn-key package
- Basado en PHP y código del proyecto DiGIR
- Para Linux y Windows
- Registro con el UDDI del GBIF
- Apoyo técnico helpdesk_at_gbif.org
27De las bases de datos al acceso via Internet
- De quien son esos datos?
- Todo, todo?
- Como de limpio?
- Como?
28De quien son esos datos?
29Todo, todo?
- El proveedor de los datos retiene el control
sobre lo que hace accesible - Hace pruebas
- Decide diluir la precisión de registros de
especies amenazadas o de datos de interés
económico - No hace pública los datos de investigaciones en
curso
30Como de limpio?
- La perfección no existe
- El dato malo tampoco un dato no es bueno o malo
intrínsicamente, sino que su bondad depende del
uso - Hacer los datos públicos ayuda a su mejoramiento
- Hay herramientas para mejorar los datos y GBIF
estatrabajando en esto - http//www.secretariat.gbif.net/datatester/index.j
sp - http//www.gbif.org/prog/digit/data_quality
31Como?
GBIFPortal
GBIFIndex
GBIFRegistry
Participant Portal B
Participant Portal A
Participant Portal C
Data Warehouse
Data Warehouse
32A vuestra disposición
- Francisco Pando
- Nodes Liaison Officer
- GBIF Secretariat
- Universitetsparken 15
- 2100 Kobenhavn, Dinamarca
- pando_at_gbif.org
- Tél. 45 35 32 1470
- Fax 45 35 32 1480
33(No Transcript)
34(No Transcript)
35(No Transcript)