Title: Exportaci
1Exportación de datos a GBIF-Servicio de
alojamiento de datos de la Unidad de
Coordinación Qué es Opciones de
uso Características del servicio Procesos Alta
y actualizaciones Dónde y cómo se integra-
Formato de Intercambio de datos Darwin Core -
Exportar datos a GBIF desde HERBAR
- Taller de iniciación al programa HERBAR ver.
3.5b - 8-10 Mayo 2007
2Servicio de AlojamientoQué es?
- Es un servicio proporcionado por GBIF.es con el
objetivo de conectar bases de datos
pertenecientes a las distintas instituciones con
la red de GBIF - Trata de simplificar el proceso de integración en
la red evitando a los proveedores de datos
diversas dificultades - Conexión permanente a internet, requerimientos
hardware (server dedicado), IP estática,
políticas de seguridad, etc - La instalación y administración del software
requerido (DiGIR provider), copias de seguridad,
etc
3Servicio de Alojamiento.Opciones de uso
Dos opciones de uso a./- Instituciones con
servidor de base de datos disponible (Oracle,
MS-SQLServer, MySQL) ? Conexión-Configuración
del software (DiGIR provider) de la unidad de
coordinación, mapeo con una vista/tabla de su
servidor b./- Instituciones sin servidor de base
de datos (MS-Access). ? Espacio físico en disco
en nuestros servidores para alojar la/s base/s de
datos (copias de seguridad semanales
incluidas) ?Conexión y configuración a nuestro
DiGIR. ?Mantenimiento del proceso para
actualizaciones Esta segunda opción, es la
utilizada por la mayoría de los proveedores de
datos de este servicio.
4Servicio de Alojamiento. Características del
servicio
- Características de uso
- Para poder utilizar esta infraestructura , los
proveedores de datos han de estar registrados - Han de aceptar el Acuerdo de Intercambio de Datos
en la Red de GBIF - La gestión y control de la base de datos, queda
en manos del proveedor de datos. - En el caso de alojamiento físico de la/s base/s
de datos, cada proveedor accederá a un espacio
exlusivo y no compartido, sus base de datos
tendrán entidad por sí mismas, esto es, sus
registros no serán en ningún caso anexados a
otros ni serán usados para otro fin que el de
responder a las peticiones de las consultas de la
red de GBIF. - Características técnicas
- Estándar de intercambio utilizado Darwin Core 2
- Cada colección constará de una única tabla
formada por los campos definidos según las
especificaciones de DarwinCore 2 (versión 1.2) - En el caso de Alojamiento físico de la base de
datos - Formato la Unidad de Coordinación puede alojar
archivos de bases de datos tanto en MS-Access
(.mdb) como en MySQL (.frm/.MYD/.MYI). - Espacio en disco cada Proveedor de datos podrá
disponer de un directorio con un espacio máximo
de 250 Mb. (El tamaño de una base de datos
depende del número de registros, pero a modo de
ejemplo, unos 14.000 registros de una tabla de
DarwinCore en MS-Access, ocupan aproximadamente
8.5 Mb)
5Servicio de Alojamiento. Procesos Alta y
actualizaciones (I)
Contacto con la Unidad de Coordinación
lusa_at_gbif.es
Información del Servicio Alta http//www.gbif.e
s/Alojamiento/ (aceptación del Acuerdo de
Intercambio de Datos en la Red de GBIF)
Solicitud de Metadatos Datos asociados a la
institución y a la/s colección/es
Opción de uso a. (Institución con servidor de
base de datos)
Opción de uso b. (Institución sin servidor de
base de datos)
6 Servicio de Alojamiento. Procesos Alta y
actualizaciones (II)
Datos necesarios para el acceso por ftp seguro a
nuestros servidores
Datos del servidor necesarios para su conexión.
Creación de tabla/vista DarwinCore2.
Creación y Upload de la tabla/s DarwinCore2
Actualizaciones
Actualizaciones
Validación -Calidad de los datos -Técnica(Conexió
n y configuración de DiGIR)
Integración de los datos alojados en el DiGIR de
la Unidad de Coordinación en la red de GBIF
7Servicio de Alojamiento. Donde y cómo se integra
GBIF http//www.gbif.net http//www.gbif.es/Dato
s
DiGIR provider software
Validación -Calidad de datos -Técnica
Equipo técnico de GBIF.es
Actualizaciones -Metadatos -Datos
Servicio de Alojamiento
SFTP
Usuario
8Formato de Intercambio de datos Darwin Core
- Para asegurar la interoperabilidad a la hora de
consultar diferentes bases de datos de
biodiversidad repartidas por todo el mundo es
necesario tener una formato común de intercambio - Darwin Core2 es un estándar diseñado para
facilitar el intercambio de información de datos
primarios de biodiversidad a través de internet - Características
- Para datos de colecciones y datos observacionales
- Representa un mínimo común denominador en la la
información a compartir. Trata de recopilar
conceptos ampliamente utilizados por diferentes
disciplinas que trabajan en biodiversidad - Información en espacio y tiempo El qué, el
cuando y el dónde. (extensiones 1.4) - Simplicidad
- minimizando las barreras entre los proveedores de
datos - maximizando la disponibilidad para los usuarios
- Permite que los datos sean estructurados como
documentos XML y que éstos puedan ser
transmitidos a través de Internet - Para intercambio, no para modelado de datos
- Versiones
- El documento que define el estándar es un XML
Schema (.xsd) - DwC 1.2 schema Primera versión (usada en GBIF)
- DwC 1.4 schema Borrador bajo discusión
9Darwin Core 1.2
- XML Schema http//digir.net/schema/conceptual/dar
win/2003/1.0/darwin2.xsd - Versión no oficial en castellano
http//www.gbif.es/ficheros/DarwinCore2_esp.pdf - Contiene 48 elementos no jerarquizados de los
cuales 5 campos son obligatorios - Constituye el formato de intercambio utilizado
por DiGIR - Proveedores que utilizan esta versión a nivel
mundial (fuente http//bigdig.ecoforge.net/wiki/S
chemaStatus) - Estructurados en
- Identificación
- ScientificName, Kingdom, Phylum, Class, Order,
Family, Genus, Species, Subspecies,
ScientificNameAuthor, IdentifiedBy,
YearIdentified, MonthIdentified, DayIdentified,
TypeStatus. - Preparación y Conservación
- InstitutionCode, CollectionCode, CatalogNumber,
BasisOfRecord, Sex, PreparationType,
IndividualCount. - Recolección y Notas
- Collector, CollectorNumber, FieldNumber,
Notes,PreviousCatalogNumber - El cuándo
- YearCollected, MonthCollected, DayCollected,
JulianDay, TimeOfDay. - El dónde
- ContinentOcean, Country, StateProvince, County,
Locality, Longitude,Latitude, CoordinatePrecision,
BoundingBox, MinimumElevation,
MaximumElevation, MinimumDepth, MaximumDepth
10Darwin Core 1.2
DateLastModified InstitutionCode CollectionCode CatalogNumber
ScientificName BasisOfRecord Kingdom Phylum
Class Order Family Genus
Species Subspecies ScientificNameAuthor IdentifiedBy
YearIdentified MonthIdentified DayIdentified TypeStatus
CollectorNumber FieldNumber Collector YearCollected
MonthCollected DayCollected JulianDay TimeOfDay
ContinentOcean Country StateProvince County
Locality Longitude Latitude CoordinatePrecision
BoundingBox MinimumElevation MaximumElevation MinimumDepth
MaximumDepth Sex PreparationType IndividualCount
PreviousCatalogNumber RelationshipType RelatedCatalogItem Notes
Indica los campos obligatorios.
DateLastModified Fecha y hora de la última
modificación del registro según la norma ISO
8601. Va a ser el dato utilizado por el motor de
indexación del portal internacional. Cad vez que
el portal indexa, se comprueba para cada
registro si este dato ha sido modificado, en caso
afirmativo lo reindexa de nuevo.
11Darwin Core 1.4
- EstadoDraft. Se encuentra bajo desarrollo para
adaptarse a la nueva arquitectura del TDWG - Formado por un núcleo central de elementos y una
serie de extensiones con información adicional - de una disciplina en concreto
- simplemente información extra
- Independiente del protocolo DiGIR
- Incluye GlobalUniqueIdentifier
- XML Schema
- Core http//rs.tdwg.org/dwc/tdwg_dw_core.xsd
- Extensión curatorial http//rs.tdwg.org/dwc/tdwg
_dw_curatorial.xsd - Extensión geoespacial http//rs.tdwg.org/dwc/tdw
g_dw_geospatial.xsd - Extensión Paleontológica
12Darwin Core 1.4
- Core
- Elementos a nivel de registro
- GlobalUniqueIdentifier , DateLastModified ,
BasisOfRecord , InstitutionCode , CollectionCode
, CatalogNumber , InformationWithheld , Remarks - Elementos taxonómicos
- ScientificName, HigherTaxon , Kingdom , Phylum,
Class, Order , Family, Genus, SpecificEpithet,
InfraspecificRank, InfraSpecificEpithet,
AuthorYearOfScientificName , NomenclaturalCode - Elementos de Identificación
- IdentificationQualifer
- Elementos referentes a la localidad y
localización - HigherGeography, Continent, WaterBody,
IslandGroup, Island, Country, StateProvince,
County, Locality, MinimumElevationInMeters,
MaximumElevationInMeters, MinimumDepthInMeters,
MaximumDepthInMeters - Elementos referentes al evento de recolección
- CollectingMethod, ValidDistributionFlag,
EarliestDateCollected, LatestDateCollected,
DayOfYear, Collector - Elementos biológicos
- Sex, LifeStage, Attributes
- Elementos de referencia
- ImageURL, RelatedInformation
13Darwin Core 1.4
- Extension Curacional
- Elementos a nivel de registro
- CatalogNumberNumeric , IdentifiedBy,
DateIdentified, CollectorNumber, FieldNumber,
FieldNotes, VerbatimCollectingDate,
VerbatimElevation, VerbatimDepth, Preparations,
TypeStatus, GenBankNumber, OtherCatalogNumbers,
RelatedCatalogedItems, Disposition,
IndividualCount - Extensión Geoespacial
- Elementos Geoespaciales
- DecimalLatitude, DecimalLongitude,
GeodeticDatum, CoordinateUncertaintyInMeters,
PointRadiusSpatialFit, VerbatimCoordinates,
VerbatimLatitude, VerbatimLongitude,
VerbatimCoordinateSystem, GeoreferenceProtocol,
GeoreferenceSources, GeoreferenceVerificationStatu
s, GeoreferenceRemarks, FootprintWKT,
FootprintSpatialFit - Extensión Paleontológica
- Elementos Paleontológicos
- EarliestEonOrLowestEonothem, LatestEonOrHighestEo
nothem, EarliestEraOrLowestErathem,
LatestEraOrHighestErathem, EarliestPeriodOrLowestS
ystem, LatestPeriodOrHighestSystem,
EarliestEpochOrLowestSeries, LatestEpochOrHighestS
eries, EarliestAgeOrLowestStage,
LatestAgeOrHighestStage, LowestBiostratigraphicZon
e, HighestBiostratigraphicZone,
LithostratigraphicTerms, Group, Formation,
Member, Bed
14Exportar datos a GBIF desde HERBAR
- Casos prácticos de exportación de datos a GBIF
desde Herbar - Taller_Herbar_May07_C_alumno_2.pdf