Exportaci - PowerPoint PPT Presentation

1 / 14
About This Presentation
Title:

Exportaci

Description:

Formato de Intercambio de datos: Darwin Core - Exportar datos a GBIF desde HERBAR ... permanente a internet, requerimientos hardware (server dedicado), IP est tica, ... – PowerPoint PPT presentation

Number of Views:64
Avg rating:3.0/5.0
Slides: 15
Provided by: sil975
Category:

less

Transcript and Presenter's Notes

Title: Exportaci


1
Exportación de datos a GBIF-Servicio de
alojamiento de datos de la Unidad de
Coordinación Qué es Opciones de
uso Características del servicio Procesos Alta
y actualizaciones Dónde y cómo se integra-
Formato de Intercambio de datos Darwin Core -
Exportar datos a GBIF desde HERBAR
  • Taller de iniciación al programa HERBAR ver.
    3.5b
  • 8-10 Mayo 2007

2
Servicio de AlojamientoQué es?
  • Es un servicio proporcionado por GBIF.es con el
    objetivo de conectar bases de datos
    pertenecientes a las distintas instituciones con
    la red de GBIF
  • Trata de simplificar el proceso de integración en
    la red evitando a los proveedores de datos
    diversas dificultades
  • Conexión permanente a internet, requerimientos
    hardware (server dedicado), IP estática,
    políticas de seguridad, etc
  • La instalación y administración del software
    requerido (DiGIR provider), copias de seguridad,
    etc

3
Servicio de Alojamiento.Opciones de uso
Dos opciones de uso a./- Instituciones con
servidor de base de datos disponible (Oracle,
MS-SQLServer, MySQL) ? Conexión-Configuración
del software (DiGIR provider) de la unidad de
coordinación, mapeo con una vista/tabla de su
servidor b./- Instituciones sin servidor de base
de datos (MS-Access). ? Espacio físico en disco
en nuestros servidores para alojar la/s base/s de
datos (copias de seguridad semanales
incluidas) ?Conexión y configuración a nuestro
DiGIR. ?Mantenimiento del proceso para
actualizaciones Esta segunda opción, es la
utilizada por la mayoría de los proveedores de
datos de este servicio.
4
Servicio de Alojamiento. Características del
servicio
  • Características de uso
  • Para poder utilizar esta infraestructura , los
    proveedores de datos han de estar registrados
  • Han de aceptar el Acuerdo de Intercambio de Datos
    en la Red de GBIF
  • La gestión y control de la base de datos, queda
    en manos del proveedor de datos.
  • En el caso de alojamiento físico de la/s base/s
    de datos, cada proveedor accederá a un espacio
    exlusivo y no compartido, sus base de datos
    tendrán entidad por sí mismas, esto es, sus
    registros no serán en ningún caso anexados a
    otros ni serán usados para otro fin que el de
    responder a las peticiones de las consultas de la
    red de GBIF.
  • Características técnicas
  • Estándar de intercambio utilizado Darwin Core 2
  • Cada colección constará de una única tabla
    formada por los campos definidos según las
    especificaciones de DarwinCore 2 (versión 1.2)
  • En el caso de Alojamiento físico de la base de
    datos
  • Formato la Unidad de Coordinación puede alojar
    archivos de bases de datos tanto en MS-Access
    (.mdb) como en MySQL (.frm/.MYD/.MYI).
  • Espacio en disco cada Proveedor de datos podrá
    disponer de un directorio con un espacio máximo
    de 250 Mb. (El tamaño de una base de datos
    depende del número de registros, pero a modo de
    ejemplo, unos 14.000 registros de una tabla de
    DarwinCore en MS-Access, ocupan aproximadamente
    8.5 Mb)

5
Servicio de Alojamiento. Procesos Alta y
actualizaciones (I)

Contacto con la Unidad de Coordinación
lusa_at_gbif.es
Información del Servicio Alta http//www.gbif.e
s/Alojamiento/ (aceptación del Acuerdo de
Intercambio de Datos en la Red de GBIF)
Solicitud de Metadatos Datos asociados a la
institución y a la/s colección/es
Opción de uso a. (Institución con servidor de
base de datos)
Opción de uso b. (Institución sin servidor de
base de datos)
6

Servicio de Alojamiento. Procesos Alta y
actualizaciones (II)

Datos necesarios para el acceso por ftp seguro a
nuestros servidores
Datos del servidor necesarios para su conexión.


Creación de tabla/vista DarwinCore2.
Creación y Upload de la tabla/s DarwinCore2
Actualizaciones
Actualizaciones
Validación -Calidad de los datos -Técnica(Conexió
n y configuración de DiGIR)
Integración de los datos alojados en el DiGIR de
la Unidad de Coordinación en la red de GBIF
7
Servicio de Alojamiento. Donde y cómo se integra
GBIF http//www.gbif.net http//www.gbif.es/Dato
s
DiGIR provider software
Validación -Calidad de datos -Técnica
Equipo técnico de GBIF.es
Actualizaciones -Metadatos -Datos
Servicio de Alojamiento
SFTP
Usuario
8
Formato de Intercambio de datos Darwin Core
  • Para asegurar la interoperabilidad a la hora de
    consultar diferentes bases de datos de
    biodiversidad repartidas por todo el mundo es
    necesario tener una formato común de intercambio
  • Darwin Core2 es un estándar diseñado para
    facilitar el intercambio de información de datos
    primarios de biodiversidad a través de internet
  • Características
  • Para datos de colecciones y datos observacionales
  • Representa un mínimo común denominador en la la
    información a compartir. Trata de recopilar
    conceptos ampliamente utilizados por diferentes
    disciplinas que trabajan en biodiversidad
  • Información en espacio y tiempo El qué, el
    cuando y el dónde. (extensiones 1.4)
  • Simplicidad
  • minimizando las barreras entre los proveedores de
    datos
  • maximizando la disponibilidad para los usuarios
  • Permite que los datos sean estructurados como
    documentos XML y que éstos puedan ser
    transmitidos a través de Internet
  • Para intercambio, no para modelado de datos
  • Versiones
  • El documento que define el estándar es un XML
    Schema (.xsd)
  • DwC 1.2 schema Primera versión (usada en GBIF)
  • DwC 1.4 schema Borrador bajo discusión

9
Darwin Core 1.2
  • XML Schema http//digir.net/schema/conceptual/dar
    win/2003/1.0/darwin2.xsd
  • Versión no oficial en castellano
    http//www.gbif.es/ficheros/DarwinCore2_esp.pdf
  • Contiene 48 elementos no jerarquizados de los
    cuales 5 campos son obligatorios
  • Constituye el formato de intercambio utilizado
    por DiGIR
  • Proveedores que utilizan esta versión a nivel
    mundial (fuente http//bigdig.ecoforge.net/wiki/S
    chemaStatus)
  • Estructurados en
  • Identificación
  • ScientificName, Kingdom, Phylum, Class, Order,
    Family, Genus, Species, Subspecies,
    ScientificNameAuthor, IdentifiedBy,
    YearIdentified, MonthIdentified, DayIdentified,
    TypeStatus.
  • Preparación y Conservación
  • InstitutionCode, CollectionCode, CatalogNumber,
    BasisOfRecord, Sex, PreparationType,
    IndividualCount.
  • Recolección y Notas
  • Collector, CollectorNumber, FieldNumber,
    Notes,PreviousCatalogNumber
  • El cuándo
  • YearCollected, MonthCollected, DayCollected,
    JulianDay, TimeOfDay.
  • El dónde
  • ContinentOcean, Country, StateProvince, County,
    Locality, Longitude,Latitude, CoordinatePrecision,
    BoundingBox, MinimumElevation,
    MaximumElevation, MinimumDepth, MaximumDepth

10
Darwin Core 1.2
DateLastModified InstitutionCode CollectionCode CatalogNumber
ScientificName BasisOfRecord Kingdom Phylum
Class Order Family Genus
Species Subspecies ScientificNameAuthor IdentifiedBy
YearIdentified MonthIdentified DayIdentified TypeStatus
CollectorNumber FieldNumber Collector YearCollected
MonthCollected DayCollected JulianDay TimeOfDay
ContinentOcean Country StateProvince County
Locality Longitude Latitude CoordinatePrecision
BoundingBox MinimumElevation MaximumElevation MinimumDepth
MaximumDepth Sex PreparationType IndividualCount
PreviousCatalogNumber RelationshipType RelatedCatalogItem Notes
Indica los campos obligatorios.
DateLastModified Fecha y hora de la última
modificación del registro según la norma ISO
8601. Va a ser el dato utilizado por el motor de
indexación del portal internacional. Cad vez que
el portal indexa, se comprueba para cada
registro si este dato ha sido modificado, en caso
afirmativo lo reindexa de nuevo.
11
Darwin Core 1.4
  • EstadoDraft. Se encuentra bajo desarrollo para
    adaptarse a la nueva arquitectura del TDWG
  • Formado por un núcleo central de elementos y una
    serie de extensiones con información adicional
  • de una disciplina en concreto
  • simplemente información extra
  • Independiente del protocolo DiGIR
  • Incluye GlobalUniqueIdentifier
  • XML Schema
  • Core http//rs.tdwg.org/dwc/tdwg_dw_core.xsd
  • Extensión curatorial http//rs.tdwg.org/dwc/tdwg
    _dw_curatorial.xsd
  • Extensión geoespacial http//rs.tdwg.org/dwc/tdw
    g_dw_geospatial.xsd
  • Extensión Paleontológica

12
Darwin Core 1.4
  • Core
  • Elementos a nivel de registro
  • GlobalUniqueIdentifier , DateLastModified ,
    BasisOfRecord , InstitutionCode , CollectionCode
    , CatalogNumber , InformationWithheld , Remarks
  • Elementos taxonómicos
  • ScientificName, HigherTaxon , Kingdom , Phylum,
    Class, Order , Family, Genus, SpecificEpithet,
    InfraspecificRank, InfraSpecificEpithet,
    AuthorYearOfScientificName , NomenclaturalCode
  • Elementos de Identificación
  • IdentificationQualifer
  • Elementos referentes a la localidad y
    localización
  • HigherGeography, Continent, WaterBody,
    IslandGroup, Island, Country, StateProvince,
    County, Locality, MinimumElevationInMeters,
    MaximumElevationInMeters, MinimumDepthInMeters,
    MaximumDepthInMeters
  • Elementos referentes al evento de recolección
  • CollectingMethod, ValidDistributionFlag,
    EarliestDateCollected, LatestDateCollected,
    DayOfYear, Collector
  • Elementos biológicos
  • Sex, LifeStage, Attributes
  • Elementos de referencia
  • ImageURL, RelatedInformation

13
Darwin Core 1.4
  • Extension Curacional
  • Elementos a nivel de registro
  • CatalogNumberNumeric , IdentifiedBy,
    DateIdentified, CollectorNumber, FieldNumber,
    FieldNotes, VerbatimCollectingDate,
    VerbatimElevation, VerbatimDepth, Preparations,
    TypeStatus, GenBankNumber, OtherCatalogNumbers,
    RelatedCatalogedItems, Disposition,
    IndividualCount
  • Extensión Geoespacial
  • Elementos Geoespaciales
  • DecimalLatitude, DecimalLongitude,
    GeodeticDatum, CoordinateUncertaintyInMeters,
    PointRadiusSpatialFit, VerbatimCoordinates,
    VerbatimLatitude, VerbatimLongitude,
    VerbatimCoordinateSystem, GeoreferenceProtocol,
    GeoreferenceSources, GeoreferenceVerificationStatu
    s, GeoreferenceRemarks, FootprintWKT,
    FootprintSpatialFit
  • Extensión Paleontológica
  • Elementos Paleontológicos
  • EarliestEonOrLowestEonothem, LatestEonOrHighestEo
    nothem, EarliestEraOrLowestErathem,
    LatestEraOrHighestErathem, EarliestPeriodOrLowestS
    ystem, LatestPeriodOrHighestSystem,
    EarliestEpochOrLowestSeries, LatestEpochOrHighestS
    eries, EarliestAgeOrLowestStage,
    LatestAgeOrHighestStage, LowestBiostratigraphicZon
    e, HighestBiostratigraphicZone,
    LithostratigraphicTerms, Group, Formation,
    Member, Bed

14
Exportar datos a GBIF desde HERBAR
  • Casos prácticos de exportación de datos a GBIF
    desde Herbar
  • Taller_Herbar_May07_C_alumno_2.pdf
Write a Comment
User Comments (0)
About PowerShow.com