Title: Sumario TDWG Annual Meeting 2006
1Reunión Anual TDWG 2006Sumario
2Acerca del TDWG
- TDWG (Taxonomic Databases Working Group )
- Grupo de trabajo internacional sobre bases de
datos taxonómicas - Es una organización sin ánimo de lucro,
afiliada a la Unión Internacional de Ciencias
Biológicas (IUBS), formada para - establecer colaboraciones internacionales entre
diferentes proyectos de bases de datos biológicas - promover la divulgación de la información sobre
los organismos vivos para beneficio de la
sociedad. - Para conseguir sus objetivos el TDWG
- Desarrolla, adopta y promueve estándares para el
intercambio de datos sobre los organismos vivos. - Actúa como foro de discusión a través de
reuniones, publicaciones y newsletter
3Historia
- 1985. Primera reunión. Génova.
- Desde entonces, reunión anual cada año en
una ciudad distinta (en España1989 Las Palmas
Gran Canaria (Jardín Botánico) y en 1995, Real
Jardín Botánico de Madrid) - La Mayoría de las instituciones y proyectos
miembros provenían del campo botánico (estándares
de datos de bases taxonómicas de plantas) - A partir de 1994 Expansión a otras áreas de
trabajo como la zoología, microbiología,
geológía, etc - 1988. Afiliación a (IUBS) Unión Internacional de
Ciencias Biológicas
4TDWG 2006 meeting
- Fecha 15-22 de Octubre
- Lugar Missouri Botanical Garden-St Louis,
Missouri, U.S.A. - Más de 160 participantes de 22 países y de 94
instituciones científicas, museos, etc. - Programa de trabajo
- http//tdwg2006.tdwg.org/fileadmin/2006meeting/doc
uments/TDWG2006_Schedule_Active_061016.pdf - 85 Presentaciones, posters y comunicaciones.
- Sesiones de trabajo organizado en
- Presentaciones ,Symposios,
- Posters, Demostraciones on-line
- Sesiones de trabajo de los subgrupos
5TDWG 2006 meeting
- Presentaciones
- http//tdwg2006.tdwg.org/programme/presentations/
6TDWG 2006 meeting
- Temas tratados
- La nueva infraestructura del TDWG
- Estándares
- Identificadores Globales únicos (GUIDsGlobally
Unique Identifiers) - Ontologías y semántica
- Lenguajes de representación de datos (UML, BNF,
RDF, XML) - Presentación del trabajo de los subgrupos y
sesiones paralelas de trabajo - Simposio sobre Aplicaciones para datos de
biodiversidad
7TDWG Infrastructure Project (TIP)
- Objetivo Rediseñar la infraestructura del TDWG
- Financiación y Duración
- 1.5 mill (Fundacion GordonBetty Moore)
- Julio 2005-Diciembre 2007
- En Oct-2006 (80 objetivos cumplidos)
- Tareas
- Trabajo sobre la nueva constitución
- Technical Arquitecture Group (TAG)
- Rediseñar la Documentación (Especificaciones,
Plantillas) - Desarrollo de Identificadores globales Únicos
- Rediseñar el Entorno de trabajo
- TDWG website
- Automatización del proceso de desarrollo de
estándares
8Nueva Constitución
- Nombre
- TDWG (Biodiversity Information Standars)
- Nueva constitución http//wiki.tdwg.org/twiki/pub
/Process/WebHome/TDWG_Constitution_2006-08-16.pdf - Establece como miembros a dirigirse a los
creadores, administradores y usuarios de
información sobre biodiversidad vs proyectos de
bases de datos biológicas - El Comité Ejecutivo aumenta sus atribuciones
debido al cambio en la nueva infraestructura de
trabajo - Nuevo articulo 10. Votaciones
- Las decisiones han de estar basadas en el
consenso en vez de en una mayoría simple. - El comité ejecutivo asegurará ese consenso
mediante mecanismos como revisiones y peticiones
de comentarios públicos. - Si no se alcanza un consenso, el comité
ejecutivo convocará una votación sobre el tema en
cuestión - El sistema de votación seguirá siendo el
mecanismo de elección del comité ejecutivo,
officers y de todo aquél proceso que dicta la
actual constitución
9Nuevo Proceso de Desarrollo de los Estándares
- Nueva Estructura del TDWG
- http//tdwg2006.tdwg.org/fileadmin/2006meeting/sl
ides/StanBlum_ProcessOverview.ppt - El TDWG necesita un nuevo Marco de trabajo para
- Proporcionar una visión unificada e integrada de
los estándares del TDWG - Fomentar la coordinación y la comunicación
interno - Asegurar revisiones críticas (públicas y por
expertos), así como consensos - Control del Ciclo de vida de los estándares
(mantenimiento y retirada, consenso, no anual) - Asegurar la coherencia entre TDWG estándares y
comunicación con estándares externos (OGC, W3C,
etc.)
10Nueva estructura organizativa
- Nueva estructura organizada a través de
- Interest Group
- Supervisar el progreso de los estándares así como
el estatus de los mismos (uso activo,
sustitución/retirada) - Actualizaciones de estatutos
- Task Group
- Para realizar tareas ó productos concretos
(estándar) - Para crear un IG ó TG se requiere de la
elaboración y aprovación (Comité Ejecutivo) de
unos estatutos (intenciones, actividades, etc) y
un convener - En proceso. Los antiguos subgrupos están
readaptando su estructura - Borrador de cómo posible escenario futuro
- http//tdwg2006.tdwg.org/fileadmin/2006meeting/doc
uments/TDWG_Group_Structure_WorkingDraft_061014.pd
f
11Nuevo Proceso de Desarrollo de los Estándares
(slide by Stan Blum)
12Nuevo entorno de trabajo
- El TDWG Infrastructure Project (TIP), ha
desarrollado un entorno de trabajo basado en una
nueva web con varias herramientas de trabajo
colaborativo on line - El TDWG website http//www.tdwg.org. Canal de
comunicación para los miembros y los usuarios.
Información sobre los Interest y Task Group,
sobre los estándares y sobre las actividades
destacadas. Cada subgrupo puede editar la
información referente a su trabajo. - El TDWG wiki wiki.tdwg.org. Sistema utilizado
por los miembros de los subgrupos para
desarrollar el trabajo de forma colaborativa
desarrollando borradores de los estándares,
documentación, etc. Para usuarios registrados - El TDWG blog http//www.tdwg.org/blog.
Aplicación que permite a los miembros compartir
ideas de forma informal en forma de artículos - El TDWG Proceedings http//www.tdwg.org/ojs.
Aplicación que funciona como una revista on line
para la publicación de actas de los eventos,
proceso de desarrollo de los estándares, etc - Repositorio de estándares http/rs.tdwg.org
donde están los paquetes de información de los
estándares (documentos RDDL (Lenguaje de
descripción de directorio de recursos ), .xsd,
etc). Principalmente documentos para acceso por
las máquinas (software) por lo que se considera
que deben de tener urls permanentes. Documentos
experimentales también pueden ser cargados aquí
durante el proceso de desarrollo del estándar.
Acceso vía WebDAV - TYPO3. http//www.tdwg.org/typo3.Aplicación para
el manejo de estándares (proceso) - Mailing lists http//lists.tdwg.org. Listas de
correo públicas.
13Nueva estrategia de documentación
- Documentación toda aquella información que
define y ayuda al desarrollo de los estándares - Basada en tres tipos de documentos
- Tipo 1 documentos que han de formar parte del
estándar de forma obligatoria (XML Schemas,
especificaciones definidas de acuerdo a lenguajes
controlados) - Controlados por -IG Process-
- Altamente estables una vez ratificado el estándar
- En inglés
- Tipo 2 documentos que forman parte del estándar
a modo informativo (no obligatorios) (Ejemplos,
código, diagramas, ilustraciones, etc) - Tipo 3 documentos que quedan fuera del estándar
(tutoriales, guías, wikis, grupos de discusión) - Documentos tipo 1 tipo 2? Estándar ? (paquete
de informaciónmetadatos)
14GUIDS (Globally Unique Identifiers) en la
Informática para la Biodiversidad
- Creación de un Task Group en esta dirección
TDWG-GUID Group - 2 reuniones (Febrero y Junio 2006) (estudio de
los requerimientos-evaluación de
tecnología-documentación) - wiki (http//wiki.gbif.org/guidwiki/wikka.php?wakk
aHomePage), y mailing list (http//mailman.nhm.k
u.edu/mailman/listinfo/tdwg-guid) - Necesidad de Identificadores únicos
- Intercambio de información en la red (Internet)
con datos servidos desde múltiples fuentes
Modelado de la información de biodiversidad
(registros) en objetos ? Surge la necesidad de
identificar objetos de forma única - Los GUIDS son
- Globales y permanentes. Solucionan la
identificación de objetos provenientes de
distintas fuentes - Poseen mecanismos que definen al objeto
(metadatos) - Evaluadas distintas tecnologías (LSID, DOI
(Digital Objet Identifier), Handles,
PURL(Persistent Uniform Resource Locator)) - Recomendado el uso de LSID (Life Sciences
Identifier).
15LSID (Life Sciences Identifier )
- Desarrollado por OMG (The Object Management
Group) W3C - Arquitectura cliente-servidor
- LSID authority server resolver client
- No centralizada
- Estructura
- urnlsidauthoritynamespaceobjectrevision
- Ejemplo
- urnlsidindexfungorum.orgnames213649
- resolución en http//lsid.biopathways.org/reso
lver/ - Implementaciones
- Open Source (sourceforge.net) lsid.sourceforge.net
- IBM (Java, C, Perl)
- Kevin Richards (Landcare Research NZ) (Microsoft
.NET) - Ejemplos de servidores LSID
- Bio Pathways, Index Fungorum, IPNI (IPNIThe
International Plant Names Index ), uBio
(Universal Biological Indexer and Organizer) - Por hacerdefinir cómo usar LSID en la
aplicaciones
16Estándares y Protocolos
17ABCD (Access to Biological Collections Data )
- ABCD Access to Biological Collections Data (Nueva
versión 2.0.6a) - Será el Estándar del Task GroupABCD del
Interest Group Primary Biodiversity Data - Para datos de colecciones biológicas (especímenes
y observaciones) - Proporciona definiciones semánticas
- Estructura jerárquica (alta estructuración con
gran número de elementos. Pretende cubrir un
máximo de detalle) - Trabaja con extensiones
- Posibilidad de trabajo con diferentes niveles de
detalle (atomización/fusión) - Incluye GUIDs
- Indica en que idioma está la información
contenida - Permite la repetición de registros (por ejemplo
revisiones) - Compatibilidad con Darwin Core (versiones 1.2 y
1.4), HISPID (Herbarium Information Standards and
Protocols for Interchange of Data ), etc. - http//www.bgbm.org/tdwg/codata/schema/
-
18Extensión EFG-Geocase
- Extensión EFG del esquema ABCD
- Será el estándar del Task GroupABCDEFG del
Interest Group Primary Biodiversity Data - Para datos de colecciones paleontológicas,
geológicas (minerales,fósiles, rocas) - Compatible con la extensión DarwinCoPE
(DarwinCore Paleontology Extension) - XML Schema (http//eim.metapath.org/ABCDEFGWeb/EFG
-1.XSD.html) - GeoCASE BioCASEEFG
- (http//projects.naturkundemuseum-berlin.de/synthe
sys_activity_d/index.htm) - Próximo workshop Berlín Enero 2007 (dirigido a
instituciones dispuestas a usar este esquema)
19Darwin Core (DwC)
- Será el estándar del Task Group DarwinCore del
Interest Group Primary biodiversity data - Estándar diseñado para facilitar el intercambio
de información de datos primarios de las
colecciones (especimenes). - Información en espacio y tiempo El qué, el
cuando y el dónde. - Trata de recopilar conceptos ampliamente
utilizados por diferentes disciplinas que
trabajan en biodiversidad - Simplicidad
- minimizando las barreras entre los proveedores de
datos - maximizando la disponibilidad para los usuarios
- Para intercambio no para modelos de datos
- Versiones http//wiki.tdwg.org/twiki/bin/view/Dar
winCore/DarwinCoreVersions - 1.2 (la versión usada mayoritariamente)
- 1.4 (Borrador)
- incluye GlobalUniqueIdentifier
- independiente del protocolo DiGIR
- Extensiones mecanismos para compartir
información adicional (Paleontológica,Curatorial,
Geospatial) - Temas futuros (debates)
- Lista de elementos ordenados-mayor estructuración
(orden-herencia,) - Vocabularios controlados
20NCD (Natural Collections Descriptions)
- Será el Estándar del Task Group NCD del Interest
Group Institutions, Organisations, Agents - XML Schema para intercambio de descripciones de
colecciones de historia natural (especimenes,
archivos, observaciones, material de libros,
bases de datos, fotografías, etc - Cada registro definiría una colección entera
según el NCD Business card - Relación con otros estándares Dublin-Core y EAD
(Encoded Archival Description) - Origen Biocase project (Biodiversity Collections
Access Service for Europe ) - Desarrollado por RAVNS (Resources Available in
the Natural Sciences) es un grupo formado por la
mayoría de bibliotecarios y archivistas de
historia natural de Norte América e Inglaterra - Pretenden tener una implementación del estándar
ya testada a finales del 2006 y una versión
estable (final draft) para el primer cuatrimestre
del 2007 - Documentos
- Esquema http//www.nhm.ac.uk/hosted_sites/tdwg/NC
D/NCDv0pt40.xsd - Diagrama http//www.nhm.ac.uk/hosted_sites/tdwg/N
CD/NCDv0pt40.png - Uso de este estándar NLBIF Metadatabase
- Catálogo de organizaciones, colecciones y
personas - Desarrollado como open source por el nodo
holandés de GBIF.
21TCS (Taxonomic Concept Schema)
- Será el estándar del Task Group TNC (Taxon Names
and Concepts). - Objetivo Promover el estudio de la nomenclatura
y los conceptos taxonómicos - Desarrollan estándares y modelos de datos para
representar la nomenclatura y la taxonomía y cómo
se relaciona con modelos de información en
biodiversidad (como los que describen especímenes
y observaciones) - wiki http//wiki.tdwg.org/twiki/bin/view/TNC/Web
Home - Presentación de la primera versión TCS1 el año
pasado, aprovada.?incorporados los cambios
TCS1.01 - Objetivo del estándar
- Permitir el intercambio de información entre de
conceptos taxonómicos definidos en
clasificaciones taxonómicas publicadas, en bases
de datos. - Representación de un modelo abstracto para
conceptos taxonómicos que pueda ser mapeado con
los diversos modelos de los proveedores de este
tipo de datos - XML Schema http//www.tdwg.org/uploads/media/v10
1.xsd - Documentación Guía de usuario http//www.tdwg.org
/uploads/media/User_Guide_01.pdf - Projectos que usan este estándar
- SEEK (Science Environment for Ecological
Knowledge ) - Euro Med
- EML (Ecological Metadata Language)
22SDD (Structured Descriptive Data)
- Será el Estándar del Task Group SDD del Interest
Group Descciptions (Species descriptions) - Surge como sustitución y modernización del
anterior estándar DELTA - http//wiki.tdwg.org/twiki/bin/view/SDD/Primer/Sdd
Introduction - Desarrolla un esquema para controlar cómo se
construye el vocabulario para trabajar con
descripciones. - Para expresar y transferir información
descriptiva de organismos biológicos y taxones - conceptos y caracteres descriptivos y conceptos y
caracteres de jerarquización - Incluye descripciones, ontologías, terminología y
herramientas de identificación - Version 1.1 es la aconsejada para
implementaciones. - Posibles usos de SDD
- codificar descripciones cortas (sumarios)
- descripciones en lenguaje natural
- para creación de claves
- Proyectos que lo usan
- LUCID 3 software para identificación y diagnosis
- UMB import/export generator
- acepta XML Schema y mapea
- produce código java para import/export
- Electronic Field Guide (EFG) Project
(http//efg.cs.umb.edu/SDD) - UMB visual SDD editor
23TAPIR (TDWG Access Protocol for Information
Retrieval )
- TAPIR es un WebService protocolo para acceso a
datos estructurados provenientes de bases de
datos distribuidas de estructura lógica y física
diferentes - TAPIR combina las características de los
protocolos BioCASe y DiGIR protocolos y amplía
las posibilidades de comunicación entre
aplicaciones cliente y proveedores de datos a
través de Internet - Su potencialidad permite la interoperabilidad no
solo entre especimenes u observaciones si no que
se puede utilizar en otros dominios (geológico,
ecológico, clima, secuenciación genética,
geoespacial, etc.) - Implementaciones
- PyWrapper 2.0 de Biocase es la primera
implementación del TAPIR provider - PHP DiGIR provider está siendo actualizada para
integrar TAPIR - La primera red en implementar TAPIR Plant
Genetic Resources Community CGIAR (Grupo
Consultivo para la Investigación Agrícola
Internacional ) Generation Challenge Programme
24TAPIR (TDWG Access Protocol for Information
Retrieval )
- Características
- Trabaja con GUIDs
- TAPIR Request/Response
- requests pueden ser hechas en
- documentos XML
- Key-Value Pairs (HTTP)
- responses siempre codificadas en XML
- Operaciones posibles ping, metadata,
capabilities (servicios), inventory y search - XML Schema Definition (XSD) para describir y
validar la estructura de los mensajes
request/response - No trabaja con un esquema en concreto
- Conceptual Schemas (XML Schema, RDF Schema)
(DarwinCore, ABCD, TCS,NCD) - Outputmodels-capabilities response
- Knownoutputmodels
- Anyoutputmodels (mappedConcepts)
- Especificaciones http//www.tdwg.org/dav/subgroup
s/tapir/1.0/docs/TAPIRSpecification_2006-12-06.htm
l - Esquema http//ww2.biocase.org/svn/tapir/trunk/pr
otocol/tapir.xsd
25OTROS
26Geospatial
- Probablemente se formará un Geospatial Interest
Group (GIG) - Objetivo integración de estándares,
especificaciones, tecnologías y buenas prácticas
entre la comunidad biológica y la geoespacial - Cooperación TDWG-OGC (Open Geospatial
Consortium) - Firmado MoU
- http//www.opengeospatial.org/pressroom/pressrele
ases - El TDWG y el the OGC colaborarán en el
desarrollo de esquemas y perfiles del OGC como el
GML (Geography Markup Language) y estándares del
TDWG para la representación de localizaciones de
especimenes biológicos, organismos y su
distribución, comunidades, movimientos, etc - El proyecto BioGeomancer (http//www.biogeomancer.
org/) - Colaboración entre expertos de historia natural y
geoespaciales - Está desarrollando WebServices y aplicaciones de
escritorio que permitirán georeferenciar a los
colectores, conservadores, etc - El trabajo con estándares está basado en
- GML para la descripción de los aspectos
espaciales de los datos de historia natural. - Integrando con DwC2 y ABCD
27Imagenes
- Probablemente se formará un Images Interest Group
(IIG) - Objetivo Desarrollar una estándarización en los
mecanismos para el manejo y la transferencia de
información descriptiva acerca de los media
incluyendo - Trabajo http//wiki.cs.umb.edu/twiki/bin/view/TDWG
Image - Manual de buenas prácticas para Imágenes de
especímenes (enbi project). - Uso de imágenes en sustitución de los ejemplares
- Metadatos para la descripción
- Formatos de archivo (JPEG2000 )
- estándar ISO con nueva forma de codificar/decof
imágenes, sonidos, películas - Alta compresion
- Decodificacion de Regions of Interest (ROIs)
?posibilidades de embeber en una imagen de un
especimen un ABCD XML recordpdf - JPIP (JPEG2000 Interactive Protocol), necesario
cliente (kdu_show client from Kakadu Software ) - Estándares para el manejo de LSID para imágenes
- Qué debe de ir asociado al dato/metadato en la
resolución
28Observaciones
- Estarían ubicados como un Task Group en Interest
Group Primary biodiversity data - Una observación caracteriza la presencia/ausencia
de un organismo ó conjunto de organismos a través
de un evento de recolección en una localización
determinada - Posible desarrollo de un estándar. Core
- Quien
- Cuando
- Donde
- Como
- Evidencia (especimen,imagen,literatura)
- Biología asociada (número de individuos,densidad,
distribución,evidencia de reproducción) - Medio ambiente (habitat, condiciones del lugar,
tiempo) -
- http//wiki.tdwg.org/twiki/bin/view/Observational/
WebHome
29Especies Invasivas
- Probablemente se formará un Interest Group
Invasive Species Information Systems - ISIS - Objetivo Trabajo con especies invasivas incluida
taxonomía, distribuciones, terminología,
descripciones, herramientas de identificación,
etc - Checklists ? mapas ? modelos
- Trabajan con GISIN (Global Invasive Species
Information Network)
30Monitorización DiGIR providers- The Big Dig
- The "Big Dig" es un proyecto de ecoforge.net
desarrollado en 2006 por el Natural History
Museum and Biodiversity Research Center of the
University of Kansas. - http//bigdig.ecoforge.net/
- Servicio que genera de manera automática informes
del estado y las características de los DiGIR
providers - StatusUna vez al día
- Schema Una vez a la semana
- Evalua el estado de las instalaciones de los
DiGIR provider - Examina registros y reporta las características
del software instalado - Status, versión, número de colecciones, número de
registros, schema, tiempo de respuesta, encoding - Ayuda a los administradores ante posibles
problemas
31Openmodeller
- Desarrollado por CRIA (Centro de Referência em
Informação Ambiental) - Proyecto Open Source de sourceforge
- Librería para modelado de nichos
- Intenta proveer métodos para el modelado usando
una variedad de algoritmos (GARP, Bioclim, CSM
etc ya implementados) - Estándar propuesto OMWS (open standard for
distributed ecological niche modelling) - http//openmodeller.sf.net