Title: Padr
1- Padrões e Protocolos em Informática para
Biodiversidade - Renato De Giovanni
- Centro de Referência em Informação Ambiental, CrIA
2Principais pontos da apresentação
- Padrões e Protocolos em Informática para
Biodiversidade - O que são e para que servem
- Que papel podem desempenhar junto às Coleções
Biológicas - Principais padrões sendo utilizados ou discutidos
- Protocolos para realizar buscas em dados
distribuídos - Recomendações gerais
3Definições
- Protocolo Descrição formal das regras e
formatos de mensagem que dois sistemas devem
obedecer para que possam se comunicar e
interagir. - Padrão Algo definido ou em comum acordo ou por
autoridade específica para servir como modelo ou
regra para determinado fim.
Exemplos
- TCP/IP, HTTP, URI, HTML base de funcionamento da
Internet! - SMTP, POP, IMAP base para troca de e-mails
- W3C Consórcio internacional
4Cenário envolvendo o uso de padrões e protocolos
pesquisa
educação
nomenclatura taxonomia
dados descritivos
tomada de decisão
dados primários
modelagem
qualidade de dados
mapas
coleção biológica
5Caso Repatriação de dados de aves do México
6Caso Acesso a ferramentas auxiliares
7Ferramentas auxiliares qualidade dos dados
link para registros na coleção
8Ferramentas auxiliares qualidade dos dados
9Feramentas auxiliares qualidade dos dados
10- http//www.tdwg.org/
- Objetivos
- - Servir como fórum international para o debate
de projetos envolvendo dados sobre biodiversidade - Desenvolver e promover o uso de padrões
- - Facilitar a troca de dados
11- Grupos de trabalho em atividade buscam
estabelecer padrões para - Dados de Coleções Biológicas
- Dados sobre descrição de uso de plantas
- Dados geográficos
- Metadados de Coleções Biológicas
- Dados de imagens e observações
- Dados espaciais
- - Estrutura de dados descritivos de espécies
- - Dados taxonômicos
12TCS Taxonomic Concept Transfer Schema
- Objetivo
- Servir como padrão para troca de dados
taxonômicos considerando as abordagens de
diferentes grupos (taxonomistas,
nomenclaturistas, ecólogos, etc). - Características técnicas
- Utiliza XML (definido através de XML-Schema).
- Situação
- Aguardando homologação pelo TDWG.
- Protótipo sendo desenvolvido repositório de
conceitos taxonômicos.
13TCS Taxonomic Concept Transfer Schema
- Centrado na idéia de Conceito Taxonômico
classificação de um grupo de organismos por uma
pessoa num determinado momento. - Documentos podem conter conceitos, nomes e as
relações taxonômicas e nomenclaturais entre eles.
- Consegue representar vários tipos de definições
circunscrição com base em caracteres ou em
espécimes, e referências a outros conceitos. - Tipos de conceitos taxonômicos definição
original, revisão, conceito incompleto, agregado
de conceitos, nomenclatural (referência implícita
a todos os conceitos que já usaram o mesmo nome).
14SDD Structured Descriptive Data
- Objetivo
- Servir como padrão para armazenamento e troca de
dados descritivos de organismos (Taxa e
espécimes). - Características técnicas
- Utiliza XML (definido através de XML-Schema).
- Situação
- Aguardando homologação pelo TDWG.
- Existência de um protótipo para editar
documentos SDD.
15SDD Conteúdo de um documento
- Metadados.
- Terminologia de dados descritivos (em múltiplas
línguas e tendo em vista múltiplos
públicos-alvo). - Possibilidade de descrever categorias de
organismos (Taxa) ou organismos específicos
(espécimes / linhagens). - Descrições em linguagem natural com possibilidade
de marcar texto. - Descrições codificadas.
- Chaves de identificação.
- Recursos adicionais (glossário, imagens, notas,
referências, etc).
16DarwinCore
- Objetivo
- Definição de elementos comuns a todos os grupos
taxonômicos para padronizar a integração de dados
primários de biodiversidade. - Características técnicas
- Utiliza XML (definido através de XML-Schema) e
aceita extensões. - Situação
- Versão atual é utilizada pela maioria das
redes speciesLink, GBIF, Manis, OBIS, etc. - Nova versão sendo discutida e aguardando
homologação pelo TDWG.
17DarwinCore versão atual
Date Last Modified Year Identified Locality
Institution Code Month Identified Longitude
Collection Code Day Identified Latitude
Catalog Number Type Status Coordinate Precision
Scientific Name Collector Number Bounding Box
Basis of Record Field Number Minimum Elevation
Kingdom Collector Maximum Elevation
Phylum Year Collected Minimum Depth
Class Month Collected Maximum Depth
Order Day Collected Sex
Family Julian Day Preparation Type
Genus Time of Day Individual Count
Species Continent / Ocean Previous Catalog Nº
Subspecies Country Related Catalog Item
Scientific Name Author State / Province Ralationship Type
Identified By County Notes
18Extensão para dados de coleções microbiológicas
History of Deposit Isolation Method Strain Properties
Depositor Conditions For Growth Strain Applications
Year Deposited Genetically Modified Form Of Supply
Month Deposited Genotype Restrictions
Day Deposited Mutant Biological Risks
Substrate Race Pathogenicity
Isolator Alternate State
19ABCD Access to Biological Collection Data
- Objetivo
- Estabelecer um padrão para a troca de dados e
metadados de registros em coleções biológicas
procurando englobar as particularidades de todos
os grupos taxonômicos. - Características técnicas
- Utiliza XML (definido através de XML-Schema).
- Situação
- Utilizado pela rede de coleções européias
BioCASE. - Aguardando homologação pelo TDWG (iniciativa
conjunta com CODATA).
20ABCD Access to Biological Collection Data
- Possui ao todo cerca de 500 elementos!
- Contém elementos específicos para os seguintes
tipos de coleções - Herbários e Jardins Botânicos
- Coleções Zoológicas
- Coleções de Culturas
- Coleções Paleontológicas
21Protocolos para busca em dados distribuídos
Linux MySQL
Win98 biota
Win98 Access
FreeeBSD PostgreSQL
Col 3
Win2000 Brahms
Col 4
Col 2
Col 5
Col 1
protocolo X
?
?
?
protocolo X
protocolo X
?
protocolo X
?
protocolo X
programa
22Protocolos para busca em dados distribuídos
- The Species Analyst (1999)
- Muito complicado.
- Impossibilidade de definir esquemas conceituais
separadamente. - Suporte limitado a XML e Unicode.
Z39.50
- Manis, speciesLink, OBIS, etc (2002)
- Motivação inicial foi superar as limitações do
Z39.50 produzindo um novo protocolo com novas
ferramentas.
- BioCASE (2003)
- Surgiu após tentativas frustradas de convencer a
comunidade DiGIR a alterar seu protocolo para que
o mesmo pudesse ser usado com esquemas
conceituais mais complexos (ABCD).
DiGIR
- TAPIR (2004)
- Estudo contratado pelo GBIF por recomendação de
um dos subcomitês (DADI). - Existência de protocolos distintos dificulta
interoperabilidade e acarreta duplicidade de
esforços.
BioCASe
TAPIR
23DiGIR Distributed Generic Information Retrieval
- Protocolo para acesso a dados distribuídos e
heterogêneos - Iniciativa (junho de 2001)
- University of Kansas
- California Academy of Sciences
- Museum of Vertebrate Zoology (Berkeley)
- Projeto financiado pela NSF (National Science
Foundation) - Parceiros
- CRIA (Fapesp)
- GBIF
24DiGIR Distributed Generic Information Retrieval
- Requisitos e objetivos da proposta original
- Utilização de padrões e protocolos abertos HTTP,
XML e UDDI - Separação clara entre protocolo, software e
semântica - Facilidade na instalação e configuração de
provedores de dados - Desenvolvimento colaborativo (modelo open
source) - Produtos disponíveis a todos através de licensa
pública (GPL - GNU General Public License)
25Uso de esquema conceitual em busca distribuída
Linux MySQL
Win98 biota
Win98 Access
FreeeBSD PostgreSQL
Col 3
Win2000 Brahms
Col 4
Col 2
mapeamento
Col 5
Col 1
mapeamento
mapeamento
protocolo X
mapeamento
mapeamento
protocolo X
protocolo X
protocolo X
protocolo X
DarwinCore
programa
26DiGIR exemplo de requisição de busca
27Recomendações gerais
- Acompanhar os padrões e protocolos sendo usados
ou discutidos - Quão compatíveis estão meus dados em relação
aos padrões atuais? - Quão compatível é meu sistema de gerenciamento em
relação aos padrões e protocolos atuais? - Participar das redes de informação sobre
biodiversidade sendo criadas - Maior visibilidade e valor para a coleção
- Fazer uso de eventuais ferramentas
disponibilizadas pelas redes - Fazer uso das redes de informação sobre
biodiversidade existentes
28- Obrigado
- renato at cria . org . br