Padr - PowerPoint PPT Presentation

1 / 28
About This Presentation
Title:

Padr

Description:

Padr es e Protocolos em Inform tica para Biodiversidade Renato De Giovanni Centro de Refer ncia em Informa o Ambiental, CrIA Principais pontos da apresenta o ... – PowerPoint PPT presentation

Number of Views:87
Avg rating:3.0/5.0
Slides: 29
Provided by: Centro177
Category:

less

Transcript and Presenter's Notes

Title: Padr


1
  • Padrões e Protocolos em Informática para
    Biodiversidade
  • Renato De Giovanni
  • Centro de Referência em Informação Ambiental, CrIA

2
Principais pontos da apresentação
  • Padrões e Protocolos em Informática para
    Biodiversidade
  • O que são e para que servem
  • Que papel podem desempenhar junto às Coleções
    Biológicas
  • Principais padrões sendo utilizados ou discutidos
  • Protocolos para realizar buscas em dados
    distribuídos
  • Recomendações gerais

3
Definições
  • Protocolo Descrição formal das regras e
    formatos de mensagem que dois sistemas devem
    obedecer para que possam se comunicar e
    interagir.
  • Padrão Algo definido ou em comum acordo ou por
    autoridade específica para servir como modelo ou
    regra para determinado fim.

Exemplos
  • TCP/IP, HTTP, URI, HTML base de funcionamento da
    Internet!
  • SMTP, POP, IMAP base para troca de e-mails
  • W3C Consórcio internacional

4
Cenário envolvendo o uso de padrões e protocolos
pesquisa
educação
nomenclatura taxonomia
dados descritivos
tomada de decisão
dados primários
modelagem
qualidade de dados
mapas
coleção biológica
5
Caso Repatriação de dados de aves do México
6
Caso Acesso a ferramentas auxiliares
7
Ferramentas auxiliares qualidade dos dados
link para registros na coleção
8
Ferramentas auxiliares qualidade dos dados
9
Feramentas auxiliares qualidade dos dados
10
  • http//www.tdwg.org/
  • Objetivos
  • - Servir como fórum international para o debate
    de projetos envolvendo dados sobre biodiversidade
  • Desenvolver e promover o uso de padrões
  • - Facilitar a troca de dados

11
  • Grupos de trabalho em atividade buscam
    estabelecer padrões para
  • Dados de Coleções Biológicas
  • Dados sobre descrição de uso de plantas
  • Dados geográficos
  • Metadados de Coleções Biológicas
  • Dados de imagens e observações
  • Dados espaciais
  • - Estrutura de dados descritivos de espécies
  • - Dados taxonômicos

12
TCS Taxonomic Concept Transfer Schema
  • Objetivo
  • Servir como padrão para troca de dados
    taxonômicos considerando as abordagens de
    diferentes grupos (taxonomistas,
    nomenclaturistas, ecólogos, etc).
  • Características técnicas
  • Utiliza XML (definido através de XML-Schema).
  • Situação
  • Aguardando homologação pelo TDWG.
  • Protótipo sendo desenvolvido repositório de
    conceitos taxonômicos.

13
TCS Taxonomic Concept Transfer Schema
  • Centrado na idéia de Conceito Taxonômico
    classificação de um grupo de organismos por uma
    pessoa num determinado momento.
  • Documentos podem conter conceitos, nomes e as
    relações taxonômicas e nomenclaturais entre eles.
  • Consegue representar vários tipos de definições
    circunscrição com base em caracteres ou em
    espécimes, e referências a outros conceitos.
  • Tipos de conceitos taxonômicos definição
    original, revisão, conceito incompleto, agregado
    de conceitos, nomenclatural (referência implícita
    a todos os conceitos que já usaram o mesmo nome).

14
SDD Structured Descriptive Data
  • Objetivo
  • Servir como padrão para armazenamento e troca de
    dados descritivos de organismos (Taxa e
    espécimes).
  • Características técnicas
  • Utiliza XML (definido através de XML-Schema).
  • Situação
  • Aguardando homologação pelo TDWG.
  • Existência de um protótipo para editar
    documentos SDD.

15
SDD Conteúdo de um documento
  • Metadados.
  • Terminologia de dados descritivos (em múltiplas
    línguas e tendo em vista múltiplos
    públicos-alvo).
  • Possibilidade de descrever categorias de
    organismos (Taxa) ou organismos específicos
    (espécimes / linhagens).
  • Descrições em linguagem natural com possibilidade
    de marcar texto.
  • Descrições codificadas.
  • Chaves de identificação.
  • Recursos adicionais (glossário, imagens, notas,
    referências, etc).

16
DarwinCore
  • Objetivo
  • Definição de elementos comuns a todos os grupos
    taxonômicos para padronizar a integração de dados
    primários de biodiversidade.
  • Características técnicas
  • Utiliza XML (definido através de XML-Schema) e
    aceita extensões.
  • Situação
  • Versão atual é utilizada pela maioria das
    redes speciesLink, GBIF, Manis, OBIS, etc.
  • Nova versão sendo discutida e aguardando
    homologação pelo TDWG.

17
DarwinCore versão atual
Date Last Modified Year Identified Locality
Institution Code Month Identified Longitude
Collection Code Day Identified Latitude
Catalog Number Type Status Coordinate Precision
Scientific Name Collector Number Bounding Box
Basis of Record Field Number Minimum Elevation
Kingdom Collector Maximum Elevation
Phylum Year Collected Minimum Depth
Class Month Collected Maximum Depth
Order Day Collected Sex
Family Julian Day Preparation Type
Genus Time of Day Individual Count
Species Continent / Ocean Previous Catalog Nº
Subspecies Country Related Catalog Item
Scientific Name Author State / Province Ralationship Type
Identified By County Notes
18
Extensão para dados de coleções microbiológicas
History of Deposit Isolation Method Strain Properties
Depositor Conditions For Growth Strain Applications
Year Deposited Genetically Modified Form Of Supply
Month Deposited Genotype Restrictions
Day Deposited Mutant Biological Risks
Substrate Race Pathogenicity
Isolator Alternate State
19
ABCD Access to Biological Collection Data
  • Objetivo
  • Estabelecer um padrão para a troca de dados e
    metadados de registros em coleções biológicas
    procurando englobar as particularidades de todos
    os grupos taxonômicos.
  • Características técnicas
  • Utiliza XML (definido através de XML-Schema).
  • Situação
  • Utilizado pela rede de coleções européias
    BioCASE.
  • Aguardando homologação pelo TDWG (iniciativa
    conjunta com CODATA).

20
ABCD Access to Biological Collection Data
  • Possui ao todo cerca de 500 elementos!
  • Contém elementos específicos para os seguintes
    tipos de coleções
  • Herbários e Jardins Botânicos
  • Coleções Zoológicas
  • Coleções de Culturas
  • Coleções Paleontológicas

21
Protocolos para busca em dados distribuídos
Linux MySQL
Win98 biota
Win98 Access
FreeeBSD PostgreSQL
Col 3
Win2000 Brahms
Col 4
Col 2
Col 5
Col 1
protocolo X
?
?
?
protocolo X
protocolo X
?
protocolo X
?
protocolo X
programa
22
Protocolos para busca em dados distribuídos
  • The Species Analyst (1999)
  • Muito complicado.
  • Impossibilidade de definir esquemas conceituais
    separadamente.
  • Suporte limitado a XML e Unicode.

Z39.50
  • Manis, speciesLink, OBIS, etc (2002)
  • Motivação inicial foi superar as limitações do
    Z39.50 produzindo um novo protocolo com novas
    ferramentas.
  • BioCASE (2003)
  • Surgiu após tentativas frustradas de convencer a
    comunidade DiGIR a alterar seu protocolo para que
    o mesmo pudesse ser usado com esquemas
    conceituais mais complexos (ABCD).

DiGIR
  • TAPIR (2004)
  • Estudo contratado pelo GBIF por recomendação de
    um dos subcomitês (DADI).
  • Existência de protocolos distintos dificulta
    interoperabilidade e acarreta duplicidade de
    esforços.

BioCASe
TAPIR
23
DiGIR Distributed Generic Information Retrieval
  • Protocolo para acesso a dados distribuídos e
    heterogêneos
  • Iniciativa (junho de 2001)
  • University of Kansas
  • California Academy of Sciences
  • Museum of Vertebrate Zoology (Berkeley)
  • Projeto financiado pela NSF (National Science
    Foundation)
  • Parceiros
  • CRIA (Fapesp)
  • GBIF

24
DiGIR Distributed Generic Information Retrieval
  • Requisitos e objetivos da proposta original
  • Utilização de padrões e protocolos abertos HTTP,
    XML e UDDI
  • Separação clara entre protocolo, software e
    semântica
  • Facilidade na instalação e configuração de
    provedores de dados
  • Desenvolvimento colaborativo (modelo open
    source)
  • Produtos disponíveis a todos através de licensa
    pública (GPL - GNU General Public License)

25
Uso de esquema conceitual em busca distribuída
Linux MySQL
Win98 biota
Win98 Access
FreeeBSD PostgreSQL
Col 3
Win2000 Brahms
Col 4
Col 2
mapeamento
Col 5
Col 1
mapeamento
mapeamento
protocolo X
mapeamento
mapeamento
protocolo X
protocolo X
protocolo X
protocolo X
DarwinCore
programa
26
DiGIR exemplo de requisição de busca
27
Recomendações gerais
  • Acompanhar os padrões e protocolos sendo usados
    ou discutidos
  • Quão compatíveis estão meus dados em relação
    aos padrões atuais?
  • Quão compatível é meu sistema de gerenciamento em
    relação aos padrões e protocolos atuais?
  • Participar das redes de informação sobre
    biodiversidade sendo criadas
  • Maior visibilidade e valor para a coleção
  • Fazer uso de eventuais ferramentas
    disponibilizadas pelas redes
  • Fazer uso das redes de informação sobre
    biodiversidade existentes

28
  • Obrigado
  • renato at cria . org . br
Write a Comment
User Comments (0)
About PowerShow.com