Sites de Busca - PowerPoint PPT Presentation

About This Presentation
Title:

Sites de Busca

Description:

... either written texts or a transcription of recorded speech, ... A Dictionary of Linguistics and Phonetics, Blackwell, 3rd Edition, 1991. The plural is corpora. – PowerPoint PPT presentation

Number of Views:93
Avg rating:3.0/5.0
Slides: 17
Provided by: Isabe170
Category:

less

Transcript and Presenter's Notes

Title: Sites de Busca


1
Sites de Busca
2
Surgimento dos primeiros sistemas de busca
  • AltaVista, foi desenvolvido durante a primavera
    de 1995 por cientistas no Laboratório de
    Pesquisas da Digital Equipment Corporation em
    Palo Alto, Califórnia (EUA) primeiro banco de
    dados textual pesquisável da Web.
  • Google, foi fundado por Larry Page e Sergey Brin,
    dois estudantes do curso de Doutorado de Stanford
    em 1998.

3
Não recomendado para
  • ... Fazer compras em XXX é o mesmo que comprar
    em qualquer cidade grande com uma excessão
    língua. (Guia de compras).
  • Era do Estado de Direito ou Era da excessão? ...
    (autor- Produtor Cultural - SIC)
  • Ortografia
  • inguinorante 12.900 ocorrências
  • poblema 172.000 ocorrências, mas em português
    foram 78.300
  • excessão 11700 ocorrências

4
Invisible Web
  • Objetivo dos sites de busca
  • Quem patrocina?
  • Páginas com inclusão prioritária
  • Páginas com exclusão automática (Power points,
    .doc, entre outros)
  • CONCLUSÃO

5
Remédios
  • Tomar ciência de sua existência
  • Contornar os limites da web
  • Acesso aos bancos de dados (database) e
    bibliotecas (library)
  • Criar seus próprios bancos de dados (Corpora)

6
Ferramentas de Auxílio à Tradução (CAT tools)
  • Machine Translation
  • CAT (Computer-Assisted Translation)
  • Segmentation and Translation Memory
  • Translation Unit
  • Glossaries

7
CAT tools

                                                                                                     

                                                                                                     

                                                                                                     
8
(No Transcript)
9
Dilemas das CAT tools
  • Cobrança por palavras
  • Cobrança por palavras novas
  • Memórias compartilhadas, memórias enviadas
  • Texto sujo
  • Estigma da TM

10
  • Listas de Discussão e Grupos de Ajuda Mútua
    (Profissão Tradutor yahoogroups)

11
(No Transcript)
12
Pesquisa de corpus
  • Definição
  • What is a Corpus?
  • A collection of linguistic data, either written
    texts or a transcription of recorded speech,
    which can be used as a starting-point of
    linguistic description or as a means of verifying
    hypotheses about a language
  • David Crystal, A Dictionary of Linguistics and
    Phonetics, Blackwell, 3rd Edition, 1991.
  • The plural is corpora.

13
(No Transcript)
14
(No Transcript)
15
Corpora Prontos
  • BNC monolingual, synchronic, general, written
    texts, British English
  • Cobuild (Collins Birmingham University
    International Language Database )
  • CORIS/CODIS Corpus of Written Italian
  • FLLOC French Learner Language Oral Corpora

16
http//www.natcorp.ox.ac.uk/
Write a Comment
User Comments (0)
About PowerShow.com