World%20Wide%20Web%20M.%20Andrea%20Rodr - PowerPoint PPT Presentation

About This Presentation
Title:

World%20Wide%20Web%20M.%20Andrea%20Rodr

Description:

La Web se inicia en marzo de 1989 propuesto por el investigador Tim ... Arquitectura de Cosecha. Ranking. Modelos m s usados: Boolean o Vector y sus variaciones ... – PowerPoint PPT presentation

Number of Views:80
Avg rating:3.0/5.0
Slides: 12
Provided by: infU1
Category:

less

Transcript and Presenter's Notes

Title: World%20Wide%20Web%20M.%20Andrea%20Rodr


1
World Wide WebM. Andrea Rodríguez TastetsDIIC -
Universidad de Concepciónhttp//www.inf.udec.cl/
andrea
2
Introducción
  • La Web se inicia en marzo de 1989 propuesto por
    el investigador Tim Berners-Lee, como un proyecto
    de desarrollo de un sistema de hipertexto, es
    decir un sistema de creación y distribución de
    documentos, que permitiera compartir información
    desarrollada en diferentes aplicaciones, de forma
    sencilla y eficiente, entre equipos de
    investigadores ubicados en distintos lugares
    geográficos.

3
Requerimientos iniciales
  • Obtener una interfaz consistente, es decir el
    sistema debería permitir una conexión que al
    menos asegurara una transferencia de datos
    consistente (lo que envío es obtenido intacto).
  • Permitir incorporar un amplio rango de
    tecnologías y distintos tipos de documentos.
  • Proveer de una herramienta que permita leer los
    documentos desde cualquier lugar y por cualquier
    individuo que este navegando dentro de este
    almacén, y deberá permitir que cualquier
    documento sea accequible en forma paralela por
    dos o más personas de forma sencilla.

4
Posteriormente
  • A principios de 1993 se vio surgir al browser
    Mosaic, que cumplía con todos los requerimientos
    que se buscaban (funcionamiento en diversas
    plataformas, poseer una interfaz grafica y fácil
    de usar), lo que produjo su éxito inmediato.
    Después aparecieron Netscape de Netscape Inc. e
    Internet Explorer de Microsoft. Finalmente a
    fines de 1994 y principios de 1995, se formó el
    Consorcio World Wide Web o W3C que esta bajo la
    dirección del fundador de la Web

5
Desafíos de RI
  • ? Datos distribuidos sobre diferentes plataformas
  • ? Datos volátiles
  • ? Gran volumen de datos
  • ? Datos redundantes y no estructurados
  • ? Calidad de los datos
  • ? Datos heterogeneos.

6
Directorios son Robot
  • Directorios o buscador sin Robot estos
    buscadores son administrados por personas. Debido
    a esta razón están limitados en el tamaño de la
    base de datos que contiene los documentos
    indexados, es decir limitan el campo de búsqueda.
    Los documentos se indexan después de un análisis
    que también es hecho por personas, es decir, su
    crecimiento se limita a la velocidad de trabajo
    de las personas (incluye actividades como
    agregar páginas nuevas, eliminar páginas que han
    expirado o que han sido eliminadas, etc.).

7
Máquinas de Búsqueda
  • La indexación de documentos es realizada
    automáticamente a través de SW que indexa las
    páginas existentes en la Web.

8
Arquitectura Crawler-Indexer
9
Arquitectura de Cosecha
10
Ranking
  • Modelos más usados Boolean o Vector y sus
    variaciones
  • Ranking tiene que realizarse sin accesar el
    texto,sólo el índice
  • Los algoritmos de ranking son top secret
  • Es casi imposible determinar el recall

11
Ranking
  • No sólo texto,pero también hyperlinks
  • La importancia de una página depende de quién
    apunta ella o a quién apunta.
  • La web como una grafo dirigido
Write a Comment
User Comments (0)
About PowerShow.com