Title: Bases de datos' Repaso histrico'
1Bases de datos. Repaso histórico.
Alumna Isabelle Hupont Torres
2Estructura de la presentación
- Introducción- Repaso histórico- 90s- Siglo
XXI- Conclusión
3Estructura de la presentación
- Introducción- Repaso histórico- 90s- Siglo
XXI- Conclusión
4Introducción. Generalidades I.
- La llamada DB research community juega un papel
fundamental en la creación de la infraestructura
tecnológica a partir de la cual evolucionan los
avances en BD. - Desde principios de los 90, se celebran una serie
de reuniones con el propósito de evaluar/examinar
el estado de la investigación en BD - De forma lo más objetiva posible
- Auto-critica
- Se votan los topics que se consideran más
relevantes y también los que se estiman
sobrevalorados overrated topics.
5Introducción. Generalidades II.
- The purpose of the workshop was to discuss what
DBMS topics deserve research attention in the
future - Topics más relevantes
- each participant presented topics that he
thought were important and that he would like to
investigate - Overrated topics
- topics unlikely to yield signifiant research
progress - topics he would be happy never to see another
paper on - Reuniones llevadas por senior researchers
- Ampliamente experimentados
- Conocen el campo
6Introducción. Los participantes.
7Introducción. Referencias/Meetings.
8Introducción. Meetings.
- 1989 Laguna Beach, CA
- 1993 Vienna
- 1995 San Jose, CA
- 1998 Asilomar, CA
- 2003 Lowell, Massachusets
9Estructura de la presentación
- Introducción- Repaso histórico- 90s- Siglo
XXI- Conclusión
10Estructura de la presentación
- Introducción- Repaso histórico- 90s- Siglo
XXI- Conclusión
11Repaso histórico. Generalidades.
- 60s principios
- 70s génesis
- 80s desarrollo
- 90s madurez
12Repaso histórico. 60s - principios.
- Datos almacenados directamente en archivos.
- Problemas
- Redundancia e inconsistencias
- Dificultad de acceso
- Integridad lógica
- Seguridad
- Atomicidad de las transacciones
- SGBDs pioneros IMS, TOTAL
- Problemas encaminados
- Redundancia e inconsistencias
- Atomicidad de las transacciones
- Seguridad
- Problemas abiertos
- Dificultad de acceso
- Integridad lógica
13Repaso histórico. 70s génesis.
- Inicio de la década
- Modelo Relacional 1970
- Una única estructura de datos relaciones
- Álgebra relacional
- Cálculo relacional
- Formas normales 1NF, 2NF, 3NF
- B-trees 1972
- Mantienen los datos ordenados. Inserciones y
eliminaciones se realizan de manera eficiente.
Especialmente buenos para trabajar con grandes
volúmenes de claves en memoria secundaria.
14Repaso histórico. 70s génesis.
15Repaso histórico. 70s génesis.
- Mitad de la década
- SGBD relacionales pioneros
- System R 1976 e Ingres 1976
- Introducción de la mayor parte de la tecnología
utilizada en SGBDs actuales, incluido el lenguaje
SQL 1974 - Problemas encaminados
- Redundancia e inconsistencias
- Atomicidad de las transacciones
- Seguridad
- Dificultad de acceso
- Problemas parcialmente encaminados
- Integridad lógica
16Repaso histórico. 80s desarrollo.
- Inicio de la década
- SGBD relacionales distribuidos pioneros
- System R e Ingres distribuido
- Extensiones de la tecnología relacional para
tratar BDDs - Ejemplo optimización de consultas distribuidas
- Desarrollo de nuevas tecnologías para tratar
nuevos problemas - Ejemplo protocolo 2PC para terminación de
transacciones.
17Repaso histórico. 80s desarrollo.
- Mitad de la década
- SGBDs orientados a objeto (SGBD-OO)
- Se basan en el paradigma de orientación a objeto,
como los lenguajes de programación OO. - SGDB-OOs pioneros
- O2 1988
- Exodus 1986
- ORION 1986
- Próxima generación de SGBD-Rs
- Combinan características de OO con el modelo
relacional. - Expanden la arquitectura de SGBDs con nuevas
posibilidades. - Ejemplo optimizadores de consultas
configurables. - Ejemplos
- POSTGRES 1986
- STARBURST
18Repaso histórico. 80s desarrollo.
- Final de la década
- Madurez tecnológica de SGBDs
- Varios SGBD-Rs con desempeño aceptable
- DB2, Ingres, Oracle, Sybase, Informix
- Estandarización de SQL 1986,1989
19Estructura de la presentación
- Introducción- Repaso histórico- 90s- Siglo
XXI- Conclusión
20Estructura de la presentación
- Introducción- Repaso histórico- 90s- Siglo
XXI- Conclusión
2190s 1989.
-
- The Laguna Beach Report
- M. Stonebraker et al., "The Laguna Beach
Report", International Institute of Computer
Science Technical Report 1, Berkeley, CA., June
1989.
2290s. 1989 DBMS Research Laguna Beach, CA.
2390s. 1989 DBMS Research Laguna Beach, CA.
- Sistemas de reglas que soporten triggers y alertas
Estudio de nuevas áreas de aplicación como
Computer Integrated Manufacturing (CIM), BD de
imágenes, Information Retrieval (IR) y Computer
Assisted Software Engineering (CASE).
2490s. 1989 DBMS Research Laguna Beach, CA.
No son considerados la mejor manera de diseñar
sistemas expertos de BD. Se prefiere el uso de
sistemas de reglas integrados con el DBMS.
Muy trabajados, pocas mejoras que ofrecer.
- El software es mucho más prometedor.
Desuso (no se necesita)
2590s. 1989 DBMS Research Laguna Beach, CA.
Tema muy debatido. Se duda de la naturaleza de
estos sistemas y de la relación entre los OODBs y
los sistemas relacionales.
2690s 1993.
-
- The DBMS Research at crossroads the Vienna
update - M. Stonebraker et al., "The DBMS Research at
Crossroads The Vienna Update", Proceedings of
the VLDB Conference, pp. 688-692, Dublin,
Aug.1993.
2790s. 1993 DBMS Research the Vienna update.
2890s. 1993 DBMS Research the Vienna update.
Existe mucho entusiasmo con las nuevas interfaces
de usuario, como los lenguajes de workflow y
herramientas de colaboración. Se lamenta que la
investigación en este campo se limite a las
empresas.
2990s. 1993 DBMS Research the Vienna update.
- Se debe estudiar el problema de escalar los DBMS
a VLDBs (multi-terabyte) y a sistemas con un gran
número de clientes (miles). - Esto implica
- Copiar con control de memoria en una jerarquía
multi-nivel. - Hacer caching inteligente.
- Enfrentarse a problemas como no tener que tirar
el sistema cuando un cliente instala una nueva
copia de un programa o mantener el seguimiento de
una aplicación de la cual diferentes clientes
están ejecutando diferentes versiones.
3090s. 1993 DBMS Research the Vienna update.
- Muchas compañías quiere dejar sus viejos DBMS
obsoletos y moverse a nuevos DBMS con tecnología
cliente-servidor. - Problema reescribir todos los datos. Se necesita
la creación de estrategias de migración. - Se muestra entusiasmo por la ingeniería inversa y
sugerencias arquitecturales.
3190s. 1993 DBMS Research the Vienna update.
- Cómo almacenar grandes objetos multimedia en BD?
- Cómo indexarlos?
- Cómo dar servicios que garanticen su recepción?
3290s. 1993 DBMS Research the Vienna update.
- Minar los datos para tener información útil
- Problemas de soporte a la decisión
- Respuestas a queries de tipo dime algo
interesante
3390s. 1993 DBMS Research the Vienna update.
- Serivicios en los que es cliente estará
intermitentemente conectado a un DBMS. - Problemas
- Operar el sistema en modo desconectado y hacer
merging. - Minimizar el consumo (potencia)
3490s. 1993 DBMS Research the Vienna update.
Optimización inteligente de queries que contienen
funciones definidas por el usuario (fruto del
nacimiento de los SGBD-OOs).
3590s. 1993 DBMS Research the Vienna update.
- Hardware y software son un mundo cerrado.
- Problemas
- Alta disponibilidad nuevas versiones del
software deben instalarse sin tirar el
dispositivo. - Performance extremadamente alta.
3690s. 1993 DBMS Research the Vienna update.
Dead topics
3790s. 1993 DBMS Research the Vienna update.
Los estudios deben reflejar el estado actual, no
realidades pasadas que nunca se volverán a dar.
3890s. 1993 DBMS Research the Vienna update.
Jim Gray formula la Ley In a well-designed
data base, the probability of waiting as a result
of a lock request is less than 0.01 Las bases
de datos pueden sin problemas ser rediseñadas
para hacer la probabilidad de espera muy baja en
stmas reales.
Los estudios deben reflejar el estado actual, no
realidades pasadas que nunca se volverán a dar.
3990s. 1993 DBMS Research the Vienna update.
El estándar XA va a forzar a soportar una
capacidad de transacción distribuida común,
solucionando este problema.
4090s. 1993 DBMS Research the Vienna update.
Comparado con SQL, C va a desaparecer del
mercado. Hay que explorar áreas con más
posibilidades de penetración en el mercado.
4190s. 1993 DBMS Research the Vienna update.
No merece la pena estudiar sistemas que no
soporten todas las propiedades ACID (Atomicity,
Consistency, Isolation, Durability).
4290s. 1993 DBMS Research the Vienna update.
Se reposicionan los OODBs. Se empiezan a combinar
las buenas características de los DBMSs
relacionales (acceso SQL a datos simples) con los
OODBs (modelado de datos complejos).
4390s. 1993 DBMS Research the Vienna update.
- Conclusiones del ejercicio
- Los topics importantes de Laguna Beach fueron
extensamente investigados y se eliminaron de la
lista (excepto las nuevas interfaces de usuario).
Los topics negativos cesaron/desaparecieron. - En 1993 los papers sobre temas negativos eran
numerosos la comunidad estaba mal encaminada. - Están en un punto denominado crossroads se
puede continuar por el camino tradicional o
explorar nuevos caminos más costosos. - Los 90s deberían centrarse más en las
aplicaciones y menos en la tecnología. - Boom de publicaciones too many papers
researchers seem to dissect their ideas into
least publishable units, so as to maximize the
length of their vitae.
4490s 1995.
-
- Database Research Achievements and
Opportunities Into the 21st Century - Avi Silberschatz, Michael Stonebraker, and
Jeffrey D. Ullman. Database Research
Achievements and Opportunities into the 21st
Century. Technical Report CS-TR-96-1563,
Stanford Technical Report, 1996.
http//elib.stanford.edu/.
4590s. 1995 Database Research San Jose, CA.
- Generalidades
- Revisando los papers de años anteriores se
concluye - The database research community plays a
foundational role in creating the technological
infraestructure from which advancements evolve. - Nacen nuevas áreas de investigación debido a
- Empiezan a aparecer DBMSs más sofisticados
(relacionalesOO), que soportan transacciones
largas y versiones y configuraciones. - Prácticamente todas las empresas incluyen ya un
procesado de información computerizado. Las
aplicaciones cliente-servidor migran a BD. - Aparecen nuevos tipos de datos explosión de la
información digital, documentos multimedia, datos
espaciales para GIS (Geographic Information
Systems) - El desarrollo tecnológico del pasado reciente
- Capacidad y poder del hardware
- Desarrollo de las comunicaciones web y móviles -
The world is on-line and exchanging
information. - Se necesita mayor ayuda gubernamental e
industrial en investigación sobre BD para
responder a estas necesidades.
4690s. 1995 Database Research San Jose, CA.
- Ejemplos de aplicaciones de próxima generación
- EOSDIS Earth Observing System Data and
Information System - Previsto para 1998.
- Colección de satélites enviados por la NASA para
recoger información terrestre, que será accesible
a todo público. - 1015 bytes de información/año.
- Retos
- Dar acceso on-line a los datos y controlar
eficientemente los almacenes terciarios. - Soportar miles de clientes con gran volumen de
peticiones. - Diseñar mecanismos para búsquedas eficientes de
material. - Mas información http//www.esdis.eosdis.nasa.gov/
- Comercio electrónico
- Catálogos electrónicos y compras on-line.
- Gran número de participantes (compradores
vendedores). - Retos
- Integración de múltiples fuentes de información.
- Necesidad de autenticación segura, fiabilidad y
transferencia de fondos.
4790s. 1995 Database Research San Jose, CA.
- Ejemplos de aplicaciones de próxima generación
- Health Care Information Systems
- Información sobre pacientes, medicamentos,
diagnósticos, - Retos
- Control para preservar la confidencialidad del
historial del paciente. - Integración de formas heterogéneas de información
legada. - Interfaces de información apropiados para el uso
de todos los médicos. - Publicaciones digitales (BiDs)
- Publicar libros y artículos y enviarlos sobre
redes de alta velocidad a los consumidores. - El documento puede incluir video, imágenes,
anotaciones, etc. - Retos
- Manejar grandes volúmenes de datos, envío en
tiempo real. - Protección de la propiedad intelectual.
- Organización y acceso a la información.
4890s. 1995 Database Research San Jose, CA.
- Ejemplos de aplicaciones de próxima generación
- Diseño colaborativo
- Desarrollo de grandes proyectos realizados en
consorcio entre compañías independientes. - Retos
- Integración de varias fuentes de información,
muchas veces legadas. - Nuevos diseños para control de concurrencias y
mecanismos de sharing entre BD. - Interacción entre colecciones de procesos que
requieren workflows. - Soporte para versiones y configuraciones
(releases) del diseño.
4990s. 1995 Database Research San Jose, CA.
- RESEARCH AGENDA
- Soporte para objetos multimedia
- Distribuir la información
- Nuevos usos para sistemas de BD
- Nuevos modelos de transacción
- Facilidad de uso y control de las BDs
5090s. 1995 Database Research San Jose, CA.
- SOPORTE PARA OBJETOS MULTIMEDIA
- Problemas asociados con poner objetos multimedia
en DBMSs. - Almacenes terciarios los datos ocupan un volumen
tan grande que no se pueden guardar únicamente en
discos. Problema tiempo de acceso. - Nuevos tipos de datos cada tipo de dato
multimedia requiere su propia colección de
operaciones y funciones. Retos - Pensar en la implementación de las operaciones
disponibles para cada tipo de dato multimedia. - Integración de los datos que requieren varios
tipos nuevos de datos. - QoS asegurar que los datos llegan con la calidad
apropiada. - Ejemplo video con audio.
- Nuevas técnicas de optimización (e.g.
interpolación, extrapolación).
5190s. 1995 Database Research San Jose, CA.
- SOPORTE PARA OBJETOS MULTIMEDIA
- Queries multi-resolución abiertas a nociones más
imprecisas. - Ejemplo buscar color o textura en imágenes.
- Nuevas Interfaces de usuario para acceder a la
nueva información multimedia. Nuevas formas para
buscar y visualizar datos. - Ejemplo buscar zonas específicas en un mapa.
5290s. 1995 Database Research San Jose, CA.
- 2. DISTRIBUIR LA INFORMACIÓN
- La distribución de información en la Web implica
retomar varios conceptos. - Grado de autonomía. El sistema distribuido debe
- Posibilitar que un participante rechace una
conexión. - Tener en cuenta que diferentes participantes
puedan usar el sistema con diferentes capacidades - Pagos en respuesta a servicios information for
sale - Nuevas estrategias de diseño
- Ejemplo contador de accesos a la información.
- Algoritmos para hacer manejar información acerca
de pagos - Ejemplo dime el sitio más barato donde puedo
encontrar la información. - Seguridad y privacidad
- Concepto de roles.
- Cómo vender info a usuarios cuya identidad es
desconocida para el vendedor?
5390s. 1995 Database Research San Jose, CA.
- 2. DISTRIBUIR LA INFORMACIÓN
- Replicación y reconciliación. El entorno Web
sufre frecuentes desconexiones, se necesitan
algoritmos eficientes para - Replicación replicar datos por razones de
eficiencia. - Reconciliación mantener copias de la misma
información consistentemente, aunque alguna de
ellas haya estado desconectada de la red en algún
momento. - Integración de datos y conversión integración de
fuentes con gran variedad de formatos y modelos. - Investigación sobre mediators modelos
intermedios para traducir los datos - Information retrieval búsqueda de técnicas para
indexar información no estructurada en la web
(hasta entonces solo se indexaba info
estructurada). - Calidad de los datos necesidad de métodos para
evaluar la calidad de la información y la
confianza en la fuente.
5490s. 1995 Database Research San Jose, CA.
- 3. NUEVOS USOS PARA SISTEMAS DE BDs
- Data Mining extracción de información inesperada
sobre grandes cantidades de datos almacenadas
para otros propósitos. - Optimización de técnicas para queries complejas
(agregación, agrupación). - Técnicas para soportar queries multidimensionales
(diferentes dimensiones de búsqueda). - Lenguajes de queries de alto nivel e interfaces
que soporten las queries ad-hoc de personas
no-expertas. - Data Warehouse copia de datos provenientes de
una o mas BDs. - Data pumps modulos para obtener de la fuente
las actualizaciones de la información almacenada,
traduciéndolas al esquema del warehouse. - Data scrubbing hacer que los datos sean
consistentes identificandp valores que
representan el mismo objeto (e.g. A. Perez y
Ana Perez). - Facilidades para crear y mantener un
metadiccionario que informe de cómo se han
obtenido los datos.
5590s. 1995 Database Research San Jose, CA.
- 3. NUEVOS USOS PARA SISTEMAS DE BDs
- Repositorios aplicaciones que manejan datos y
metadatos. - Deben permitir representar la evolución de la
información versiones y configuraciones. - Objetivo creación de un sistema gestor de
repositorios.
5690s. 1995 Database Research San Jose, CA.
- 4. NUEVOS MODELOS DE TRANSACCIÓN
- Necesidad de crear nuevos modelos de transacción
para atacar múltiples BDs independientes. - Concepto de workflow romper largas
transacciones en pequeños pasos y controlar su
ejecución. - 5. FACILIDAD DE USO
- Mejorar las interfaces para facilitar su uso y su
actualización. - Necesidad provocada por la expansión del papel de
la información en la sociedad.
5790s. 1995 Database Research San Jose, CA.
- Otras conclusiones
- Estos nuevos retos han de resolverse rápidamente
para responder a la demanda de la sociedad. - Se prevee una época de grandes descubrimientos
tanto en el ámbito industrial como académico
5890s 1998.
-
- The Asilomar Report on Database Research
- Berstein et al. The Asilomar Report on Database
Research. - SIGMOD Record, Vol. 27, Issue 4, p. 74-80, 1998.
5990s 1998 Database Research, Asilomar.
- Generalidades
- Resumen de años anteriores se han realizado
grandes descubrimientos relacionados con
optimización de queries, sistemas de BDs
objeto-relacionales, BDs activas, replicación de
datos y paralelismo. - Se critica el exceso de publicaciones a corto
plazo. Para acelerar la transición y la
adaptación al crecimiento de la Web se necesitan
grandes esfuerzos de investigación hacia nuevas
áreas. - The Grand Challenge. Objetivo a 10 años
- The Information Utility Make it easy for
everyone to store, organize, - access, and analyze the majority of human
information online.
6090s 1998 Database Research, Asilomar.
- Driving forces
- La Web e Internet hacen fácil y atractiva la
publicación de toda la información en el
ciberespacio, haciéndola accesible para todo
público. - Necesario el manejo de contenido dinámico, no
solo de páginas HTML estáticas. - Extensión de XML para describir datos
estructurados. Necesaria la integración de estos
datos estructurados con la web. - Necesidad de herramientas para producir grandes
almacenes de datos rápida y económicamente. - Integración de programas y datos
- Necesidad promovida por las técnicas
objeto-relacionales y Java. - Nuevos servicios web para favorecer la
interoperabilidad de las aplicaciones. - Avances hardware. A gran y pequeña escala
- Los avances (CPU, discos, velocidades de
conexión) invalidan las decisiones de diseño de
la tecnología DBMS actual (estructuras de datos,
algoritmos y utilidades). - Explosión en escala y tamaño de clientes y
servidores aparición de gizmos (PDAs,
teléfonos móviles, smart-cards) son candidatos a
nuevas tecnologías de BDs.
6190s 1998 Database Research, Asilomar.
- RESEARCH AGENDA
- SGBDs Plug and Play
- BDs sin necesidad de administración
(self-tuning). - Adaptación del sistema a cambios de condiciones
(no-knobs operations). - Descubrimiento automático de información basado
en metadatos, capturando la semántica de los
datos. - Temas de investigación
- BDs auto-configurables
- Bancos de datos ricos en metadatos
- Federación de BDs a larga escala
- La Web es un gran sistema federado millones de
clientes acceden millones de BDs. - Temas de investigación
- Optimizadores de consultas para federaciones con
millones de BDs. - Ejecución de consultas basadas en acumulación de
evidencia. El usuario decide parar cuando la
respuesta es suficientemente buena. - Integración de BDs al sistema federado asistidas
por herramientas.
6290s 1998 Database Research, Asilomar.
- RESEARCH AGENDA
- 3. Revisión de la arquitectura tradicional de
SGBDs - Necesidad de operación continua never fails.
- Necesidad de almacenar grandes volúmenes de
datos - Imágenes satélites, TV digital...
- Tema de investigación
- Revisión de la mayoría de los componentes de un
SGBD. - 4. Integración de datos estructurados y
semi-estructurados - XML datos organizados jerárquicamente (no
relacionales ni OOs). - Temas de investigación
- Unificación de las tecnologías de BDs y de la
web.
6390s 1998 Database Research, Asilomar.
- RESEARCH AGENDA
- 5. Integración de programas y datos. Temas de
investigación - Sistemas capaces de escalar miles de triggers.
- Ejemplo broker de bolsa que debe ser avisado de
numerosos cambios en los datos. - Integrar distintos modelos de componentes
incompatibles (EJBs, OLE, etc.) en un SGBDs
objeto-relacional. - Lenguajes de programación persistentes combinar
SQL y programas de persistencia eficientes en el
mismo sistema, sobretodo cuando el entorno tiene
continuas actualizaciones.
64Estructura de la presentación
- Introducción- Repaso histórico- 90s- Siglo
XXI- Conclusión
65Estructura de la presentación
- Introducción- Repaso histórico- 90s- Siglo
XXI- Conclusión
66Siglo XXI. Dónde estamos?
- Datos (2002)
- 5 millones de terabytes (5 exabytes) de
información nueva. - 92 de información almacenada en medio digital.
- 0,4 millones de terabytes enviados por mail.
- http//www2.sims.berkeley.edu/research/projects/ho
w-much-info-2003/
67Siglo XXI. Dónde estamos?
68Siglo XXI. Dónde estamos?
- Trivialización del uso de tecnología de BDs
- Proliferación de productores y consumidores de
datos - Aplicaciones de almacenamiento del orden de
petabytes
69Siglo XXI 2003.
-
- The Lowell Database Research Self Assessment
- Abiteboul et al. The Lowell Database Research
Self Assessment. - Communications of the ACM, Vol. 48, Nº 5, p.
111-118, 2003.
70Siglo XXI 2003 Database Research, Lowell.
71Siglo XXI 2003 Database Research, Lowell.
72Siglo XXI 2003 Database Research, Lowell.
73Siglo XXI 2003 Database Research, Lowell.
74Siglo XXI 2003 Database Research, Lowell.
- Nuevas aplicaciones de monitorización que generan
secuencias de datos.
75Siglo XXI 2003 Database Research, Lowell.
76Siglo XXI 2003 Database Research, Lowell.
77Siglo XXI 2003 Database Research, Lowell.
78Siglo XXI 2003 Database Research, Lowell.
79Estructura de la presentación
- Introducción- Repaso histórico- 90s- Siglo
XXI- Conclusión
80Estructura de la presentación
- Introducción- Repaso histórico- 90s- Siglo
XXI- Conclusión
81Conslusión.
82Gracias por vuestra atención