OLAP et SOLAP - PowerPoint PPT Presentation

1 / 45
About This Presentation
Title:

OLAP et SOLAP

Description:

S'exprime par une grande quantit de produits logiciels disponibles sur le march ... 02 ' du niveau ' r gion ' de la dimension ' d coupage administratif ' ... – PowerPoint PPT presentation

Number of Views:810
Avg rating:3.0/5.0
Slides: 46
Provided by: yvanb9
Category:

less

Transcript and Presenter's Notes

Title: OLAP et SOLAP


1
OLAP et SOLAP
  • Notions avancées de bases de données SIG
  • Yvan Bédard

2
OLAP
  • Il sagit dune catégorie de logiciels axés
    sur lexploration et lanalyse rapide des données
    selon une approche multidimensionnelle à
    plusieurs niveaux dagrégation  (Caron, 1998)

3
OLAP
  • Catégorie de logiciels
  • Sexprime par une grande quantité de produits
    logiciels disponibles sur le marché
  • Exploration et analyse rapide
  • OLAP vise à assister lusager dans son analyse en
    lui facilitant lexploration de ses données et en
    lui donnant la possibilité de le faire rapidement
  • Rapidité et facilité

4
OLAP
  • Facilité
  • Lusager na pas à maîtriser des langages
    dinterrogation et des interfaces complexes
  • Lusager interroge directement les données, en
    interagissant avec celles-ci
  • Rapidité
  • OLAP exploite une dénormalisation maximale des
    données, sous la forme dune pré-agrégation
    stockée
  • Lusager devient opérationnel en très peu de
    temps
  • Lusager peut se concentrer sur son analyse et
    non sur le processus (les moyens utilisés pour
    lanalyse)

5
OLAP
  • Approche multidimensionnelle
  • Basée sur des thèmes danalyse (dimensions)
  • Plus intuitive
  • Plusieurs niveaux dagrégation
  • Les données peuvent être groupées à différents
    niveaux de granularité (les regroupements sont
    pré-calculés, par exemple, le total des ventes
    pour le mois dernier calculé à partir de la somme
    de toutes les ventes du mois).
  • Granularité niveau de détail des données
    emmagasinées dans une base de données.

6
Vocabulaire OLAP
  • Dimension
  • Une dimension peut être définie comme un thème,
    ou un axe (attributs), selon lequel les données
    seront analysées (en fonction de )
  • Ex. Temps, Découpage administratif, Produits
  • Une dimension contient des membres organisés en
    hiérarchie, chacun des membres appartenant à un
    niveau hiérarchique (ou niveau de granularité)
    particulier
  • Ex. Pour la dimension Temps, les années, les mois
    et les jours peuvent être des exemples de niveaux
    hiérarchiques. 1998 est un exemple de membre du
    niveau Année

7
Vocabulaire OLAP
  • Mesure
  • Une mesure est un élément de donnée sur lequel
    portent les analyses, en fonction des différentes
    dimensions
  • Ex. coût des travaux, nombre daccidents, ventes,
    dépenses

8
Vocabulaire OLAP
  • Fait
  • Un fait représente la valeur dune mesure,
    mesurée ou calculée, selon un membre de chacune
    des dimensions (ex. ce qui est recueilli par les
    systèmes transactionnels).
  • Ex. le coût des travaux en 1995 pour la région
    02 est 250 000 est un fait qui exprime la
    valeur de la mesure coût des travaux pour le
    membre 1995 du niveau  année  de la
    dimension temps  et le membre 02 du niveau
    région de la dimension découpage
    administratif .

9
Vocabulaire OLAP
  • Cube
  • Un ensemble de mesures organisées selon un
    ensemble de dimensions (aussi hypercube)
  • Ex. Un cube de ventes qui comprend
  • Les dimensions Temps, Produit, Magasin
  • La mesure Ventes en

10
Cube multidimensionnel
  • Ce cube multidimensionnel présente les profits
    dentreprises agricoles par propriété, par
    exploitation et par année.

Cas 1 visualisation des profits des propriétés gt
0.05 km2 pour toutes les exploitations durant
les 4 années. Cas 2 visualisation des profits
des propriétés gt 1.5 km2 pour lexploitation de
légumes pour lannée 1993.
11
Composantes OLAP
  • Larchitecture OLAP consiste en trois services
  • Base de données
  • Doit supporter les données agrégées ou résumées
  • Peut provenir dun entrepôt ou dun marché de
    données
  • Doit posséder une structure multidimensionnelle
    (SGDB multidimensionnel ou relationnel)
  • Serveur OLAP
  • Gère la structure multidimensionnelle dans le
    SGBD
  • Gère laccès aux données de la part des usagers
  • Module client
  • Permet aux usagers de manipuler et dexplorer les
    données
  • Affiche les données sous forme de graphiques
    statistiques et de tableaux
  • Selon le type de base de données accédé,
    plusieurs configurations sont possibles
    multidimensionnelle, relationnelle ou hybride

12
MOLAP(OLAP Multidimensionnel)
  • Les données détaillées de base ainsi que les
    données agrégées de lentrepôt sont stockées dans
    une base de données multidimensionnelle (souvent
    appelée cube ou hypercube)
  • Une base de données multidimensionnelle utilise
    une structure propriétaire au logiciel utilisé (?
    matrice)
  • Le serveur MOLAP extrait les données de
    lhypercube et les présente directement au module
    client

13
MOLAP(OLAP Multidimensionnel)
14
ROLAP (OLAP Relationnel)
  • Les données détaillées de base ainsi que les
    données agrégées de lentrepôt sont stockées sous
    forme de tables dans une base de données
    relationnelle
  • La base de données relationnelle doit être
    structurée selon un modèle particulier (étoile,
    flocon, )
  • Le serveur extrait les données par des requêtes
    SQL et interprète les données selon une vue
    multidimensionnelle avant de les présenter au
    module client

15
ROLAP (OLAP Relationnel)
16
HOLAP (OLAP Hybride)
  • Architecture qui consiste en un croisement des
    architectures MOLAP et ROLAP
  • Les données détaillées de base de lentrepôt sont
    stockées dans une base de données relationnelle
    et les données agrégées sont stockées dans une
    base de données multidimensionnelle
  • Le serveur HOLAP accède deux bases de données et
    les présente au module client, selon une vue
    multidimensionnelle dans le cas des données de la
    BD relationnelle

17
HOLAP (OLAP Hybride)
18
MOLAP vs ROLAP vs HOLAP
MOLAP
HOLAP
Critère de comparaison
ROLAP
Stockage des données de base (détaillées)
BD relationnelle
BD multidimensionnelle
BD relationnelle
BD relationnelle
Stockage des agrégations
BD multidimensionnelle
BD multidimensionnelle
Performance des requêtes (habituellement)
Le moins performant
Le plus performant
Performance moyenne
19
Structure multidimensionnelle
  • Pour une configuration ROLAP ou HOLAP, il est
    nécessaire de simuler une structure
    multidimensionnelle dans un SGBD relationnel à
    laide de modèles particuliers qui permettent de
    mieux répondre aux besoins multidimensionnels
  • Modèle en étoile (Star Schema)
  • Modèle en flocon (Snowflake Schema)
  • Modèle mixte (Mixed Schema)
  • Modèle en constellation (Fact Constellation
    Schema)

20
Modèle en étoile
  • Le schéma en étoile tire son nom de sa
    configuration
  • Objet central, nommé table des faits
  • Connecté à un certain nombre dobjets de manière
    radiale, les tables de dimension
  • La table des faits, comme son nom lindique,
    contient les faits
  • Les tables de dimensions contiennent les
    attributs définissant chacun des membres des
    dimensions. Elles sont dénormalisées.

21
Modèle en étoile
Un niveau 1 identifiant
3 niveau 3 couples (id nom)
Un niveau 1 couple (id nom)
22
Modèle en étoile
23
Modèle en flocon
  • Le schéma en flocon est dérivé du schéma en
    étoile où les tables de dimension sont
    normalisées (la table des faits reste inchangée)
  • Avec ce schéma, chacune des dimensions est
    décomposée selon sa ou ses hiérarchie(s)

24
Modèle en flocon
25
Modèle en flocon
26
Modèle mixte
  • Il sagit dune structure qui résulte de la
    meilleure combinaison des deux types de modèles
    précédents
  • Seules quelques dimensions seront normalisées,
    souvent il sagit des plus grandes tables et
    celles contenant le plus de redondance

27
Modèle mixte
28
Modèle en constellation
  • Le schéma en constellation est en fait composé de
    plusieurs schémas en étoile qui partagent des
    tables de dimension

29
Modèle en constellation
30
Modèle en constellation
31
Opérations OLAP
  • Les outils OLAP utilisent des opérateurs
    particuliers afin de  naviguer  dans les cubes
    multidimensionnels
  • Pivoter (pivot, swap) Permet dinterchanger
    deux dimensions
  • Forer (drill-down) Permet de descendre dans la
    hiérarchie de la dimension. Ex. visualiser le
    nombre daccidents par mois au lieu de par année.
  • Remonter (drill-up, roll-up) Permet de remonter
    dans la hiérarchie de la dimension. Ex.
    visualiser le nombre daccidents par année au
    lieu de par mois.
  • Forer latéralement (drill-across)
  • Permet de passer dune mesure à lautre. Ex.
    visualiser le coût des travaux au lieu du nombre
    daccidents
  • Permet de passer dun membre de dimension à un
    autre. Ex. visualiser les données de Montréal au
    lieu de celles de Québec

32
OLTP vs OLAP
33
OLTP vs OLAP
34
SOLAP
35
SOLAP
  • Environ 80 des données ont une composante
    spatiale qui est souvent inexploitée
  • Besoin de nouveaux outils danalyse
    spatio-temporelle pour exploiter cette composante

36
SOLAP
  • SIG ? Il est bien connu que les SIG seuls ne
    présentent pas lefficacité requise par les
    applications analytiques (langages
    dinterrogation, interfaces complexes, temps de
    traitement longs)
  • OLAP ? Lintérêt dOLAP pour lanalyse
    spatio-temporelle a été démontré Caron, 1997.
    Cependant, sans volet cartographique, il est
    impossible de visualiser la composante
    géométrique des données
  • SIG OLAP ? Une solution pourrait être de
    combiner des technologies spatiales et
    non-spatiales SIG et OLAP

37
SOLAP
  • Quelques logiciels combinant des fonctionnalités
    SIG et OLAP ont été mis sur le marché
  • Cognos Visualizer
  • ProClarity MapX
  • AC OLAP Map
  • Ils offrent un sous-ensemble seulement des
    fonctionnalités dun outil SOLAP idéal

38
SOLAP
  • SOLAP Une plate-forme visuelle supportant
    lexploration et lanalyse spatio-temporelle
    faciles et rapides des données selon une approche
    multidimensionnelle à plusieurs niveaux
    dagrégation via un affichage cartographique,
    tabulaire ou en diagramme statistique.

39
SOLAP
  • 3 types de dimensions spatiales
  • Descriptive
  • Géométrique
  • Mixte
  • 2 types de mesures
  • Descriptive numérique
  • Spatiale
  • ensemble de coordonnées
  • résultat dune opération de mesure spatiale ou
    topologique
  • ensemble de pointeurs vers une structure
    géométrique externe

40
SOLAP
41
SOLAP
  • Plusieurs architectures possibles (SGBDM, SGBDR,
    SIG, serveur OLAP, client OLAP, logiciel de
    visualisation, DAO, logiciel statistique, )
  • Exemples
  • ICEMSE Access SoftMap VB
  • MSSS SQL Server JMap Java
  • MTQ routier SQL Server (Analysis Services)
    ProClarity Geomedia VB

42
SOLAP
  • Caractéristiques souhaitables
  • Visualisation des données
  • Plusieurs types daffichage (cartographique,
    tabulaire, diagrammes statistiques)
  • Gestion flexible des affichages
  • Représentation de plusieurs mesures à la fois
  • Affichage de données de contexte
  • Modification de la sémiologie graphique
  • Légende interactive
  • Exploration des données
  • Opérations dexploration disponibles dans tous
    les affichages
  • Fonctions danalyse spatio-temporelle (métriques
    et topologiques)
  • Gestion de la dimension temporelle à laide dune
    ligne du temps
  • Ajout de mesures calculées
  • Filtrage sur les membres des dimensions
  • Affichage des agrégations significatives seulement

43
SOLAP
  • Caractéristiques souhaitables
  • Structure des données
  • Support pour plusieurs dimensions spatiales
    géométriques à la fois
  • Support pour toutes les primitives géométriques
    et leurs complexes (ISO)
  • Support pour la généralisation automatique et la
    représentation multiple
  • Support pour le stockage des données géométriques
    historiques
  • Support pour différentes sources de données

44
SOLAP
  • Des recherches très actives sont en cours à ce
    sujet au CRG
  • Projets SOLAP en cours
  • Ministère des Transports transport hors-norme
  • SOLAP 3D
  • À moyen terme SOLAP 3D, temps réel, sans-fil

45
Liens intéressants
  • Entrepôts de données
  • Data warehouse.com http//www.datawarehouse.com
  • Data warehousing Information Center
    http//www.dwinfocenter.org/
  • OLAP
  • OLAP Council http//www.olapcouncil.org/
  • OLAP Report http//www.olapreport.com/
  • Dm Review http//www.dmreview.com
  • OLAP Information http//www.olapinfo.de/
  • SOLAP
  • http//sirs.scg.ulaval.ca/YvanBedard/
Write a Comment
User Comments (0)
About PowerShow.com