Title: OLAP et SOLAP
1OLAP et SOLAP
- Notions avancées de bases de données SIG
- Yvan Bédard
2OLAP
- Il sagit dune catégorie de logiciels axés
sur lexploration et lanalyse rapide des données
selon une approche multidimensionnelle à
plusieurs niveaux dagrégation (Caron, 1998)
3OLAP
- Catégorie de logiciels
- Sexprime par une grande quantité de produits
logiciels disponibles sur le marché - Exploration et analyse rapide
- OLAP vise à assister lusager dans son analyse en
lui facilitant lexploration de ses données et en
lui donnant la possibilité de le faire rapidement
- Rapidité et facilité
4OLAP
- Facilité
- Lusager na pas à maîtriser des langages
dinterrogation et des interfaces complexes - Lusager interroge directement les données, en
interagissant avec celles-ci - Rapidité
- OLAP exploite une dénormalisation maximale des
données, sous la forme dune pré-agrégation
stockée - Lusager devient opérationnel en très peu de
temps - Lusager peut se concentrer sur son analyse et
non sur le processus (les moyens utilisés pour
lanalyse)
5OLAP
- Approche multidimensionnelle
- Basée sur des thèmes danalyse (dimensions)
- Plus intuitive
- Plusieurs niveaux dagrégation
- Les données peuvent être groupées à différents
niveaux de granularité (les regroupements sont
pré-calculés, par exemple, le total des ventes
pour le mois dernier calculé à partir de la somme
de toutes les ventes du mois). - Granularité niveau de détail des données
emmagasinées dans une base de données.
6Vocabulaire OLAP
- Dimension
- Une dimension peut être définie comme un thème,
ou un axe (attributs), selon lequel les données
seront analysées (en fonction de ) - Ex. Temps, Découpage administratif, Produits
- Une dimension contient des membres organisés en
hiérarchie, chacun des membres appartenant à un
niveau hiérarchique (ou niveau de granularité)
particulier - Ex. Pour la dimension Temps, les années, les mois
et les jours peuvent être des exemples de niveaux
hiérarchiques. 1998 est un exemple de membre du
niveau Année -
7Vocabulaire OLAP
- Mesure
- Une mesure est un élément de donnée sur lequel
portent les analyses, en fonction des différentes
dimensions - Ex. coût des travaux, nombre daccidents, ventes,
dépenses -
8Vocabulaire OLAP
- Fait
- Un fait représente la valeur dune mesure,
mesurée ou calculée, selon un membre de chacune
des dimensions (ex. ce qui est recueilli par les
systèmes transactionnels). - Ex. le coût des travaux en 1995 pour la région
02 est 250 000 est un fait qui exprime la
valeur de la mesure coût des travaux pour le
membre 1995 du niveau année de la
dimension temps et le membre 02 du niveau
région de la dimension découpage
administratif .
9Vocabulaire OLAP
- Cube
- Un ensemble de mesures organisées selon un
ensemble de dimensions (aussi hypercube) - Ex. Un cube de ventes qui comprend
- Les dimensions Temps, Produit, Magasin
- La mesure Ventes en
-
10Cube multidimensionnel
- Ce cube multidimensionnel présente les profits
dentreprises agricoles par propriété, par
exploitation et par année.
Cas 1 visualisation des profits des propriétés gt
0.05 km2 pour toutes les exploitations durant
les 4 années. Cas 2 visualisation des profits
des propriétés gt 1.5 km2 pour lexploitation de
légumes pour lannée 1993.
11Composantes OLAP
- Larchitecture OLAP consiste en trois services
- Base de données
- Doit supporter les données agrégées ou résumées
- Peut provenir dun entrepôt ou dun marché de
données - Doit posséder une structure multidimensionnelle
(SGDB multidimensionnel ou relationnel) - Serveur OLAP
- Gère la structure multidimensionnelle dans le
SGBD - Gère laccès aux données de la part des usagers
- Module client
- Permet aux usagers de manipuler et dexplorer les
données - Affiche les données sous forme de graphiques
statistiques et de tableaux - Selon le type de base de données accédé,
plusieurs configurations sont possibles
multidimensionnelle, relationnelle ou hybride
12MOLAP(OLAP Multidimensionnel)
- Les données détaillées de base ainsi que les
données agrégées de lentrepôt sont stockées dans
une base de données multidimensionnelle (souvent
appelée cube ou hypercube) - Une base de données multidimensionnelle utilise
une structure propriétaire au logiciel utilisé (?
matrice) - Le serveur MOLAP extrait les données de
lhypercube et les présente directement au module
client
13MOLAP(OLAP Multidimensionnel)
14ROLAP (OLAP Relationnel)
- Les données détaillées de base ainsi que les
données agrégées de lentrepôt sont stockées sous
forme de tables dans une base de données
relationnelle - La base de données relationnelle doit être
structurée selon un modèle particulier (étoile,
flocon, ) - Le serveur extrait les données par des requêtes
SQL et interprète les données selon une vue
multidimensionnelle avant de les présenter au
module client
15ROLAP (OLAP Relationnel)
16HOLAP (OLAP Hybride)
- Architecture qui consiste en un croisement des
architectures MOLAP et ROLAP - Les données détaillées de base de lentrepôt sont
stockées dans une base de données relationnelle
et les données agrégées sont stockées dans une
base de données multidimensionnelle - Le serveur HOLAP accède deux bases de données et
les présente au module client, selon une vue
multidimensionnelle dans le cas des données de la
BD relationnelle
17HOLAP (OLAP Hybride)
18MOLAP vs ROLAP vs HOLAP
MOLAP
HOLAP
Critère de comparaison
ROLAP
Stockage des données de base (détaillées)
BD relationnelle
BD multidimensionnelle
BD relationnelle
BD relationnelle
Stockage des agrégations
BD multidimensionnelle
BD multidimensionnelle
Performance des requêtes (habituellement)
Le moins performant
Le plus performant
Performance moyenne
19Structure multidimensionnelle
- Pour une configuration ROLAP ou HOLAP, il est
nécessaire de simuler une structure
multidimensionnelle dans un SGBD relationnel à
laide de modèles particuliers qui permettent de
mieux répondre aux besoins multidimensionnels - Modèle en étoile (Star Schema)
- Modèle en flocon (Snowflake Schema)
- Modèle mixte (Mixed Schema)
- Modèle en constellation (Fact Constellation
Schema)
20Modèle en étoile
- Le schéma en étoile tire son nom de sa
configuration - Objet central, nommé table des faits
- Connecté à un certain nombre dobjets de manière
radiale, les tables de dimension - La table des faits, comme son nom lindique,
contient les faits - Les tables de dimensions contiennent les
attributs définissant chacun des membres des
dimensions. Elles sont dénormalisées.
21Modèle en étoile
Un niveau 1 identifiant
3 niveau 3 couples (id nom)
Un niveau 1 couple (id nom)
22Modèle en étoile
23Modèle en flocon
- Le schéma en flocon est dérivé du schéma en
étoile où les tables de dimension sont
normalisées (la table des faits reste inchangée) - Avec ce schéma, chacune des dimensions est
décomposée selon sa ou ses hiérarchie(s)
24Modèle en flocon
25Modèle en flocon
26Modèle mixte
- Il sagit dune structure qui résulte de la
meilleure combinaison des deux types de modèles
précédents - Seules quelques dimensions seront normalisées,
souvent il sagit des plus grandes tables et
celles contenant le plus de redondance
27Modèle mixte
28Modèle en constellation
- Le schéma en constellation est en fait composé de
plusieurs schémas en étoile qui partagent des
tables de dimension
29Modèle en constellation
30Modèle en constellation
31Opérations OLAP
- Les outils OLAP utilisent des opérateurs
particuliers afin de naviguer dans les cubes
multidimensionnels - Pivoter (pivot, swap) Permet dinterchanger
deux dimensions - Forer (drill-down) Permet de descendre dans la
hiérarchie de la dimension. Ex. visualiser le
nombre daccidents par mois au lieu de par année. - Remonter (drill-up, roll-up) Permet de remonter
dans la hiérarchie de la dimension. Ex.
visualiser le nombre daccidents par année au
lieu de par mois. - Forer latéralement (drill-across)
- Permet de passer dune mesure à lautre. Ex.
visualiser le coût des travaux au lieu du nombre
daccidents - Permet de passer dun membre de dimension à un
autre. Ex. visualiser les données de Montréal au
lieu de celles de Québec
32OLTP vs OLAP
33OLTP vs OLAP
34SOLAP
35SOLAP
- Environ 80 des données ont une composante
spatiale qui est souvent inexploitée - Besoin de nouveaux outils danalyse
spatio-temporelle pour exploiter cette composante
36SOLAP
- SIG ? Il est bien connu que les SIG seuls ne
présentent pas lefficacité requise par les
applications analytiques (langages
dinterrogation, interfaces complexes, temps de
traitement longs) - OLAP ? Lintérêt dOLAP pour lanalyse
spatio-temporelle a été démontré Caron, 1997.
Cependant, sans volet cartographique, il est
impossible de visualiser la composante
géométrique des données - SIG OLAP ? Une solution pourrait être de
combiner des technologies spatiales et
non-spatiales SIG et OLAP
37SOLAP
- Quelques logiciels combinant des fonctionnalités
SIG et OLAP ont été mis sur le marché - Cognos Visualizer
- ProClarity MapX
- AC OLAP Map
- Ils offrent un sous-ensemble seulement des
fonctionnalités dun outil SOLAP idéal
38SOLAP
- SOLAP Une plate-forme visuelle supportant
lexploration et lanalyse spatio-temporelle
faciles et rapides des données selon une approche
multidimensionnelle à plusieurs niveaux
dagrégation via un affichage cartographique,
tabulaire ou en diagramme statistique.
39SOLAP
- 3 types de dimensions spatiales
- Descriptive
- Géométrique
- Mixte
- 2 types de mesures
- Descriptive numérique
- Spatiale
- ensemble de coordonnées
- résultat dune opération de mesure spatiale ou
topologique - ensemble de pointeurs vers une structure
géométrique externe
40SOLAP
41SOLAP
- Plusieurs architectures possibles (SGBDM, SGBDR,
SIG, serveur OLAP, client OLAP, logiciel de
visualisation, DAO, logiciel statistique, ) - Exemples
- ICEMSE Access SoftMap VB
- MSSS SQL Server JMap Java
- MTQ routier SQL Server (Analysis Services)
ProClarity Geomedia VB
42SOLAP
- Caractéristiques souhaitables
- Visualisation des données
- Plusieurs types daffichage (cartographique,
tabulaire, diagrammes statistiques) - Gestion flexible des affichages
- Représentation de plusieurs mesures à la fois
- Affichage de données de contexte
- Modification de la sémiologie graphique
- Légende interactive
- Exploration des données
- Opérations dexploration disponibles dans tous
les affichages - Fonctions danalyse spatio-temporelle (métriques
et topologiques) - Gestion de la dimension temporelle à laide dune
ligne du temps - Ajout de mesures calculées
- Filtrage sur les membres des dimensions
- Affichage des agrégations significatives seulement
43SOLAP
- Caractéristiques souhaitables
- Structure des données
- Support pour plusieurs dimensions spatiales
géométriques à la fois - Support pour toutes les primitives géométriques
et leurs complexes (ISO) - Support pour la généralisation automatique et la
représentation multiple - Support pour le stockage des données géométriques
historiques - Support pour différentes sources de données
44SOLAP
- Des recherches très actives sont en cours à ce
sujet au CRG - Projets SOLAP en cours
- Ministère des Transports transport hors-norme
- SOLAP 3D
- À moyen terme SOLAP 3D, temps réel, sans-fil
45Liens intéressants
- Entrepôts de données
- Data warehouse.com http//www.datawarehouse.com
- Data warehousing Information Center
http//www.dwinfocenter.org/ - OLAP
- OLAP Council http//www.olapcouncil.org/
- OLAP Report http//www.olapreport.com/
- Dm Review http//www.dmreview.com
- OLAP Information http//www.olapinfo.de/
- SOLAP
- http//sirs.scg.ulaval.ca/YvanBedard/