Title: Data Mining spatial
1Data Mining spatial
2Plan
- Historique
- DM - Définition
- Les facteurs démergence du DM
- KDD
- Techniques de DM
- Exemples
- Data mining spatial
- Techniques de DMS
- Exemples
- Domaines dapplication du DMS
3Historique
- Le terme  Data mining est apparu vers le début
des années 1960, - Fin des années 1980, des chercheurs (tel que
Rakesh Agrawal) ont commencè à travailler sur
lexploitation du contenu des BD volumineuses
(ex. tickets de caisses de grandes surfaces), - En Mars 1989, Shapiro Piatetski proposa le terme
 Knowledge discovery , - 1995 1ére conférence sur le  data miningÂ
suite aux nombreux workshops (1989-1994), - 1997 1ére revue du domaine  data mining and
knowledge discovery journal publiée par
 Kluwers - 1998 Création de ACM-SIGKDD qui réunit la
communauté internationale du KDD.
4Data mining - Définition
- Le data mining est le fait dextraire
automatiquement de la connaissance intéressante,
intelligible et cachée dans les bases de données
Gardarin99 - Le DM concerne une part importante du processus
KDD (Knowledge Discovery in Databases) - Le terme DM est souvent employé pour désigner
lensemble des outils permettant daccéder aux
données et de les analyser
5Les facteurs démergence du DM
ECD-D.Zighed
6Les facteurs démergence du DM
- 2- Évolution de la vitesse de transmission des
réseaux
ECD-D.Zighed
7Les facteurs démergence du DM
- 3- Évolution des technologies informatiques de la
décision
ECD-D.Zighed
8Les facteurs démergence du DM
- Volumes des données
- Nombre de variables
- Seulement 5 à 10 des données collectées sont
analysées - ? Nous somme noyés dans les données mais affamés
en connaissances
Yang Yubin.Spatial Data Mining
9KDD - Définition
ECD-D.Zighed
10Le processus
ECD-D.Zighed
11- Pré traitement
- Les méthodes de FD opèrent sur des tables
attributs-valeurs - Sélection /Lignes/colonnes/Filtrage
- Construction dattributs
- Correction/Données manquantes/Données aberrantes,
12Tâches de data mining
- Description Généralise, résume et compare des
données - Classification Catégorise les données en classes
- Regroupement Identifie des groupes homogènes de
données - Association Extrait des corrélations entre les
données - Prédiction Prédit des données manquantes
13- Visualisation
GeoMiner
GeoBs
http//www.geobs.com/produits_geobs.htm http//www
-cse.uta.edu/cook/dm/presentations/ajay/sld023.ht
m ECD-D.Zighed
14Méthodes de structuration et de classification
ECD-D.Zighed
15Data mining non structurées
- 1- Fouille de textes
- - Indexation et Rech.Info.
- - Classement de pages HTML
- - Sélection des textes à analyser
- - Tri des courriels
- -
- Pour les langages naturel
- - Extraction des éléments du langage ,
- - Utilisation des thésaurus, des ontologies
et des règles de grammaire, - Techniques
- - Clustering de texte
- - Classification
16Data mining non structurées
- 2- Fouille dans les images
- - Indexation
- - Classement
- - Identification de contenu
- - Aide au diagnostic
- - typologie
Siminaire.O.Boussaid
17Data mining non structurées
- 3- Fouille dans le WEB
- - Fouille des usages (Web usage mining)
- - Fouille dans le contenu (Web contain mining)
18Data mining non structurées
- Fouille de données complexes
ECD-D.Zighed
19Techniques du data mining
- 1-Méthodes de visualisation et de description
compréhension synthétique de lensemble des
données. - 2- Méthodes de classification et de structuration
Identifier des groupes dobjets semblables. - 3- Méthodes dexplication et de prédiction
20Exemples
Arbre de décision
FDS.Chelghoum
21Exemples Extraction des associations
(Agrawal et al. 1993)
- Analyse du panier de la ménagère
- Découverte de relations de corrélation ou
dassociation parmi - un ensemble dobjets (items).
- I ensemble d'items, T ensemble de
transactions (BD) - X ? Y (s, c) / X et Y ensembles d'items
22Data mining spatial
- Relations spatiales peuvent être métriques
(distance), topologiques (intersection,
inclusion, union, etc.) ou directionnelles (nord,
ouest, sud, etc.) - Relations spatiales peuvent exister explicitement
ou implicitement dans une BD spatiale.
23Données relationnelles- Données spatiales
(Zeitouni)
24Data mining spatial
Connaissances
Données spatiales
Data mining spatial
- Définition Extraction des connaissances
implicites, les rapports spatiaux et d'autres
modèles qui ne sont pas explicitement stockés
dans une base de données géographiques
Hanal.2000. - DMS nest quune partie du processus GKD
(Géographic knowledge discovery). - Objectif Exploiter dans un but décisionnel des
données spatiales, produites, importées ou
accumulées au fil du temps et qui sont
susceptibles de délivrer des informations ou des
connaissances Zeitouni.
25Data mining spatial
Statistique Spatiale
BD Spatiale
Data Mining spatial
SIG
Analyse spatiale
Data Mining
26Data mining spatial
- DMS se résume en deux fonctions
- 1- Phase exploratoire Explorer les données pour
décrire un phénomène spatial - 2- Phase décisionnelle expliquer, prédire des
phénomènes localisés en recherchant des
correspondances avec des propriétés de
lenvironnement géographique
27Data mining spatial
- Mode Vecteur
- - Information décrite par des formes
géométriques (points, lignes, polygones) - - Grand nombre de traitement géométriques
possible, - - Les relations spatiales ne sont pas toutes
décrites dans le modèle. - Prise en compte de lorganisation en couches
thématiques et des relations spatiales propres
aux données géographiques. - Mode raster
- - Information décrite point par point,
- - Certaines relations spatiales sont décrites
dans ce modèle, -
- Prise en compte des données déscriptives et
sémantiques des images (pixels).
28Data mining spatial
- Les données spatiales sont liées
- Les relations entre les objets spatiaux sont
multiples, - Les relations spatiales sont implicites
29Techniques de DMS
- ! Soit adapter les techniques du DM classique Ã
ce nouveau type de données - ! Soit réorganiser les données spatiales pour
appliquer les techniques du DM classique
30Techniques de DMS
- - Statistiques spatiales,
- - Classification,
- Règles dassociation spatiale,
- Arbre de décision spatiale,
-
31Exemples Méthode de Koperski et al.
ID_O Classe Le voisinage ID_O1
C Adjacent (lycée), Distance
(collège) 10,
Adjacent (parc1), Distance
(parc2) 15,
Adjacent (primaire), Distance (parc3)
30, ID_O2 C2 ... Adjacent (primaire),
Distance (lycée) 40,
Adjacent (parc3), Distance (collège)
50,
Distance (parc1) 45cm,
Distance (parc2) 40, . .
Environnement géographique
Description des objets à analyser
Arbre de décision spatial
FDS.Chelghoum
32Exemples Zeitouni
33Domaines dapplication DMS
- Sécurité ,
- Médecine,
- Environnement,
- Gestion des risques,
34DM Spatial Vs DM spatio-temporel
ECD-D.Zighed
35Comparaison
Data Mining Spatial
SOLAP
Analyse spatiale
Découverte automatique
Découverte Visuelle
Découverte Visuelle
Exploration
Confirmation
Exploration Visuelle
Inapplicable sur de gros BDs
Applicable sur de gros BDs / DW
Applicable sur les DW
36Lectures
- Zeitouni K., Yeh L., " Les bases de données
spatiales et le data mining spatial", Revue
internationale de géomatique, Numéro spécial
"Data mining spatial", Vol 9, N 4, 1999. - Extraction des connaissances à partir des données
Data Mining- . D.Zighed - Spatial data mining Progress and Challenges
Survey paper Kopersky et al. - Trends in spatial data mining Shashi Shekhar et
al.