Data Mining spatial - PowerPoint PPT Presentation

1 / 36
About This Presentation
Title:

Data Mining spatial

Description:

Fin des ann es 1980, des chercheurs (tel que: Rakesh Agrawal) ont commenc travailler ... Nous somme noy s dans les donn es mais affam s en connaissances ... – PowerPoint PPT presentation

Number of Views:134
Avg rating:3.0/5.0
Slides: 37
Provided by: yy55
Category:
Tags: affames | data | mining | spatial

less

Transcript and Presenter's Notes

Title: Data Mining spatial


1
Data Mining spatial
2
Plan
  • Historique
  • DM - Définition
  • Les facteurs démergence du DM
  • KDD
  • Techniques de DM
  • Exemples
  • Data mining spatial
  • Techniques de DMS
  • Exemples
  • Domaines dapplication du DMS

3
Historique
  • Le terme  Data mining  est apparu vers le début
    des années 1960,
  • Fin des années 1980, des chercheurs (tel que
    Rakesh Agrawal) ont commencè à travailler sur
    lexploitation du contenu des BD volumineuses
    (ex. tickets de caisses de grandes surfaces),
  • En Mars 1989, Shapiro Piatetski proposa le terme
     Knowledge discovery ,
  • 1995 1ére conférence sur le  data mining 
    suite aux nombreux workshops (1989-1994),
  • 1997 1ére revue du domaine  data mining and
    knowledge discovery journal  publiée par
     Kluwers 
  • 1998 Création de ACM-SIGKDD qui réunit la
    communauté internationale du KDD.

4
Data mining - Définition
  • Le data mining est le fait dextraire
    automatiquement de la connaissance intéressante,
    intelligible et cachée dans les bases de données
    Gardarin99
  • Le DM concerne une part importante du processus
    KDD (Knowledge Discovery in Databases)
  • Le terme DM est souvent employé pour désigner
    lensemble des outils permettant daccéder aux
    données et de les analyser

5
Les facteurs démergence du DM
  • 1- Volume des BDs

ECD-D.Zighed
6
Les facteurs démergence du DM
  • 2- Évolution de la vitesse de transmission des
    réseaux

ECD-D.Zighed
7
Les facteurs démergence du DM
  • 3- Évolution des technologies informatiques de la
    décision

ECD-D.Zighed
8
Les facteurs démergence du DM
  • Volumes des données
  • Nombre de variables
  • Seulement 5 à 10 des données collectées sont
    analysées
  • ? Nous somme noyés dans les données mais affamés
    en connaissances

Yang Yubin.Spatial Data Mining
9
KDD - Définition
ECD-D.Zighed
10
Le processus
ECD-D.Zighed
11
- Pré traitement
  • Les méthodes de FD opèrent sur des tables
    attributs-valeurs
  • Sélection /Lignes/colonnes/Filtrage
  • Construction dattributs
  • Correction/Données manquantes/Données aberrantes,

12
Tâches de data mining
  • Description Généralise, résume et compare des
    données
  • Classification Catégorise les données en classes
  • Regroupement Identifie des groupes homogènes de
    données
  • Association Extrait des corrélations entre les
    données
  • Prédiction Prédit des données manquantes

13
- Visualisation
GeoMiner
GeoBs
http//www.geobs.com/produits_geobs.htm http//www
-cse.uta.edu/cook/dm/presentations/ajay/sld023.ht
m ECD-D.Zighed
14
Méthodes de structuration et de classification
ECD-D.Zighed
15
Data mining non structurées
  • 1- Fouille de textes
  • - Indexation et Rech.Info.
  • - Classement de pages HTML
  • - Sélection des textes à analyser
  • - Tri des courriels
  • -
  • Pour les langages naturel
  • - Extraction des éléments du langage ,
  • - Utilisation des thésaurus, des ontologies
    et des règles de grammaire,
  • Techniques
  • - Clustering de texte
  • - Classification

16
Data mining non structurées
  • 2- Fouille dans les images
  • - Indexation
  • - Classement
  • - Identification de contenu
  • - Aide au diagnostic
  • - typologie

Siminaire.O.Boussaid
17
Data mining non structurées
  • 3- Fouille dans le WEB
  • - Fouille des usages (Web usage mining)
  • - Fouille dans le contenu (Web contain mining)

18
Data mining non structurées
  • Fouille de données complexes

ECD-D.Zighed
19
Techniques du data mining
  • 1-Méthodes de visualisation et de description
    compréhension synthétique de lensemble des
    données.
  • 2- Méthodes de classification et de structuration
    Identifier des groupes dobjets semblables.
  • 3- Méthodes dexplication et de prédiction

20
Exemples
Arbre de décision
FDS.Chelghoum
21
Exemples Extraction des associations
(Agrawal et al. 1993)
  • Analyse du panier de la ménagère
  • Découverte de relations de corrélation ou
    dassociation parmi
  • un ensemble dobjets (items).
  • I ensemble d'items, T ensemble de
    transactions (BD)
  • X ? Y (s, c) / X et Y ensembles d'items

22
Data mining spatial
  • Relations spatiales peuvent être métriques
    (distance), topologiques (intersection,
    inclusion, union, etc.) ou directionnelles (nord,
    ouest, sud, etc.)
  • Relations spatiales peuvent exister explicitement
    ou implicitement dans une BD spatiale.

23
Données relationnelles- Données spatiales
(Zeitouni)
24
Data mining spatial
Connaissances
Données spatiales
Data mining spatial
  • Définition Extraction des connaissances
    implicites, les rapports spatiaux et d'autres
    modèles qui ne sont pas explicitement stockés
    dans une base de données géographiques
    Hanal.2000.
  • DMS nest quune partie du processus GKD
    (Géographic knowledge discovery).
  • Objectif Exploiter dans un but décisionnel des
    données spatiales, produites, importées ou
    accumulées au fil du temps et qui sont
    susceptibles de délivrer des informations ou des
    connaissances Zeitouni.

25
Data mining spatial
Statistique Spatiale
BD Spatiale
Data Mining spatial
SIG
Analyse spatiale
Data Mining
26
Data mining spatial
  • DMS se résume en deux fonctions
  • 1- Phase exploratoire Explorer les données pour
    décrire un phénomène spatial
  • 2- Phase décisionnelle expliquer, prédire des
    phénomènes localisés en recherchant des
    correspondances avec des propriétés de
    lenvironnement géographique

27
Data mining spatial
  • Mode Vecteur
  • - Information décrite par des formes
    géométriques (points, lignes, polygones)
  • - Grand nombre de traitement géométriques
    possible,
  • - Les relations spatiales ne sont pas toutes
    décrites dans le modèle.
  • Prise en compte de lorganisation en couches
    thématiques et des relations spatiales propres
    aux données géographiques.
  • Mode raster
  • - Information décrite point par point,
  • - Certaines relations spatiales sont décrites
    dans ce modèle,
  • Prise en compte des données déscriptives et
    sémantiques des images (pixels).

28
Data mining spatial
  • Les données spatiales sont liées
  • Les relations entre les objets spatiaux sont
    multiples,
  • Les relations spatiales sont implicites

29
Techniques de DMS
  • ! Soit adapter les techniques du DM classique à
    ce nouveau type de données
  • ! Soit réorganiser les données spatiales pour
    appliquer les techniques du DM classique

30
Techniques de DMS
  • - Statistiques spatiales,
  • - Classification,
  • Règles dassociation spatiale,
  • Arbre de décision spatiale,

31
Exemples Méthode de Koperski et al.
ID_O Classe Le voisinage ID_O1
C Adjacent (lycée), Distance
(collège) 10,
Adjacent (parc1), Distance
(parc2) 15,
Adjacent (primaire), Distance (parc3)
30, ID_O2 C2 ... Adjacent (primaire),
Distance (lycée) 40,
Adjacent (parc3), Distance (collège)
50,
Distance (parc1) 45cm,
Distance (parc2) 40, . .

Environnement géographique
Description des objets à analyser
Arbre de décision spatial
FDS.Chelghoum
32
Exemples Zeitouni
33
Domaines dapplication DMS
  • Sécurité ,
  • Médecine,
  • Environnement,
  • Gestion des risques,

34
DM Spatial Vs DM spatio-temporel
ECD-D.Zighed
35
Comparaison
Data Mining Spatial
SOLAP
Analyse spatiale
Découverte automatique
Découverte Visuelle
Découverte Visuelle
Exploration
Confirmation
Exploration Visuelle
Inapplicable sur de gros BDs
Applicable sur de gros BDs / DW
Applicable sur les DW
36
Lectures
  • Zeitouni K., Yeh L., " Les bases de données
    spatiales et le data mining spatial", Revue
    internationale de géomatique, Numéro spécial
    "Data mining spatial", Vol 9, N 4, 1999.
  • Extraction des connaissances à partir des données
    Data Mining- . D.Zighed
  • Spatial data mining Progress and Challenges
    Survey paper Kopersky et al.
  • Trends in spatial data mining Shashi Shekhar et
    al.
Write a Comment
User Comments (0)
About PowerShow.com