Comment calculer une distance - PowerPoint PPT Presentation

1 / 5
About This Presentation
Title:

Comment calculer une distance

Description:

Une distance r pond 3 axiomes fondamentaux. signe d(A,B) 0 ; ... in galit triangulaire : d(A,B) =d(A,C) d(C,B) Choisir une distance n'est pas une ... – PowerPoint PPT presentation

Number of Views:74
Avg rating:3.0/5.0
Slides: 6
Provided by: POSTA7
Category:

less

Transcript and Presenter's Notes

Title: Comment calculer une distance


1
Comment calculer une distance ?
  • Il existe de nombreuses manières de calculer une
    distance
  • Une distance répond à 3 axiomes fondamentaux
  • signe d(A,B) gt 0 d(A,B)0 ltgt AB
  • symétrie d(A,B) d(B,A)
  • inégalité triangulaire d(A,B)ltd(A,C)d(C,B)
  • Choisir une distance nest pas une question
    triviale surtout pour les variables binaires

2
Perturbation de la mesure des distances
  • Catégories de problèmes
  • Lexistence dune relation entre les variables
  • plus les variables corrélées sont nombreuses plus
    leur poids est important dans la constitution des
    groupes
  • Lhétérogénéité des unités de mesure (centrer,
    réduire) entre les variables
  • Plus la variance est importante, plus la variable
    joue un rôle important
  • La présence de points extrêmes
  • Il faut donc choisir délibérément et avec
    attention les variables sur lesquelles on va
    mesurer la distance
  • Solution
  • Détecter les points extrêmes (et les neutraliser)
  • Utiliser au préalable une analyse factorielle
  • Standardiser les variables si elles ont des
    unités de mesure différentes
  • Faire plusieurs passages ou enchaîner les méthodes

3
Distances sur variables quantitatives
  • Soit X la matrice et V la matrice de
    variance-covariance
  • Euclidienne
  • non standardisée (w1)
  • standardisée à l'écart-type (w1/s2)
  • standardisée à l'écart maximum (w1/max
    (Xik-Xjk))
  • Minkovsky
  • n2 dist euclidienne
  • n1 dist rectangulaire
  • poids unitaire city-block
  • Mahalanobis
  • tient compte des corrélations entre les variables

4
Distances sur fréquences
  • Informationnelle (base modèles log-linéaires)
  • Distance du Chi-2

5
Distances sur variables binaires
  • a (1,1) b(1,0) c(0,1) d(0,0)
  • Ochiai a/ racine (ab)(ac)
  • Yule (a.dc.b) / (a.d-c.b)
  • Haman (ad)-(cb) / (ad)(cb)
Write a Comment
User Comments (0)
About PowerShow.com