Title: Les arbres de dcisions
1Les arbres de décisions
- F. KOHLER
- kohler_at_spieao.u-nancy.fr
2Le contexte de la décision clinique
- La complexité médicale
- Les méthodes quantitatives et déclaratives
- Quantitatives
- Déterminer la probabilité de survenue
- Déclaratives
- Raisonnement par règles
- Apprentissages
- Supervisé
- Non supervisé
3Les méthodes
4Exemple darbre logique
5Rappels de logique
- Logique des propositions
- Les propositions sont des assertions qui peuvent
être vraies ou fausses. Elle sont symbolisées par
des lettres - Exple
- proposition a Le diabète est une maladie
chronique - Proposition b Le diabète est une maladie
fréquente - Les propositions a et b sont des propositions
élémentaires (atomique). Une proposition complexe
(ou formule) est composée de propositions
atomiques reliées par des connecteurs. - Le diabète est une maladie chronique ET fréquente
a b - Les 4 connecteurs principaux sont
- ET noté
- OU noté Ú
- Si Alors Implication notée É
- Si et seulement si Équivalence notée º ou
- Complétés par la négation notée Ø
6Logique des propositions
7Logique des propositions
- Propriétés des connecteurs
8Logique des propositions
- Quelques règles dinférences \ se lit comme
déduit formellement
9Logique et moteur dinférence
a Vrai A gt b Vrai ----------------
b Vrai
Prémisses
Règle
Conclusion
Pierre est un homme Etre un homme implique Etre
mortel Donc Pierre est mortel
10Logique et motuer dinférence
b Faux a gt b Vrai ----------------
a Faux
Prémisses
Conclusion
Gabriel n'est pas mortel Etre un homme implique
Etre mortel Donc Gabriel n'est pas un homme
vous le saviez ce doit être l'archange ou tout
autre immortel !
11Logique des prédicats
- Ordre 1
- Introduit la notion de variables, de constantes
- De quantificateur universel "
- De quantificateur existentiel
- Prédicat Malade(x)
- malade() fonction
- X prédicat
- A donné lieu au langage PROLOG
- Très utilisé en IA
12Logique et moteur dinférence
Base de faits Faits initiaux Il pleut Faits
déduits
Base de règles R1 Si il pleut Alors la route
est mouillée R2 Si la route est mouillée Alors
risque daccident R3 Si pneus lisses Alors
risque daccidents
Moteur dinférences
La route est mouillée
Risque daccident
Chaînage avant Recherche de règles applicables
R1 Mise à jour de la base de faits Tuer règle
R1
R2
R2
Plus de règle applicable FIN
13Chaînage avant/ arrière
- Avant part des prémisses et en déduit le
caractère vrai de la conclusion - Arrière part dune conclusion fausse et en
déduit le caractère faux de la prémisse - Remarque
- Quand la conclusion est vraie on ne peut rien
déduire en chaînage arrière - Mécanisme le plus utilisé
- Chaînage mixte
- Processus monotone ou non
14Analyse de la décision
- Lanalyse de la décision concerne les situations
caractérisées par - Lexistence de décisions alternatives
- Léventualité dapparition dévénements (état de
la nature) multiples - Incertitude sur lapparition de tel ou tel
événement
15Principe de la méthode
- 1) Identifier lensemble des choix possibles face
à des événements - 2) Disposer dun critère de partage entre les
décisions alternatives - 3) Représenter lenchaînement des décisions et
événements sous forme dun graphe logique arbre
de décision - 4) Réduction de larbre lorsque des solutions
sont dominées par dautres - 5) Évaluer le prix accordé à linformation (achat
de la certitude par des enquêtes appropriées)
16Définitions
- Décision
- Une décision relève dun choix délibéré du
décideur même si certaines conséquences sont
incertaines. - Un événement se réalise ou ne se réalise pas en
dehors du contrôle du décideur. Il simpose à lui
dès lors que celui-ci sest mis dans une
situation de nature à lui faire supporter cet
événement - Probabilité
- Tout événement est plus ou moins fréquent. Nous
appellerons probabilités la mesure quantitative
de cette fréquence. - Il peut sagir dune probabilité subjective
estimée par lexpert ou objective issue denquête
adéquate (probabilité empirique) permettant
souvent de modéliser le phénomène en se
rattachant le plus souvent à des lois de
probabilité connue, la loi normale centrée
réduite par exemple.
17Arbre de décision
- Cest la représentation graphique de la
succession, le plus souvent chronologique, des
décision/événements - Pour que ce schéma soit cohérent il faut
- Lexhaustivité Tous les événements et les
décisions doivent être déterminés y compris celle
de ne rien faire - Lexclusivité Les décisions et les événements
sexcluent mutuellement. Les conséquences dun
événement doivent pouvoir être mesurées de
manière non ambiguë - Exemple
- Événements Tension artérielle systolique
- A) inférieure à 140 (incluse dans B)
- B) inférieure à 180
- Ne sont pas recevables
- A) lt 140
- B) De 140 à 180 exclu
- Est recevable
- Décisions
- Demander une numération formule
- Demander un compte des globules rouges (est
compris dans A) - Non recevable
18Les différents critères
- Un critère permet de partager des décisions
alternatives - Exemple du marchand de plage
- Un marchand ambulant a comme décisions possibles
de remplir son chariot de glaces ou (exclusif) de
boissons. Lévénement qui peut se produire est
beau temps ou (exclusif) temps couvert. Dans
chaque case, on porte les profits attendus par le
marchand de plage
19Coût dopportunité
- Cest le manque à gagner par le fait que le
décideur, face à un événement, na pas forcément
pris la meilleure décision possible. - Ici on a mis le coût dopportunité entre
parenthèses
20Coût dopportunité
- Si lon se place dans le cas du beau temps, la
meilleure décision était de vendre des glaces. Si
cest cette décision qui a été prise, on ne
pouvait pas gagner plus le coût dopportunité est
donc nul. Si par contre on avait rempli le
chariot de boissons, le manque à gagner était de
500- 200 300. - En fait le coût dopportunité est aussi le prix
de linformation certaine.
21Critère de décision
- Théoriquement
- Il nest pas difficile de dire ce quil faut
faire pour analyser un problème pour lequel
lavenir nest pas connu avec certitude Il faut
prévoir les événements et ensuite analyser les
alternatives possibles. - La solution est simple lorsque quelque soit
lévénement qui se produit, une alternative est
systématiquement la meilleure. - Mais la plupart du temps la décision sera
différente selon lévénement qui se produit - Les critères de décision peuvent être regroupés
en 5 catégories illustrées à partir de lexemple
du marchand de plage étendu à 4 décisions
Glaces, Boissons, Journaux et jouets et à 3
événements beau temps, couvert, pluie.
22Critère de Laplace (L)
- Choisir la décision qui rend maximale la moyenne
arithmétique des gains - Tous calculs faits, cest Boissons qui est la
meilleure décision
23Critère de Wald (W)
- Choisir la solution qui rend maximal le gain
minimal de chaque décision. - Ici il faut retenir les jouets
24Critère de Hurwicz
- Prendre la décision qui rend maximal le résultat
pondéré entre valeurs maximale et minimale de
chaque décision a(mini) (1-a)(maxi). - Avec a 0,5 cest Jouet qui est la meilleure
décision. - ATTENTION le rôle de a est fondamental
25Critère de Savage
- Choisir la décision pour laquelle on rend minimal
le maximum des regrets. Le regret est défini
comme le coût dopportunité (calculé entre
parenthèses) - Les décisions Boissons et Journaux sont les
meilleures et équivalentes.
26Critère de lespérance mathématique
- Cest lapplication des probabilités aux
combinaisons décisions / événements - E(x) S pi xi
- Si lon retient P(Beau)0,5 P(Couvert) 0,3
P(Pluie) 0,2 cest la décision jouet qui est la
meilleure. - Dans les applications en santé cest le critère
usuel.
27Quelques rappels sur les probabilités
- Axiomes élémentaires
- 0 lt P(A) lt 1
- P(A) 1 événement toujours réalisé
- P(A) 0 événement impossible
28Événements mutuellement exclusifs
- Les événements A et B ne peuvent se produire
simultanément. Pour tous couples (A,B)
l'ensemble A B est vide. - P(A ou B) P(A B) P(A U B) P(A) P(B)
- Exemple probabilité d'extraire un cur ou un
carreau P(Cur ou Carreau) 0,25 0,25
0,5. - Généralisation P(ABC) P(A)P(B)P(C)
- Si 2 événements sont mutuellement exclusifs
(mort-vivant) on a P(A)P(B) 1 gt P(A)
1-P(B). La probabilité de survie à un moment
donné est égale à 1 moins la probabilité de
décéder à ce moment.
29Événements non nécessairement exclusifs
- Les événements peuvent se produire simultanément
exemples avoir un infarctus du myocarde ,
être diabétique . - P(A ou B) P(B ou A) P(A) P(B) - P(A et B)
- Ceci se déduit des relations
- P(A ou B) P(A sans B) P(B sans A) P(A et B)
- P (A sans B) P(A) - P(A et B)
- P(B sans A) P(B) - P(A et B)
- En conclusion
- P(A ou B) lt P(A) P(B)
- P(A ou B ou C) P(A) P(B) P(C) - P(A et B) -
P(B et C) - P(A et C) P(A et B et C)
30Probabilités conditionnelles
- Soit deux événements non exclusifs A et B par
exemple avoir un signe clinique (douleur de la
fosse iliaque droite) et avoir une maladie
(avoir une appendicite) - Soit une expérience pouvant conduire à la
réalisation ou non de A et B, à l'issue de N
répétitions de l'expérience on a le tableau
suivant
Malades Non Malades Tot.
(A) (A-) Test Positif (B)
80 20 100 Test Négatif(B-)
40 160 200 Tot.
120 180 300
P(A/B) P(A et B) / P(B) P(A et B)
P(A/B)P(B) P(B/A)P(A)
31Indépendance
- L'événement A est dit indépendant de B si la
probabilité de voir se réaliser A ne dépend pas
de la réalisation ou de la non réalisation de B. - P(A/B) P(A/non B) P(A)
- Si, et seulement si, A et B sont indépendants,
on a P(A et B) P(A) P(B) - Exemple de phénomènes a priori indépendants
état des pneus de la voiture et pluie. - Exemple de phénomènes a priori liés état des
pneus de la voiture et accident. - Hypothèse nulle du Khi 2 indépendance. C'est
sous cette hypothèse que sont calculés les
effectifs théoriques
32Application à un test diagnostique
- Sensibilité, Spécificité, Valeur prédictive
positive, Valeur prédictive négative
Malades Non Malades Tot.
(A) (A-) Test Positif (B)
80 20 100 Test Négatif(B-)
40 160 200 Tot. 120
180 300
P( A) 120 / 300 Prévalence P(A-) 1 - P(A)
Fréquence des Non Malades P(A/B) P(A et
B) / P(B) 80 / 100 VPP P(B/A) P(A et
B) / P(A) 80 / 120 Sensibilité P(A-/B-)
P(A- et B-) / P(B-) 160 / 200 VPN P(B-/A-)
P(A- et B-) / P(A-) 160 / 180 Spécificité
33Intérêt et limites
- Permet de systématiser létude dun problème de
décision complexe en incertitude - Oblige à une formulation précise et claire
- Oblige à un effort de quantification
- Les limites
- Caractère subjectif des probabilités utilisées
- Évaluation des coûts et profits associés à chaque
cas de figure - En cas de risque important décès, handicap,
ruine du système lespérance mathématique nest
pas aussi représentative car il faut pouvoir
supporter la perte - Événement A P(A) 0,85 Profit 5 000
- Événement B P(Non (A)) 0,15 Profit - 20 000
- E(x) 1250
- Mais la perte de 20 000 est elle supportable ?
34Travail pratique
- La compagnie des produits pharmaceutiques LEMAY
cherche à développer et à commercialiser de
nouveaux produits. En particulier, le Dr DUBOIS,
chimiste en chef, a informé le directeur, Mr
LEMAY que de récents résultats de recherche
permettaient denvisager le développement dun
nouveau produit ayant des applications médicales
immédiates. - Le Dr DUBOIS souhaiterait quun programme de
recherche complémentaire soit engagé. Il a estimé
quune dépense de 500 000 permettrait la mise
au point finale dans le délai dun an. Interrogé
par Mr. LEMAY, le Dr DUBOIS a estimé que son
équipe avait 9/10 chances de réussir la mise au
point de ce produit. - Mr LEMAY, inquiet sur les perspectives de vente
dun produit aussi coûteux à développer, sest
informé auprès du directeur commercial, Léon
MARTIAL qui a répondu que le succès dépendrait,
en grande partie de la réaction des professions
médicales et aussi de la possibilité que des
concurrents créent un produit similaire. - Le service commercial a ensuite établi les
estimations suivantes sur les chances de succès - Conditions du marché Probabilités
Produits actualités - Potentiel élevé 0.2
2 000 000 - Potentiel modéré 0.5
1 250 000 - Potentiel réduit 0.3
250 000 - Les chiffres de profits sont établis avant
déduction des frais de recherche et
développement, et de celui du lancement
commercial évalué à 200 000 . - La décision de lancement ne sera prise que
lorsque le produit aura été mis au point. - Ces informations ayant quelque peu inquiété Mr.
LEMAY, il sadressa de nouveau au Dr. DUBOIS pour
lui demander sil nexistait pas dautre moyen
plus économique et moins risqué de développer ce
produit. Le Dr DUBOIS lui répondit quil
préférait sa première suggestion mais quune
alternative existait Lancer un plan de
recherche de 9 mois donnant le temps à Mr.
MARTIAL dévaluer le marché, puis intensifier le
programme pendant 3 mois. Le coût de la première
phase serait de 400 000 celui de la deuxième
de 200 000 . Le Dr. Dubois indiqua par ailleurs
que cela ne modifierait pas les chances de succès
du produit. - Consulté à ce propos, Mr MARTIAL précisa que le
coût de létude de marché nécessaire serait de 50
000 . - Mr LEMAY, sinforma également sur la possibilité
dattendre quun produit concurrent sorte sur le
marché et de copier ce produit après lavoir
analysé. Le Dr DUBOIS avait indiqué que cela
était envisageable et ramenait les coûts de
recherche à 250 000 . - Mr Martial mis en doute cette possibilité en
arguant du fait que le premier à mettre le
produit sur le marché prendrait la plus grande
part des ventes. Il estima que les profits
seraient seulement de 50 de ceux établis
précédemment et que, de plus, il y avait une 1/ 4
chance quaucun produit similaire ne soit mis sur
le marché. - Mr LEMAY demeurait perplexe et souhaitait
réfléchir rationnellement à toutes ces
possibilités.
35Sélection de décisions/événements
- 3 décisions
- Fabriquer le produit avec un programme normal
- Fabriquer le produit en 2 étapes avec étude de
marché) - Attendre lapparition dun produit concurrent
- 3 événements
- Niveau de la demande (3 niveaux possibles)
- Succès de la mise au point du produit
- Apparition dun produit concurrent
- Vérification de règles dexhaustivité et
dexclusivité - Établissement de larbre
- Calcul des profits cumulés à chaque extrémité
- Calcul des espérances mathématiques
36Arbre de décision
37Calcul des espérances mathématiques
- Cas 1, 2, 3
- 0.21 300 000 0.5550 000 .3-450 000 400
000 - Avec le cas 5
- 0.9400 000 0.1-500 000 310 000
- Cas 6 et 7
- 0.9-1 150 000 0.1-650 000 970 000
- Cas 9 et 10
- 0.9400 000 0.1-650 000 295 000
- Cas 12 et 13
- 0.9-600 000 0.1-650 000 -605 000
- Doù espérance de ces 3 résultats 0.2970 000
0.5295 000 0.3-450 000 206 500 - Cas 15, 16, 17
- 0.2550 000 0.5175 000 0.3-325 000 100
000 - Avec le cas 19
- 0.75100 000 0.250 75 000
38La solution
- Qui simpose est de faire le programme sur 1 an
- Espérance 310 000
- Mais
- Il reste 4 éventualités
- Cas Profit Probabilité
Espérance - 1 1 300 000 .9.2 0.18
234 000 - 2 550 000 .9.5 0.45
247 500 - 3 -450 000 .9.3 0.27
-121 500 - 4 -500 000 01 0.1
- 50 000 - Peut on supporter 450 000 de perte avec une
probabilité de 27 ou 500 000 avec une
probabilité de 10 ?
39Analyse de sensibilité
- Si on modifie le jeu des probabilités notamment
en ce qui concerne la demande, cet événement se
situant en fin darbre, la sensibilité de la
décision à ces paramètres sera peu importante et
ne modifiera pas la décision.
40Coût dopportunité
- On étudie la branche de recherche sur 1 an en
conditionnant la recherche au résultat de létude
de marché. Lespérance devient alors 446 500 soit
446 500 310 000 136 500 de coût dopportunité
nettement supérieur au coût de létude mais reste
à savoir si le délai consenti pour cette étude ne
permettra pas à un concurrent dêtre plus rapide.
41En conclusion
- Développements anciens
- Mycine, guidon,
- Renouveau actuel
- Guide de bonne pratique, EBM
- Succès ?