Jean Caelen - PowerPoint PPT Presentation

About This Presentation
Title:

Jean Caelen

Description:

Th orie des jeux = Von Neumann et Morgensten ' The Theory of Games ... Monsieur B accepte de reporter sa r union. Je peux vous r server la salle Bleue pour ... – PowerPoint PPT presentation

Number of Views:76
Avg rating:3.0/5.0
Slides: 60
Provided by: jcae1
Category:
Tags: accepte | caelen | jean

less

Transcript and Presenter's Notes

Title: Jean Caelen


1
Jeux dialogiques
  • Jean Caelen

2
Dialogue jeu
Jeu de langage Wittgenstein en 1952 Théorie des
jeux Von Neumann et Morgensten  The Theory of
Games and Economic Behavior  en 1944 Dans le
dialogue homme-machine, nous supposons au moins
deux acteurs, lhomme et le système, comme étant
deux locuteurs qui dialoguent, chacun visant au
départ un certain but dans larrière-plan. Un
dialogue est un jeu au cours duquel chaque
participant joue des coups à laide dactes de
dialogue pour atteindre son but. Un dialogue se
présente comme une suite déchanges (actions,
transactions), les échanges visant à résoudre des
sous-buts ou des pré-conditions. Le dialogue
lui-même peut être discontinu dans le temps et se
dérouler sur plusieurs sessions.
3
Théorie des jeux
Définition un jeu est une situation où des
individus rationnels (les "joueurs") sont
conduits à faire des choix stratégiques parmi un
certain nombre d'actions possibles, et dans un
cadre défini à l'avance (les "règles du jeu"), le
résultat de ces choix constituant une issue du
jeu, à laquelle est associé un gain (ou
paiement), positif ou négatif, pour chacun des
participants. La théorie des jeux modélise le
comportement d'un agent face à des situations de
choix, elle étudie toute situation dans laquelle
des agents interagissent. On pourrait aussi
l'appeler théorie de la décision interactive, car
elle modélise des situations dans lesquelles
plusieurs agents font des choix, puis des actions
conditionnées par ces choix, ces actions ayant à
leur tour des effets sur les gains (ou pertes),
ceux des uns affectant les gains des autres.
4
Théorie des jeux
  • Un jeu se caractérise par des règles qui
    définissent 
  • le nombre de joueurs (au moins deux), lordre
    dintervention des joueurs,
  • les types dactions, stratégies possibles des
    joueurs et informations disponibles pour choisir,
  • les informations disponibles ou non sur les
    stratégies des participants (ce dernier paramètre
    sépare les types de jeux en jeu coopératif ou de
    coalition vs. en jeu compétitif),
  • le degré de communication entre joueurs
    (collusion ou non)
  • le déroulement et les étapes du jeu,
  • les rétributions (gains, pertes) et les
    résultats,
  • la répétition ou non du jeu.
  • La théorie distingue différents types de jeux
    suivant qu'ils sont plus ou moins coopératifs,
    compétitifs, répétitifs. Lintérêt de la
    modélisation dun jeu porte sur ses règles.

5
Théorie des jeux
Le concept dutilité est central dans un jeu.
Cest non seulement le critère qui permet de
mesurer le gain ou la perte à lissue du jeu,
mais cest aussi le critère qui motive le jeu et
maintien les acteurs dans cette situation et leur
fait respecter les règles. Lutilité peut se
décliner en unités monétaires, biens matériels ou
non, etc. On lassocie souvent à un nombre
réel. Un jeu est dit jeu stratégique entre deux
ou plusieurs personnes lorsque lutilité est
affectée non seulement par laction du joueur
lui-même mais aussi par toutes les actions des
autres joueurs (jeu déchec par exemple). Les
conflits peuvent souvent se modéliser par des
intérêts contradictoires en terme dutilité.
6
Théorie des jeux
  • Le jeu est souvent un problème combinatoire que
    lon peu représenter sous forme darbre de
    décision (forme dite extensive) ou sous forme
    duale, la matrice (forme dite normale).
  • Les "formes extensives" arbre de Kuhn, ayant
    des branches, des nœuds et des feuilles, où
    l'issue d'un jeu est assimilée à une feuille dans
    laquelle nous retrouvons le vecteur des gains (ou
    "paiements") respectif des joueurs. Les
    embranchements possibles à partir dun nœud
    représentent les choix à ce moment du jeu.
  • Les "formes normales" tableau de gains (ou
    "paiements") mais qui sont inadaptés aux jeux
    répétitifs.

7
Le dilemme du prisonnier
Stratégie Joueur B dénonce A B ?dénonce A
A dénonce B 5, 5 0, 10
A ?dénonce B 10, 0 3, 3
Jeu à connaissance incomplète Comportement de A
dépend de celui de B quil ne connaît pas, donc
émerge la notion dintérêt commun et la solution
qui offre le moins de  regret  3,3
8
Équilibre de Nash
On appelle équilibre un état ou une situation où
aucun joueur ne souhaite modifier son
comportement même connaissant le comportement des
autres joueurs. Une fois quun équilibre a été
atteint il ny a aucune raison de le quitter.
Léquilibre de Nash est un concept fondamental
en théorie des jeux, cest pour un joueur la
meilleure stratégie possible étant donnée les
stratégies des autres joueurs. Mais cet équilibre
est relatif, il dépend des stratégies des autres
joueurs. Cependant, un équilibre global peut
émerger si le risque est partagé par lensemble
des joueurs. Ainsi le risque pour A de ne pas
dénoncer B est moindre si B raisonne de la même
manière que lui. Léquilibre de Nash global est
alors (3,3).
9
Stratégie dominante
Joueur 2 Joueur 1 Stratégie A Stratégie B
Stratégie C 3, 0 4, 0
Stratégie D 4, 3 0, 2
Dans ce jeu la stratégie A du joueur 2 domine
faiblement sa stratégie B. Le joueur 1 na pas de
stratégie dominante mais il pense que le joueur 2
jouera sa stratégie dominante A. Avec cette
hypothèse il doit donc jouer la stratégie D qui
maximise son gain et devient sa stratégie
dominante après élimination des stratégies
dominées du joueur 2. Ainsi (4,3) est le point
déquilibre de ce jeu.
10
Équilibres multiples
Locut. B Locut. A Appeler Attendre
Appeler 0, 0 6, 0
Attendre 0, 6 0, 0
Dans ce jeu A et B sont en conversation
téléphonique et la liaison est coupée. Chacun a
la possibilité de rappeler ou dattendre lappel
de lautre. Il coûte 6 dappeler. Sils attendent
tous les deux ou appellent simultanément la
conversation ne pourra pas avoir lieu. Supposons
que (a) lintérêt de A et B soit le même alors il
y a deux équilibres, le choix in fine de la
stratégie de lun se fera sur la connaissance
supposée des préférences de comportement de son
interlocuteur (cest-à-dire par exemple savoir
que B est plus impatient que A), sinon (b) cest
celui qui a un intérêt supérieur qui devra
appeler lautre gt gains composés (plusieurs jeux
composés ou gain externe au jeu)
11
La rationalité
  • La théorie des jeux suppose souvent que les
    joueurs sont rationnels. En réalité il nen est
    pas toujours ainsi,
  • Soit que lun des joueurs suppose que les autres
    ne le sont pas,
  • Soit que les critères de choix ne le sont pas ,
  • Soit que des stratégies à long terme de type
    spéculatif sont mises en place,
  • Soit quil peut aussi y avoir des connaissances
    fausses qui biaisent la prise de décision.
  • Exemple de biais psychologique  on dit à deux
    joueurs de choisir au hasard et de noter un
    chiffre quelconque compris entre 1 et 10. Si le
    hasard leur donne le même chiffre ils gagnent
    tous deux 10 fois ce chiffre et sinon ils ne
    gagnent rien. Le jeu est répété 10 fois.
  • Y a-t-il une stratégie gagnante ?

12
Limites de la rationalité
La théorie des jeux dite néoclassique suppose
que les joueurs sont rationnels et intéressés.
Ils ne se préoccupent que de leur propre intérêt
et des gains des autres, que dans la mesure où
ces derniers conditionnent les leurs (par exemple
dans les jeux de marchandage à somme nulle). Or
ce comportement est actuellement contesté par
certains résultats expérimentaux. On montre que
le sentiment de partage équitable ou de
rémunération équitable entre en jeu, notamment
dans certaines relations de marchandage. Des
valeurs humanitaires (ou sentimentales) entrent
ainsi en considération dans certaines situations.
Par exemple le sentiment de magnanimité en
marchandage consiste pour un acheteur à accepter
un prix au-dessus de léquilibre pour des raisons
deffort à marchander ou parce quil lui semble
que le vendeur a fait une concession plus
importante que lui (Hollard, 2005).
13
Tendances actuelles
Depuis quelques années, la théorie des jeux
sest ouverte à des concepts plus raffinés qui
permettent de réduire le nombre des équilibres
comme dans les sous-jeux parfaits ou la
renégociation. Dans ces cas la représentation
extensive (arbre de choix) nest pas toujours
équivalente à la représentation sous forme
normale (matrice). Les sous-jeux parfaits
utilisent des notions comme la menace  cela
consiste à menacer à lavance lun des joueurs,
que si le jeu tombe dans une certaine
configuration alors il y aura sanction. Un
équilibre de sous-jeu parfait devient alors une
combinaison de stratégies telle que les actions
prescrites par ces stratégies constituent un
équilibre de Nash dans tous les sous-jeux
14
Les jeux répétés
Un jeu répété est un jeu dans lequel les mêmes
joueurs se rencontrent plusieurs fois. On suppose
dans un premier temps que les règles du jeu ne
changent pas et que les gains acquis à un tour
précédent ninfluent pas sur les gains espérés du
tour suivant. Malgré ces conditions dautres
équilibres se créent du fait de la répétition du
jeu, notamment par le phénomène de collusion ou
de coopération, selon que les joueurs se font ou
non confiance au cours du temps. Ainsi dans le
dilemme du prisonnier, si linterrogatoire
recommence touts les mois, il est probable que
les choses changent  (a) au début aucun des deux
ne dénonce lautre puis (b) lorsque cet équilibre
semble définitivement établi ainsi que la
confiance réciproque, alors lun des deux peut en
décider autrement pour sortir de prison (il
 craque  dans le jargon policier).
15
Conclusion sur la théorie des jeux
  • Cadre fécond
  • Beaucoup de travaux, communauté très dynamique
  • Modélisation mathématique puissante
    (probabilités, logique, optimisation
    fonctionnelle)
  • Raffinements possibles
  • Hors du cadre strictement rationnel
  • Par la répétition du jeu et lintroduction de
    phases stratégiques distinctes
  • Par lintroduction de facteurs humains complexes,
    individuels ou collectifs autres que les intérêts
    et les connaissances

16
Retour au dialogue
  • Nous allons tenter détendre la théorie des jeux
    pour le dialogue dans trois directions 
  • Attacher à la notion de but celle dutilité (
    fonction de satisfaction continue)
  • Appliquer la théorie des jeux à la prise de
    tour de parole dans un dialogue à plusieurs,
  • Formaliser des stratégies générales de dialogue.

17
But satisfait ?
Usager allô, je voudrais réserver une salle
pour lundi prochain Système désolé, toutes les
salles sont déjà prises. Usager bon merci, au
revoir
Le but du dialogue est satisfait mais pas le but
du jeu (appelé bU). Ce dialogue na pas été
 utile .
But du jeu réussir à obtenir un service But du
dialogue réussir la transaction But illocutoire
réussir un acte de dialogue
18
But bU  mieux  satisfait
Usager U allô, je voudrais réserver une salle
pour lundi prochain Système désolé, toutes les
salles sont déjà prises mais je vais me
renseigner pour savoir si une permutation est
possible. Je vous mets en attente. Usager U
bon merci Système  bonjour monsieur A, vous
est-il possible de déplacer votre réunion de
lundi ? Usager A ah non désolé, ma réunion est
trop importante Système  bonjour monsieur B,
vous est-il possible de déplacer votre réunion de
lundi ? Usager B  oui, si cest encore possible
le lendemain Système  merci, je réserve votre
salle pour le lendemain, mardi, mais je vous
confirmerai par e-mail de ce changement Système 
allô monsieur U ? Monsieur B accepte de reporter
sa réunion. Je peux vous réserver la salle Bleue
pour lundi. Cela vous convient ?
19
La satisfaction du but
Satisfaction de bA
1
Buts satisfaits Compromis positif Compromis à
somme nulle Compromis négatif
 
Satisfaction de bB
0
1
20
La gestion des conflitsLes tours de parole
  • Exemple un dialogue pour gérer les ressources
    partagées. Dans ce type de problème
  • Comment gérer les conflits par le dialogue ?
  • Comment gérer les tours de parole entre
    partenaires ?

21
Résolution par la théorie des jeux
  • bU x, ylundi salle(x) Ù jour(y) Ù
    réservé(x,y,U)
  • ce but posé par U est étendu en considérant 
  • b bU Ù (h, d, ?A heure(h) Ù durée(d) Ù
    ?réservé(x,y,A)
  • ? (x, ?y ? lundi salle(x) Ù jour(y) Ù
    réservé(x,y,U)
  • qui permet de chercher
  • soit une heure et une durée en cas de
    disponibilité de salle,
  • soit les agents A qui ont réservé le jour y
  • soit de relâcher la contrainte sur le jour de
    réservation de U pour lui proposer une autre date
    le cas échéant si aucun agent A naccepte de
    modifier sa réservation

22
Construire un arbre de conflits
Dans cet exemple le but bU est en conflit avec
les buts (b1p1 Ù b2p2 Ù b4p4) ? (b1p1 Ù b2p2 Ù
b5p5) ? (b3p3 Ù b4p4) ? (b3p3 Ù b5p5) ce qui
laisse 4 tactiques pour résoudre le problème.
Plus généralement, le problème est de parcourir
larbre de conflits de manière optimale afin de
rechercher le chemin qui offre la meilleure
possibilité de lever le conflit en activant des
sessions de dialogue de négociation avec les
patients concernés Pi. Trouver la solution qui
maximise lespérance de succès de la négociation.
23
Optimiser
  • La recherche de cet optimum, guide la tactique de
    dialogue qui consiste donc à 
  • énumérer tous les chemins possibles dans larbre
    de conflits,
  • estimer les gains individuels et généraux pour
    tous les chemins,
  • ordonnancer ces chemins selon lun des deux
    critères de choix à savoir intérêts particuliers
    ou intérêt général,
  • parcourir ces chemins pour organiser les sessions
    de négociation selon cet ordre et dialoguer avec
    chaque participant jusquà trouver une solution
    ou constater un échec,
  • revenir au dialogue principal qui a motivé le
    but, en faisant le compte-rendu à lappelant.

24
Position du problème
La phase de négociation à laquelle nous nous
intéressons ici est la phase destimation a
priori des chances de succès dune demande de
service afin de planifier les sessions de
dialogue selon une tactique optimale. Les
participants sont en nombre quelconque n,
Ui,i1,n-1, et U0, pose un problème b0
(demandeur initial) qui se trouve être en conflit
avec une situation précédente.
25
Définitions
On définit on ensemble de fonctions dans
lintervalle -1, 1 Gain(Ui) le gain (resp.
perte) que Ui espère retirer (resp. craint de
subir) de la réalisation de b0. Ce gain ne dépend
que de lintérêt propre de Ui, considéré
indépendamment de lintérêt des autres
participants. Gain_conjoint(Ui, Uj) le gain
(resp. perte) que Ui espère retirer (resp. craint
de subir) de lacceptation (resp. refus) de b0
par Uj. Ici on considère lintérêt que Ui et Uj
partagent. Si ces intérêts sont opposés le gain
conjoint prend une valeur négative. Concession(Ui
) réduction de gain (resp. augmentation) que Ui
est prêt à accepter (resp. en attend) en cas
dimposition de b0. Cette valeur dite de
concession est la borne limite encore acceptable
par Ui sil peut encore influer sur une situation
qui lui est défavorable. Une concession positive
serait un gain inespéré par lui à ce stade de la
négociation, Concession_conjointe(Ui, Uj)
concession faite par Ui suite à une pression
subie par Ui de la part de Uj pour imposer b0. On
remarque ici que U0 nest peut-être pas le seul à
vouloir réaliser b0, et que de ce fait Ui peut
recevoir diverses pressions pour accepter b0. Si
b0 est favorable à Ui alors il peut lui-même
faire subir des pressions aux autres participants
pour réaliser b0.
26
Tactiques
  • La théorie des jeux propose des solutions pour
    maximiser soit le gain total de certains
    individus soit le gain total de lensemble des
    participants.
  • Le gain espéré pour Ui est 
  • Gi G(Ui) SGc(Ui, Uj) C(Ui) SCc(Ui, Uj)
  • On a donc plusieurs types de tactiques 
  • Max G0 sur lintérêt du demandeur initial,
  • Max SpiGi sur lensemble des participants ou de
    certains participants  prioritaires .

j
j
i
27
Exemple numérique
Problème  U0 souhaite organiser une réunion il
sagit de trouver une date T qui permette de
réunir lensemble des participants U0, Ui,
i1,n-1 sous la contrainte C. Le  poids  des
participants vis-à-vis de leur importance par
rapport à lordre du jour de la réunion est par
définition une valeur pi réelle comprise dans
lintervalle 0, 1 Parmi les contraintes on peut
avoir par exemple  C1- tous les participants
doivent être présents C2- tous les participants
parmi les k plus importants doivent être
présents C3- un quorum q doit être
atteint Dialogue  on suppose que le dialogue de
prise de rendez-vous se fait en face-à-face. La
négociation est un jeu répété.
28
Exemple numérique
Discussion à trois  1-U0  je vous propose une
réunion sur le sujet S à la date T1 2-U1  désolé
je ne peux pas à T1, mais plutôt à T2 3-U0 
pourtant il faudrait que tout le monde soit
présent 4-U1  OK mais jaimerais aussi que U2
soit présent 5-U2  pour moi pas de problème à T1
mais impossible à T2 6-U1  bon, je vais
marranger pour venir Dans cet exemple on note
que U0 fait  pression  sur U1 et U2 (à laide
darguments et/ou par sa position hiérarchique),
que U1 a un gain conjoint avec U2 (il le
manifeste explicitement à lacte 4) et quil
finit par faire une concession à U0 à lacte 6,
la contrainte étant ici que tous les participants
doivent être présents.
29
Exemple numérique
Les valeurs des fonctions sont les suivantes par
rapport au sujet S  P 1 0.5 0.8
1 0.4 0.6 G 0.8 0.5
0.7 0.6 0.2 0.5 Cette matrice
Gain nest pas symétrique, elle peut évoluer au
cours du dialogue si le sujet S change ou se
modifie. 0 0 0.2 C(T1)
0.8 1 0.5 0.5 0.4 0 0 0 0.2 C(T2)
0.8 0 0.5 0.5 0.4 1
30
Exemple numérique
Au départ  G0(T1) 1 0 1 G0(T2) 1 0
1 G1(T1) 0.5 1 -0.5 G1(T2) 0.5 0
0.5 G2(T1) 0.5 0 0.5 G2(T2) 0.5 1
-0.5 Remarques  la date T1 ou T2 est
indifférente pour U0. Il peut subir une pression
de la part de U2 mais pas de U1 pour changer de
date. La date T1 ne convient pas à U1 il peut
subir une pression de la part de U0 et de U2. La
date T1 peut convenir à U2 mais pas T2, il peut
subir une pression de U0 (mais ressentie moins
fortement que U1).
31
Exemple numérique
Pour la suite du dialogue on a  1-U0  je vous
propose une réunion sur le sujet S, à la date
T1 Cet acte propose un intérêt pour le sujet S et
fait subir une pression sur U1 et U2 pour la date
T1 G0(T1) 1 0 1 G1(T1) -0.5 0.8 0.8
-0.5, G1(T2) 0.5 G2(T1) 0.5 0.6 -0.5
0.6 2-U1  désolé je ne peux pas à T1 mais plutôt
à T2 Cet énoncé exprime létat G1(T1) et fait
subir une pression sur U2 mais pas sur U0 (car la
concession est nulle) G0(T1) 1 0 1 G1(T1)
-0.5 G2(T1) 0.6 -0.4 0.2, G2(T2)
-0.5 3-U0  pourtant il faudrait que tout le
monde soit présent Cet énoncé exprime une
insistance de U0 sur U1 G1(T1) -0.5 0.8 0.3
32
Exemple numérique
4-U1  OK mais jaimerais aussi que u2 soit
présent Le gain G1 devient positif donc U1
acquiesce mais exerce une pression sur U2 pour
augmenter son gain conjoint G2(T1) 0.2 0.2
0.4, G2(T2) -0.5 0.4 -0.1 5-U2  pour moi
pas de problème à T1 mais impossible à T2 Fait
état de son gain positif et répond à U1 G1(T1)
0.3 0.5 0.8 6-U1  bon, je vais marranger
pour venir La réunion a donc lieu à T1 avec les
trois participants avec les gains (1, 0.8, 0.4)
33
Discussion
Ce modèle de gestion de la négociation est
relativement indépendant du modèle de tâche. Il
travaille seulement sur létat du but de dialogue
et il permet donc de séparer le gestionnaire de
dialogue du gestionnaire de la tâche,
cest-à-dire le quoi et le comment. La théorie
des jeux est une alternative intéressante pour
modéliser le dialogue et dépasser les deux types
de modèles habituellement utilisés, le modèle
intentionnel et le modèle conventionnel. Limites
les valeurs des paramètres, la numérisation
34
Jeu stratégique de dialogue
  • Gestion des buts de dialogue
  • Stratégies de dialogue

35
Le but du jeu
U "dessine un triangle" M "pouvez-vous
préciser ?" U "équilatéral" M "de couleur
rouge ?" U "peu importe" M "OK"
Motive et oriente le dialogue Le but du dialogue
est de maintenir une interaction conjointe
OK
Peu importe
De couleur rouge ?
Équilatéral
Pouvez-vous préciser ?
Dessine un triangle
36
Le but du jeu
On appelle but du jeu un état utile que désire
atteindre lusager. Cet état concerne aussi bien
un état mental de ce dernier (par exemple
connaître une information, acquérir un
savoir-faire) quun état du monde. On suppose
quon peut représenter ce but à laide dun
prédicat bU, par exemple   bU (x) Ù
Cercle(x) Ù Rouge(x) Ù Sur(x, Carré) Mettre un
cercle rouge sur le carré bU (?x) Ù Cercle(x)
Ù CU(Ballon(x)) Savoir quun cercle représente
un ballon
37
Évolution du but au cours du dialogue
  • nouveau but ?b, ce but vient dêtre exprimé
    par X,
  • but atteint b, létat de la situation rend le
    prédicat b vrai,
  • but satisfait b, X manifeste son accord
    explicitement ou implicitement sur b,
  • but mis en attente -b, lusager ou la machine
    résolvent temporairement un autre problème,
  • but réparé b, à la suite dune
    incompréhension le but est modifié,
  • but déplacé b, à la suite dun compromis le
    but est modifié,
  • sous-but sb, le problème est décomposé en
    sous-problèmes,
  • but abandonné _at_b, à la suite dun échec ou
    dun souhait dabandon.

38
Laction
  • Les unités élémentaires sont les actes de langage
    de la forme Fp, avec
  • FAp faire p (action), les effets immédiats
    obtenus sont p (déclaratif)
  • FFp faire-faire p, demande de faire p, les
    effets p sont différés (directif)
  • FSp faire savoir p, les effets sont obtenus
    immédiatement (assertif, FS(Ø) note un expressif)
  • FFSp faire faire-savoir p, demande information
    sur p, la réponse est différée
  • FPp faire pouvoir p, offre un choix fermé, la
    réplique est attendue parmi p (promissif)
  • FDp faire devoir p, oblige une action dont
    leffet sera p (directif)

 
 
39
Règles du jeu
Consistance de U devant ses buts FSUb ? b ?
?b U pose un nouveau but en le manifestant FSUb2
? b1 ? -b1 ? ?b2 si U manifeste un deuxième but
b2 alors quun autre but b1 est déjà en cours, on
met ce dernier en attente (car on ne traite le
dialogue que sur un fil, cest-à-dire échange par
échange) b ? FSUb ? _at_b U na pas de raison de
maintenir un but satisfait b ? FSUb ? b si un
but est atteint et que U ne le conteste pas, il
est satisfait de manière implicite b ? FSU (b)
? _at_b si un but est atteint et que U le conteste,
on labandonne FSU (_at_b) ? _at_b U peut décider
dabandonner un but de propos délibéré
 
 
40
Règles du jeu
Consistance de U devant les buts de M b ?
FUp les actes a de U sont motivées par le but
courant FUp la non-action est une
incompréhension FSM b ? b ? ?b si elle pose un
but, il est accepté par U FPMb ? FSUb si elle
donne un choix à U sur les buts, celui-ci le
fait FDMb ? FAUb si elle donne une obligation à U
sur le but, celui-ci le fait
 
 
Les attentes sont motivées par lefficacité FAxp
Þ Cyp les effets de lacte sont pris en compte
par lallocutaire FFxp Þ FAyp ? FFSyp lacte
attendu est une contribution au FF demandé FPxp ?
FDxp Þ FAyp ? FFyp lacte attendu est un choix
daction parmi ceux proposés FSxp Þ Cyp ? FFSyp
une information est prise en compte ou
clarifiée FFSxp Þ FSyp ? FFSyp une question
motive la réponse ou une demande de clarification
41
Gestion des buts
FSb Ù b Þ ?b un nouveau but est empilé et
devient candidat à la résolution b Þ b le but
est atteint et marqué comme tel FS(b1) Ú (b1 Ù
FSb2 Ù (b1?b2)) Þ b1 le but est satisfait après
accord explicite ou implicite de celui qui a posé
le but (il est alors dépilé) FSMb Ù (b sb )
Þ?b Ù -b le but est déplacé par M pour des
raisons de planification (il est empilé) FSMb Ù
(b ? sb ) Þ?bÙ _at_b le but est déplacé par M pour
des raisons motivées par la situation ou suite à
un compromis ou à une réparation (il remplace
b) CMb Ù ?b Þ _at_b le but est abandonné car M ne
sait pas le résoudre (il est dépilé) FSUb Ú b
Þ _at_b le but est abandonné si U change davis ou
sil est satisfait (il est dépilé)
 
 
42
Stratégie
  • Manière de gérer un échange pour atteindre et
    satisfaire le but (les rôles peuvent changer au
    cours des échanges)
  • Direction dajustement des buts
  • Soit bX le but de X et by celui de Y en début
    déchange. Au cours de léchange on peut avoir
  • _at_ bx au profit de by X est réactif (by ? bx)
  • Imposition de bx à Y X est directif (bx ? by)
  • Partage des buts X, Y sont coopératifs (bx ? by
    )
  • Recherche dun compromis X, Y négocient (bx
    ?b? by)
  • Détour constructif X, Y font une incidence (bx
    ? Ø ? by)

 
43
Gestion du dialogue
  • Le  jeu de dialogue  est réglé par
  • des règles de choix de stratégies,
  • des règles de comportement,
  • un mécanisme de contrôle,
  • des règles de reprise par des sous-dialogues,
  • une ontologie de jeu (description des sous-jeux
    ou des étapes).

 
44
Réactif (R)
Règle mode réactif si le nombre de tours de
parole p depuis la précédente action (FA) dépasse
un certain seuil. Ce mode est également activé en
cas de refus dune autre stratégie ou pour
conclure un dialogue. Les conditions de
complétude, de vérité et de réussite ne sont pas
prises en compte.  (p gt p0) v FSU(réactif) v
FSM(clôture) Þ (d réactif) Comportement FAUp
Þ CMp U fait un acte, M en enregistre les
effets FFUp Ù CondF(p) Þ FAMp Ù CMp U fait-faire
un acte, M exécute et enregistre les effets (a)
Ù attr(a,p) Ù (a Ø) Þ Défaut(a) si acte
incomplet M complète par défaut ("a) Ù attr(a,p)
Ù (a Ø) Ù pPlan Þ CondF(p) lacte doit
pouvoir déclencher un Plan FSUp Ù CondS(p) Þ CMp
U donne une information, M lenregistre (a) Ù
attr(a,p) Ù (a Ø) Þ CondS(p) FFSUp) Ù CMp Þ
FSMp U pose une question, M y répond si elle
connaît la réponse FPUp ? FDUp Þ FAMp Ù CMp M
fait le choix proposé On pose incomplet(p)
(a) Ù attr(a,p) Ù (a Ø), nonvide(p) (a) Ù
attr(a,p) Ù (a Ø) complet(p) ("a) Ù
attr(a,p) Ù (a Ø), lopérateur se lit
 déclencheur de 
 
45
Directif (D)
Règle Au début linitiative est à la machine
pour lui permettre de se présenter et de
connaître son interlocuteur. Elle doit être pour
cela en mode directif. Elle revient à ce mode dès
quune incompréhension surgit (pour éviter le
risque de bouclage ou dimpasse). ((p 0)) v
(FSU(directif)) v (FSM(erreur)) Þ (d
directif) Comportement FAMp Þ CMp Ù CM(Cup)
M fait un acte et en enregistre les effets FFMp
Þ CM(FAUp) Ù CMp M fait-faire un acte, U est
supposé exécuter FSMp Þ CM(Cup) M donne une
info. et suppose que U laccepte FFSMp Þ FSUp v
FFSUp M pose une question, et attend de U une
réponse FSUp Ù CondS(p) Þ CMp U donne une
information, M lenregistre nonvide(p) Þ
CondS(p) FSU(contestation) Þ (d négociation)
si U conteste il y a changement de
stratégie FFSUp Ù CMp Þ FSMp U pose une question
de clarification, M y répond et reprend
linitiative FDMp Þ CM(FAUp) Ù CMp M fait-faire
un acte, U est supposé exécuter
 
46
Coopératif (C1)
Règle Pour un novice, une action est menée en
coopération si elle est incomplètement spécifiée
et si le nombre de tours de parole depuis la
précédente action nest pas trop élevée. En
situation de non-action, M propose une
continuation au dialogue dans ce mode
(relance). ((p lt p0) v (FSU(coop.)) Ù (FSUp Ù
incomplet(p) Ù CM(u,novice) Þ (d coopératif)
FUp Þ (d coopératif) Comportement   FAUp Þ
CMp Ù FSMp U fait un acte, M en enregistre les
effets et commente FFUp Ù CondF(p) Þ FAMp Ù CMp
Ù FSMp U fait-faire un acte, M exécute et
commente incomplet(p) Þ FSMp Ù FFSMp si acte
incomplet M explicite et questionne alors FFSMp
Þ FSUp complet(p) Ù pPlan Þ CondF(p) lacte
doit pouvoir déclencher un Plan FFUp Ù CondF(p)
Þ FSM(p) Ù FFSMp si lacte est erroné, M
propose un but voisin FSUp Ù CondS(p) Þ CMp Ù
FSMp U donne une information, M lenregistre et
commente nonvide(p) Þ CondS(p) FFSUp Þ FSMp U
pose une question, M y répond si elle connaît la
réponse, informe sinon FPUp ? FDUp Þ FAMp Ù CMp
Ù FSMp M fait le choix proposé et le commente FU
Þ FPMp en cas de non action, M propose des
choix à U Pour les cas où M a linitiative voir
la stratégie directive
 
47
Coopératif (C2)
Règle Pour un expert et chaque fois que cela
est possible, mais surtout en début de nouvel
échange le dialogue sétablit en mode
intentionnel dans le but pour M de se ramener à
une situation prototypique. Lorsquune situation
prototypique est identifiée, acceptée comme telle
par U, le plan peut être exécuté. (FSU(coopératif)
v (?b Ù CM(u,expert) Þ (d coopératif)
Comportement   FFSMb Ù CUb Þ FSUb Ù CMb M
pose une question sur le but, U y répond si elle
connaît la réponse sinon FPMb Þ FSUb Ù CMb M
propose des buts possibles et U choisit CMb Ù
bPlan Ù b Þ FAMPlan Ù FFSMb M exécute le plan
par anticipation et demande confirmation Pour
les autres cas où M a linitiative voir la
stratégie directive Pour les cas où U a
linitiative voir la stratégie coopérative
précédente
 
48
Négocié (N)
Règle Une action supporte la négociation si
elle est incomplètement spécifiée et si le nombre
de tours de parole depuis la précédente action
nest pas trop élevée. La négociation est menée
jusquà son terme, elle ne peut être rompue par
la machine. ((p lt p0) v FSU(négocié)) Ù FSUp Ù
incomplet(p) Þ (d négocié) Comportement FAUp
v FDUp Þ (d réactif) U fait un acte qui
interrompt dautorité la négociation FPUp Þ (d
coopératif) U fait un acte qui interrompt
dautorité la négociation FFUp Ù CondN Þ FAMp Ù
CMp U fait-faire un acte, M exécute sous
condition Incomplet(p) Þ FFSMp si acte
incomplet M négocie FFSMp Þ FSUp v
(FSU(contestation) Ù FSUp) (complet(p) Ù
pPlan) v (complet(p) Ù pPlan) Þ CondN lacte
négocié doit pouvoir déclencher un Plan CondN
Þ FFSMp si lacte nest pas exécutable, M
continue de négocier FSUp Ù CondS(p) Þ CMp U
donne une information, M lenregistre si
daccord nonvide(p) Ù CM(p) Þ
CondS(p) Cond(p)Þ FSMp(contestation) Ù
FFSMp si linformation est erronée, M
négocie FFSUp Ù CMp Þ FSMp U pose une
question, M y répond Pour les cas où M a
linitiative voir la stratégie directive
 
49
Constructif (K)
Règle La stratégie constructive sert surtout à
alerter lusager ou à attirer son attention sur
des sujets voisins de son propos. Elle peut être
utilisée si le thème du dialogue na pas évolué
depuis un certain temps et quaucune action nest
été faite. Elle peut être utilisée enfin comme un
moyen de détour.   ((p gt p0) v (FSU(constructif))
Ù (focus constant)) Þ (d constructif)   Compo
rtement FUp Þ FSMp Ù FFSMp Ù (d coopératif)
pour tout acte de U, M le commente et pose une
question dans un propos voisin, puis passe en
stratégie coopérative FFSMp Þ FSUp ? (FUp Ù (d
réactif))
 
50
Ontologie de (sous)jeux élémentaires
Un sous-jeu est un jeu (par récursivité)
51
Exemple de dialogue
Dialogue acte stratégie jeu
C Bonjour madame FP D ouverture Je
voudrais une chambre pour 2 nuits FF
D demande-serv/exp. A oui, pour quand ? FFS
C termes(b1) C pour les 13 et 14 prochains
FS R termes A les nuits du 13 et du 14
? FFS D termes C oui FS R termes A
voulez-vous une chambre avec bain ? FFS C
termes(b2) C oui pour deux personnes FS C
termes A jai une chambre à 50 FS
N offre-serv/exp. Ça vous convient ? C
vous navez pas moins cher ? FFS N
modification A non tout est complet FS N
modification C bon eh bien, daccord FF
N concl-serv/accept. Où se trouve votre
hôtel ? FFS D demande-serv/exp. A cest
facile, cest en face de la gare FS
C offre-serv/exp. Pouvez-vous me verser
des arrhes ? FF D concl-serv/exec. C oui bien
sûr, voici le n de ma carte VISA FA
R concl-serv/exec. A merci, je réserve la
chambe FA D concl-serv/exec. C au revoir,
merci, à bientôt FD R clôture
 
52
Le contrôle du dialogue
  • Les rôles du contrôleur de dialogue sont
  • Calcul des stratégies,
  • Gestion des buts,
  • Conduite des (sous)jeux et des interventions,
  • Pilote du système de dialogue,
  • Gestion de lapprentissage,
  • Calcul des tactiques de jeu
  • Gestion des conflits, des tours de parole et des
    sessions.
  •  
  • Sous-jeu (et jeu élémentaire)
  •   C'est la séquence des interventions qui conduit
    à la satisfaction d'un but de dialogue (ou
    l'abandon en cas d'échec).
  • Intervention
  • C'est la séquence des actes qui porte sur le
    même sous-jeu.
  • Acte
  •   Unité élémentaire daction.

 
53
Le contrôle du dialogue
Le contrôleur gère les (Sous)Jeux et les
Interventions à laide dun automate relativement
simple qui maintient le but à travers les jeux et
permet de passer dun jeu au suivant dès que le
but courant est satisfait. La succession des
(sous)jeux se cale sur lontologie.   Dialogue ?
Jeu-Ouverture. Jeu.Jeu-Clôture Jeu ?
Intervention Intervention ? Acte
 
54
Le cycle local
USAGER MACHINE
Analyse pragmatique
FUp
segmentation de lénoncé en actes de langages
recherche du type illocutoire
calcul de la composante locutoire (si échec
sous-dialogue
de clarification)
Planification du jeu
recherche du but (si échec
sous-dialogue
de réparation ou apprentissage)
ordonnancement des buts en attente
calcul du plan daction découlant des plans
appris
Planification du dialogue
calcul de la stratégie
calcul du comportement adéquat
mise en forme du plan daction
 
mise à jour du modèle utilisateur
Génération des actes
de la composante illocutoire le type (quoi
faire)
de la composante locutoire actants (quoi
dire)
de la composante perlocutoire choix du
degré de force illocutoire
Mise à jour
de lhistorique du dialogue via linterpréteur
pragmatique
du plan dactivité via le gestionnaire de
tâches
de la situation.
FMp
FUp
Niveau
Niveau de
profond
surface
55
Exemple
Dialogue acte stratégie but
Jeu présentation
M1 Bienvenue sur ICPtalk FP connaissez-vous
le système ? FFS D ?b1CM(u) U oui, un
peu FS b1 (uoccasionnel) M2 je vous
présente ses principales fonctions FP C1 b1,
?b2FFU(tâche) 1. lédition graphique... FS U
stop FF b2 je connais FS b2 je veux
ICPdraw FF ?b3Run(ICPdraw)   M3 action
(ICPdraw) (U ltsilencegt) FA R b3, b3 que
voulez-vous faire ? FFS C2 ?b4 CM(b) jattends
votre intention générale FS
interv.
Jeu dessin
 
56
Exemple
Dialogue acte stratégie but
U () FS -b4 M4 jattends une
commande FP D ?b5CM(b) Ù (b sb) U
dessine un cercle rouge FF b5, ?b6
b(Cercle1) Ù M5 action (dessin
cercle) FA R b6 U un autre, noir FF
b6, ?b7(Cercle2) Ù M6 où ? à droite du
premier ? FFS N b7b7 Ù A_droite U non, à
gauche FS b7b7 Ù A_gauche M7 identique
au premier ? FFS N b7b7Ù (Taille) U
oui FS b7 M8 action FA b7 que
représentent-ils ? des roues ? FFS C2 b4 U
dessine un carré vert FF -b4, ?b8(Carré1) Ù
M9 action FA R b8
interv.
interv.
 
interv.
interv.
interv.
57
Exemple
Dialogue acte stratégie but
U et deux autres sur les cercles FF
b8,?b9(Carré2)Ù(Carré3)Ù... M10 sur chacun
des cercles FFS N b9Sur(Carré2,Cercle1)Ù... U
non, superposés FS b9b9ÙRéf M11 je ne
comprends pas ce mot FFS D -b9, ?b10
CM(Réf) U lun sur lautre FS b10 M12
bon FS R b10 action (dessin) FA b9 oui,
mais en vue de quelle figure ? FFS C2 b4 U un
organigramme FF b4, ?b10 Dessin(Orga) M13
ah ! je comprends FS R b4, b10 jaligne donc
les figures FA jéquilibre les espaces FA U
oui, merci, cest çà FS b10 sauve-çà
maintenant FF ?b11Sauver(Orga) M14 voilà
action FA R b11 U merci, cest tout FF
b11 M15 au revoir FD R
incidence
 
Jeu sauvegarde
Clôture
58
Discussion
  • Un modèle général basé sur la théorie des jeux
    stratégiques
  • service jeux, tactiques
  • jeu but, sous-jeux
  • sous-jeu jeu, stratégies, règles
  • Récursivité un sous-jeu est un jeu

 
59
Conclusion
Au-delà des modèles intentionnels et
conventionnels théorie des jeux pour le
dialogue. Cadre fécond.
 
Write a Comment
User Comments (0)
About PowerShow.com