Title: Mention Management des connaissances et innovation
1- Mention Management des connaissances et
innovation - Spécialité IFL
Modélisation de lutilisateur et de
lapprenant Jean-Marc LABAT
2Plan du cours
- Nicolas Labroche
- Mesure daudience sur Internet
- Catherine Pélachaud
- Agents Conversationnels Animés
- Modélisation des émotions Analyse et synthèse
- Jean-Marc Labat
- Cours 1 Introduction, Architectures cognitives
- Cours 2 Modélisation de lutilisateur modèles
symboliques - Cours 3 Modélisation de lutilisateur Modèles
numériques - Cours 4 et 5 Modèles de lapprenant
- Un examen écrit constitué de
- Des questions de compréhension sur les cours
- Des questions portant sur des textes donnés à
lire - Des questions de compréhension
- Des questions danalyse critique
- Des questions demandant un peu dinnovation
Evaluation
3La modélisation de l'utilisateur
- Généralités
- Les problématiques
- Les 2 catégories d'approches
- Le rôle de l'Interaction H-M pour la résolution
de problèmes - Les architectures cognitives
- ACT
- SOAR
- Cas d'école Les tours de Hanoi
- Présentation de différents modèles
- Modélisations basées sur des protocoles verbaux
- Bilan
- Outil pour le travail pluridisciplinaire
4Généralités
- Problématique très importante de l'IA
- sur un plan fondamental
- travail théorique
- travail pluridisciplinaire neuro-sciences,
psychologie cognitive, linguistique - sur un plan plus appliqué
- pour personnaliser l'enseignement
- pour fournir une aide appropriée à l'utilisation
de logiciels - pour connaître les besoins des internautes
52 catégories d'approches
- Modèles dynamiques
- objectif simuler ou rejouer le comportement de
l'humain - utilisation des systèmes à base de connaissances
- Modèles statiques
- objectif stocker de l'information pour prendre
des décisions - utilisation d'attributs-valeurs
- Modèles basés sur des calculs et des méthodes
d'apprentissage - objectif avoir un modèle complet qui ne répond
jamais de manière aberrante - utilisation
- des réseaux neuronaux
- des réseaux bayésiens
- du filtrage collaboratif
6Problématique
Le rôle de l'Interaction H-M pour la résolution
de problèmes
L'humain (expert) est très fort malgré sa lenteur
de calcul
Reproduire les méthodes humaines Permettre à
l'humain de guider la recherche
Interaction entre l'homme et la machine dans le
cadre de la résolution de problèmes
7Quelle interaction ?
Exemple 1 l'EIAO
Le niveau stratégique de la résolution est
assuré par le système L'ordinateur joue le rôle
du "maître" il est supposé posséder une
connaissance parfaite de ce qu'il enseigne
L'apprenant interagit pour choisir le
thème d'étude pour répondre aux
questions posées pour demander des
explications et des aides
Exemple 2 l'AD
L'ordinateur impose la définition du problème,
sa modélisation et donc la résolution Le
"décideur" interagit pour piloter la
recherche pour fournir les données
initiales pour faire de l'analyse de
sensibilité pour demander des
explications
Modèle d'Interaction faible Vision
"Utilisateur"
8Quelle interaction ?
? L'Humain est le "maître du jeu"
Il contrôle le processus de la
résolution Il peut intervenir au
niveau des choix stratégiques Il
assure le contrôle de la gestion des rôles ?
La communication homme-machine permet une
véritable coopération Le partage des
tâches est en partie dynamique La
machine peut fournir une aide pertinente
La machine peut expliquer son propre
raisonnement, justifier ses résultats
Vision "Producteur"
Modèle d'Interaction forte
9Quelles sont les conditions d'une interaction
forte ?
La Machine dispose d'une représentation de
ses compétences (savoir métacognitif)
Elle peut les présenter à lhumain
La Machine adopte une résolution proche de celle
de l'Humain Vocabulaire,
représentation et méthodes La Machine a une
certaine perception du processus de
communication Elle comprend un énoncé,
elle a des capacités de négociation
La Machine a une représentation dynamique de
l'Humain Elle connaît les buts de
l'humain Elle a un modèle du
fonctionnement de l'humain et de ses possibilités
d'intervention
L'Humain dispose d'un modèle des compétences de
la Machine
La machine dispose d'un modèle cognitif de
l'Humain
10Architecture cognitive
? Proposition complète sur la structure de la
cognition humaine plus complet qu'une théorie
cognitive qui ne traite qu'un seul aspect
l'objectif est d'obtenir un comportement
"intelligent", c'est-à-dire flexible ?
Propriétés d'une architecture cognitive Fortes
et nombreuses ! ? Hypothèse fondamentale
Les capacités cognitives humaines conscientes
sont bien représentées, sur le plan
psychologique, par le formalisme des règles de
production
11 Propriétés que doit posséder une architecture
cognitive
? Avoir un comportement rationnel, orienté par
les buts et adapté à l'environnement ? Agir en
temps réel dans un environnement complexe ?
Utiliser différents niveaux d'abstraction de type
symbolique ? Utiliser un langage à la fois
naturel et artificiel ? Apprendre à partir de
l'environnement et de l'expérience ? Acquérir
des capacités progressivement ? Faire preuve de
conscience de soi (de réflexivité)
12Présentation de ACT-R
Nouvelle version de ACT (R rational) Principe
s 2 types de mémoire à long terme
Une mémoire déclarative Les "chunks" (
"cognitive unit" dans ACT)
Une mémoire procédurale les règles de
production Activer les règles de
production a un certain coût en temps calculé
par le système Le temps d'activation
d'une règle dépend de la fréquence d'utilisation
de la règle et des coefficients
d'activation des chunks qui s'apparient aux
prémisses L'apprentissage des chunks et des
règles est différencié Pour les
chunks, seul le coefficient d'activation est
objet d'apprentissage Les règles
peuvent être créées uniquement à partir
d'exemple ( par analogie)
13Les chunks
? Ils représentent ce qui peut être verbalisé ?
Ils sont acquis directement par encodage de
l'environnement ? Chaque chunk est formé d'un
nom et de slots (généralement pas plus de 3
slots) ? Ils sont organisés hiérarchiquement ?
Chaque chunk i possède un coefficient
d'activation Ai Bi S W jS ji
S
ji force de l'association entre le chunk i et
le chunk j appartenant au contexte
(traduit la probabilité que i soit utilisé quand
j est présent) Bi fonction du temps
depuis lequel i a été utilisé ? Le coefficient
d'activation d'un chunk est modifié par l'usage
de celui-ci mais aussi par l'usage des
autres chunks du contexte
j
14Les règles de production
Elles traduisent ce qui peut être inféré à
partir de l'observation du comportement
Propriété caractéristique dissymétrie
condition/action Elles contiennent toujours un
but en partie condition Si
ltButgt et ltconditionsgt Alors ltsous-butgt et
ltactionsgt Chaque production a une force Sp qui
dépend du temps depuis lequel elle a été
utilisée ? cette force dépend des coefficients
d'activation des chunks qui s'apparient aux
prémisses Les nouvelles productions sont
construites par le système par un mécanisme basé
sur le raisonnement par analogie (peu
développé) Pas d'apprentissage compositionnel
de règles (contrairement à ACT ou SOAR)
15Principe de fonctionnement
Tant que non-vide(pile-de-buts) 1) Activer
le but du sommet de pile (ou un sous-but
nécessaire pour l'atteindre) 2) Déterminer
les règles candidates (celles dont le but en
partie condition s'apparie avec le but actif)
3) Déterminer les règles déclenchables en
respectant pour chaque règle p une durée
d'activation Tp (équation principale
d'ACT-R) Tp S B e
i chunk qui s'apparie avec une des
prémisses de la règle p 4) Choisir un moment
d'exécution grâce à une fonction qui estime le
bénéfice de l'apport de nouvelles règles
déclenchables par rapport au coût supplémentaire
en temps 5) Déclencher celle qui a le
meilleur rapport qualité/prix Rp
Rp PG - C P probabilité d'atteindre le
but G gain
C coûts des
actions en cours coût des actions futures
-b(Ai Sp)
i
16Limites
L'acquisition des règles se fait-il uniquement
à partir d'exemples ? l'apprentissage par
analogie est très peu développé Pas de
modélisation du raisonnement inductif Pas de
théorie sur comment les règles peuvent être mal
appliquées (il faudrait un appariement
partiel) Les nombreux coefficients numériques
qui décident du déclenchement des règles
sont-ils psychologiquement plausibles ?
17Présentation de SOAR
9 versions, dernière version 9.0.1 (9.1.1 et
9.2.0 béta) http//sitemaker.umich.edu/soar/home
Principes ? Combiner connaissances et
recherche flexible grâce aux notions
d'espace-problème et de règles de productions
L'espace problème est organisé
classiquement en états et opérateurs
SOAR contient plusieurs méthodes pour résoudre le
même problème Les règles de productions
servent pour choisir la méthode la plus
appropriée ? Différents espace-problèmes et
différentes méthodes de contrôle de la
recherche doivent être accessibles A
priori, le comportement est contrôlé grâce à la
mémoire à long terme par l'architecture
Les impasses (incapacité de choisir) sont
résolues en changeant d'espace-problème
en faisant appel à un raisonnement explicite ?
L'apprentissage se fait par composition
(chunking) de règles de décision
déclenchées
18La génération de sous-buts
A partir de SOAR-2, Objectif améliorer le
processus de vote et raisonner à un
méta-niveau Les sous-buts sont créés
automatiquement chaque fois qu'une impasse se
produit Impasse
Beaucoup de types de
buts possibles réaliser les
pré-conditions d'un opérateur
choisir un opérateur remplir les
slots du contexte courant Le but et ses
sous-buts sont simultanément actifs (présents en
mémoire de travail)
Pas d'alternatives sélectionnables ou
Pas de
connaissances pour choisir entre plusieurs
alternatives
19La notion d'espace-problème
La mémoire de travail contient un stock de
buts, d'espaces-problèmes, d'états et
d'opérateurs Le contexte courant contient les
4 éléments choisis dans le stock qui définissent
un espace de recherche. Contexte (but,
espace-problème, états, opérateurs) 2
fonctions sont fondamentales 1) La
génération de nouveaux objets qui vont dans le
stock 2) La sélection d'un objet qui se
substitue à l'ancien dans le contexte courant.
Les autres attributs du contexte sont
alors remis à nil Les opérateurs sont
représentés par des règles de production, ce qui
permet éventuellement de les représenter de
manière déclarative
20Différents niveaux de l'architecture de SOAR-5
Impasse et sous-buts
Niveau réflexif
Résolution dans l'espace-problème
Niveau délibératif
Mémoire des règles de production
Niveau réactif
Mémoire de travail
Entrées
Sorties
Cycle de résolution au niveau délibératif
alternance Elaboration/Décision
Proposition d'états
Sélection d'états
Proposition d'états
Proposition et comparaison d'opérateurs
Sélection d'opérateurs
Application, proposition et comparaison d'opérateu
rs
Sélection d'opérateurs
21La notion dimpasse
- 3 types dimpasses
- Tie impasse
- Soar narrive pas à choisir entre plusieurs
objets. - No-change impasse
- aucun objet nest proposé à lissue de
lélaboration. - Constraint-failure impasse
- Soar détecte un conflit entre des contraintes
pesant sur un objet candidat (quand les
préférences indiquent par exemple que lobjet est
de priorité absolue, et quil est en même temps
interdit) - Résolution
- Création dun sous-but permettant de résoudre
cette impasse - La résolution de problème est alors appliquée à
ce sous-but
22Apprentissage
Apport majeur de SOAR-3, le processus s'appelle
le "chunking" Consiste à résumer dans une
règle de production la résolution d'un
sous-but ? Accélère la résolution en évitant de
faire appel au niveau réflexif N'interfère pas
avec la résolution Concerne les propositions
et sélections d'espaces-problème, d'états
initiaux et d'opérateurs S'apparente à
l'apprentissage basé sur les explications Pas
de problème de performance en temps même avec
beaucoup de productions apprises (en partie grâce
à un ré-ordonnancement automatique de l'ordre des
prémisses)
23Limites
Projet commencé en 80, encore beaucoup de
difficultés L'apprentissage reste bien
limité (pas d'apprentissage de connaissances
déclaratives) L'apprentissage est fragile
(sur-généralisation, sous-généralisation,
"utility problem") L'interaction entre buts
est traité de manière ad hoc Le raisonnement
temporel et spatial est incomplet et ad hoc
SOAR reste radicalement incomplet en tant que
théorie complète de la cognition (par
exemple, la mémoire de travail a des ressources
illimitées) Sur le plan pratique SOAR est
difficile à apprendre et à comprendre pour des
novices mais une petite communauté
mondiale y travaille (jusquen 2009 29 workshops)
24Exemple dutilisation
- SETHI Simulateur dEnvironnement Tactique
Hétérogène Interactif - système temps-réel de simulation de Forces
- a pour fonction d'animer le champ de bataille
dans lequel sont immergés des agents virtuels et
des avatars de simulateurs physiques. - conçu pour lentraînement technique et tactique
de personnels de différents échelons grâce à la
mise en réseau de simulateurs participant à un
exercice commun - SETHI est constitué de quatre composants
principaux - Les IHM qui permettent à l'utilisateur de
définir les scénarios de simulation et de
contrôler leur déroulement en temps-réel - les bases de données contenant toutes les
informations de terrains, darmes, de véhicules,
de réactions comportementales, - le noyau de calcul qui maintient les données
cohérentes en temps réel - une couche réseau permettant le partage dobjets
et de messages en temps réel entre applications
sexécutant sur des machines distantes
25Exemple dutilisation
- Modèle de sélection daction Emotionnelle basé
sur SOAR (MEbS) - Olga Kozlova, stage chez Thales 2005-2006
- MEbS a pour but de fournir à SETHI un système
comportemental alternatif qui permet à certains
types dagents virtuels qui ne suivent pas la
doctrine militaire typique (civils, terroristes,
milices) dexhiber un comportement réaliste et de
prendre en compte des événements particuliers.
26Exemple dutilisation
- MEbS est composé de 2 sous-systèmes
- Système dévaluation des émotions
- alimenté par les informations sur létat de
lenvironnement et de lagent issues de SETHI. - chaque agent évalue la situation par rapport à un
ensemble de critères qui lui sont propres. - Système de prise de décision
- alimenté par les informations sur les
possibilités dactions issues de SETHI et les
informations sur létat émotionnel de lagent
issues du système dévaluation des émotions - fournit à SETHI les actions à exécuter par
lagent. - le comportement de lagent émerge dune suite de
plusieurs cycles de décision - Un cycle de décision de MEbS inclut lévaluation
des émotions suivi de plusieurs cycles de
décision de Soar
27Cycle de décision de l'agent
28peg B
Cas d'école Les tours de Hanoi
peg B
peg A
peg C
peg B
peg A
peg C
Situation initiale
Situation finale
- Règles
- On ne déplace qu'un seul disque à la fois
- On ne peut prendre que celui en haut de la pile
- On ne peut pas poser un disque sur un autre de
taille inférieure
peg A
peg C
peg B
peg A
peg C
Situations intermédiaires
29Graphe de résolution du problème des tours de
Hanoi à 4 disques
la tour de Hanoi
1 2 3 4 - -
Modèles basés sur la génération de buts
Si (But Mettre ?X de ?P sur ?Q)
Existe disque ?Y sur ?Q, ?Y plus petit que
?X Alors EMPILER (But Mettre ?Y sur (Autre
?P ?Q))
1 4 3 2
1 4 2 3
1 4 3 2
1 2 4 3 -
1 2 4 - 3
1 2 4 3 -
1 2 4 3 -
1 3 2 - 4
1 3 2 4 -
1 3 2 - 4
1 2 3 - 4
1 2 3 - - 4
30Objectifs
Construire une architecture cognitive Traiter
automatiquement des énoncés linguistiques Étudier
les différences intra et inter-individuelles
Architecture cognitive
? Obtenir un comportement "intelligent",
c'est-à-dire flexible ? Hypothèse fondamentale
Les capacités cognitives humaines conscientes
sont bien représentées par le formalisme des
règles de production
31Modélisation cognitive d'un sujet en situation de
résolution de problèmesà partir de protocoles
verbaux
Hypothèse de travail Les marques
linguistiques et leurs agencements permettent de
modéliser les processus cognitifs d'un
sujet dans une tâche de résolution de problèmes
Méthode
Simulation de protocoles d'enfants résolvant le
problème des tours de Hanoï à 4 disques et 3
tiges à partir d'une analyse psycholinguistique
Objectif
Modèle de résolution de chaque sujet
particulier (reproduisant les parcours des
différents essais)
- Protocole verbal d'un sujet
- Modèle général de résolution
32 Analyse de protocoles d'enfants
Recueil des protocoles verbaux
Des enfants d'une dizaine d'années gt
verbalisations parfois pauvres La verbalisation
des sujets est simultanée à la résolution Une
consigne de verbalisation laissant une grande
latitude Pas de demande de commentaires au
niveau méta
Analyse "à la main"
Repérage des marques de modalité (les
verbes) avec leurs choix lexicaux Connecteurs ch
oix lexicaux pour les référents, les
prépositions et les verbes d'action ordre
d'apparition, structure grammaticale
Termes de départ Buts modalisés Sous-buts Episo
des Repérage
33La planification des buts issue de l'analyse d'un
protocole
2 en C
4 en C
enlever 1
Ý
enlever 3
2 en C
enlever 4
Les buts modaux sont enlever ?X
enlever le disque ?X ?X sur ?P mettre le
disque ?X sur le piquet ?P ?X sur ?Y
mettre le disque ?X sur le disque ?Y
2 sur 4
1 sur C
Ý
2 sur A
4 en C
enlever 2
Ý
enlever 3
1 sur A
Ý
3 sur 4
34L'analyse psycholinguistique
3 règles de mouvement pour un débutant
R1 Si le but est Transporter ?Di du piquet
?X sur le piquet ?Z ?Di est libre et
?Z est libre Alors Mettre ?Di sur ?Z
R1-Bd Si le but est Transporter ?Di du
piquet ?X sur le piquet ?Z ?Dj est
sur ?Di et ?Z est libre Alors
Mettre ?Dj sur ?Y et ?Di sur ?Z
R1-Bp Si le but est Transporter ?Di du
piquet ?X sur le piquet ?Z ?Di est
libre et ?Dj est sur ?Z Alors Mettre
?Dj sur ?Y et ?Di sur ?Z
35Résolution aléatoire
Modélisation des mouvements élémentaires
Ni mémorisation des états déjà visités Ni
raisonnement en terme de buts
MAIS
Exemple de règle
Règle deplacer-3 "deplacement d'un disque
pose sur un autre, sur un piquet occupe" Si
le disque ?d1 posé sur ?p1 n'a rien au dessus
le disque ?d2 posé sur ?p2 n'a rien au dessus
taille (?d2) gt taille (?d1) Alors
Mettre ?d1 sur ?p2
SEULE STRATEGIE QUI RESOUT LE PROBLEME
HASARD
Résultats
avec 3 disques, de 20 à 200 mouvements pour
résoudre le problème avec 4 disques, l'état
final n'est pas atteint après plus de 30 000
mouvements AJOUT d'une connaissance
supplémentaire le système reconnaît
les configurations partiellement conformes à
l'état final la solution est toujours
trouvée en moins de 700 mouvements (parfois en
moins de 100)
36Première modélisation
Base de Faits 4 classes pour décrire l'état
de la résolution Disque, Situation, But,
Pile-de-but Règles issues du modèle
psycholinguistique R1, R1-Bd, R1-Bp
Règles complémentaires pour les situations où
aucune des 3 règles ci-dessus ne s'applique
R-enlever pour choisir le piquet sur
lequel on met le disque gênant R-Sous-but
quand le disque à déplacer est sous une pile
Les buts modalisés par le sujet
ne sont pas "calculés" mais introduits
interactivement au fur et à mesure de la
résolution
Cette dernière règle est beaucoup trop puissante
car elle introduit la récursivité
37 La modélisation
Utilise CLIPS et le LOO intégré gt tout est
exprimé en terme de classes et d'instances
La base de faits
1) Description de la situation
Classe SITUATION
Classe DISQUE
attributs Piquet-A
Piquet-B Piquet-C
attributs Taille Piquet
2) Description des buts de l'humain
Classe BUT
Classe PILE
attributs Disque Piquet
attribut But
38Règles complémentaires
R1-Bd Si le but est Mettre ?Di sur ?Z
?Dj est sur ?Di sur ?X ?Z est libre
?Y est libre Alors Déplacer ?Dj sur
?Y et ?Di sur ?Z
R1-Bd-Echec1 Si le but est "Mettre ?Di sur
?Z" ?Dj est sur ?Di sur ?X ?Y est
libre ?Z n'est pas libre Alors
Déplacer ?Dj sur ?Y ajouter le but
"Libérer ?Z"
R1-Bd-Echec2 Si le but est "Mettre ?Di sur ?Z"
?Dj est sur ?Di sur ?X ?Y n'est pas
libre ?Z est libre Alors ajouter
le but "Mettre ?Dj sur ?Y"
R1-Bd-Echec3 Si le but est Mettre ?Di sur ?Z
?Dj est sur ?Di sur ?X ?Y n'est pas
libre ?Z n'est pas libre Alors Déplacer
?Dj sur ?Y ajouter "Mettre ?Dj sur ?Y
ajouter "Libérer ?Z"
39 Les résultats
Différents tests effectués
1) Avec le but 4-en-C en arrière plan dès le
début 2) Sans le but 4-en- C en arrière
plan 3) Comparaison épisode par épisode
BILAN
Dans tous les cas une grande différence dans
les parcours obtenus
40 Parcours effectué par Olivier (essai 2)
Parcours effectué par le SE avec 4 C en
arrière plan
1 2 3 4 - -
1 2 3 4 - -
1 4 3 2
1 4 2 3
1 4 3 2
1 4 2 3
1 4 3 2
1 4 3 2
1 4 3 2
1 2 4 3 -
1 2 4 - 3
1 2 4 3 -
1 2 4 - 3
1 2 4 3 -
1 2 4 - 3
1 2 4 3 -
1 2 4 3 -
1 3 2 - 4
1 3 2 - 4
1 3 2 4 -
1 3 2 4 -
1 3 2 - 4
1 3 2 - 4
3 2 1 4
1 2 3 - - 4
3 2 1 4
1 2 3 - 4 -
1 2 3 - 4 -
1 2 3 - - 4
1 2 3 - 4
41 Analyse des différences
PROGRAMME
HUMAIN
Mémorisation des 2 derniers mouvements "Cela
ne sert à rien de bouger 2 fois de suite le
même disque" Notion de mouvement
obligatoire
Pas d'historique des états Pas
d'historique des mouvements
Abandon des buts trop difficiles à
atteindre Création de buts pas toujours
pertinents
Empilement des buts sans limitation Pas de
ré-organisation des buts
VERSUS
Utilisation de phénomènes perceptifs pour choisir
où mettre un disque gênant en raisonnant "en
avant"
Calcul de sous-buts en chaînage arrière Pas de
prévision "en avant"
Changements de représentation introduits par
- les termes de départ - les
représentations mentales "1-3 º 1"
Une représentation univoque de l'état de la
résolution
L'expérimentation permet de modifier et d'affiner
le modèle informatique mais aussi le modèle
psycholinguistique
42Objectifs de la seconde modélisation
Modéliser la gestion
partielle de l'historique des états
la limitation de l'empilement des sous buts
Introduire des règles de "calcul" des buts
modalisés Séparer les règles de buts et les
règles de mouvements
43Deuxième modélisation
Modifications de l'analyse psycholinguistique
Dans la planification suppression du but "4
en C" (but d'arrière plan) au profit des buts
"Tous en B" ou "Tous en C" Structure d'épisodes
remaniée avec l' introduction de la notion de
focalisation Mémorisation du dernier disque
bougé Séparation des règles d'actions et des
règles de buts Modélisation partielle d'un
regard avant Introduction de différents types
de buts Une base de connaissance unique avec
une fonction redéfinissant les priorités des
règles pour chaque essai de chaque sujet Une
résolution opportuniste dès que le but du
sommet de pile est réalisable, l'action est
effectuée
Modifications du modèle informatique
Buts généraux Buts modaux Buts calculés
44Les catégories de règles
accomplir le but du sommet de la pile de but seul
mouvement possible
?
Les actions
La génération de buts
?
Tous-en-B, Tous-en-C, A-ou-B-vers-C,
A-vers-B-ou-C
Les buts généraux
pile-partielle-en-C, 4-en-C, 4-en-B, 3-en-B
Les buts modaux
R1-d-unique, R1-d-court-terme, R1-d-long-terme 1-e
-2, 1-e-3, 2-e- 4,
Les sous-buts
L'évaluation de la situation
Reconnaissance de buts complexes fin! ,
fin-1-2-3, mouvements-possibles
?
45Court-terme vs long-terme
Le but est de mettre le plus grand disque du
piquet A sur le piquet C
R1-d-court-terme le sujet met le disque du
haut de pile sur le piquet intermédiaire
R1-d-long-terme le sujet met le disque du haut
de pile sur le piquet arrivée
(pour le ramener ensuite sur le piquet
intermédiaire)
A
B
C
Etat initial
A
B
C
46Résultats
7 protocoles reproduits à plus de 90. Seuls
ceux avec de nombreux retour-arrières résistent
Sujet SE
1 2 3 4 - -
1 2 3 4 - -
1 4 3 2
1 4 3 2
1 4 2 3
1 4 2 3
1 4 3 2
1 4 3 2
1 4 3 2
1 2 4 3 -
1 2 4 - 3
1 2 4 3 -
1 2 4 - 3
1 2 4 3 -
1 2 4 3 -
1 2 4 3 -
1 2 4 - 3
1 3 2 - 4
1 3 2 4 -
1 3 2 - 4
1 3 2 4 -
1 3 2 - 4
1 3 2 - 4
3 2 1 4
3 2 1 4
1 2 3 - 4 -
1 2 3 - - 4
1 2 3 - - 4
1 2 3 - 4
1 2 3 - 4 -
47Analyse critique de la modélisation informatique
- Règles de génération de buts
- Certaines règles sont "ad hoc", pour combler des
trous - Il manque des règles modélisant des buts
traduisant des classes d'états - Exemple "libérer un piquet"
- Evaluation de la situation incomplète
- l'écart au but n'est pas modélisé
- pas d'évaluation de la difficulté à atteindre un
but - Certaines notions sont absentes de la
modélisation - "Reprendre un disque" pour reconstituer une pile
- Focalisation sur un disque
- Affordance
- Représentation trop rigide
- La base de faits décrit uniquement la situation
réelle - Les priorités devraient être contextuelles
48Problèmes (1) La notion d'impasse
- On peut toujours avancer !
- Dans SOAR,
- impasse
- Pour J-F. Richard, C. Tijus et Poitrenaud
- Un sujet est représenté par un ensemble ordonné
de contraintes - impasse situation dans laquelle le sujet est
obligé de violer une de ses contraintes
Pas d'alternatives sélectionnables ou Pas de
connaissance pour choisir entre plusieurs
alternatives
Pas de notion d'impasse dans ce modèle
?
49Problèmes (2) Les retours arrière et les
boucles
- 2 types de retours-arrière
- Retour volontaire
- Défaire ce qu'on vient de faire (combien de pas
en arrière ? ) - Faire une boucle pour revenir à une position
antérieure choisie comme but - Retour involontaire
- Faire une boucle sans sen rendre compte
- Les verbalisations des sujets sont insuffisantes
- Pas d'expression de retour-arrière volontaire
- Pas d'expression de la reconnaissance d'états
déjà visités -
Aucun protocole avec des boucles ou des
retours-arrière n'est reproduit
?
50Problèmes (3) L'apprentissage
- Le rôle de la mémorisation des essais antérieurs
- Pas de verbalisation sur l'utilisation des essais
antérieurs - Le temps écoulé entre 2 coups est-il une bonne
indication ? - L'apprentissage dans un essai
- 4 stratégies explicitées par H. Simon
- "recherche sélective", "dirigée par les piquets",
"calcul récursif de sous-buts", "dirigé par les
pyramides" - Les sujets n'expriment pas les moments où ils
apprennent - Il est très difficile de les repérer à travers
les changements de discours
? Pas de modification des coefficients de
priorité pendant un essai
51BILAN
- Des progrès considérables entre les 2
modélisations... - Des règles de génération de buts
psychologiquement plausibles - Plusieurs parcours reproduits
- Un modèle psycholinguiste enrichi par lanalyse
des modélisations informatiques - Grâce à un dialogue fructueux entre psychologues,
linguistes et informaticiens - Base de règles fournie au niveau connaissance
- Possibilité de suivre tous les déclenchements en
détail - Un modèle à compléter
- Une architecture encore trop simplifiée
- Ajouter la notion de contrainte et d'affordance
- Des informations comportementales absentes et
sûrement nécessaires - Les pauses ne sont pas prises en compte
- Certaines activités d'évaluation ne sont pas
verbalisées mais repérables par les durées - Il manque aussi les esquisses de gestes, les
gestes avortés
52BILAN
Modèles descriptifs permettent une analyse
rétroactive des traces d'une activité
VERSUS Modèles
effectifs qui permettent une comparaison avec le
fonctionnement du phénomène modélisé
Approche constructiviste avec une conception par
amorce Les expérimentations sont
enrichissantes à condition que les chercheurs des
autres disciplines puissent suivre l'exécution
très finement Base de règles fournie au
niveau connaissance Possibilité de suivre
tous les déclenchements avec l'ensemble des
conflits ordonné et l'état courant de la
situation (état des piquets et liste des buts
dans la pile de buts) Question très
difficile Comment évaluer la validité d'un
modèle ?
Sur un plan méthodologique
53Perspectives
Poursuite du travail engagé dans les
modélisations précédentes
Étude du lien entre connaissances générales de
résolution de problèmes et connaissances liées
au problème étudié
Implicite Explicite
Quoi ? Quand ?
Compréhension des phénomènes d'apprentissage
humain
Introduction de "schéma de sens" pour les
connecteurs, les verbes modaux
Rôle du contexte Instanciation
Plus généralement
Générations de buts Utilisation de
contraintes Modélisation des affordances
Mise en commun des différentes modélisations
Modélisation d'autres domaines (utilisation du
logiciel Apple-djinn)
54Complémentarité entre l'IA"sciences des
conditions générales et effectives de
l'intelligence" et"sciences des artefacts
interactifs"
55Compléments sur la méthode de travail
- Présentation de la modélisation au "knowledge
level" - Modélisation de la situation
- (defclass Disque (is-a USER) (defclass But
(is-a USER) - slot nom slot type
- slot taille slot action
- slot pos slot disque
- slot piquet
- (defclass Historique (is-a USER) slot priorite
(default 10) - slot numero
- slot disque (deftemplate piquet
- slot dpt slot nom
- slot arr
- Règles écrites en Français
- Ex règle But-general-A-vers-B-ou-C
- Règle tendant à amener les gros disques du
piquet A vers les piquet de droite. - Si - le système n'a aucun but modal ou calculé
- - un disque de taille 3 ou 4 est libre au
sommet de A - - un piquet de droite (B ou C) est vide
56Compléments sur la méthode de travail
Affichage
Declenc
hement numero 59 4 But-general-pile-partielle
-C but1,,,d4,,d3 3 R-2-repere-a-4
f-2,,d4,,coup0, -10 but-modal
initial-object,,,but1 -10 but-modal
initial-object,,,but2 -30
afficher-regles-utilisees f-0 For a total of 5
activations. piquet A piquet B d1 d2 d3
piquet C d4 On veut mettre le disque d3 sur
le piquet C avec la priorite 11
AGENDA
SITUATION
57Compléments sur la méthode de travail
(deffunction affichage () (printout t crlf
"piquet A ") (do-for-all-instances ((?disq
Disque)) (eq ?disqpos A) (printout t
?disqnom " ")) (printout t crlf "piquet B
") (do-for-all-instances ((?disq Disque)) (eq
?disqpos B) (printout t ?disqnom "
")) (printout t crlf "piquet C
") (do-for-all-instances ((?disq Disque)) (eq
?disqpos C) (printout t ?disqnom "
")) (printout t crlf) (do-for-all-instances
((?but But)) (or (eq ?buttype general)
(eq ?buttype calcule)) (send ?but afficher)
))
- Présentation d'une exécution
- Procédures
- (deffunction deroule (?nb)
- (bind ?x 1)
- (affichage)
- (while (lt ?x ?nb) do
- (printout t
- ")
- (printout t crlf
- "Declenchement numero " ?x crlf)
- (agenda)
- (run 1)
- (affichage)
- (bind ?x ( ?x 1)) ))
58Bibliographie
Modélisation cognitive de l'humain
- Architectures cognitives
- A. Newell, P. S. Rosenbloom et J.E. Laird
"Symbolic Architectures for cognition" dans
Foundations of Cognitive Science, MIT Press, pp
93-131, 1989 - H. A. Simon "Invariants of Human Behavior",
Annu. Rev Psycho., 41, pp 1-19, 90 - H. A. Simon "Artificial intelligence an
empirical science", AI 77, pp 95-127, 95 - ACT-R
- J. R. Anderson Rules of the Mind, Lawrence
Erlbaum Ass. Publ. - SOAR
- "A preliminary analysis of the Soar architecture
as a basis for general intelligence", P.S.
Rosenbloom, J. E. Laird, A. Newell, R. McCarl, AI
47, pp 289-325, 91 - "The Evolution of the Soar Cognitive
Architecture", J. E. Laird, P. S. Rosenbloom, pp
1-49, in Mind matters, A tribute to A. Newell,
Lawrence Erlbaum Ass. Steier Mitchell
59Bibliographie
- Modélisations de la tour de Hanoï
- Y. Anzaï and H. A. Simon "The theory of
Learning by Doing", Psychological review, vol 86,
n2, pp 124-140, 1979 - J. Caron ""Schémas de sens et "effets de sens"
La sémantique des termes fonctionnels" Actes du
colloque de l'A.R.C. "Cognition et Connaissance
Où va la Science cognitive ?", Paris, pp 283-297,
1988 - J. Caron-Pargue et J. Caron "Processus
psycholinguistiques et analyse des verbalisations
dans une tâche cognitive", Archives de
psychologie, 57, pp 3-32, 1989 - J. Caron-Pargue et M.D. Fièvre
"Psycholinguistic analysis of a ten years old
child's thinking aloud verbal report", LACO,
Poitiers, 1992 - Labat J.-M., Pomerol J.-Ch., Nigro J.-M., Caron
J., Fievre M.-D., Caron-Pargue J. "Computer and
Human problem solving strategies The case of
the Tower of Hanoï", Antwerp papers in
Linguistics, 85, pp 75-90, 1996. - J.-F. Richard, S. Poitrenaud et C. Tiju
"Problem-Solving Restructuration Elimination of
Implicit Constraints", Cognitive Science vol 17,
pp 497-529, 1993 - Vanlehn, 91 K. Vanlehn "Rule Acquisition
events in the Discovery of Problem-Solving
Strategies", Cognitive Science vol 15, pp 1-47,
1991