Title: Intelligence Artificielle I'A'
1Intelligence ArtificielleI.A.
- Basile Charasse
- Laboratoire Neurosciencessystèmes sensoriels
- bcharass_at_olfac.univ-lyon1.fr
2Plan du cours
- Introduction démarche scientifique
- Les systèmes experts
- Réseaux de Neurones
- Applications
3Introduction
- Démarche scientifique modèle prédictif
Sciences physiques gt étude de la nature
Qu est ce que la démarche scientifique ?
4Les 11 étapes de la science
- L'activité scientifique passe par onze étapes
classiques - 1. Observation élémentaire identifier et
observer des phénomènes de manière fiable et
répétitive, les mesurer - 2. Identification des éléments élémentaires
distinguer, classifier, identifier, et nommer les
observations
5- Découverte des éléments sous-jacents et de la
dynamique sous-jacente identifier les influences
évidentes et cachées, les liens directionnels et
bidirectionnels entre phénomènes - Découverte de la structure identifier des
structures ordonnées, structures hiéarchiques,
structures hybrides - 5. Développement d'hypothèses explicatives
entamer un processus d'abstraction, proposer une
structure intégrée potentielle
6- Vérification d'hypothèses appliquer les
principes de la plus grande simplicité (du
"principe d'Occam", Occam's razor), et de la
vérification indépendante - Proposition de théories proposer de grandes
théories intégrantes - 8. Vérification de théories appliquer le
principe de l'argumentation congruente,
acceptation et rejet.
7- Développement de modèles prédictifs développer
des modèles statiques et dynamiques, des modèles
mathématiques et computationnels - 10. Vérification d'un modèle prédictif
confronter systématiquement la prédiction et les
informations de base en utilisant des
informations connues et nouvelles
811. L'exploitation d'un modèle prédictif
promouvoir la compréhension d'un ensemble de
phénomènes, prédire la récurrence d'un phénomène
ou d'un comportement donné, exercer de
l'influence sur un phénomène ou un
comportement
9Exemple dans lhistoire des sciences
La relativité générale d Einstein
Lune
étoile
Soleil
La théorie prévoit, le système est prédictif
Terre
10Les systèmes experts
D'un système de prédiction par règles à un
système expert Origine des systèmes de prédiction
à règles Les systèmes de prédiction par
règles sont anciens et fort répandus. On pense
notamment aux almanachs des agriculteurs
(calendriers de prévisions météorologiques
associées à des conseils de travaux à effectuer à
chaque saison). Au cours des siècles, les bases
astronomiques pour ces règles sont devenues assez
complexes. Ces règles prennent la forme de le
jour x, il est propice de faire y ce qui
correspond logiquement à la règle si...alors de
si le jour x, alors fais y
11- Règles simples, règles complexes, systèmes
experts - Les règles sont partout. La société humaine est
gouvernée par des règles explicites ("garder la
droite", "virage permis après stop", "il faut
être ponctuel", etc.) - Un système de règles informatique peut capter
presque n'importe quel jeu de règles. Un système
expert formalise un ensemble complexe de telles
règles (les lois d'un pays, un système de lois en
chimie, un système de règles d'interconnexion
électrique, etc.). - Systèmes experts. Comme le nom le suggère, un
système expert diffère d'un système de règles par
sa complexité. Dans le cas d'un système expert,
l'assistance d'un expert dans un domaine donné
est requise pour créer le système.
12- Un système expert codifie un fonctionnement.
Cependant, l'intérêt central d'un système expert
est la promesse de la prédiction automatique. En
théorie, si les connaissances d'un domaine donné
sont bien codifiées, n'importe quelle
connaissance humaine peut être convertie en
système de connaissances informatiques. - Importance des systèmes de règles/experts. En
dépit des difficultés de création de systèmes
experts, les systèmes à règles et les systèmes
experts représentent les seuls moyens réalistes
de formalisation d'un ensemble de connaissances.
13- La connaissance à codifier dans un système expert
- Créer un système de raisonnement automatique
n'est pas facile. - Chaque domaine du savoir humain est caractérisé
par un ensemble de connaissances amples et
détaillées. - Ces connaissances évoluent dans le temps
Régulièrement, il y a ajout et remplacement de
connaissances. - Ces connaissances sont structurées. Il existe
une série de relations loisibles entre les
différents segments dun domaine de
connaissances, résumées par des hypothèses et
théories. Régulièrement, ces hypothèses et
théories subissent des modifications, ajouts ou
un remplacements.
14- Pour qu'un système de règles soit profitable (du
moins autant ou même plus qu'un expert humain),
il doit être suffisamment complexe pour avoir une
puissance de prédiction intéressante (dépassant
typiquement les pouvoirs d'inférence de "M
Tout-le-monde") et suffisamment à jour pour
pouvoir s'appliquer à des situations d'intérêt
actuel.
15Composants d'un système expert
Formellement, un système expert consiste dans les
modules suivants Les bases de
connaissances l'information à long terme, les
"faits reconnus" ou "faits permanents" d'un
domaine. Un ensemble (ou "une base") de
faits à considérer l'information à court terme,
les faits sous considération immédiate, les
"faits à examiner". Un "moteur
d'inférences" ou un interpréteur un ensemble de
règles "si - alors" permettant des inférences sur
les faits stockés dans les bases de connaissance
et de faits à examiner.
16Développement d'un système expert
Raisons favorisant le développement d'un
système expert Existence d'un grand
nombre d'observations systématiques
Existence d'une procédure d'analyse et de prise
de décisions acceptée Importance des
paramètres qualitatifs, non seulement
quantitatifs solution algorithmique
impossible Solutions souhaitées non
évidentes du premier coup, ou difficiles à
obtenir autrement Intérêt économique du
projet (disponibilité d'une information
intelligente 24/24h, complexité excessive, etc.)
17 Participants au développement
Un ou plusieurs experts du domaine,
capable et intéressé à formaliser les procédures
d'analyse et de prise de décisions. Un
ou plusieurs "ingénieurs de la connaissance",
capable(s) et intéressé(s) à formaliser les
connaissances sous forme d'un système expert.
18 Phases de développement 1.
Spécification du cahier des charges2.
Choix d'une architecture du système, de son
interface utilisateur, et d'un langage de
traitement. Prévision des mécanismes de
modification ultérieure du système3.
Sélection d'un sous-ensemble représentatif du
problème pour l'élaboration d'un
démonstrateur4. Acquisition des
informations et élaboration du mécanisme
d'ajout et de modification de
la base de connaissances5. Implantation du
"moteur d'inférences" (règles d'inférence)6.
Test, ajustement et documentation du système
19L'utilisation d'un système expert
Coût Des milliers de systèmes
experts sont actuellement en utilisation. La
constitution d'un système expert représente un
investissement important. Il est donc
important de souligner les atouts tout comme
les limites de tels systèmes.
Atouts L'expérience montre que ce type de
système est utile dans un contexte
d'informations stables et bien définies,
p.ex. Vérification de lois et de
règlements Vérification de la
compatibilité entre différents équipements, Dia
gnostic etc.
20 Limites Par contre, ce type de
système est mal adapté à l'évaluation de
conditions mal circonscrites, comme l'entrée
sonore de la parole humaine, la surveillance
d'une chaîne de production, l'interprétation de
n'importe quel "pattern" ou schéma visuel,
acoustique, etc., comme les sondages
météorologiques, une séquence vidéo, etc. Pour
ces dernières applications, on applique de
préférence les "réseaux neuronaux" et les
"algorithmes génétiques" avec beaucoup plus de
succès que les systèmes experts
Systèmes hybrides Un grand nombre d'applications
courantes invitent l'utilisation de concepts de
type 'système expert' pour les aspects stables et
de concepts de type "réseaux neuronaux" ou
"algorithmes génétiques" pour l'acquisition et
l'interprétation initiale des informations.
21Exemple
22 1. Base de connaissances. Supposons une
base de connaissances contenant les faits
schématisés dans le tableau ci-dessous ("garçon",
"Daniel", "singe"). 2. Faits à examiner
Est-ce que la proposition "Daniel ressemble à un
singe" est vraie ou fausse? 3. Moteur
dinférences La partie "moteur d'inférences" du
système expert contient, parmi dautres, deux
règles RESSEMBLANCE. Si la phrase
contient "ressembler à", alors appliquer la règle
ANALOGIE. ANALOGIE. S'il existe au
moins deux relations de partage, dégalité ou de
descendance entre au moins un trait examiné et un
trait permanent, la relation danalogie est
VRAIE. Dans le cas contraire, la relation est
FAUSSE.
23Les règles de partage-égalité-descendance
suivantes s'appliquent Daniel a 7
ans, un singe a gt 0 ans relation de
descendance, car gt 0 inclut 7. Daniel
et les singes adorent les bananes relation de
partage Daniel grimpe souvent sur les
arbres et les singes grimpent habituellement sur
les arbres relation de partage, car
"habituellement" est sémantiquement proche de
"souvent". Il existe au moins trois analogies.
La proposition est donc jugée VRAIE.
24Résumé
1. Concepts traités. Les systèmes experts
sont en mesure de traiter rapidement,
systématiquement et de manière intuitivement
plausible des concepts provenant dun très grand
nombre de domaines, y-compris des domaines des
sciences humaines. Un système expert peut
appliquer des règles dans nimporte quel ordre de
saillance souhaité par le programmeur.
252. Prédominance des connaissances.
Lexpérience des 20 dernières années a souligné
limportance cardinale du stockage structuré des
connaissances. Selon deux des premiers inventeurs
des systèmes experts, le stockage et la
manipulation damples connaissances joue un rôle
plus important dans la réussite dun système
expert que la conception des règles de traitement
(Feigenbaum Buchanan, 1993).
263. Application. Les systèmes experts peuvent
facilement et rapidement résoudre des problèmes
de type "contraintes stables, multiples et
complexes". Par conséquent, ces systèmes sont
fort utiles pour le traitement dinformations
stables et peu variables, comme lapplication
dun réglement, la planification de travaux
étendus, la réservation de billets, la découverte
de compositions chimiques, la configuration de
systèmes informatiques, etc.
27Les réseaux de neurones
28Introduction aux réseaux de neurones
Réseaux de neurones formels Les réseaux de
neurones formels sont à l'origine une tentative
de modélisation mathématique du cerveau humain.
Les premiers travaux datent de 1943 et sont
l'oeuvre de MM. Mac Culloch et Pitts. Ils
présentent un modèle assez simple pour les
neurones et explorent les possibilités de ce
modèle. L'idée principale des réseaux de
neurones "modernes" est la suivante On se
donne une unité simple, un neurone, qui est
capable de réaliser quelques calculs
élémentaires. On relie ensuite entre elles un
nombre important de ces unités et on essaye de
déterminer la puissance de calcul du réseau ainsi
obtenu. Il est important de noter que ces
neurones manipulent des données numériques et non
pas symboliques.
29Deux visions s'affrontent donc, d'un côté les
tenant de la modélisation biologique qui veulent
respecter un certain nombre de contraintes liées
à la nature du cerveau, de l'autre les tenants de
la puissance de calcul qui s'intéressent au
modèle en lui-même, sans aucun lien avec la
réalité biologique. Dans la suite je présente le
point de vue biologique afin d'aboutir au modèle
des perceptrons multicouches, le type de réseaux
de neurones le plus utilisé actuellement.
30Un modèle biologique
Cette section décrit un modèle très grossier des
neurones biologiques qui a servi à la mise en
place des premiers neurones formels. Dans le
cerveau, les neurones sont reliés entre eux par
l'intermédiaires d'axones et de dendrites. En
première approche. on peut considérer que ces
sortes de filaments sont conducteurs
d'électricité et peuvent ainsi véhiculer des
messages depuis un neurone vers un autre. Les
dendrites représentent les entrées du neurone et
son axone sa sortie.
31Un neurone émet un signal en fonction des signaux
qui lui proviennent des autres neurones. On
observe en fait au niveau d'un neurone, une
intégration des signaux reçus au cours du temps,
c'est à dire une sorte de sommations des signaux.
En général, quand la somme dépasse un certain
seuil, le neurone émet à son tour un signal
électrique.
32Un neurone formel
Le modèle Le modèle de neurone formel présenté
ici, du à Mac Culloch et Pitts, est un modèle
mathématique très simple dérivé d'une analyse de
la réalité biologique. On constate tout d'abord
que le modèle biologique fait intervenir une
notion temporelle qui est difficile à intégrer
dans un modèle simple. On oublie donc cette
notion et de ce fait on remplace l'intégration
temporelle par une simple sommation des signaux
arrivant au neurone (ces signaux sont communément
appelés les entrées du neurones).
33On compare ensuite la somme obtenue à un seuil et
on déduit de la comparaison la sortie du neurone.
Cette sortie sera par exemple égale à 1 si la
somme est supérieure au seuil et à 0 dans le cas
contraire. Plus formellement encore, il suffit
pour obtenir ce comportement de soustraire le
seuil considéré à la somme des entrées, et de
faire passer le résultat par la fonction de
transfert du neurone qui est ici la fonction de
heaviside. Le résultat après transfert est alors
la sortie du neurone. Cette enchaînement
"sommation" puis "non-linéarité" représente
finalement les propriétés "physiques" du neurone.
34En résumé, un neurone formel réalise simplement
une somme pondérée de ces entrées, ajoute un
seuil à cette somme et fait passer le résultat
par une fonction de transfert pour obtenir sa
sortie.
35Réseau de neurones
L'idée principale est de grouper des neurones
dans une couche. On place ensuite bout à bout
plusieurs couches et on connecte complètement les
neurones de deux couches adjacentes. Les entrées
des neurones de la deuxième couche sont donc en
fait les sorties des neurones de la première
couche. Les neurones de la première couche sont
reliés au monde extérieur et reçoivent tous le
même vecteur d'entrée (c'est en fait l'entrée du
réseau). Ils calculent alors leur sorties qui
sont transmises aux neurones de la deuxième
couche, etc. Les sorties des neurones de la
dernière couche forment la sortie du réseau.
36Neurones en reseau
37Comment ca marche en pratique
- Phase dapprentissage
- Rétropopagation du gradient
- Validation
38Phase dapprentissage
- On donne des exemples au reseau
- Par un algorithme dapprentissage le réseau
ajuste ses poids pour minimiser une erreur - Quand lerreur cible est atteinte le réseau est
prêt
39Rétropopagation du gradient
- Consiste a regarder la difference entre la valeur
cible attendue par le réseau et la valeur donnée
par le réseau lors de la phase dapprentissage - Le réseau modifie ses propres poids en fonction
du gradient de cette différence
40(No Transcript)
41Phase de test
Consiste à regarder si le comportement du réseau
est satisfaisant sur un ensemble dexemples !! On
quantifie alors la zone de confiance du réseau de
neurone
42Avantages des réseaux de neurones
- Capacité de représenter n'importe quelle
dépendance fonctionnelle. Le réseau découvre
(apprend, modélise) la dépendance lui-même sans
avoir besoin qu'on lui "souffle" quoi que ce
soit. Pas besoin de postuler un modèle, de
l'amender, etc. - On passe directement des données au prédicteur,
sans intermédiaire, sans recodage, sans
discrétisation, sans simplification ou
interprétation sujette à caution. - Résistance au bruit ou au manque de fiabilité des
données.
43- Grande variété possible dans la variable
prédite oui/non, valeur continue, une ou
plusieurs classes parmi n, etc. - Simple à manier, beaucoup moins de travail
personnel à fournir que dans l'analyse
statistique classique. Aucune compétence en
maths, informatique ou statistiques requise. Pas
besoin de détecter les colinéarités, non plus. - En segmentation, le réseau de neurones détermine
de lui-même combien de clusters distincts
renferme chaque classe.
44- Comportement moins mauvais en cas de faible
quantité de données. - Pour l'utilisateur novice, l'idée d'apprentissage
est plus simple à comprendre que les complexités
des statistiques multivariables. - Consultation rapide (10 microsecondes câblé - 50
millisecondes sur IBM-PC).
45Inconvénients des réseaux de neurones
Le problème de la "boîte noire" la validation
du modèle neuronal La validation se fait par test
sur un certain nombre de dossiers passés, dont on
connaît l'issue, que l'on a écartés de
l'échantillon d'apprentissage et réservés à cet
effet. On compare la prédiction de risque faite
par le réseau de neurones sur ces dossiers dits
"de test" avec la réalité survenue. La
performance se mesure en pourcentage de
reclassements exacts, ou bien en pourcentage de
déviation des valeurs attendues.Cette méthode de
validation est parfaitement objective, courante
en analyse de données et peut être appliquée à
toute technique ou même pour évaluer une personne
experte.
46exemple
47Reconnaissance de visages
A b c d
a) Images originales apprises à gauche. b) Clefs
soumises en entrée au réseau. c) Images
restituées par le réseau lorsque 160 images ont
été stockées. d) Images restituées par le réseau
lorsque 500 images ont été stockées.
48résumé
49Exemple
Le système NRT
50(No Transcript)
51Limplant cochleaire
52(No Transcript)
53(No Transcript)
54(No Transcript)
55Le système NRT
Cest un système qui permet denregistrer la
réponse du nerf auditif à la suite dune
stimulation électrique.
56(No Transcript)
57(No Transcript)
58(No Transcript)
59Quel est linterêt de ce système ?
Potentiels evoqués
60(No Transcript)