Title: PLANS D
1PLANS DEXPERIENCES NUMERIQUES, APPRENTISSAGE ET
GEOSTATISTIQUE
Laurent CARRARO mars 06
2Plan
- Introduction
- Formalisation
- Le phénomène réel
- Le simulateur
- Les problèmes à résoudre
- Métamodèles et géostatistique
- Modèles pour lapprentissage
- Caractéristiques des expériences numériques
- Rappels de géostatistique
- Computer experiments et géostatistique
- Conclusions
3Plan
- Introduction
- Formalisation
- Le phénomène réel
- Le simulateur
- Les problèmes à résoudre
- Métamodèles et géostatistique
- Modèles pour lapprentissage
- Caractéristiques des expériences numériques
- Rappels de géostatistique
- Computer experiments et géostatistique
- Conclusions
4Exemple exploration pétrolière
- Objectifs
- découvrir, évaluer et produire des réservoirs
pétroliers. - objets complexes, difficilement accessibles, mal
connus. - nécessité dinvestir des sommes colossales.
- Risques financiers énormes
nécessité de développer une méthode de gestion
des incertitudes subsurface.
5Problèmes à résoudre
- Trois types de problèmes
- Propagation des incertitudes
- Calage/qualification de codes
- Optimisation
- Enjeux et objectifs
- Analyses de risques pour prise de décision
- Maximiser la rentabilité
6Exploration pétrolière
caractéristiques du réservoir
scénario(s) de production
SIMULATEUR
évaluation de la production y1(t), y2(t),, yn(t)
7Problèmes direct et inverse
- En phase dappréciation / développement
- Quel impact les incertitudes sur les
caractéristiques du réservoir peuvent avoir sur
lévaluation de la production et des réserves? - Direct propagation des incertitudes
- En phase de production
- Comment la connaissance de la production passée,
avec ses erreurs de mesures, peut aider à mieux
connaître les caractéristiques du réservoir et à
affiner les prédictions de production? - Inverse calage
8Plan
- Introduction
- Formalisation
- Le phénomène réel
- Le simulateur
- Les problèmes à résoudre
- Métamodèles et géostatistique
- Modèles pour lapprentissage
- Caractéristiques des expériences numériques
- Rappels de géostatistique
- Computer experiments et géostatistique
- Conclusions
9Le phénomène réel
- Il est caractérisé par
- des variables dintérêt yréel
- exemple production de pétrole cumulée à venir
- des variables denvironnement venv
- variables subies et mal connues, de grande
dimension - exemple caractéristiques du sous-sol
- des variables de contrôle ucont
- variables pouvant être fixées par lutilisateur
pour atteindre divers objectifs
10Le phénomène réel
11Plan
- Introduction
- Formalisation
- Le phénomène réel
- Le simulateur
- Les problèmes à résoudre
- Métamodèles et géostatistique
- Modèles pour lapprentissage
- Caractéristiques des expériences numériques
- Rappels de géostatistique
- Computer experiments et géostatistique
- Conclusions
12Le simulateur
- La fonction fréel est approchée par un
simulateur. - Une nouvelle classe de variables, les variables
de simulation, apparaît pour - paramétrer le simulateur et/ou
- lajuster ( tuning parameters )
- Ainsi
- ysim est la réponse estimée par le simulateur
- uenv est une approximation des variables
denvironnement de venv - ucont représente les variables de contrôle
- usim est le vecteur des variables de simulation
13Le simulateur
14Plan
- Introduction
- Formalisation
- Le phénomène réel
- Le simulateur
- Les problèmes à résoudre
- Métamodèles et géostatistique
- Modèles pour lapprentissage
- Caractéristiques des expériences numériques
- Rappels de géostatistique
- Computer experiments et géostatistique
- Conclusions
15Les problèmes à résoudre
- Propagation dincertitudes
- Comment propager les incertitudes affectant la
variable uenv sur la réponse ysim ? - Problèmes inverses
- Calage de paramètres / dhistorique
- Les variables de contrôle sont fixées et le
phénomène réel est observé. Comment ajuster les
paramètres denvironnement et/ou de simulation
pour reproduire les observations ? - Optimisation des variables de contrôle
- Les variables de modélisation et denvironnement
sont fixées et un ou plusieurs critères à
maximiser introduits. Quel niveau des variables
de contrôle ucont maximise les critères ?
16Difficultés à surmonter
- Dimension des variables du problème
- Il faut réduire la taille des variables en
présence - Analyses de sensibilités (globales)
- Temps de calcul de fsim
- Renault simulation dun cycle dexplosion dans
un cylindre. Quelques heures de calcul pour
simuler une fraction de secondes. - ONERA une simulation de soufflerie à Mach 3 dure
plusieurs semaines.
17Démarche adoptée
- Approximation du simulateur
- On remplace le simulateur fsim par une fonction
plus simple, notée fapp. Cest la surface de
réponse. - La réponse yapp donnée par la fonction fapp est
liée aux variables denvironnement xenv, de
contrôle ucont et dapproximation uapp par -
- Plan dexpériences numériques
- Pour construire la fonction approchée fapp, le
simulateur est évalué sur un jeu de variables
denvironnement, qui constitue un plan
dexpériences numériques.
18En résumé
19Plan
- Introduction
- Formalisation
- Le phénomène réel
- Le simulateur
- Les problèmes à résoudre
- Métamodèles et géostatistique
- Modèles pour lapprentissage
- Caractéristiques des expériences numériques
- Rappels de géostatistique
- Computer experiments et géostatistique
- Conclusions
20Modèles pour lapprentissage
- Historiquement reconnaissance des formes
- Domaine frontière - data mining
- informatique
- neurosciences
- statistiques
- Apprentissage supervisé
- apprendre une relation, une classification,
- à partir dune base dexemples,
- et dinformations a priori
21Quelques modèles du data mining
- Modèles paramétriques
- Régression linéaire
- Régression non linéaire
- Modèles non paramétriques
- Lissage et splines
- modèles semi-paramétriques (GAM, PPR)
- réseaux de neurones
- machines à support vectoriel (SVM)
- arbres de régression et forêts aléatoires
- bagging et boosting
22Plan
- Introduction
- Formalisation
- Le phénomène réel
- Le simulateur
- Les problèmes à résoudre
- Métamodèles et géostatistique
- Modèles pour lapprentissage
- Caractéristiques des expériences numériques
- Rappels de géostatistique
- Computer experiments et géostatistique
- Conclusions
23Expériences numériques
- Les variables denvironnement sont inconnues,
mais on peut les fixer !! - Les points sur le bord du plan dexpériences sont
de probabilité nulle. - Problème des plans dexpériences factoriels.
- Répétabilité fsim est une fonction !
24Plan
- Introduction
- Formalisation
- Le phénomène réel
- Le simulateur
- Les problèmes à résoudre
- Métamodèles et géostatistique
- Modèles pour lapprentissage
- Caractéristiques des expériences numériques
- Rappels de géostatistique
- Computer experiments et géostatistique
- Conclusions
25Rappels de géostatistique
- Origine statistique minière
- Formalisme
- Variable régionalisée z(x), x de dim 1,2 ou 3
- Hypothèse z(x) est la réalisation dune
fonction aléatoire Z(x) - Observations z(xi) ou z(xi)?i, pour 1?i?n
- Modèles stationnaires, avec dérive
- Z(x) t(x) Y(x)
- t est la tendance
- Y est un processus stationnaire gaussien centré
- cov(Y(x), Y(xh)) ?2 R(h)
26Plan
- Introduction
- Formalisation
- Le phénomène réel
- Le simulateur
- Les problèmes à résoudre
- Métamodèles et géostatistique
- Modèles pour lapprentissage
- Caractéristiques des expériences numériques
- Rappels de géostatistique
- Computer experiments et géostatistique
- Conclusions
27Métamodèles et géostatistique
- On écrit
- fsim(uenv) t(uenv) y(uenv)
- Commentaires
- Lalea sur y est une traduction de la régularité
supposée de la fonction - le krigeage est une méthode dinterpolation
- t est estimée par les techniques de data mining
- R aussi, à partir de la nuée variographique
- estimation du métamodèle et de son incertitude
28Plan
- Introduction
- Formalisation
- Le phénomène réel
- Le simulateur
- Les problèmes à résoudre
- Métamodèles et géostatistique
- Modèles pour lapprentissage
- Caractéristiques des expériences numériques
- Rappels de géostatistique
- Computer experiments et géostatistique
- Conclusions
29Conclusions et perspectives
- Projet DICE (Deep Inside Computer Experiments)
- Géostatistique
- à adapter aux grandes dimensions
- krigeage bayésien
- Théorie des plans dexpériences à reconstruire
dans ce contexte - Suites à faible discrépance
- Propriétés des projections des plans
dexpériences sur des sous-espaces
30Eléments bibliographiques
- Carraro L., Corre B., Helbert C., Roustant O.
(2005), Construction dun critère doptimalité
pour plans dexpériences numériques dans le cadre
de la quantification dincertitudes, Revue de
Statistique Appliquée, LIII (4), p. 87-103. - Cressie N.A.C. (1993), Statistics for spatial
data, Wiley series in probability and
mathematical statistics. - Hastie T., Tibshirani R., Friedman J. (2001), The
elements of statistical learning, Springer. - Jones D.R., Schonlau M., Welch W.J. (1998),
Efficient global optimization of expensive
black-box functions, J. of Global Optimization,
13, p. 455-492. - Oakley J.E., O'Hagan A. (2004), Probabilistic
sensitivity analysis of complex models a
Bayesian approach, J. R. Statist. Soc. B, 66, 3,
p. 751-769. - Sacks J., Welch W.J., Mitchell T.J., Wynn H.P.
(1989), Design and analysis of computer
experiments, Statist. Science, 4, p. 409-435. - Saltelli A., Tarantola S., Campolongo F., Ratto
M. (2004) Sensitivity Analysis in Practice A
Guide to Assessing Scientific Models, Wiley. - Santner T.J., Williams B.J., Notz W.I. (2003),
The design and analysis of computer experiments,
Springer Series in Statistics. - Vapnik V. (1998), Statistical learning theory,
Wiley. - Walter E., Pronzato L. (1994), Identification de
modèles paramétriques à partir de données
expérimentales, Masson.