II) 3.Analyse des résultats du programme

Transcription

II) 3.Analyse des résultats du programme
Mesnildrey Yohann
3HY MSN 2014-2015
Méthodes d'optimisation
L'assimilation de données à travers 3 exemples
Page 1/16
Mesnildrey Yohann
3HY MSN 2014-2015
Table des matières
Introduction..........................................................................................................................................3
I) Meilleure estimation de l'heure.........................................................................................................4
I) 1. Présentation du problème.........................................................................................................4
I) 2. Description du programme.......................................................................................................5
I) 3. Analyse des résultats du programme........................................................................................5
II) Application de l'assimilation de données au problème du ressaut hydraulique...............................7
II) 1. Description du problème.........................................................................................................7
II) 2. Description du programme.....................................................................................................8
II) 3.Analyse des résultats du programme.......................................................................................8
III) Filtrage du café.............................................................................................................................10
III) 1. Présentation du problème....................................................................................................10
III) 2. Description du programme..................................................................................................11
III) 3. Analyse des résultats du programme...................................................................................12
Conclusion..........................................................................................................................................16
Page 2/16
Mesnildrey Yohann
3HY MSN 2014-2015
Introduction
L'assimilation de données met en jeu simultanément la modélisation physique, l’analyse de
l'incertitude et de l'algorithmique mathématique. Compte tenu des erreurs des mesures, et
considérant l’inexactitude éventuelle de la modélisation, l'assimilation de données mélange ces
différentes sources d'information à la pondération appropriée. Cette science intervient dans les
domaine géophysique, hydraulique, financier et météorologique et permet de déterminer la
meilleure estimation d'une grandeur physique en se basant sur des données expérimentales,
généralement entachées d’erreurs de mesure, et un modèle mathématique censé décrire ces données.
Soit x un vecteur de l'espace de contrôle, c'est-a-dire l'espace regroupant toutes les valeurs
que peut prendre la variable que l'on souhaite estimer ; xb l'ébauche, c'est-a-dire une idée de la
valeur de la variable à estimer (prédictions de la veille dans le cas de la meteo) ; yo le vecteur
regroupant toutes les observations faites. Soit y le vecteur des observations artificielles, c'est-a-dire
celles extraites a partir de x via l'opérateur d'observations G.
La fonction coût J est la suivante :
Où B est la matrice de corrélation des erreurs de l'ébauche et R est la matrice de corrélation des
erreurs de l'observation.
A travers 3 exemples, on essaiera de voir si le minimum de cette fonction est une bonne
estimation de la vraie valeur du paramètre de contrôle du problème.
Page 3/16
Mesnildrey Yohann
3HY MSN 2014-2015
I) Meilleure estimation de l'heure
I) 1. Présentation du problème
Dans cette simulation, on dispose de deux montres affichant chacune, avec une certaine précision,
l'heure. Connaissant l'heure réelle (ici 30) nous souhaitons savoir laquelle de ces deux situations est
préférable : n'utiliser qu'une seule montre – la plus précise, ou utiliser deux montres, la précédente
et une autre moins précise
Cela dans le but d'obtenir une meilleure estimation de l'heure réelle.
On considère le temps comme une variable aléatoire de loi de probabilité gaussienne ou chaque
mesure
du temps correspond a une réalisation. Sa valeur moyenne est prise comme l'heure vraie, c'est-a
-dire qu'elle n'est pas biaisée. Sa variance est l'erreur commise sur la mesure de l'heure.
La fonction coût a minimiser est la suivante :
avec les certitudes définies par :
Notre « temps pondéré d'analyse » afin de comparer les deux situations précédemment décrites est :
Avec la certitude
Page 4/16
Mesnildrey Yohann
3HY MSN 2014-2015
I) 2. Description du programme
Dans un premier temps, l'utilisateur choisit s'il souhaite utiliser la saisie clavier ou non. En mode
interactif, l'utilisateur peut saisir les valeurs d’écart type. Sinon, les valeurs par défaut sont
utilisées : écart type de 5 pour l'heure 1 et de 7 pour l'heure 2.
L'heure vraie saisie par défaut est Tt=30.
Il faut ensuite saisir le nombre de tirages de l’expérience.
Ensuite :
- Calcul les certitudes C1, C2, Ca et l'écart type.
- Calcul de l’analyse Ta a l’aide des certitudes de T1 et T2.
· Calcul du cumul des erreurs pour le calcul du score moyen final.
· Affichage des paramètres du problème et des paramètres calcules (tirages, écarts-types, score).
· Traces sur la même figure (pour un tirage donne) des lois de probabilités (gaussiennes) de T1,
T2 et Ta ainsi que leurs écarts-types respectifs.
I) 3. Analyse des résultats du programme
Assimilation de donnees : Quelle heure est-il ?
Heure vraie Tt=30.0
Erreur de la montre 1 : sig1=5.0
Erreur de la montre 2 : sig2=7.0
T1=29.9, T2=33.3
Ta=31.0, siga=4.1
T1=34.5, T2=32.9
Ta=33.9, siga=4.1
T1=31.4, T2=36.9
Ta=33.3, siga=4.1
T1=29.7, T2=30.5
Ta=30.0, siga=4.1
T1=32.8, T2=29.7
Ta=31.7, siga=4.1
T1=25.6, T2=23.6
Ta=24.9, siga=4.1
T1=37.9, T2=39.2
Ta=38.3, siga=4.1
T1=36.0, T2=22.7
Ta=31.5, siga=4.1
T1=23.5, T2=46.8
Ta=31.4, siga=4.1
T1=27.1, T2=39.4
Ta=31.3, siga=4.1
score moyen = 3.61
Page 5/16
Mesnildrey Yohann
3HY MSN 2014-2015
On trace alors les densités de probabilité pour T1, T2, Ta.
L'analyse apparaît en rouge, T1 en vert, T2 en jaune.
Le trait rouge horizontal semble être un « intervalle de confiance », délimitant une zone dans
laquelle les valeurs de T1, T2, et Ta (symbolisées sur chaque figure par des traits verticaux de
couleur) sont assez proches de la valeur réelle Tt pour être « comptabilisées ».
Cet exemple basique d'un cas d'assimilation de données permet de se familiariser avec toutes les
notations mais surtout avec le principe même de l'optimisation qui est de minimiser une fonction
coût J. De plus, cet exemple introduit de manière simple les notions d'erreurs qui sont tres
importantes en assimilation de données.
Page 6/16
Mesnildrey Yohann
3HY MSN 2014-2015
II) Application de l'assimilation de données au
problème du ressaut hydraulique
II) 1. Description du problème
Ce phénomène peut être décrit par des principes de conservation de débit. Connaissant la vitesse et
la hauteur de l'écoulement en amont du ressaut, et mesurant soit la hauteur du ressaut, soit la vitesse
de remontée du ressaut, on peut en déduire respectivement la vitesse du ressaut ou la hauteur du
ressaut.
La vitesse W du ressaut est reliée aux autres paramètres tel que :
Si on suppose que q=hLUL et hL sont exactement connu ainsi que hR est calculé avec une
incertitude, on peut définir l'opérateur d'observation comme suit :
Page 7/16
Mesnildrey Yohann
3HY MSN 2014-2015
II) 2. Description du programme
Le but de la démarche est d'estimer la hauteur d'un ressaut hydraulique après fermeture d'une vanne.
Le programme Matlab est construit de manière simple : un script principal muni d'un ensemble de
fonctions corrélées entre elles.
→ Le script principal fait une description générale du problème, puis incrémente la boucle en
tirages (munies d'une option de temporisation).
→ Dans la boucle en tirages, le code appelle la fonction jumelles_ressaut.m qui constitue le
solveur du code. En effet, cette fonction initialise les paramètres du problème par le biais de
init_ressaut.m, puis appelle la fonction blue.m qui calcule la matrice de gain K, l'analyse
x^A, et la matrice de covariance des erreurs d'analyse A.
Le programme principal vitressaut.m appelle les sous-programmes suivants :
→ calcG_ressaut.m : on fixe ici les variations en x et y (qui dépendent de hR en général)
→ blue.m : c’est une méthode d’estimation non biaisé de l’observation, on calcul le gain K à partir
d’une matrice de covariance d’erreur B (ébauche), une matrice de covariance d’erreur R
(observation) et G (opérateur d’observation linéarisé) :
→ Glin_ressaut.m : création de G, on pourra donc le faire varier à partir de cette sub-routine
→ jumelles_ressaut.m : on réalise des expériences jumelles pour les observations et on calcule
également le score (valeur à minimiser pour espérer retrouver l’état vrai)
→ init_ressaut.m : initialisation des boucles de calculs et choix des paramètres
→ visual_ressaut.m : permet de tracer les courbes pour visualiser les résultats des différents états
II) 3.Analyse des résultats du programme
Assimilation de donees pour le probleme du ressaut
Etat vrai : hRt= 17, Wt=-0.56
Ebauche : hRb= 18, Wb=-0.52
Erreurs ebauche : sigBhR=1.3
Erreur de mesures : sigRW=0.028
Erreur analyse : sigAhR =0.615
Tirage 1 : Wo=-0.588 => hRa= 16.7, Wa=-0.577
Tirage 2 : Wo=-0.537 => hRa= 17.7, Wa=-0.533
Tirage 3 : Wo=-0.626 => hRa= 16, Wa=-0.616
Tirage 4 : Wo=-0.584 => hRa= 16.8, Wa=-0.574
Tirage 5 : Wo=-0.613 => hRa= 16.2, Wa=-0.602
Tirage 6 : Wo=-0.544 => hRa= 17.5, Wa=-0.539
Tirage 7 : Wo=-0.583 => hRa= 16.8, Wa=-0.572
Tirage 8 : Wo=-0.604 => hRa= 16.4, Wa=-0.593
Page 8/16
Mesnildrey Yohann
3HY MSN 2014-2015
Tirage 9 : Wo=-0.582 => hRa= 16.8, Wa=-0.572
Tirage 10 : Wo=-0.572 => hRa= 17, Wa=-0.563
score =0.545
On remarque que pour chaque tirage ,la vitesse observée change de valeur Wo et par suite l'analyse
change. On obtient un score de 0,545 qui est différent de l'erreur de l'analyse 0,615
On obtient aussi les courbes qui illustrent les tracés de la fonction coût ainsi que ses deux
composantes Jr et Jb ,de même pour la fonction de coût incrémentale.( voir courbe ci-dessous)
où :
- hR(t):représente la hauteur vraie hR
- hR(a):représente la valeur de l'analyse
- hR(b):représente l'ébauche
On voit bien que le minimum de la fonction coût appelée hR(a) est une bonne estimation de la
hauteur réelle aval.
Page 9/16
Mesnildrey Yohann
3HY MSN 2014-2015
III) Filtrage du café
III) 1. Présentation du problème
On souhaite dans cet exemple estimer les paramètres d'un réservoir .L'eau de pluie de débit
surfacique P(t) est assimile a l'eau de robinet P , le sol a travers lequel s'infiltre de débit surfacique
α.H(t) ou H(t) est la hauteur dans le réservoir ou du filtre , est assimile au marc de café comme le
montre les deux schémas suivants :
Équations du problème :
On a le système suivant :
avec H(t) la hauteur d'eau, P(t) le flux entrant et Q(t)=α.H(t) le flux sortant.
La fonction modele est donc :
Et la fonction coût s'écrit :
Page 10/16
Mesnildrey Yohann
3HY MSN 2014-2015
III) 2. Description du programme
Dans ce troisième exemple, nous étudions un problème a deux dimensions. En effet, tous les
vecteurs x comprennent deux variables de débit : alpha le débit a travers le filtre et P le débit injecte
par le robinet.
On va, grâce a un programme similaire a celui de l'exemple précédent, tenter
de déterminer les paramètres P et α a partir d'une ébauche Pb, αb et des mesures
artificielles de H (créées a partir d'un état vrai connu). En rentrant ensuite les matrices
des covariances d'erreurs ou encore l’opérateur d'observation G, le programme va
utiliser une méthode de calcul (méthode BLUE) pour calculer une analyse Pa et αa
pour ensuite déduire la fonction Ha(t) grâce a l’opérateur d'observation.
Page 11/16
Mesnildrey Yohann
3HY MSN 2014-2015
III) 3. Analyse des résultats du programme
Un jeu de données donne la simulation suivante :
Assimilation de donees pour le probleme du filtre a cafe
Etat vrai : alphat= 1, Pt= 1
Ebauche : alphab= 1, Pb= 1
Nombre observations : nobs= 3
Temps max observations : tmaxobs=2.5
Erreurs ebauche : sigBalpha=0.24, sigBP=0.24, rho= 0
Erreur de mesures : sigR=0.1
Erreur analyse :Ecart-type_alpha=0.189Ecart-type_P=0.133Correlation =0.837
Analyse 1 : alphaa= 1.09, Pa= 1.05
Analyse 2 : alphaa= 1.07, Pa=0.969
Analyse 3 : alphaa= 1.05, Pa=0.968
Analyse 4 : alphaa=0.969, Pa= 0.97
Analyse 5 : alphaa=0.641, Pa=0.807
Analyse 6 : alphaa=0.751, Pa=0.857
Analyse 7 : alphaa= 1.21, Pa= 1.2
Analyse 8 : alphaa=0.997, Pa= 1.02
Analyse 9 : alphaa=0.833, Pa= 1.02
Analyse 10 : alphaa= 1.06, Pa= 1.13
score =0.142
Nous allons regarder l'influence des différents paramètres comme Pb, alphab, B(σab,σpb), ainsi que
le nombre d'observation nobs sur le score.
Page 12/16
Mesnildrey Yohann
3HY MSN 2014-2015
Page 13/16
Mesnildrey Yohann
3HY MSN 2014-2015
Page 14/16
Mesnildrey Yohann
3HY MSN 2014-2015
On voit que la plupart des courbes (celles pour les paramètres Pb, αb, B(σab,σpb)
et R) passent par un minimum dans les domaines que nous avons étudie, ce qui veut
dire qu'il existe a chaque fois une valeur permettant d'optimiser notre résultat (d'avoir
un score le plus petit possible). Et enfin, on a aussi pu remarquer que plus le
nombre d'observation est important, plus le score sera faible. Ce dernier point semble
évident, en effet plus on aura d'observation pour trouver notre analyse plus nos
calculs seront fiables.
Page 15/16
Mesnildrey Yohann
3HY MSN 2014-2015
Conclusion
Pour conclure, on peut voir que l'assimilation des données permet de donner une meilleure
estimation d'une grandeur physique avec une certitude plus grande que les mesures expérimentales
et la modélisation mathématique
Pour cela, une fonction coût qui est une pondération par les certitudes de l'ébauche et de la mesure
est minimisée par la méthode BLUE. Cette dernière consiste a introduire une matrice de gain K et le
vecteur innovation d, ce qui permet d'écrire l'analyse simplement comme la somme de l'ébauche et
du produit de cette matrice par l'innovation. Dans le cas non linéaire, l'opérateur d'observation est
au préalable linéarise autour de l'ébauche mais la méthode reste identique. D'autres méthodes plus
complexes existent mais n'ont pas étés abordées ici. C'est le cas de la méthode 4D-VAR.
Page 16/16