II) 3.Analyse des résultats du programme
Transcription
II) 3.Analyse des résultats du programme
Mesnildrey Yohann 3HY MSN 2014-2015 Méthodes d'optimisation L'assimilation de données à travers 3 exemples Page 1/16 Mesnildrey Yohann 3HY MSN 2014-2015 Table des matières Introduction..........................................................................................................................................3 I) Meilleure estimation de l'heure.........................................................................................................4 I) 1. Présentation du problème.........................................................................................................4 I) 2. Description du programme.......................................................................................................5 I) 3. Analyse des résultats du programme........................................................................................5 II) Application de l'assimilation de données au problème du ressaut hydraulique...............................7 II) 1. Description du problème.........................................................................................................7 II) 2. Description du programme.....................................................................................................8 II) 3.Analyse des résultats du programme.......................................................................................8 III) Filtrage du café.............................................................................................................................10 III) 1. Présentation du problème....................................................................................................10 III) 2. Description du programme..................................................................................................11 III) 3. Analyse des résultats du programme...................................................................................12 Conclusion..........................................................................................................................................16 Page 2/16 Mesnildrey Yohann 3HY MSN 2014-2015 Introduction L'assimilation de données met en jeu simultanément la modélisation physique, l’analyse de l'incertitude et de l'algorithmique mathématique. Compte tenu des erreurs des mesures, et considérant l’inexactitude éventuelle de la modélisation, l'assimilation de données mélange ces différentes sources d'information à la pondération appropriée. Cette science intervient dans les domaine géophysique, hydraulique, financier et météorologique et permet de déterminer la meilleure estimation d'une grandeur physique en se basant sur des données expérimentales, généralement entachées d’erreurs de mesure, et un modèle mathématique censé décrire ces données. Soit x un vecteur de l'espace de contrôle, c'est-a-dire l'espace regroupant toutes les valeurs que peut prendre la variable que l'on souhaite estimer ; xb l'ébauche, c'est-a-dire une idée de la valeur de la variable à estimer (prédictions de la veille dans le cas de la meteo) ; yo le vecteur regroupant toutes les observations faites. Soit y le vecteur des observations artificielles, c'est-a-dire celles extraites a partir de x via l'opérateur d'observations G. La fonction coût J est la suivante : Où B est la matrice de corrélation des erreurs de l'ébauche et R est la matrice de corrélation des erreurs de l'observation. A travers 3 exemples, on essaiera de voir si le minimum de cette fonction est une bonne estimation de la vraie valeur du paramètre de contrôle du problème. Page 3/16 Mesnildrey Yohann 3HY MSN 2014-2015 I) Meilleure estimation de l'heure I) 1. Présentation du problème Dans cette simulation, on dispose de deux montres affichant chacune, avec une certaine précision, l'heure. Connaissant l'heure réelle (ici 30) nous souhaitons savoir laquelle de ces deux situations est préférable : n'utiliser qu'une seule montre – la plus précise, ou utiliser deux montres, la précédente et une autre moins précise Cela dans le but d'obtenir une meilleure estimation de l'heure réelle. On considère le temps comme une variable aléatoire de loi de probabilité gaussienne ou chaque mesure du temps correspond a une réalisation. Sa valeur moyenne est prise comme l'heure vraie, c'est-a -dire qu'elle n'est pas biaisée. Sa variance est l'erreur commise sur la mesure de l'heure. La fonction coût a minimiser est la suivante : avec les certitudes définies par : Notre « temps pondéré d'analyse » afin de comparer les deux situations précédemment décrites est : Avec la certitude Page 4/16 Mesnildrey Yohann 3HY MSN 2014-2015 I) 2. Description du programme Dans un premier temps, l'utilisateur choisit s'il souhaite utiliser la saisie clavier ou non. En mode interactif, l'utilisateur peut saisir les valeurs d’écart type. Sinon, les valeurs par défaut sont utilisées : écart type de 5 pour l'heure 1 et de 7 pour l'heure 2. L'heure vraie saisie par défaut est Tt=30. Il faut ensuite saisir le nombre de tirages de l’expérience. Ensuite : - Calcul les certitudes C1, C2, Ca et l'écart type. - Calcul de l’analyse Ta a l’aide des certitudes de T1 et T2. · Calcul du cumul des erreurs pour le calcul du score moyen final. · Affichage des paramètres du problème et des paramètres calcules (tirages, écarts-types, score). · Traces sur la même figure (pour un tirage donne) des lois de probabilités (gaussiennes) de T1, T2 et Ta ainsi que leurs écarts-types respectifs. I) 3. Analyse des résultats du programme Assimilation de donnees : Quelle heure est-il ? Heure vraie Tt=30.0 Erreur de la montre 1 : sig1=5.0 Erreur de la montre 2 : sig2=7.0 T1=29.9, T2=33.3 Ta=31.0, siga=4.1 T1=34.5, T2=32.9 Ta=33.9, siga=4.1 T1=31.4, T2=36.9 Ta=33.3, siga=4.1 T1=29.7, T2=30.5 Ta=30.0, siga=4.1 T1=32.8, T2=29.7 Ta=31.7, siga=4.1 T1=25.6, T2=23.6 Ta=24.9, siga=4.1 T1=37.9, T2=39.2 Ta=38.3, siga=4.1 T1=36.0, T2=22.7 Ta=31.5, siga=4.1 T1=23.5, T2=46.8 Ta=31.4, siga=4.1 T1=27.1, T2=39.4 Ta=31.3, siga=4.1 score moyen = 3.61 Page 5/16 Mesnildrey Yohann 3HY MSN 2014-2015 On trace alors les densités de probabilité pour T1, T2, Ta. L'analyse apparaît en rouge, T1 en vert, T2 en jaune. Le trait rouge horizontal semble être un « intervalle de confiance », délimitant une zone dans laquelle les valeurs de T1, T2, et Ta (symbolisées sur chaque figure par des traits verticaux de couleur) sont assez proches de la valeur réelle Tt pour être « comptabilisées ». Cet exemple basique d'un cas d'assimilation de données permet de se familiariser avec toutes les notations mais surtout avec le principe même de l'optimisation qui est de minimiser une fonction coût J. De plus, cet exemple introduit de manière simple les notions d'erreurs qui sont tres importantes en assimilation de données. Page 6/16 Mesnildrey Yohann 3HY MSN 2014-2015 II) Application de l'assimilation de données au problème du ressaut hydraulique II) 1. Description du problème Ce phénomène peut être décrit par des principes de conservation de débit. Connaissant la vitesse et la hauteur de l'écoulement en amont du ressaut, et mesurant soit la hauteur du ressaut, soit la vitesse de remontée du ressaut, on peut en déduire respectivement la vitesse du ressaut ou la hauteur du ressaut. La vitesse W du ressaut est reliée aux autres paramètres tel que : Si on suppose que q=hLUL et hL sont exactement connu ainsi que hR est calculé avec une incertitude, on peut définir l'opérateur d'observation comme suit : Page 7/16 Mesnildrey Yohann 3HY MSN 2014-2015 II) 2. Description du programme Le but de la démarche est d'estimer la hauteur d'un ressaut hydraulique après fermeture d'une vanne. Le programme Matlab est construit de manière simple : un script principal muni d'un ensemble de fonctions corrélées entre elles. → Le script principal fait une description générale du problème, puis incrémente la boucle en tirages (munies d'une option de temporisation). → Dans la boucle en tirages, le code appelle la fonction jumelles_ressaut.m qui constitue le solveur du code. En effet, cette fonction initialise les paramètres du problème par le biais de init_ressaut.m, puis appelle la fonction blue.m qui calcule la matrice de gain K, l'analyse x^A, et la matrice de covariance des erreurs d'analyse A. Le programme principal vitressaut.m appelle les sous-programmes suivants : → calcG_ressaut.m : on fixe ici les variations en x et y (qui dépendent de hR en général) → blue.m : c’est une méthode d’estimation non biaisé de l’observation, on calcul le gain K à partir d’une matrice de covariance d’erreur B (ébauche), une matrice de covariance d’erreur R (observation) et G (opérateur d’observation linéarisé) : → Glin_ressaut.m : création de G, on pourra donc le faire varier à partir de cette sub-routine → jumelles_ressaut.m : on réalise des expériences jumelles pour les observations et on calcule également le score (valeur à minimiser pour espérer retrouver l’état vrai) → init_ressaut.m : initialisation des boucles de calculs et choix des paramètres → visual_ressaut.m : permet de tracer les courbes pour visualiser les résultats des différents états II) 3.Analyse des résultats du programme Assimilation de donees pour le probleme du ressaut Etat vrai : hRt= 17, Wt=-0.56 Ebauche : hRb= 18, Wb=-0.52 Erreurs ebauche : sigBhR=1.3 Erreur de mesures : sigRW=0.028 Erreur analyse : sigAhR =0.615 Tirage 1 : Wo=-0.588 => hRa= 16.7, Wa=-0.577 Tirage 2 : Wo=-0.537 => hRa= 17.7, Wa=-0.533 Tirage 3 : Wo=-0.626 => hRa= 16, Wa=-0.616 Tirage 4 : Wo=-0.584 => hRa= 16.8, Wa=-0.574 Tirage 5 : Wo=-0.613 => hRa= 16.2, Wa=-0.602 Tirage 6 : Wo=-0.544 => hRa= 17.5, Wa=-0.539 Tirage 7 : Wo=-0.583 => hRa= 16.8, Wa=-0.572 Tirage 8 : Wo=-0.604 => hRa= 16.4, Wa=-0.593 Page 8/16 Mesnildrey Yohann 3HY MSN 2014-2015 Tirage 9 : Wo=-0.582 => hRa= 16.8, Wa=-0.572 Tirage 10 : Wo=-0.572 => hRa= 17, Wa=-0.563 score =0.545 On remarque que pour chaque tirage ,la vitesse observée change de valeur Wo et par suite l'analyse change. On obtient un score de 0,545 qui est différent de l'erreur de l'analyse 0,615 On obtient aussi les courbes qui illustrent les tracés de la fonction coût ainsi que ses deux composantes Jr et Jb ,de même pour la fonction de coût incrémentale.( voir courbe ci-dessous) où : - hR(t):représente la hauteur vraie hR - hR(a):représente la valeur de l'analyse - hR(b):représente l'ébauche On voit bien que le minimum de la fonction coût appelée hR(a) est une bonne estimation de la hauteur réelle aval. Page 9/16 Mesnildrey Yohann 3HY MSN 2014-2015 III) Filtrage du café III) 1. Présentation du problème On souhaite dans cet exemple estimer les paramètres d'un réservoir .L'eau de pluie de débit surfacique P(t) est assimile a l'eau de robinet P , le sol a travers lequel s'infiltre de débit surfacique α.H(t) ou H(t) est la hauteur dans le réservoir ou du filtre , est assimile au marc de café comme le montre les deux schémas suivants : Équations du problème : On a le système suivant : avec H(t) la hauteur d'eau, P(t) le flux entrant et Q(t)=α.H(t) le flux sortant. La fonction modele est donc : Et la fonction coût s'écrit : Page 10/16 Mesnildrey Yohann 3HY MSN 2014-2015 III) 2. Description du programme Dans ce troisième exemple, nous étudions un problème a deux dimensions. En effet, tous les vecteurs x comprennent deux variables de débit : alpha le débit a travers le filtre et P le débit injecte par le robinet. On va, grâce a un programme similaire a celui de l'exemple précédent, tenter de déterminer les paramètres P et α a partir d'une ébauche Pb, αb et des mesures artificielles de H (créées a partir d'un état vrai connu). En rentrant ensuite les matrices des covariances d'erreurs ou encore l’opérateur d'observation G, le programme va utiliser une méthode de calcul (méthode BLUE) pour calculer une analyse Pa et αa pour ensuite déduire la fonction Ha(t) grâce a l’opérateur d'observation. Page 11/16 Mesnildrey Yohann 3HY MSN 2014-2015 III) 3. Analyse des résultats du programme Un jeu de données donne la simulation suivante : Assimilation de donees pour le probleme du filtre a cafe Etat vrai : alphat= 1, Pt= 1 Ebauche : alphab= 1, Pb= 1 Nombre observations : nobs= 3 Temps max observations : tmaxobs=2.5 Erreurs ebauche : sigBalpha=0.24, sigBP=0.24, rho= 0 Erreur de mesures : sigR=0.1 Erreur analyse :Ecart-type_alpha=0.189Ecart-type_P=0.133Correlation =0.837 Analyse 1 : alphaa= 1.09, Pa= 1.05 Analyse 2 : alphaa= 1.07, Pa=0.969 Analyse 3 : alphaa= 1.05, Pa=0.968 Analyse 4 : alphaa=0.969, Pa= 0.97 Analyse 5 : alphaa=0.641, Pa=0.807 Analyse 6 : alphaa=0.751, Pa=0.857 Analyse 7 : alphaa= 1.21, Pa= 1.2 Analyse 8 : alphaa=0.997, Pa= 1.02 Analyse 9 : alphaa=0.833, Pa= 1.02 Analyse 10 : alphaa= 1.06, Pa= 1.13 score =0.142 Nous allons regarder l'influence des différents paramètres comme Pb, alphab, B(σab,σpb), ainsi que le nombre d'observation nobs sur le score. Page 12/16 Mesnildrey Yohann 3HY MSN 2014-2015 Page 13/16 Mesnildrey Yohann 3HY MSN 2014-2015 Page 14/16 Mesnildrey Yohann 3HY MSN 2014-2015 On voit que la plupart des courbes (celles pour les paramètres Pb, αb, B(σab,σpb) et R) passent par un minimum dans les domaines que nous avons étudie, ce qui veut dire qu'il existe a chaque fois une valeur permettant d'optimiser notre résultat (d'avoir un score le plus petit possible). Et enfin, on a aussi pu remarquer que plus le nombre d'observation est important, plus le score sera faible. Ce dernier point semble évident, en effet plus on aura d'observation pour trouver notre analyse plus nos calculs seront fiables. Page 15/16 Mesnildrey Yohann 3HY MSN 2014-2015 Conclusion Pour conclure, on peut voir que l'assimilation des données permet de donner une meilleure estimation d'une grandeur physique avec une certitude plus grande que les mesures expérimentales et la modélisation mathématique Pour cela, une fonction coût qui est une pondération par les certitudes de l'ébauche et de la mesure est minimisée par la méthode BLUE. Cette dernière consiste a introduire une matrice de gain K et le vecteur innovation d, ce qui permet d'écrire l'analyse simplement comme la somme de l'ébauche et du produit de cette matrice par l'innovation. Dans le cas non linéaire, l'opérateur d'observation est au préalable linéarise autour de l'ébauche mais la méthode reste identique. D'autres méthodes plus complexes existent mais n'ont pas étés abordées ici. C'est le cas de la méthode 4D-VAR. Page 16/16