Optimisation dynamique en temps continu
Transcription
Optimisation dynamique en temps continu
Mathias André École Polytechnique – Crest M1 EPP 2009 Optimisation dynamique en temps continu Fiche sur l’Hamiltonien - Économie de la croissance Cette fiche s’appuie en grande partie sur l’annexe mathématique 3 de Barro, R. Sala-i-Martin, La croissance économique, McGraw Hill, 1995. Cette méthode s’appuie sur le principe du maximum en contrôle optimal de L. Pontryagin généralisant le calcul des variations. 1 Problème type L’agent économique cherche à maximiser une fonction objectif, ses décisions portant sur les variables de contrôle. Les contraintes évoluent au cours du temps (contraintes dynamiques) : les variables d’état permettent de décrire l’économie. Le problème type s’écrit sous la forme : Z ct T v[k(t), c(t), t]dt sous les contraintes : max (1) 0 k̇(t) = g[k(t), c(t), t] k(0) = k0 > 0 fixé k(T )e−r(T )T ≥ 0 r(T ) est un facteur d’escompte. La première contrainte est une équation d’accumulation qui traduit l’influence du choix c(t) (variable de contrôle) sur l’évolution de k(t) (variable d’état). La deuxième fixe la valeur initiale de la variable d’état (point de départ de l’économie) et la troisième tient compte du fait qu’à la fin de la planification (à l’infini ou non) la variable d’état actualisée ne peut pas être négative (par exemple, dette à la disparition de l’agent) ou doit croître à un taux inférieur à r(t). 2 Conditions du premier ordre L’approche adoptée est heuristique (intuitive) et s’inspire du théorème de Kühn-Tucker. Il ne s’agit donc pas d’une démonstration mais d’un parallèle explicatif avec le cas statique. Par analogie, on définit le lagrangien associé à (1) : Z L= T Z v[k(t), c(t), t]dt + 0 T µt {g[k(t), c(t), t] − k̇(t)}dt + νk(T )e−r(T )T (2) 0 µt est le multiplicateur dynamique de Lagrange associé à la contrainte d’accumulation, il correspond donc au prix (ou à la valeur) d’une unité supplémentaire de stock de capital à t en unités d’utilité au temps 0. Dans le cas statique, on dérive le lagrangien en fonction de k(t) et c(t), ce qui ne peut être fait ici à cause du k̇(t) ; l’idée est d’intégrer par parties le terme µt k̇(t) dans (2) qui fait apparaître l’Hamiltonien du problème (ceci vaut donc pour définition) : H(k, c, t, µ) = v[k, c, t] + µt g[k, c, t] tel que Z T L = H(k(t), c(t), t, µt ) + µ̇(t)k(t)dt + µ(0)k0 − µ(T )k(T ) + νk(T )e−r(T )T (3) (4) 0 L’interprétation économique de l’Hamiltonien est la suivante : à un instant t donné l’agent consomme c(t) et possède k(t). Son choix c(t) affecte directement l’utilité par le premier terme mais aussi indirectement avec le second. La décision c(t) contribue à faire évoluer k(t) par la contrainte d’accumulation (cette variation vaut g[k(t), c(t), t]) et ceci au prix implicite µt . Ainsi, l’Hamiltonien traduit la contribution totale à l’utilité du choix c(t). 1 Pour obtenir les conditions du premier ordre « habituelles » concernant les sentiers temporels optimaux de k et c, l’idée est de définir une perturbation ε autour de l’équilibre (C∗, K∗, KT∗ ) telle que : c(t) = C ∗ + εp1 (t) k(t) = K ∗ + εp2 (t) Après avoir écrit le lagrangien en fonction de ε, on annule Après réangement et avec (4) on obtient : ∂L = ∂ε Z T { 0 ∂L ∂ε k(T ) = KT∗ + εdk(T ) pour que les trajectoires soient optimales. ∂H ∂H p1 (t) + ( + µ̇)p2 (t)}dt + (νk(T )e−r(T )T − µ(T ))dk(T ) ∂c ∂k Cette dernière expression devant être valable pour toutes perturbations p1 , p2 et dk, on en déduit les trois relations appelées conditions du premier ordre : ∂H ∂c ∂H ∂k νk(T )e−r(T )T = 0 (5) = −µ̇ (6) = µ(T ) (7) Autrement exprimé : la dérivée de l’Hamiltonien par rapport aux variables de contrôle est nulle et pour les variables d’état, est égale à l’opposé de la variation du multiplicateur de Lagrange associé. Ceci recoupe l’interprétation économique de l’Hamiltonien en terme de variation globale d’utilité. 3 Conditions de transversalité Dans le cas de l’horizon fini, la dernière relation permet d’arriver à l’équation (en utilisant la troisième et dernière contrainte) dite condition de transversalité : µ(T )k(T ) = 0 (8) Pour l’interpréter, on distingue les deux cas suivants : – k(T ) > 0 : la quantité de capital détenu est positive en fin de période, son prix doit être nul µ(T ) = 0 – µ(T ) ≥ 0 : à l’inverse, si sa valeur est positive, l’agent ne peut en détenir. 4 Evolution du Hamiltonien et conditions suffisantes En dérivant la valeur optimale du Hamiltonien par rapport au temps, on obtient : dH ∂H ∂H ∂H ∂H = ċ + k̇ + µ̇ + dt ∂c ∂k ∂µ ∂t ∂H En utilisant les conditions du premier ordre (7), cela devient dH dt = ∂t , qui s’annule donc dans le cas où le Hamiltonien ne dépend pas explicitement du temps (problème autonome). Dans le cas autonome, le Hamiltonien est donc stationnaire à l’optimum. e Brièvement : on définit H(k, µ, t) le maximum en c de H(k, c, µ, t). Le théorème de Arrow-Wurz e assure que si H est concave en k, alors les conditions nécessaires sont aussi suffisantes. 5 Horizons infinis Cette section correspond au cas où T = ∞. Les résultats sont identiques en transformant formellement T en +∞ et en remplaçant les égalités en T par des limites. Par exemple, la condition de transversalité s’écrit : lim µt k(t) = 0 (9) +∞ 2 Les interprétations économiques sont aussi semblables en raisonnant asymptotiquement. Cependant l’équation (9) ne fait pas l’unanimité dans la littérature comme condition nécessaire (elle ne s’applique pas toujours, Halkins(1974) ayant trouvé un contre-exemple). Michel (1982) a montré qu’une condition de transversalité toujours nécessaire est lim+∞ H(t) = 0 qui est une conséquence de (9) (donc moins contraignante). Nous plaçons très majoritairement dans les cas où (9) est nécessaire ; ce qui est vérifié en présence d’un facteur d’escompte dans l’utilité (du type préférence pour le présent). 6 Récapitulatif pour exprimer les conditions du premier ordre En résumé la démarche à adopter est la suivante : 1. écrire le Hamiltonien : H = v(k, c, t) + µt g(k, c, t) 2. annuler la dérivée par rapport à la variable de contrôle : ∂H ∂c =0 3. égaliser l’opposé de la dérivée par rapport à la variable d’état et la variation temporelle du multiplicateur associé : ∂H ∂k = −µ̇ 4. pour la condition de transversalité on distingue les trois cas suivants – horizons finis : µ(T )k(T ) = 0 – horizons infinis avec facteur d’escompte : lim+∞ µt k(t) = 0 – horizons infinis sans facteur d’escompte : lim+∞ H(t) = 0 Les deux premiers points ajoutés à la contrainte d’accumulation sur k̇ permettent d’obtenir un système à deux équations différentielles en µ et k (on peut aussi raisonner en c et µ). La condition initiale est k0 et une condition terminale est fournit par la condition de transversalité. 7 Variables multiples La démarche précédente s’adapte parfaitement au cas à plusieurs variables. Avec n variables d’état et p variables de contrôle, nous obtenons les conditions du premier ordre : ∂H = 0 pour i = 1 . . . p ∂ci ∂H = −µ̇i pour i = 1 . . . n ∂ki µi (T )ki (T ) = 0 pour i = 1 . . . n 8 (10) (11) (12) Hamiltonien et facteur d’escompte : valeurs courante et actualisée Dans le cas où la fonction objectif s’écrit avec facteur d’escompte (ρ est le taux d’escompte, supposé constant) : Z T e−ρt u[k(t), c(t)]dt 0 −ρt Le Hamiltonien s’écrit : H(k, c, t, µ) = e u[k, c, t] + µt g[k, c, t] où µ représente le prix implicite de k(t) en unité d’utilité initiale. Il peut être utile de raisonner en valeur courante. Pour ce faire, on définit Ĥ = eρt H = u[k, c, t] + q(t)g[k, c, t] avec q(t) = eρt µ(t). Les conditions du premier ordre sont inchangées : Hc = 0 et Hk = −µ̇ ; ce qui donne : Ĥc = 0 Ĥk = ρq − q̇ La condition de transversalité s’écrit ainsi : e−ρT q(T )k(T ) = 0 Tout ceci s’interprète comme la fixation du prix d’un actif vue en TD. 3