Télécharger
Transcription
Télécharger
Titre : Parallélisation massive de dynamiques spatiales : contribution à la gestion durable du mildiou de la pomme de terre Financement prévu : Région / SMCO Cofinancement éventuel : (Co)-Directeur de thèse : Pr. E. Ramat E-mail : [email protected] Co-directeur de thèse : Gauthier Quesnel (INRA/MIA/BIA) E-mail : [email protected] Laboratoire : Laboratoire d'Informatique Signal et Image de la Côte d'Opale EA 4491 Equipe : M2SiD (Multi-Modélisation, Simulation et Décision) Descriptif : Les enjeux socio-économiques Le sujet de thèse proposé, fortement pluridisciplinaire, relève du domaine de l'informatique appliquée et plus particulièrement de la modélisation et de la simulation de systèmes dynamiques, de l'agronomie, de la phytopathologie et de l'environnement. Dans le cadre du réseau « Ferme expert écophyto 2018 », l’objectif est de réduire de 30 % à 50% l’utilisation des produits phytosanitaires d’ici 2018. A ce titre, le projet « Parallélisation de dynamiques spatiales : contribution à la gestion durable du mildiou de la pomme de terre » s’intègre parfaitement dans cette dynamique du territoire Nord-Pas de Calais - Picardie. La dimension du réseau « Ferme expert » porté par Monsieur Michel DENIS, la fédération du négoce Nord Picardie et l’axe du groupe est orientée sur l’eau et son respect. Dix exploitations agricoles font parties de ce réseau et sont localisées : • soit des bassins d’alimentation et de captage : Quiéry la Motte, Lille Sud, Airon St Vaast, Guines et Moulle • soit des zones sensibles de marais : Bassin de l’Aa (polder) • soit des marais : béthunois et Lorgies. Pour notre territoire local, quatre exploitations sont concernées : • Monsieur VANDERHAEGHE Hervé à LEFFRINCKOUCK en zone de polder : cette exploitation est axée sur l’agronomie, la qualité des sols. Il développe 2 Ha de pomme de terre en vente directe. • Monsieur RIVENET Xavier à VIEILLE EGLISE en zone polder : la particularité de cette exploitation est que la quasi-totalité est développée en agriculture biologique. En culture biologique, le projet aidera fondamentalement à la maîtrise de la maladie de la pomme de terre : le mildiou. • Monsieur RIVENET Alexandre à LES ATTAQUES en zone polder et sur le champ captant de Moulle alimentant le dunkerquois, l’audomarois et l’usine Coca-cola. Pour une partie de sa production de plants de pomme de terre représente 80 Ha de plants dans sa totalité. La qualité du plant est essentielle car 1 Ha de plant produit la semence de plant pour plus ou moins 35Ha de pomme de terre de consommation. • Une exploitation située à GUINES dans le périmètre immédiat du pompage du champ captant de Guines alimentant Calais et ses environs. Cette exploitation est en polyculture / élevage de vaches laitières et d’ovins. Elle produit un peu plus de 10 Ha de pomme de terre. L’enjeu de la pomme de terre du territoire est très important : c'est une très grosse zone de production de plants et la deuxième zone en polder : plus ou moins 20 000 Ha produisant des pommes de terre « lavable ». Les enjeux scientifiques Phytophthora infestans, agent causal du mildiou, est le principal bioagresseur de la pomme de terre. Afin de maîtriser les épidémies, de nombreux traitements fongicides sont appliqués tout au long du cycle cultural. Avec un Indice de Fréquence de Traitement moyen de 16 à cause de cette maladie (INRA, Écophyto R&D. Quelles voies pour réduire l’usage des pesticides ? 2010), la pomme de terre est l'une des cultures les plus dépendantes de l'usage des pesticides. Dans le cadre du plan national ECOPHYTO 2018 (http://agriculture.gouv.fr/ecophyto), qui vise à réduire de moitié l'usage des pesticides en agriculture d'ici 2018, si possible ; il apparaît essentiel de proposer des stratégies de gestion durable de la maladie, moins dépendantes de l'utilisation des pesticides. Afin d'aider à concevoir de telles stratégies, un modèle appelé Simulator for Integrated Pathogen POpulation Management a été développé (SIPPOM, Lô-Pelzer et al, 2009). Une adaptation au cas du mildiou de la pomme de terre a été réalisée sous la plateforme RECORD de l'INRA (http://www4.inra.fr/record) et l'environnement VLE (http://vle-project.org) (SIPPOM de terre, thèse Rakotonindraina, soutenue le 14 décembre 2012). Le modèle permet de représenter les effets des systèmes de culture, de leur agencement dans le territoire, et du climat sur les épidémies de mildiou de la pomme de terre et sur l'adaptation des populations de Phytophthora infestans aux résistances variétales. Il permet ainsi de représenter les performances agronomiques, économiques, et environnementales de stratégies de contrôle de la maladie combinant contrôle cultural, génétique et chimique. A l'échelle de la parcelle, SIPPOM est composé de 5 modules : • un modèle de culture (SPUDGRO, Jonhson et al, 1986), un modèle épidémiologique (MILEOS, http://www.mileos.fr/), • un modèle représentant les dynamiques de repousses dans les champs et sur les tas de déchet (VOLPONE, Aubertot et al., à soumettre), • un modèle de nuisibilité (Rakotonindraina et al, 2012), • un modèle génétique représentant l'évolution de la structure génétique des populations (Lô-Pelzer et al, 2010). Un modèle de dispersion (Scherm, 1996) permet de représenter les flux d'ascospores entre éléments du territoire (parcelles et tas de déchets) et permet donc d'appréhender les effets de stratégies de gestion de la maladie à l'échelle idoine : celle du territoire. Compte tenu du nombre élevé de calculs à réaliser à chaque pas de temps du modèle, il est nécessaire de perfectionner la représentation de la dispersion des ascospores de Phytophthora infestans afin de pouvoir optimiser des stratégies de gestion intégrées et durables in silico à l'aide de SIPPOM. L'enjeu méthodologique principal de la thèse concerne la parallélisation des modèles multi-échelles de simulation DEVS sur plusieurs unités de calculs afin de permettre : - l'augmentation de la vitesse de simulation : le temps requis pour exécuter une simulation peut être réduite en proportion du nombre de processeurs alloués à la simulation. - l'augmentation de la taille des modèles : la combinaison de capacité de mémoire de plusieurs processeurs peut être employée. - l'utilisation de noeuds spécialisés : meilleure prise en charge des données et fournis par des noeuds spécialisés. Ces caractéristiques permettront de modéliser plus finement les modèles de dispersion du mildiou de la pomme de terre et de mieux modéliser la gestion durable du système. La question de recherche Les travaux sur la parallélisation et la distribution des simulations ont été initiés depuis l'existence même de la simulation informatique. De ces travaux sont nés des méthodes, des algorithmes et des outils pour permettre la parallélisation de simulations suivant des approches pessimistes [Chandy79, Chandy81] ou optimistes [Steinman1993] c'est-à-dire, autorisant ou non la violation du principe de causalité issu de la simulation de systèmes dynamiques. Depuis plusieurs années, la communauté DEVS a adopté et adapté ces travaux pour le formalisme DEVS [zeigler00] afin de développer des simulateurs permettant la parallélisation de simulation. Cependant, le formalisme DEVS ne proposent des simulations que pour les modèles ayant un structure statique. Or, aujourd'hui, l'évolution de la manière de modéliser avec DEVS nous obligent à prendre en considération les graphes dynamiques de modèles. La thèse vise alors à répondre à la question de recherche suivante : «comment utiliser de manière optimale la puissance de calcul pour une simulation parallélisée entre plusieurs noeuds de calculs et simulé avec le formalisme DEVS et avec l'environnement informatique VLE ?» (Quesnel 2009). Plus précisément, il s'agira de réaliser un état de l'art complet sur : • le formalisme DSDE (Barros 1997) et ses simulateurs abstraits qui permettent de modéliser des systèmes à structures dynamiques, c'est-à-dire, où le nombre de modèles et leurs interactions évoluent en cours de simulation ; • les travaux récents réalisés par la communauté DEVS dans le cadre de la parallélisation avec, par exemple, les thèses de Qi Liu et d'Ernesto Posse (Liu 2010, Posse 2008) ; • les environnements informatiques DEVS existants qui proposent la parallélisation de simulation comme CD++ (Wainer 2010) ou James II (Himmelspach 2007) et leurs travaux sur l'équilibre de charge des simulations ; • la modélisation multi-échelles et la métamodélisation. De cette étude, il sera demandé de proposer à la communauté DEVS de nouveaux algorithmes pour les simulateurs abstraits du formalisme DSDE mais adaptés à la parallélisation tout en suivant les approches pessimiste et optimiste de la parallélisation. Par la suite, il s'agira de proposer des algorithmes de partitionnement de graphes et des méta-heuristiques, issus des communautés telle que la recherche opérationnelle ou de la simulation, pour réaliser un équilibre de charge en se basant sur des métriques statiques telle que la représentation structurelle du modèle (par exemple, le parcellaire d'une exploitation agricole) ou des métriques dynamiques comme le nombre d'échanges entre les modèles ou l'évolution de la structure du modèle. Ainsi, les travaux que nous proposons de mener ici se situent dans la parallélisation massive de ces modèles de simulations sur les systèmes de clusters multiprocesseurs et multi-cœurs et GP-GPU (utilisation de la machine GP-GPU du CGR de Calais). Nous souhaitons étudier et développer dans le cadre théorique DEVS et dans l'environnement informatique VLE, une solution pour développer des modèles multi-échelles spatiaux de très grandes tailles et des algorithmes pour réaliser l'équilibre de charge lors de l'exécution des simulations. Le contexte méthodologique choisi et les développements envisagés Le formalisme DEVS fournit une méthodologie pour la construction de modèles de simulations modulaires, hiérarchiques et réutilisables dans le but de simuler des systèmes dynamiques complexes. Ce formalisme de modélisation et de simulation, issu des mathématiques discrètes, permet de modéliser des systèmes compliqués dans une très large variété de domaine. Il est basé sur les événements discrets pour la modélisation de systèmes discrets et continus. Le modèle est vu comme un réseau d'interconnexions entre des modèles atomiques et couplé formant une hiérarchie de modèles. Les modèles sont en interaction via l'échange d'événements estampillés. À partir de ce formalisme, B. P. Zeigler a proposé une représentation informatique de ce formalisme qu'il appelle les simulateurs abstraits. Ainsi, depuis l'année 2003, nous développons un environnement de modélisation et de simulation libre dont le cœur de simulation se base sur le formalisme DEVS : VLE [quesnel09]. Cet environnement est aujourd'hui utilisé dans des domaines très différents allant des travaux scientifiques sur le formalisme DEVS ou en intelligence artificielle mais aussi dans les domaines d'applications comme les systèmes industriels, la biologie, l'épidémiologie ou l'agronomie. Pour ce dernier domaine d'applications une plate-forme d'aide aux développements et à l'étude de modèles de simulations a été montée par les départements MIA (Mathématiques et Informatique appliquée) et EA (Environnement et Agronomie) : le projet RECORD. Cependant, aujourd'hui nous sommes confrontés à un problème de temps de simulation. En effet, la croissance de la taille et de la complexité des modèles en terme de formalismes ou de couplage de formalismes que nous concevons ou que nous étudions avec la simulation, l'estimation de paramètres, l'exploration de modèles ou l'optimisation par simulations nous imposent des temps de calculs de plus en plus importants. Le principal moyen que nous avons pour diminuer les temps de calculs sont soit d'attendre de nouveaux processeurs plus puissants soit d'exploiter les architectures à plusieurs processeurs repartis sur une même machine, sur un réseau local ou depuis internet. De plus, récemment, l'industrie des microprocesseurs a pris la voie du développement d'architectures à plusieurs unités de calculs par processeur. En effet, pendant très longtemps cette industrie a travaillé à l'augmentation des fréquences pour augmenter la rapidité d'exécution des instructions sur ses microprocesseurs. Aujourd'hui, avec les problèmes de températures engendrés par des fréquences très élevées, ces industries se sont orientées vers de nouvelles architectures des microprocesseurs dites multicœurs dans lesquelles plusieurs processeurs, appelés cœurs, communiquent directement via un système de cache au sein d'un même processeur. Cet état de fait nous pousse d'avantage encore vers le développement et vers la transition de nos algorithmes et méthodes vers la parallélisation. Ainsi, pour répondre à notre problème de temps de simulation, nous avons commencé des travaux de réécriture du noyau de simulation de VLE. Ces travaux se basent sur des travaux réalisés par la communauté DEVS [liu2010, Posse2008] avec des approches optimistes et pessimistes de la parallélisation de simulations. Par ailleurs, les systèmes que nous modélisons avec nos partenaires des différents domaines d'applications et principalement avec le monde agronomique de l'INRA montre que la modélisation des systèmes étudiés évolue vers des systèmes où la structures elle-même des modèles change au cours du temps simulé avec principalement l'apparition ou la suppression de modèles. Le formalisme DEVS, dans sa définition initiale ne permet de pas de représenter de tel systèmes. Des chercheurs de cette communauté ont travaillé à fournir une telle extension à DEVS. Ainsi, F. J. Barros [barros98] a publié à la fin des années 90, une extension à DEVS sous les noms DSDEVS puis DSDE pour Dynamic Structure Discrete Event System. Ce formalisme, associé lui aussi à des simulateurs abstraits, prend en charge la manipulation de la structure du modèle en cours de simulation ce que le formalisme DEVS ne permet pas. Les changements possibles sont l'ajout ou la suppression de modèles atomiques, couplés, de ports ou de connexions. La prise en compte de ces changements est primordiale dans les domaines d'études que nous étudions avec VLE, par exemple en agronomie. Nous pouvons citer les exemples de modélisation de la croissance d'une plante organe par organe (avec des approches structure/fonction) ou la modification d'un parcellaire par un agriculteur. La parallélisation de ce type de modèle impose la gestion de l'équilibrage de charge pendant la simulation afin de limiter l'engorgement de modèles de simulations sur un même nœud. À notre connaissance, très peu de travaux dans la communauté DEVS prennent en charge la parallélisation de tels systèmes. La plate-forme VLE (Virtual Laboratory Environment) Comme nous l'avons évoqué plusieurs fois, le formalisme PDEVS est au cœur du sujet de thèse et le développement de modèles opérationnels est loin d'être simple. Pourquoi ? Premièrement, il est nécessaire de s'inscrire dans une modélisation à événements discrets or de nombreux modèles sont à base d'équations différentielles (à temps continu) ou d'équations aux différences (à temps discret) et leur reformulation en modèles à événements discrets PDEVS n'est pas triviale et/ou, peut nécessiter un temps non négligeable. Deuxièmement, PDEVS laisse une totale liberté sur l'expression des états, des fonctions de transition, des valeurs transportées par les événements. Nous sommes loin d'un formalisme profondément expressif. PDEVS offre simplement une structuration des modèles et une algorithmique minimaliste. En réalité, cette simplicité est le garant pour définir un socle solide et simple pour le couplage des modèles. Naturellement, il est alors nécessaire de disposer d'une infrastructure informatique pour aider le modélisateur. La plate-forme, «Virtual Laboratory Environment», (VLE) est une solution modulaire et extensive pour réaliser des modèles multiformalismes par couplage. Notre but avec VLE est donc de proposer un outil complet pour réaliser le cycle de modélisation et de simulation. Chacune des activités de ce cycle est prise en charge par un ou plusieurs composants de VLE : • modélisation à l'aide des outils classiques de modélisation, équations différentielles, équations aux différences, automates à états, systèmes à événements discrets ou DEVS en dernier niveau étape. • Implémentation en code informatique de votre modèle, utilisation des bibliothèques de VLE et des extensions proposées et de l'interface graphique GVLE pour composer vos modèles. • préparation du plan d'expérience avec l'initialisation des paramètres et des variables, le nombre de réplicats, les modèles à observer, comment les observer et où diriger les données : GVLE. • exécution des simulations depuis VLE, GVLE, RVLE ou PyVLE sur une machine locale ou une grille de calcul. VLE offre aux modélisateurs l'accès à DEVS, pour la modélisation de modèles hétérogènes, la simulation sur simple ordinateur portable jusqu'aux clusters et autres grilles de calcul et l'analyse des sorties, et si possible en proposant une intégration dans leurs outils. Echéancier de travail Première année : • étude des modèles existants du mildiou et évaluation de leur performance, de leur applicabilité à la région considérée • étude des travaux de recherche en équilibrage de charges et en parallélisation dans le domaine de la simulation à événements discrets • étude des propriétés mathématiques des modèles de dispersion (Califlopp, en particulier) et relation avec une algorithmique parallèle • construction de premiers prototypes d'un noyau P-DEVS/DS-DEVS Deuxième année : • deuxième version des algorithmes du noyau parallèle et démonstration de leur performance théorique • mise à place du couplage des infrastructures matérielles (Cluster, GP-GPU, …) pour le déploiement du noyau parallèle pour valider expérimentalement la performance • élaboration du modèle couplé (évolution de SIPPOM-WOSR) et intégration dans le noyau parallèle • comparaison des diverses variantes par exploration numérique Troisième année : • validation du modèle spatialisé à l'échelle d'un territoire par comparaison avec les outils d'aide à la décision existants pour l'évaluation du mildiou • valorisation des travaux (publications, séminaires, …) Toutes les actions de ce plan de travail sont systématiquement en interaction avec les partenaires institutionnels ou privés du projet. Collaborations La thèse se déroulera dans un fort cadre de collaborations. La majorité des acteurs institutionnels (Ministère de l'Agriculture, INRA, Comité Nord de la Pomme de terre, UNPPT – Union National des Producteurs de Pomme de terre, Fédération du négoce de la pomme de terre, CASO, EuroFins, EAPR (Serge Debauchelle), …), privés (Arvalis, McCain, Roquette, …) et naturellement les personnes oeuvrants (ingénieurs, exploitants, …) au sein du réseau « Ferme expert » du territoire littoral seront partenaires du projet. Encadrement Afin d'encadrer et de piloter au mieux la thèse, nous allons mettre en place un comité de thèse composé d'une dizaine personnes maximum dont les directeurs de thèse. L'objectif de ce comité est d'orienter, d'aider à planifier les actions et de cadrer le travail de thèse. Une réunion annuelle sera planifiée. Étant donnée la nature pluridisciplinaire du sujet, le comité est composé de chercheurs informaticiens et agronomes / phytopathologistes. Proposition de composition du comité : • directeurs de la thèse ◦ Eric Ramat (informaticien - ULCO Calais) – directeur de thèse ◦ Gauthier Quesnel (informaticien - INRA Toulouse) – co-directeur de thèse • pilotage local : ◦ Michel Denis (expert - Réseau Ferme expert - Audruicq) ◦ Frédéric Velut (responsable du Pôle de l'Eau – CASO – Saint Omer) ◦ Ludovic Dubois (Direction régionale de l'alimentation, de l'agriculture et de la forêt - DRAAF Service Régional de l'Alimentation - SRAL – Nord Pas de Calais) ◦ Sophie Sylvesie (rapporteur national pomme de terre – DRAAF – Deg Pat) ◦ Virginie Deveaux (Comité Nord de la Pomme de terre) • spécialistes de la pomme de terre et du mildiou ◦ Jean-Noël Aubertot (agronome - INRA Toulouse) ◦ Catherine Chatot (phytopathologiste - Germicopa) ◦ Ivan Sache (phytopathologiste - INRA Grignon) • informaticiens externes : ◦ David Hill (informaticien - Université Blaise Pascal – Clermont-Ferrand) ◦ Michel Koskas (informaticien - AgroParisTech) Références bibliographiques (non exhaustif) : • Jan Himmelspach, Roland Ewald, Stefan Leye, and Adelinde M. Uhrmacher. Parallel and distributed simulation of parallel devs models. In Proceedings of the 2007 spring simulation multiconference Volume 2, SpringSim ’07, pages 249–256, San Diego, CA, USA, 2007. Society for Computer Simulation International. • • • • • • • • Qi Liu. Algorithms for Parallel Simulation of Large-Scale DEVS and Cell-DEVS Models. PhD thesis, Ottawa-Carleton Institute for Electrical and Computer Engineering, Department of Systems and Computer Engineering Carleton University Ottawa, Ontario, Canada, 2010. Gauthier Quesnel, Raphael Duboz, and Eric Ramat. The Virtual Laboratory Environment – An operational framework for multi-modelling, simulation and analysis of complex dynamical systems. Simulation Modelling Practice and Theory, 17 :641–653, April 2009. Lô-Pelzer E, Bousset L, Jeuffroy MH, Salam MU, Pinochet X, Boillot M, and Aubertot JN, 2009. SIPPOM-WOSR: a Simulator for Integrated Pathogen POpulation Management to manage phoma stem canker on Winter OilSeed Rape. I. Description of the Model. Field Crops Research, 118, 73-81. Lô-Pelzer E, Aubertot JN, Bousset L, Salam MU and Jeuffroy MH, 2009. SIPPOM-WOSR: a Simulator for Integrated Pathogen POpulation Management to manage phoma stem canker on Winter OilSeed Rape. II. Sensitivity analysis. Field Crops Research, 118, 82-93. Ernesto Posse. Modelling and simulation of dynamic structure discrete-event systems. PhD thesis, School of Computer Science, McGill University, 2008. Toky Rakotonindrana, Jean-Éric Chauvin, Roland Pelle, Catherine Chatot, Frédérique Aurousseau et Jean-Noël Aubertot, Modelling the effects of spatially distributed cropping systems on the epidemics of potato late blight and on the durability of cultivar resistances, 12ème workshop EuroBlight, Arras (France), 3-6 mai 2010 Gabriel A. Wainer, Qi Liu, and Shafagh Jafer. Advanced parallel simulation of DEVS models in CD++, chapter 9, page TBD. Taylor and Francis, 2010. Authors : G. Wainer, P. Mosterman Eds, Book : Discrete-Event Modeling and Simulation : Theory and Applications. B. P. Zeigler, D. Kim, and H. Praehofer. Theory of modeling and simulation : Integrating Discrete Event and Continuous Complex Dynamic Systems. Academic Press, 2000. Mots-clefs : Multimodélisation, modélisation à événements discrets, simulation distribuée, modèle de diffusion et épidémiologie