Télécharger

Transcription

Télécharger
Titre : Parallélisation massive de dynamiques spatiales : contribution à la gestion durable du mildiou de
la pomme de terre
Financement prévu : Région / SMCO
Cofinancement éventuel :
(Co)-Directeur de thèse : Pr. E. Ramat
E-mail : [email protected]
Co-directeur de thèse : Gauthier Quesnel (INRA/MIA/BIA)
E-mail : [email protected]
Laboratoire : Laboratoire d'Informatique Signal et Image de la Côte d'Opale EA 4491
Equipe : M2SiD (Multi-Modélisation, Simulation et Décision)
Descriptif :
Les enjeux socio-économiques
Le sujet de thèse proposé, fortement pluridisciplinaire, relève du domaine de l'informatique appliquée et plus
particulièrement de la modélisation et de la simulation de systèmes dynamiques, de l'agronomie, de la
phytopathologie et de l'environnement.
Dans le cadre du réseau « Ferme expert écophyto 2018 », l’objectif est de réduire de 30 % à 50% l’utilisation
des produits phytosanitaires d’ici 2018. A ce titre, le projet « Parallélisation de dynamiques spatiales :
contribution à la gestion durable du mildiou de la pomme de terre » s’intègre parfaitement dans cette dynamique
du territoire Nord-Pas de Calais - Picardie. La dimension du réseau « Ferme expert » porté par Monsieur Michel
DENIS, la fédération du négoce Nord Picardie et l’axe du groupe est orientée sur l’eau et son respect. Dix
exploitations agricoles font parties de ce réseau et sont localisées :
• soit des bassins d’alimentation et de captage : Quiéry la Motte, Lille Sud, Airon St Vaast, Guines et
Moulle
• soit des zones sensibles de marais : Bassin de l’Aa (polder)
• soit des marais : béthunois et Lorgies.
Pour notre territoire local, quatre exploitations sont concernées :
• Monsieur VANDERHAEGHE Hervé à LEFFRINCKOUCK en zone de polder : cette exploitation est axée
sur l’agronomie, la qualité des sols. Il développe 2 Ha de pomme de terre en vente directe.
• Monsieur RIVENET Xavier à VIEILLE EGLISE en zone polder : la particularité de cette exploitation est
que la quasi-totalité est développée en agriculture biologique. En culture biologique, le projet aidera
fondamentalement à la maîtrise de la maladie de la pomme de terre : le mildiou.
• Monsieur RIVENET Alexandre à LES ATTAQUES en zone polder et sur le champ captant de Moulle
alimentant le dunkerquois, l’audomarois et l’usine Coca-cola. Pour une partie de sa production de plants
de pomme de terre représente 80 Ha de plants dans sa totalité. La qualité du plant est essentielle car 1
Ha de plant produit la semence de plant pour plus ou moins 35Ha de pomme de terre de consommation.
• Une exploitation située à GUINES dans le périmètre immédiat du pompage du champ captant de Guines
alimentant Calais et ses environs. Cette exploitation est en polyculture / élevage de vaches laitières et
d’ovins. Elle produit un peu plus de 10 Ha de pomme de terre.
L’enjeu de la pomme de terre du territoire est très important : c'est une très grosse zone de production
de plants et la deuxième zone en polder : plus ou moins 20 000 Ha produisant des pommes de terre
« lavable ».
Les enjeux scientifiques
Phytophthora infestans, agent causal du mildiou, est le principal bioagresseur de la pomme de terre. Afin de
maîtriser les épidémies, de nombreux traitements fongicides sont appliqués tout au long du cycle cultural. Avec
un Indice de Fréquence de Traitement moyen de 16 à cause de cette maladie (INRA, Écophyto R&D. Quelles
voies pour réduire l’usage des pesticides ? 2010), la pomme de terre est l'une des cultures les plus dépendantes
de l'usage des pesticides. Dans le cadre du plan national ECOPHYTO 2018 (http://agriculture.gouv.fr/ecophyto),
qui vise à réduire de moitié l'usage des pesticides en agriculture d'ici 2018, si possible ; il apparaît essentiel de
proposer des stratégies de gestion durable de la maladie, moins dépendantes de l'utilisation des pesticides. Afin
d'aider à concevoir de telles stratégies, un modèle appelé Simulator for Integrated Pathogen POpulation
Management a été développé (SIPPOM, Lô-Pelzer et al, 2009). Une adaptation au cas du mildiou de la pomme
de terre a été réalisée sous la plateforme RECORD de l'INRA (http://www4.inra.fr/record) et l'environnement VLE
(http://vle-project.org) (SIPPOM de terre, thèse Rakotonindraina, soutenue le 14 décembre 2012). Le modèle
permet de représenter les effets des systèmes de culture, de leur agencement dans le territoire, et du climat sur
les épidémies de mildiou de la pomme de terre et sur l'adaptation des populations de Phytophthora infestans aux
résistances variétales. Il permet ainsi de représenter les performances agronomiques, économiques, et
environnementales de stratégies de contrôle de la maladie combinant contrôle cultural, génétique et chimique. A
l'échelle de la parcelle, SIPPOM est composé de 5 modules :
• un modèle de culture (SPUDGRO, Jonhson et al, 1986), un modèle épidémiologique (MILEOS,
http://www.mileos.fr/),
• un modèle représentant les dynamiques de repousses dans les champs et sur les tas de déchet
(VOLPONE, Aubertot et al., à soumettre),
• un modèle de nuisibilité (Rakotonindraina et al, 2012),
• un modèle génétique représentant l'évolution de la structure génétique des populations (Lô-Pelzer et al,
2010).
Un modèle de dispersion (Scherm, 1996) permet de représenter les flux d'ascospores entre éléments du
territoire (parcelles et tas de déchets) et permet donc d'appréhender les effets de stratégies de gestion de la
maladie à l'échelle idoine : celle du territoire. Compte tenu du nombre élevé de calculs à réaliser à chaque pas
de temps du modèle, il est nécessaire de perfectionner la représentation de la dispersion des ascospores de
Phytophthora infestans afin de pouvoir optimiser des stratégies de gestion intégrées et durables in silico à l'aide
de SIPPOM.
L'enjeu méthodologique principal de la thèse concerne la parallélisation des modèles multi-échelles de
simulation DEVS sur plusieurs unités de calculs afin de permettre :
- l'augmentation de la vitesse de simulation : le temps requis pour exécuter une simulation peut être
réduite en proportion du nombre de processeurs alloués à la simulation.
- l'augmentation de la taille des modèles : la combinaison de capacité de mémoire de plusieurs
processeurs peut être employée.
- l'utilisation de noeuds spécialisés : meilleure prise en charge des données et fournis par des noeuds
spécialisés.
Ces caractéristiques permettront de modéliser plus finement les modèles de dispersion du mildiou de la pomme
de terre et de mieux modéliser la gestion durable du système.
La question de recherche
Les travaux sur la parallélisation et la distribution des simulations ont été initiés depuis l'existence même de la
simulation informatique. De ces travaux sont nés des méthodes, des algorithmes et des outils pour permettre la
parallélisation de simulations suivant des approches pessimistes [Chandy79, Chandy81] ou optimistes
[Steinman1993] c'est-à-dire, autorisant ou non la violation du principe de causalité issu de la simulation de
systèmes dynamiques. Depuis plusieurs années, la communauté DEVS a adopté et adapté ces travaux pour le
formalisme DEVS [zeigler00] afin de développer des simulateurs permettant la parallélisation de simulation.
Cependant, le formalisme DEVS ne proposent des simulations que pour les modèles ayant un structure statique.
Or, aujourd'hui, l'évolution de la manière de modéliser avec DEVS nous obligent à prendre en considération les
graphes dynamiques de modèles.
La thèse vise alors à répondre à la question de recherche suivante : «comment utiliser de manière optimale la
puissance de calcul pour une simulation parallélisée entre plusieurs noeuds de calculs et simulé avec le
formalisme DEVS et avec l'environnement informatique VLE ?» (Quesnel 2009). Plus précisément, il s'agira de
réaliser un état de l'art complet sur :
• le formalisme DSDE (Barros 1997) et ses simulateurs abstraits qui permettent de modéliser des
systèmes à structures dynamiques, c'est-à-dire, où le nombre de modèles et leurs interactions évoluent
en cours de simulation ;
• les travaux récents réalisés par la communauté DEVS dans le cadre de la parallélisation avec, par
exemple, les thèses de Qi Liu et d'Ernesto Posse (Liu 2010, Posse 2008) ;
• les environnements informatiques DEVS existants qui proposent la parallélisation de simulation comme
CD++ (Wainer 2010) ou James II (Himmelspach 2007) et leurs travaux sur l'équilibre de charge des
simulations ;
• la modélisation multi-échelles et la métamodélisation.
De cette étude, il sera demandé de proposer à la communauté DEVS de nouveaux algorithmes pour les
simulateurs abstraits du formalisme DSDE mais adaptés à la parallélisation tout en suivant les approches
pessimiste et optimiste de la parallélisation. Par la suite, il s'agira de proposer des algorithmes de
partitionnement de graphes et des méta-heuristiques, issus des communautés telle que la recherche
opérationnelle ou de la simulation, pour réaliser un équilibre de charge en se basant sur des métriques statiques
telle que la représentation structurelle du modèle (par exemple, le parcellaire d'une exploitation agricole) ou des
métriques dynamiques comme le nombre d'échanges entre les modèles ou l'évolution de la structure du modèle.
Ainsi, les travaux que nous proposons de mener ici se situent dans la parallélisation massive de ces modèles de
simulations sur les systèmes de clusters multiprocesseurs et multi-cœurs et GP-GPU (utilisation de la machine
GP-GPU du CGR de Calais). Nous souhaitons étudier et développer dans le cadre théorique DEVS et dans
l'environnement informatique VLE, une solution pour développer des modèles multi-échelles spatiaux de très
grandes tailles et des algorithmes pour réaliser l'équilibre de charge lors de l'exécution des simulations.
Le contexte méthodologique choisi et les développements envisagés
Le formalisme DEVS fournit une méthodologie pour la construction de modèles de simulations modulaires,
hiérarchiques et réutilisables dans le but de simuler des systèmes dynamiques complexes. Ce formalisme de
modélisation et de simulation, issu des mathématiques discrètes, permet de modéliser des systèmes compliqués
dans une très large variété de domaine. Il est basé sur les événements discrets pour la modélisation de
systèmes discrets et continus. Le modèle est vu comme un réseau d'interconnexions entre des modèles
atomiques et couplé formant une hiérarchie de modèles. Les modèles sont en interaction via l'échange
d'événements estampillés. À partir de ce formalisme, B. P. Zeigler a proposé une représentation informatique de
ce formalisme qu'il appelle les simulateurs abstraits. Ainsi, depuis l'année 2003, nous développons un
environnement de modélisation et de simulation libre dont le cœur de simulation se base sur le formalisme
DEVS : VLE [quesnel09]. Cet environnement est aujourd'hui utilisé dans des domaines très différents allant des
travaux scientifiques sur le formalisme DEVS ou en intelligence artificielle mais aussi dans les domaines
d'applications comme les systèmes industriels, la biologie, l'épidémiologie ou l'agronomie. Pour ce dernier
domaine d'applications une plate-forme d'aide aux développements et à l'étude de modèles de simulations a été
montée par les départements MIA (Mathématiques et Informatique appliquée) et EA (Environnement et
Agronomie) : le projet RECORD.
Cependant, aujourd'hui nous sommes confrontés à un problème de temps de simulation. En effet, la croissance
de la taille et de la complexité des modèles en terme de formalismes ou de couplage de formalismes que nous
concevons ou que nous étudions avec la simulation, l'estimation de paramètres, l'exploration de modèles ou
l'optimisation par simulations nous imposent des temps de calculs de plus en plus importants. Le principal
moyen que nous avons pour diminuer les temps de calculs sont soit d'attendre de nouveaux processeurs plus
puissants soit d'exploiter les architectures à plusieurs processeurs repartis sur une même machine, sur un
réseau local ou depuis internet. De plus, récemment, l'industrie des microprocesseurs a pris la voie du
développement d'architectures à plusieurs unités de calculs par processeur. En effet, pendant très longtemps
cette industrie a travaillé à l'augmentation des fréquences pour augmenter la rapidité d'exécution des instructions
sur ses microprocesseurs. Aujourd'hui, avec les problèmes de températures engendrés par des fréquences très
élevées, ces industries se sont orientées vers de nouvelles architectures des microprocesseurs dites multicœurs dans lesquelles plusieurs processeurs, appelés cœurs, communiquent directement via un système de
cache au sein d'un même processeur. Cet état de fait nous pousse d'avantage encore vers le développement et
vers la transition de nos algorithmes et méthodes vers la parallélisation. Ainsi, pour répondre à notre problème
de temps de simulation, nous avons commencé des travaux de réécriture du noyau de simulation de VLE. Ces
travaux se basent sur des travaux réalisés par la communauté DEVS [liu2010, Posse2008] avec des approches
optimistes et pessimistes de la parallélisation de simulations.
Par ailleurs, les systèmes que nous modélisons avec nos partenaires des différents domaines d'applications et
principalement avec le monde agronomique de l'INRA montre que la modélisation des systèmes étudiés évolue
vers des systèmes où la structures elle-même des modèles change au cours du temps simulé avec
principalement l'apparition ou la suppression de modèles. Le formalisme DEVS, dans sa définition initiale ne
permet de pas de représenter de tel systèmes. Des chercheurs de cette communauté ont travaillé à fournir une
telle extension à DEVS. Ainsi, F. J. Barros [barros98] a publié à la fin des années 90, une extension à DEVS
sous les noms DSDEVS puis DSDE pour Dynamic Structure Discrete Event System. Ce formalisme, associé lui
aussi à des simulateurs abstraits, prend en charge la manipulation de la structure du modèle en cours de
simulation ce que le formalisme DEVS ne permet pas. Les changements possibles sont l'ajout ou la suppression
de modèles atomiques, couplés, de ports ou de connexions. La prise en compte de ces changements est
primordiale dans les domaines d'études que nous étudions avec VLE, par exemple en agronomie. Nous pouvons
citer les exemples de modélisation de la croissance d'une plante organe par organe (avec des approches
structure/fonction) ou la modification d'un parcellaire par un agriculteur. La parallélisation de ce type de modèle
impose la gestion de l'équilibrage de charge pendant la simulation afin de limiter l'engorgement de modèles de
simulations sur un même nœud. À notre connaissance, très peu de travaux dans la communauté DEVS
prennent en charge la parallélisation de tels systèmes.
La plate-forme VLE (Virtual Laboratory Environment)
Comme nous l'avons évoqué plusieurs fois, le formalisme PDEVS est au cœur du sujet de thèse et le
développement de modèles opérationnels est loin d'être simple. Pourquoi ? Premièrement, il est nécessaire de
s'inscrire dans une modélisation à événements discrets or de nombreux modèles sont à base d'équations
différentielles (à temps continu) ou d'équations aux différences (à temps discret) et leur reformulation en
modèles à événements discrets PDEVS n'est pas triviale et/ou, peut nécessiter un temps non négligeable.
Deuxièmement, PDEVS laisse une totale liberté sur l'expression des états, des fonctions de transition, des
valeurs transportées par les événements. Nous sommes loin d'un formalisme profondément expressif. PDEVS
offre simplement une structuration des modèles et une algorithmique minimaliste. En réalité, cette simplicité est
le garant pour définir un socle solide et simple pour le couplage des modèles. Naturellement, il est alors
nécessaire de disposer d'une infrastructure informatique pour aider le modélisateur. La plate-forme, «Virtual
Laboratory Environment», (VLE) est une solution modulaire et extensive pour réaliser des modèles
multiformalismes par couplage.
Notre but avec VLE est donc de proposer un outil complet pour réaliser le cycle de modélisation et de simulation.
Chacune des activités de ce cycle est prise en charge par un ou plusieurs composants de VLE :
• modélisation à l'aide des outils classiques de modélisation, équations différentielles, équations aux
différences, automates à états, systèmes à événements discrets ou DEVS en dernier niveau étape.
• Implémentation en code informatique de votre modèle, utilisation des bibliothèques de VLE et des
extensions proposées et de l'interface graphique GVLE pour composer vos modèles.
• préparation du plan d'expérience avec l'initialisation des paramètres et des variables, le nombre de
réplicats, les modèles à observer, comment les observer et où diriger les données : GVLE.
• exécution des simulations depuis VLE, GVLE, RVLE ou PyVLE sur une machine locale ou une grille de
calcul.
VLE offre aux modélisateurs l'accès à DEVS, pour la modélisation de modèles hétérogènes, la simulation sur
simple ordinateur portable jusqu'aux clusters et autres grilles de calcul et l'analyse des sorties, et si possible en
proposant une intégration dans leurs outils.
Echéancier de travail
Première année :
• étude des modèles existants du mildiou et évaluation de leur performance, de leur applicabilité à la
région considérée
• étude des travaux de recherche en équilibrage de charges et en parallélisation dans le domaine de la
simulation à événements discrets
• étude des propriétés mathématiques des modèles de dispersion (Califlopp, en particulier) et relation
avec une algorithmique parallèle
• construction de premiers prototypes d'un noyau P-DEVS/DS-DEVS
Deuxième année :
• deuxième version des algorithmes du noyau parallèle et démonstration de leur performance théorique
• mise à place du couplage des infrastructures matérielles (Cluster, GP-GPU, …) pour le déploiement du
noyau parallèle pour valider expérimentalement la performance
• élaboration du modèle couplé (évolution de SIPPOM-WOSR) et intégration dans le noyau parallèle
• comparaison des diverses variantes par exploration numérique
Troisième année :
• validation du modèle spatialisé à l'échelle d'un territoire par comparaison avec les outils d'aide à la
décision existants pour l'évaluation du mildiou
• valorisation des travaux (publications, séminaires, …)
Toutes les actions de ce plan de travail sont systématiquement en interaction avec les partenaires institutionnels
ou privés du projet.
Collaborations
La thèse se déroulera dans un fort cadre de collaborations. La majorité des acteurs institutionnels (Ministère de
l'Agriculture, INRA, Comité Nord de la Pomme de terre, UNPPT – Union National des Producteurs de Pomme de
terre, Fédération du négoce de la pomme de terre, CASO, EuroFins, EAPR (Serge Debauchelle), …), privés
(Arvalis, McCain, Roquette, …) et naturellement les personnes oeuvrants (ingénieurs, exploitants, …) au sein du
réseau « Ferme expert » du territoire littoral seront partenaires du projet.
Encadrement
Afin d'encadrer et de piloter au mieux la thèse, nous allons mettre en place un comité de thèse composé d'une
dizaine personnes maximum dont les directeurs de thèse. L'objectif de ce comité est d'orienter, d'aider à planifier
les actions et de cadrer le travail de thèse. Une réunion annuelle sera planifiée. Étant donnée la nature
pluridisciplinaire du sujet, le comité est composé de chercheurs informaticiens et agronomes /
phytopathologistes.
Proposition de composition du comité :
• directeurs de la thèse
◦ Eric Ramat (informaticien - ULCO Calais) – directeur de thèse
◦ Gauthier Quesnel (informaticien - INRA Toulouse) – co-directeur de thèse
• pilotage local :
◦ Michel Denis (expert - Réseau Ferme expert - Audruicq)
◦ Frédéric Velut (responsable du Pôle de l'Eau – CASO – Saint Omer)
◦ Ludovic Dubois (Direction régionale de l'alimentation, de l'agriculture et de la forêt - DRAAF Service Régional de l'Alimentation - SRAL – Nord Pas de Calais)
◦ Sophie Sylvesie (rapporteur national pomme de terre – DRAAF – Deg Pat)
◦ Virginie Deveaux (Comité Nord de la Pomme de terre)
• spécialistes de la pomme de terre et du mildiou
◦ Jean-Noël Aubertot (agronome - INRA Toulouse)
◦ Catherine Chatot (phytopathologiste - Germicopa)
◦ Ivan Sache (phytopathologiste - INRA Grignon)
• informaticiens externes :
◦ David Hill (informaticien - Université Blaise Pascal – Clermont-Ferrand)
◦ Michel Koskas (informaticien - AgroParisTech)
Références bibliographiques (non exhaustif) :
•
Jan Himmelspach, Roland Ewald, Stefan Leye, and Adelinde M. Uhrmacher. Parallel and distributed
simulation of parallel devs models. In Proceedings of the 2007 spring simulation multiconference Volume 2, SpringSim ’07, pages 249–256, San Diego, CA, USA, 2007. Society for Computer Simulation
International.
•
•
•
•
•
•
•
•
Qi Liu. Algorithms for Parallel Simulation of Large-Scale DEVS and Cell-DEVS Models. PhD thesis,
Ottawa-Carleton Institute for Electrical and Computer Engineering, Department of Systems and
Computer Engineering Carleton University Ottawa, Ontario, Canada, 2010.
Gauthier Quesnel, Raphael Duboz, and Eric Ramat. The Virtual Laboratory Environment – An
operational framework for multi-modelling, simulation and analysis of complex dynamical systems.
Simulation Modelling Practice and Theory, 17 :641–653, April 2009.
Lô-Pelzer E, Bousset L, Jeuffroy MH, Salam MU, Pinochet X, Boillot M, and Aubertot JN, 2009.
SIPPOM-WOSR: a Simulator for Integrated Pathogen POpulation Management to manage phoma stem
canker on Winter OilSeed Rape. I. Description of the Model. Field Crops Research, 118, 73-81.
Lô-Pelzer E, Aubertot JN, Bousset L, Salam MU and Jeuffroy MH, 2009. SIPPOM-WOSR: a Simulator
for Integrated Pathogen POpulation Management to manage phoma stem canker on Winter OilSeed
Rape. II. Sensitivity analysis. Field Crops Research, 118, 82-93.
Ernesto Posse. Modelling and simulation of dynamic structure discrete-event systems. PhD thesis,
School of Computer Science, McGill University, 2008.
Toky Rakotonindrana, Jean-Éric Chauvin, Roland Pelle, Catherine Chatot, Frédérique Aurousseau et
Jean-Noël Aubertot, Modelling the effects of spatially distributed cropping systems on the epidemics of
potato late blight and on the durability of cultivar resistances, 12ème workshop EuroBlight, Arras
(France), 3-6 mai 2010
Gabriel A. Wainer, Qi Liu, and Shafagh Jafer. Advanced parallel simulation of DEVS models in CD++,
chapter 9, page TBD. Taylor and Francis, 2010. Authors : G. Wainer, P. Mosterman Eds, Book :
Discrete-Event Modeling and Simulation : Theory and Applications.
B. P. Zeigler, D. Kim, and H. Praehofer. Theory of modeling and simulation : Integrating Discrete Event
and Continuous Complex Dynamic Systems. Academic Press, 2000.
Mots-clefs :
Multimodélisation, modélisation à événements discrets, simulation distribuée, modèle de diffusion et
épidémiologie