Proposition de sujet de thèse
Transcription
Proposition de sujet de thèse
Proposition de sujet de thèse Titre Algorithmes optimaux de traitement de données pour des systèmes complexes d'information et télécommunication dans un environnement incertain Laboratoire d'accueil Laboratoire de mathématiques Raphael Salem, LMRS, UMR 6085, Université de Rouen, Rouen, France Financement Allocation de recherche doctorale de la part de le Région Haute Normandie, France ; environ 1700 €/mois brut (environ 1400 €/mois net) pour 3 ans à partir de novembre 2013 Résumé Les systèmes modernes d' information et de télécommunication sont caractérisés par la complexité des outils employés et par l'augmentation des exigences concernant la qualité de la transmission d'information. Afin d'assurer la fiabilité de ces systèmes il faut tenir compte des conditions de transmission des messages, y compris de la présence du bruit généré par différentes causes physiques. Nous proposons de construire des algorithmes efficaces de traitement d'information stables par rapport au bruit et basés sur des méthodes statistiques non asymptotiques développées pour des systèmes dynamiques stochastiques . L'originalité du travail proposé vient du fait que nous traitons des modèles statistiques avec observations dépendantes. Encadrement Vlad Barbu (maître de conférences, LMRS, Université de Rouen, [email protected]) Serge Pergamenchtchikov (professeur, LMRS, Université de Rouen, [email protected]) Sujet Les systèmes modernes d'information et de télécommunication sont caractérisés par la complexité des outils employés et par l'augmentation des exigences concernant la qualité de la transmission d'information. Afin d'assurer la fiabilité de ces systèmes il faut tenir compte des conditions de transmission des messages, y compris de la présence du bruit généré par différentes causes physiques. Ces multiples causes sont principalement dues à la complexité intrinsèque des systèmes, d'une part, et à l'environnement incertain dans lequel ces systèmes évoluent, d'autre part. Tout cela nous ramène au besoin de construire des algorithmes efficaces de traitement d'information qui sont stables par rapport au bruit. Comme ce bruit est généré par un environnement incertain, le rôle crucial pour obtenir de tels algorithmes est joué par les méthodes statistiques. Lors des dernières années, des méthodes d'analyse de données basées sur des modèles dynamiques stochastiques se sont développées de manière intensive. Ces modèles sont définis mathématiquement par des systèmes différentiels stochastiques (temps continu) ou par des équations stochastiques en différences (temps discret). De telles équations ont, comme toujours, des paramètres ou fonctions de structure inconnus. L'application des méthodes statistiques traditionnelles aux systèmes complexes est souvent entravée par le fait que la théorie statistique moderne pour des séries temporelles à observations dépendantes, même dans des situations très simples, a un caractère asymptotique, ce qui nécessite de tailles très grandes de données. Pour cette raison, l'emploi des méthodes asymptotiques peut engendrer de fausses conclusions. C'est pour cela que la construction de méthodes efficaces de traitement d'information basées sur une taille bornée des données est de plus en plus actuelle. Dans ce projet nous proposons de développer des méthodes statistiques non-asymptotiques basées sur l'approche d'analyse séquentielle et sur la sélection de modèles pour des systèmes stochastiques complexes décrits par des équations différentielles stochastiques avec des sauts, gouvernés par une composante semimarkovienne. Ceci représente une nouveauté dans la littérature, permettant de prendre en compte la complexité accrue des systèmes. L'originalité principale du travail proposé vient du fait que nous traitons des modèles statistiques avec observations dépendantes. Programme de travail 1ère année - étude de la théorie de renouvellement (2 mois) - étude de la convergence faible pour des suites de variables aléatoires dépendantes (martingales, mélange) (3 mois) - étude des processus semi-markoviens en temps discret (3 mois) - étude des méthodes de simulation numérique de processus semi-markoviens à temps discret (1 mois) - étude des méthodes statistiques optimales pour des modèles semi-markoviens à temps discret; cadre paramétrique et non paramétrique (3 mois) 2ème année - développement de méthodes statistiques optimales pour des problèmes d'estimation du noyau semi-markovien en temps discret ; cadre paramétrique et non paramétrique (6 mois) - construction d'algorithmes efficaces de traitement de données représentées par des processus semi-markoviens en temps discret (2 mois) - étude de processus semi-markoviens en temps continu (2 mois) - étude de méthodes de simulation numérique de processus semi-markoviens en temps continu (2 mois) 3ème année - développement de méthodes statistiques paramétriques et non paramétriques pour l'estimation du noyau en temps continu ; construction des algorithmes associés (6 mois) - étude numérique des algorithmes proposés, comparaison avec des méthodes existantes, application sur des données réelles (6 mois) Références V. Barbu, N. Limnios, Semi-Markov Chains and Hidden Semi-Markov Models toward Applications - Their use in Reliability and DNA Analysis, Lecture Notes in Statistics, volume 191, Springer, New York, 2008. R. Cont, P. Tankov, Financial modelling with Jump Processes, Chapman & Hall / CRC Press, 2003. Y. Kabanov, S. Pergamenshchikov, Two-Scale Stochastic Systems - Asymptotic Analysis and Control, Springer, Berlin Heidelberg, 2003. Profil souhaité du candidat à recruter Le candidat aura un niveau Master 2 de Recherche en mathématiques ou équivalent. Tout particulierement, il doit avoir des connaissances de calcul stochastique pour les processus stochastiques à sauts en temps continu, processus de Markov, méthodes statistiques asymptotiques, statistique paramétriques et non paramétriques. Des connaissances de programmation informatique seront appréciées. Experience aquise par le laboratoire d'accueil Le développement au sein du LMRS d'une recherche en statistique appliquée sur la thématique des algorithmes optimaux de traitement de données pour des systèmes complexes d'information aura une grande importance pour le laboratoire, à plusieurs niveaux. D'une part, cela permettra au LMRS de s'investir d'avantage dans une recherche importante du point de vue régional, dans le cadre du projet RISC du GRR TL-TI. Les outils statistiques développés pendant cette thèse pourront être à la base des coopérations futures entre notre laboratoire et d'autres partenaires régionaux. D'autre part, cette thèse sera l'occasion de développer des méthodes fondamentales qui sont à la base d'une analyse statistique des systèmes complexes d'information.