Proposition de sujet de thèse

Transcription

Proposition de sujet de thèse
Proposition de sujet de thèse
Titre
Algorithmes optimaux de traitement de données pour des systèmes complexes d'information
et télécommunication dans un environnement incertain
Laboratoire d'accueil
Laboratoire de mathématiques Raphael Salem, LMRS, UMR 6085, Université de Rouen,
Rouen, France
Financement
Allocation de recherche doctorale de la part de le Région Haute Normandie, France ; environ
1700 €/mois brut (environ 1400 €/mois net) pour 3 ans à partir de novembre 2013
Résumé
Les systèmes modernes d' information et de télécommunication sont caractérisés par la
complexité des outils employés et par l'augmentation des exigences concernant la qualité de la
transmission d'information. Afin d'assurer la fiabilité de ces systèmes il faut tenir compte des
conditions de transmission des messages, y compris de la présence du bruit généré par
différentes causes physiques. Nous proposons de construire des algorithmes efficaces de
traitement d'information stables par rapport au bruit et basés sur des méthodes statistiques non
asymptotiques développées pour des systèmes dynamiques stochastiques . L'originalité du
travail proposé vient du fait que nous traitons des modèles statistiques avec observations
dépendantes.
Encadrement
Vlad Barbu (maître de conférences, LMRS, Université de Rouen, [email protected])
Serge
Pergamenchtchikov
(professeur,
LMRS,
Université
de
Rouen,
[email protected])
Sujet
Les systèmes modernes d'information et de télécommunication sont caractérisés par la
complexité des outils employés et par l'augmentation des exigences concernant la qualité de la
transmission d'information. Afin d'assurer la fiabilité de ces systèmes il faut tenir compte des
conditions de transmission des messages, y compris de la présence du bruit généré par
différentes causes physiques. Ces multiples causes sont principalement dues à la complexité
intrinsèque des systèmes, d'une part, et à l'environnement incertain dans lequel ces systèmes
évoluent, d'autre part.
Tout cela nous ramène au besoin de construire des algorithmes efficaces de traitement
d'information qui sont stables par rapport au bruit. Comme ce bruit est généré par un
environnement incertain, le rôle crucial pour obtenir de tels algorithmes est joué par les
méthodes statistiques. Lors des dernières années, des méthodes d'analyse de données basées
sur des modèles dynamiques stochastiques se sont développées de manière intensive. Ces
modèles sont définis mathématiquement par des systèmes différentiels stochastiques (temps
continu) ou par des équations stochastiques en différences (temps discret). De telles
équations ont, comme toujours, des paramètres ou fonctions de structure inconnus.
L'application des méthodes statistiques traditionnelles aux systèmes complexes est souvent
entravée par le fait que la théorie statistique moderne pour des séries temporelles à
observations dépendantes, même dans des situations très simples, a un caractère
asymptotique, ce qui nécessite de tailles très grandes de données. Pour cette raison, l'emploi
des méthodes asymptotiques peut engendrer de fausses conclusions. C'est pour cela que la
construction de méthodes efficaces de traitement d'information basées sur une taille bornée
des données est de plus en plus actuelle. Dans ce projet nous proposons de développer des
méthodes statistiques non-asymptotiques basées sur l'approche d'analyse séquentielle et sur la
sélection de modèles pour des systèmes stochastiques complexes décrits par des équations
différentielles stochastiques avec des sauts, gouvernés par une composante semimarkovienne. Ceci représente une nouveauté dans la littérature, permettant de prendre en
compte la complexité accrue des systèmes.
L'originalité principale du travail proposé vient du fait que nous traitons des modèles
statistiques avec observations dépendantes.
Programme de travail
1ère année
- étude de la théorie de renouvellement (2 mois)
- étude de la convergence faible pour des suites de variables aléatoires dépendantes
(martingales, mélange) (3 mois)
- étude des processus semi-markoviens en temps discret (3 mois)
- étude des méthodes de simulation numérique de processus semi-markoviens à temps discret
(1 mois)
- étude des méthodes statistiques optimales pour des modèles semi-markoviens à temps
discret; cadre paramétrique et non paramétrique (3 mois)
2ème année
- développement de méthodes statistiques optimales pour des problèmes d'estimation du
noyau semi-markovien en temps discret ; cadre paramétrique et non paramétrique (6 mois)
- construction d'algorithmes efficaces de traitement de données représentées par des
processus semi-markoviens en temps discret (2 mois)
- étude de processus semi-markoviens en temps continu (2 mois)
- étude de méthodes de simulation numérique de processus semi-markoviens en temps
continu (2 mois)
3ème année
- développement de méthodes statistiques paramétriques et non paramétriques pour
l'estimation du noyau en temps continu ; construction des algorithmes associés (6 mois)
- étude numérique des algorithmes proposés, comparaison avec des méthodes existantes,
application sur des données réelles (6 mois)
Références
V. Barbu, N. Limnios, Semi-Markov Chains and Hidden Semi-Markov Models toward
Applications - Their use in Reliability and DNA Analysis, Lecture Notes in Statistics,
volume 191, Springer, New York, 2008.
R. Cont, P. Tankov, Financial modelling with Jump Processes, Chapman & Hall / CRC
Press, 2003.
Y. Kabanov, S. Pergamenshchikov, Two-Scale Stochastic Systems - Asymptotic Analysis and
Control, Springer, Berlin Heidelberg, 2003.
Profil souhaité du candidat à recruter
Le candidat aura un niveau Master 2 de Recherche en mathématiques ou équivalent. Tout
particulierement, il doit avoir des connaissances de calcul stochastique pour les processus
stochastiques à sauts en temps continu, processus de Markov, méthodes statistiques
asymptotiques, statistique paramétriques et non paramétriques. Des connaissances de
programmation informatique seront appréciées.
Experience aquise par le laboratoire d'accueil
Le développement au sein du LMRS d'une recherche en statistique appliquée sur la thématique
des algorithmes optimaux de traitement de données pour des systèmes complexes
d'information aura une grande importance pour le laboratoire, à plusieurs niveaux.
D'une part, cela permettra au LMRS de s'investir d'avantage dans une recherche importante du
point de vue régional, dans le cadre du projet RISC du GRR TL-TI. Les outils statistiques
développés pendant cette thèse pourront être à la base des coopérations futures entre notre
laboratoire et d'autres partenaires régionaux.
D'autre part, cette thèse sera l'occasion de développer des méthodes fondamentales qui sont à la
base d'une analyse statistique des systèmes complexes d'information.