Projets SSIR RSI-TSSI 2007/2008 Informations à - ISIR
Transcription
Projets SSIR RSI-TSSI 2007/2008 Informations à - ISIR
Projets SSIR RSI-TSSI 2007/2008 Remarques importantes : L’étudiant devra effectuer soit deux projets, un « bibliographique » et un « développement », soit un projet « bibliographique et développement ». Les mêmes sujets peuvent être choisis par plusieurs étudiants. Le travail pourra alors être réalisé individuellement ou en binôme (après accord du contact enseignant). Les étudiants peuvent aussi proposer des sujets de projet personnels. Dans ce cas, ils doivent les soumettre à l’approbation du responsable de l’UE projets, puis déterminer un contact enseignant (qui sera en charge de l’encadrement et de l’évaluation du projet). Afin d’obtenir plus de renseignements sur certains sujets proposés, il vous est vivement recommandé de vous mettre en relation par email avec les enseignants correspondants avant de faire votre choix. Chaque étudiant devra fournir une liste d’au moins 3 vœux ordonnés de sujets de projet avant le 10 janvier 2008 au responsable des UE projets : Xavier CLADY, [email protected] Informations à transmettre pour les vœux de projets : NOM : Prénom : Formation (RSI ou TSSI): bibliographique 1er vœu 2e vœu 3e vœu 4e vœu Si vous proposez un (des) projet(s) personnel(s) : Titre : Contact enseignant désiré : Type (bibliographique ou/et développement) : Description ( 5 à 10 lignes environ) : développement PROPOSITIONS DE SUJET Sujet 1 : Implémentation d'un module de commande prédictive linéaire pour un mannequin virtuel Contact : Olivier Sigaud, professeur UPMC ([email protected]) Type : développement La commande prédictive semble un bon modèle pour la commande motrice humaine. Dans le cadre de nos travaux sur l'apprentissage de la commande motrice humaine, nous souhaitons mettre en place un module de commande prédictive dans le cas où la dynamique du système est approchée par un modèle linéaire. L'objet du travail consistera à réaliser l'implémentation de cette commande en s'appuyant sur une formalisation pré-existante et sur une boîte à outil destinée spécifiquement à ce type d'usage, puis à mener quelques expérimentations de validation dans des cas simples. Sujet 2 : Evaluation et amélioration d’un détecteur de voyelles pour la reconnaissance d’émotions Contact : [email protected] Type : bibliographique & développement Un système de détection automatique de voyelles a été développé au sein de l’ISIR. Celui-ci s’appuie sur un algorithme de segmentation de la parole en unité du discours. Il a été testé avec succès sur des corpus de parole anglais et allemand, et est actuellement utilisé comme support d’analyse de diverses émotions primaires (joie, tristesse, colère, …), en contexte multilingue (allemand et danois). Afin d’évaluer le détecteur de voyelles sur le corpus danois, nous vous proposons de réaliser un programme de transcription des données phonétiques contenues dans ce corpus (transcription : phonème → silence/voyelle/consonne, programme d’évaluation fourni). Ces résultats seront ensuite analysés selon le contenu linguistique des corpus étudiés. Une amélioration du système pourra également être envisagé, par l’implémentation de critères supplémentaires portants sur la mesure conjointe des trajectoires des formants et de leur énergie. Le projet pourra déboucher sur un stage. Mots clefs : Traitement automatique de la parole, analyse de corpus multilingue, détection de voyelles, trajectoires formantiques. Sujet 3 : Etude de motifs prosodiques pour la reconnaissance d’émotions en contexte multilingue Contact : [email protected] Type : bibliographique & développement La prosodie décrit la façon dont un locuteur transmet son message oral, et renseigne de ce fait sur bon nombre d’informations de différentes natures qui lui sont propres (style discursif, état émotionnel, condition physique, etc.). Les systèmes de reconnaissance d’émotions actuels reposent pour une grande majorité sur l’étude statistique de paramètres prosodiques tels que le pitch (hauteur de voix), l’énergie et la durée des sons produits. Bien que ces études produisent de bons résultats (~ 80%), elles ne prennent toutefois pas en compte certaines caractéristiques du discours, puisque peu d’entres elles s’intéressent aux motifs formés par ces paramètres prosodiques. Dans ce sens, nous vous proposons d’étudier, via des modèles probabilistes de type n-gram, l’intérêt et la robustesse des enchaînements d’unités prosodiques dans une tâche de reconnaissance automatique d’émotions, en contexte multilingue (Ces unités vous seront fournies, ainsi que les algorithmes ngram). Le projet pourra déboucher sur un stage. Mots clefs : Traitement automatique de la parole, reconnaissance automatique d’émotions en contexte multilingue, modélisation de la prosodie - prosody modeling, modèles probabilistes. Sujet 4 : Infant and Robot Directed Speech Contact : Mohamed Chetouani ([email protected]) Type : bibliographique & développement La robotique sociale vise à mettre en œuvre des robots interagissant de manière naturelle avec les humains. La conception de ces robots est aussi importante que leurs capacités d’interaction. En effet, nos interactions verbales ou non verbales vont différer selon la morphologie du robot. Des comportements similaires sont observés lors de l’interaction avec des enfants ou des adultes. Avec des enfants, nous utilisons un registre de parole simplifié (vocabulaire) et modulé (exagération des phonèmes et de la prosodie) alors qu’avec des adultes, notre registre est beaucoup plus complexe. Nous proposons dans ce projet de caractériser et de comparer les interactions que l’on peut avoir avec un bébé (infant-directed speech) de celles que l’on peut avoir avec un robot social KISMET (robot-directed speech). Après une étude bibliographique des interactions ainsi que des méthodes de caractérisation, il s’agira de développer un algorithme de détection d’unités prosodiques saillantes. Les premières unités reconnues par le bébé sont justement ces unités prosodiques viennent ensuite les voyelles, puis les syllabes. La mise en œuvre des algorithmes développés se fera sur le robot AIBO. Sujet 5: Analyse des expressions faciales Contact : Lionel Prévost, [email protected] Type : bibliographie La communication humaine passe par les voies verbale (le discours) et non verbales (le ton, les gestes, les expressions faciales, le regard). Des études ont montré que la modalité verbale véhicule moins de 10% des « messages » que nous transmettons en communiquant. Parmi les modalités non verbales, les émotions faciales (peur, joie, dégout …) sont un puissant vecteur de communication qu’il convient d’analyser et de mettre en relation avec les autres modalités. L’objectif du projet est d’établir une liste des équipes de recherche (nationales et internationales) travaillant sur le sujet et un panorama des principales méthodes mises en œuvre pour résoudre ce problème. Sujet 6 : Capture et traitement d’images pour robot préhenseur Type : développement Contact : Guillaume Walck ([email protected]) Dans le cadre de la saisie d'objets dans un environnement complexe par une main robotisée, un robot muni d'une pince surmontée par une mini-caméra (in-hand camera) "découvre" l'objet à saisir en effectuant une trajectoire autour de ce dernier pour capturer des images. La capture d'une image et le relevé de la position de la caméra doivent être fait simultanément pour permettre une calibration de l'ensemble grâce aux mesures du robot et ainsi procéder à la reconstruction 3D de l'objet. Le projet consiste donc tout d'abord à développer un ensemble de fonctions en C/C++ sous Linux pour capturer des images d'une caméra industrielle Sony XCDV50CR sur bus ieee1394a/b (firewire). Il faudra notamment pouvoir "déclencher" la prise de vue à un instant précis au moyen de commandes respectant le standard DCAM (bibliothèques libdc1394 et libraw1394) et pouvoir récupérer les images du buffer de la caméra. Une validation du processus de capture pourra être mise en place (images d'un chronomètre en marche ou d'un plateau tournant par exemple) Dans un second temps, l'étudiant construira une mini-application de traitement d'image permettant principalement d'extraire la position d'une "boite enveloppante" (bounding box) autour d'un objet de l'image suivant divers critères (couleur, luminosité etc...) en s'aidant de la bibliothèque OpenCV. La maitrise du C/C++ est indispensable et les connaissances de développement sous linux sont vivement souhaitées Sujet 7 : Programmation dynamique et appariement dense d’images. Contact : Edwige Pissaloux, [email protected], Eléanor Fontaine, [email protected] Type : développement Le but de ce stage est de développer une version Windows de l’algorithme (déjà) implanté en C (environ 400 lignes), et de la tester sur des images réelles. L’algorithme détaillé et la documentation seront à réaliser. Sujet 8 : Appariement : image –carte IGN Contact : Edwige Pissaloux, [email protected], [email protected] Type : bibliographique Eléanor Fontaine, Le but de ce projet est de faire une étude bibliographique sur différentes méthodes existantes de l’appariement des images de scènes urbaines avec données fournies par des cartes IGN. Sujet 9 : Appariement : dessin – modèles de figures géométriques. Contact : Edwige Pissaloux, [email protected], Eléanor Fontaine, [email protected] Type : bibliographique Le but de ce projet est de faire une étude bibliographique sur différentes méthodes existantes de l’appariement des images réalisées à la main avec leurs modèles géométriques idéaux. Sujet 10 : Modèle de vision chez des vertébrés simples. Contact : Edwige Pissaloux, [email protected], [email protected] Type : bibliographique Eléanor Fontaine, Le but de ce TER bibliographique est d’étudier les schémas perceptuels de l’environnement chez crapauds proposés par Arbib (lecture et analyse critique de l’article de Cliff, D., Computational ethology, in Handbook of Brain Theory and Neural Netoworks, 2nd ed, M.A. Arbib (ed) MIT Press, 2003). Sujet 11 : Etude de la forme des lèvres en fonction du phonème produit par un locuteur en français Contact : M.Milgram ([email protected]) Type : bibliographique et développement A partir de plusieurs séquences vidéos d'une personne (avec les lèvres teintes en bleu) prononçant certains phonèmes, on extraira des points sur les lèvres pour avoir une "vérité terrain" (donc habileté en Traitement des Images) ; on cherchera ensuite à caractériser les formes obtenues (donc la position des lèvres) en fonction du phonème produit. Typiquement, on se contentera de mesurer l'ouverture, l'élongation horizontale et éventuellement la protusion et de travailler sur les voyelles Sujet 12 : Recouvrement de la profondeur d’une scène 3D. Contact : Edwige Pissaloux, [email protected], Eléanor [email protected] Type : développement Fontaine, Le but de ce TER « développement » est d’apporter quelques modifications à l’affichage des images de recouvrement de la profondeur d’une scène 3D réalisée à l’aide de la triangulation de Delaunay (utilisation de la bibliothèque OpenCV et de Matlab). Sujet 13 : Localisation d’objet par suivi du regard et du geste Contact : Xavier Clady ([email protected]) Type : bibliographique et développement. Lors du mouvement de préhension d’un objet, un homme dirige sa main et son regard vers l’objet. Aussi en triangulant les données concernant la direction du geste et celle du regard, on devrait être capable de localiser dans l’espace, la position de l’objet. Le but de ce projet sera donc d’utiliser des systèmes de suivi de regard et de mains fournis afin de vérifier cette hypothèse. La bibliographie qui lui sera adjointe consistera en une étude des systèmes qui mixent analyse du geste et du regard, prioritairement ceux qui se situent dans ce même domaine (quelques références seront fournies par l’encadrant comme point de départ). Sujet 14 : Robot d’assistance à personnes âgées à domicile ou en milieu hospitalier. Contact : Xavier Clady ([email protected]) Type : bibliographique L'essence de ce projet est de proposer un robot d'assistance à personnes âgées (ou simplement médicalisées) ayant besoin d'être constamment reliées à un appareillage médical (bouteilles d'oxygène, goutte-à-goutte, etc.). La tendance actuelle est de miniaturiser au maximum ce type d'appareillage afin que la personne âgée puisse l'embarquer sur soi (dans une veste spéciale, etc.). Cependant, ceci n'est efficace essentiellement que pour les appareils électroniques. Quant il s'agit de fournir un produit en grande quantité (oxygène,...), il faut recourir à solution déportée. Or cela s'avère très handicapant et très encombrant (poids, maniabilité) pour la personne âgée si elle se déplace en dehors de son domicile ou de sa chambre d'hôpital. L'idée est donc de proposer un robot qui se chargerait de transporter l'appareil médical tout en restant « à portée filaire » de la personne âgée lors de ses déplacement. Par exemple, une personne âgée devant être constamment sous oxygène (suite à une crise cardiaque ou des problèmes pulmonaires), si elle veut quitter son appartement, soit elle doit le faire que pendant une courte durée (une ou deux heures ; durée limitée par l'autonomie de la réserve d'oxygène qu'elle est capable de transporter elle-même), soit, pour des durées plus longues (un ou plusieurs jours - séjour en famille, etc.), elle doit recourir constamment à l'assistance d'une autre personne pour transporter une bouteille trop lourde pour elle d'un endroit à l'autre (cela peut être simplement d'aller du salon à la table à manger,...). Il y a donc une perte complète de l'autonomie de la personne âgée dans ses déplacements. Le robot, que nous voulons proposer, permettrait de restaurer une autonomie, même que partiellement. Attention, ce projet demande aux étudiants intéressés de grandes capacités de créativité et d’autonomie, ainsi qu'un fort esprit de synthèse. En effet, il s'agira d'analyser et décomposer le problème (mécanique, perception, navigation, planification, contrôle,...), puis de bien identifier et formaliser les verrous technologiques, techniques et méthodologiques et de proposer des pistes de résolution de ces verrous, en s'appuyant sur une solide recherche bibliographique. Ce sujet peut s'adresser à une équipe d'étudiants ou à un seul. Selon ses goûts et ses connaissances, chaque étudiant pourra se focaliser uniquement sur un point en particulier : navigation du robot (localisation du robot/obstacles/personne, détermination d'une trajectoire d'un robot suiveur), asservissement d'un robot suiveur (sur les mouvements de la personne), modélisation mécanique de la liaison robot-personne (conception, capteur de force, modélisation des efforts,...), systèmes de perception (choix des capteurs, mise en oeuvre,...), etc. Il est important de bien argumenter chaque problème et inventorier les différentes solutions potentielles, en soulignant leurs points forts et leurs points faibles (contraintes, limitations, mise en oeuvre, coût,...). Les recherches entreprises dans le cadre des robots Nursebot du CMU, Wakamaru de Mitsubishi et Peoplebot de Robosoft, pourront servir de base à cette étude, bien qu'elles n'y répondent pas spécifiquement. Sujet 15 : Méthodes à base de « bag of features ». Contact : Xavier Clady ([email protected]) Type : bibliographique Récemment, une technique, appelée « bag of features », est devenue très populaire dans le domaine de la caractérisation automatique d’images (classer des images nonlabélisées en fonction de leur contenu : si elle contient certains objets tels des voitures, de personnes, des bicyclettes,…). Cette technique est simple à mettre en œuvre et obtient de bonnes performances, en dépit d’une grande variabilité d’objets, de poses, d’occlusion, de scènes et d’éclairages. Elle ne requiert de plus aucun modèle géométrique global de l’objet. Cette technique a été aussi étendue à la détection et la localisation d’objets. L’étude bibliographique demandée consistera à répertorier un maximum d’articles utilisant cette technique récente (depuis 2005) et à en identifier les évolutions récentes (voire en déduire les défis futurs). Sujet 16 : Capteurs fovéaux, capteurs de résolution variable quelconque. Contact : Sio-Hoï Ieng ([email protected]) Type : bibliographique. La vision robotique s'oriente progressivement vers des applications de plus en plus exigeantes en précision et rapidité d'acquisition. Ce projet se propose d'examiner les travaux menés sur le problème des capteurs de résolution spatiale variable, reconfigurable ou non. L'objectif est de proposer un panorama des techniques existantes et des applications, auxquelles elles sont prédestinées. Sujet 17 : Systèmes d’inspection visuelle, multi-vues et automatique. Contact : Xavier Clady ([email protected]) Type : bibliographique. Sur la base d’un ensemble d’articles fournis par l’encadrant, l’étudiant devra faire une comparaison des différents systèmes d’inspection visuelle d’objets manufacturés (détection de défauts) à base de vision. Sujet 18 : Descripteurs visuels pour la détection de véhicules en vision embarquée. Contact : Xavier Clady ([email protected]), Lionel Prévost ([email protected]) Type : développement. Nous avons développé un algorithme de détection de véhicules sur des images embarquées, en utilisant certains descripteurs visuels (Haar/discriminant et Histogramme de Gradients Orientés/génératif). L’étudiant devra implémenter et tester d’autres descripteurs dans cet algorithme (pratique du C/C++ requise). Sujet 19 : Détection de véhicules : méthode de clustering. Contact : Xavier Clady ([email protected]), Lionel ([email protected]) Type : développement. Prévost L’étudiant devra intégrer une méthode de clustering (k-means certainement) dans un algorithme de détection de véhicules (pratique du C/C++ requise). Sujet 20 : La rééducation avec Robot: Méthodes et commandes. Contact : Viviane Pasqui ([email protected]) Type : bibliographique. La rééducation pour certaines pathologies, comme l'hémiplégie, la sclérose en plaques, la paraplégie, etc., est fondée sur la répétition de gestes que le patient ne peut plus exécuter seul. Cette répétition permet, a minima d'entretenir les fonctions physiologiques et de fait de minimiser l'apparition de complications et, dans l'idéal, de retrouver l'intégralité de la fonction. Les robots permettent de reproduire, un grand nombre de fois, un même geste avec précision et sans lassitude. De plus, leur présence peut motiver, voire rassurer le patient. Les robots sont donc rentrés par la grande porte (vue leur taille!!) des salles de rééducation. Il s'agit dans le cadre de ce projet de faire une liste des systèmes robotiques utilisés pour la rééducation. Cette liste tiendra compte de différentes caractéristiques comme : les fonctions à rééduquer visées, les méthodes de rééducation, les commandes mises en oeuvre, les évaluations cliniques faîtes, la commercialisation,… Sujet 21 : Evaluation de la programmation génétique pour la biomécanique de la verticalisation. Contact : Ludovic Saint-Bauzel ([email protected]) Type : bibliographique et développement L'étudiant devra faire une petite bibliographie sur la programmation génétique puis au regard de cette dernière implémenter cette méthode pour essayer de contrôler un modèle 3R plan (représentation d'une personne dans le plan sagittal) afin qu'il ressemble à un comportement enregistré de verticalisation sur des personnes saines. Sujet 22 : Développement d’un suivi de personnes. Contact : Catherine Achard ([email protected]) Type : développement Ce projet a pour but de suivre des personnes dans une scène en temps réel. L'algorithme utilisé sera composé de plusieurs parties. Tout d'abord une détection des zones en mouvement par soustraction d'une image de "fond", puis une recherche de visage dans la scène (algorithme fourni) afin de retrouver les personnes et les suivre au cours de la séquence. Cet algorithme devra être mis en place sous openCV, et fonctionner en temps réel à partir d'une webcam. Il nécessite donc une bonne connaissance des langages C et C++. Sujet 23 : Modèle d'apparence pour la reconnaissance et le suivi de personnes. Contact : Catherine Achard ([email protected]) Type : bibliographique De plus en plus d'applications demandent de suivre des personnes ou des objets à travers des caméras dont les champs ne se recouvrent pas. Il est alors nécessaire de construire une signature caractérisant le passage de la personne afin de pouvoir la retrouver dans d'autres séquences d'images. Bien des problèmes apparaissent comme les changements d'éclairage, de points de vue, ... Des travaux très récents abordent cette nouvelle problématique et je propose, à travers cette étude bibliographique, d'en faire une synthèse. Sujet 24 : Stéréovision pour le comptage de personnes. Contact : Maurice Milgram ([email protected]), ([email protected]) Type : développement Catherine Achard Compter des personnes qui passent sous une caméra n'est pas trop compliqué, si les conditions d'éclairages sont stables, si les personnes ne sont pas "en contact" etavec des caméras filmant la scène vue d'en haut. L’objectif de ce projet est d'utiliser deux caméras pour capter le flux vidéo, puis de recourir à un calcul de disparité restreinte (connaissant approximativement la disparité associée aux têtes puisqu'on connaît leur hauteur approximative). L’étudiant disposera de codes de calcul de disparité, développés (en MatLab) au sein du laboratoire, ainsi que des codes de suivi. Il devra les combiner et en tester le résultat sur des séquences. Sujet 25 : Mise au point d'un "détecteur de publicité" pour la radio FM. Contact : Bruce Denby, professeur UPMC ( [email protected]) Type : bibliographique et développement Notre groupe a developpé le "Navigateur Multimédia Radiologicielle" qui applique des algorithmes d'indexage audio à la bande radio FM. Les premiers tests d'un discriminateur musique/parole avec ce navigateur se sont montrés peu satisfaisants à cause des nombreuses annonces publicitaires présentes sur la bande FM. Dans ce projet, l'étudiant appliquera les techniques de traitement du signal et de reconnaissance de formes à une base contenant des clips de musique, de parole, et de publicités, afin de réaliser un "détecteur de publicité" basé sur les caracteristiques spectrales et temporelles des signaux audio. Le projet pourra continuer en stage sur un sujet connexe. Sujet 26 : Apprentissage Semi-Supervisé pour la Localisation dans des Réseaux WiFi. Contact : Bruce Denby, professeur UPMC ( [email protected]), Yacine Oussar Type : bibliographique et développement Il y a récemment un intérêt accru en localisation automatique des personnes et d'objets par la méthode de "radio fingerprint," dans laquelle la localisation se fait en comparant l'environnment radio actuel avec une base de mesures étiquetées de ses coordonnées GPS. Tout en donnant de bons résultats, la difficulté d'obtenir la base d'apprentissage a freiné le déploiement de cette méthode. Une solution possible est l'utilisation de techniques d'apprentissage "semi-supervisé," dans lesquels seul une fraction réduite des données ont besoin d'être étiquetées. Le projet propose d'exploiter une base de données WiFi pour expérimenter les techniques d'apprentissage semi-supervisé. L'étudiant fera d'abord une étude bibliographique de ces méthodes, puis implémentera une méthode originale et évaluera ses performances en les comparant à des résultats existants sur la même base de données. Le projet pourra continuer en stage sur un sujet connexe. Sujet 27 : Application de la Radio Logicielle à la RFID Contact : Bruce Denby, professeur UPMC ([email protected] ) Type : bibliographique et développement L'étiquetage des produits et des objets du monde avec des "tags" RFID devient de plus en plus répandu. En même temps l'existence de plusieurs normes RFID aux fréquence et protocoles différents rend difficile l'interopérabilité des systèmes. La "radio logicielle," dans laquelle le signal radio est numérisé en début de chaine et tout traitement est fait en soft, a été proposé comme solution pour adresser l'interobérabilité des normes de télécommunication - GSM, UMTS, WiFi, etc.. Toutefois, on trouve dans la littérature peu d'application de la radio logicielle à la RFID, où elle pourra sans doute aussi se montrer très intéressante. Le projet consistera en une étude bibliographique du fonctionnement de la RFID et une recherche de possibles applications existantes de a radio logicielle à la RFID. Ensuite, l'étudiant dévéloppera un petit simulateur logiciel (Matlab) RFID et exploréra la possibilité d'appliquer certaines techniques de la radio logicielle, par exemple le souséchantillonnage. Le projet pourra continuer en stage sur un sujet connexe. Sujet 28 : Localisation en temps réel du visage et des lèvres d'un locuteur pour le projet d'interface de communication silencieuse Ouisper Contact : Bruce Denby ([email protected]), Thomas Hueber Type : bibliographique et développement Le projet Ouisper vise à réaliser un système de synthèse de la parole à partir d'imagerie ultrasonore et optique de l'appareil vocal pour des personnes ayant perdu l'usage de leurs cordes vocales. Le dispositif envisagé s'appuie notamment sur le suivi des lèvres du locuteur. En laboratoire, il est aisé de fixer la tête de ce dernier ; la localisation des lèvres dans l'image ne présente donc aucune difficulté. Cependant, cette tâche est un véritable enjeu pour la réalisation d'un système mobile « réaliste ». L'objectif de ce projet est donc la conception et l'évaluation d'une méthode de localisation des lèvres d'un locuteur, dans un flux vidéo temps réel. La méthode proposée sera implémentée au sein du logiciel d'acquisition et de traitement Ultraspeech, développé au laboratoire d'électronique de l'ESPCI. L'implémentation s'effectuera en langage C et sera facilitée par l'utilisation de la bibliothèque de traitement d'image OpenCV développée par Intel. Le projet pourra continuer en stage sur un sujet connexe. Ouisper Website - http://www.neurones.espci.fr/ouisper/ Librairie OpenCV - http://opencvlibrary.sourceforge.net/ Sujet 29 : Développement d'un système électronique embarqué permettant l'estimation de son propre mouvement dans l'espace pour le projet d'interface de communication silencieuse Ouisper Contact : Bruce Denby ( [email protected]), Thomas Hueber Type : bibliographique et développement Le projet Ouisper vise à réaliser un système de synthèse de la parole à partir d'imagerie ultrasonore et optique de l'appareil vocal pour des personnes ayant perdu l'usage de leurs cordes vocales. Actuellement, le protocole d'acquisition des données d'étude requiert l'immobilisation de la tête du locuteur. Dans le cadre du prototype envisagé, le locuteur tiendrait « lui-même » un dispositif intégrant la sonde échographique. On se propose de détecter et de quantifier le mouvement relatif de la sonde échographique à l'aide d'un dispositif électronique embarqué. Au cours du projet, l'étudiant devra concevoir et réaliser une carte électronique réalisant l'interface entre une série de capteurs de position (accéléromètres, magnétomètre, …) et un PC. Ces informations seront utilisées pour recadrer l'image ultrasonore dans un référentiel fixe par rapport à la tête du locuteur. Ouisper Website - http://www.neurones.espci.fr/ouisper/ Sujet 30 : Méthode de détection des mouvements des lèvres Contact : Bruce Denby, professeur UPMC ([email protected]), Angélique Amelot Type : bibliographique et développement Le sujet proposé s'insère dans le cadre du projet OUISPER. Ce projet consiste a faire de la reconnaissance de parole à partir de mouvements articulatoires : articulation labiale et linguale, sans activation des plis vocaux. Le travail s'effectuera en collaboration avec les membres du projet et au sein du Laboratoire d'éElectronique. Le traitement des images montrant les mouvements des lèvres à partir de séquences vidéo est une application importante tant en reconnaissance de la parole qu'en phonétique, les lèvres ayant une part active dans le processus langagier. Dans un premier temps, le candidat devra faire une recherche bibliographique sur les méthodes disponibles pour le traitement des images montrant les mouvements des lèvres (méthode des lèvres bleues à l'ICP de Grenoble, méthode de suivi de point à l'ENST et au LPP de Paris,…). Dans un second temps et en gardant à l'esprit que le projet OUISPER à pour but de développer une méthode souple et adapter à tous, le candidat devra proposer de nouvelles pistes (par exemple lumière blanche) permettant de traquer le plus efficacement possible les mouvements des lèvres avec le plus de contraste possible et en éliminant autant que faire se peut les problèmes d'ombre. Sujet 31 : Estimation de la de robustesse d'une station d'acquisition ultrason Contact : Bruce Denby, professeur UPMC ([email protected]), Angélique Amelot Type : bibliographique et développement Le sujet proposé s'insère dans le cadre du projet OUISPER. Ce projet consiste a faire de la reconnaissance de parole à partir de mouvements articulatoires : articulation labiale et linguale, sans activation des plis vocaux. Le travail s'effectuera en collaboration avec les membres du projet et au sein du Laboratoire d'Electronique. L'enregistrement d'importants corpus de données articulatoires à partir d'un système ultrason est une priorité du projet et pour cela il est nécessaire d'utiliser un système d'acquisition adéquate et de tester sa robustesse. Les données issues d'un système ultrason donnent une indication des mouvements de la langue et il est ensuite possible d'extraire les mouvements articulatoires à partir des images fournies par le système ultrason. Cependant, les analyses nécessitent que la configuration du conduit vocal soit similaire au début et à la fin de l'enregistrement (ce qui passe par une position stable du locuteur et de la sonde). La priorité pour ce type de données est de pouvoir limiter ou de déterminer l'ampleur des mouvements du sujet. Dans un premier temps, le candidat devra faire une recherche bibliographique sur les problèmes posés par les données Ultrasons notamment en terme de suivis de contour (cf. Maureen Stone). Dans un second temps en se basant sur les travaux de Barillas et al. (2007), et à partir d'un corpus d'environ 10 minutes, d'estimer la robustesse de la station d'acquisition ultrason. Sujet 32 : Vérification de la synchronisation de données Ultrason, audio et vidéo Contact : Bruce Denby, professeur UPMC ([email protected]), Angélique Amelot Type : bibliographique et développement Le sujet proposé s'insère dans le cadre du projet OUISPER. Ce projet consiste a faire de la reconnaissance de parole à partir de mouvements articulatoires : articulation labiale et linguale, sans activation des plis vocaux. Le travail s'effectuera en collaboration avec les membres du projet et au sein du Laboratoire d'Electronique. Une station d'acquisition de données ultrason (permettant d'enregistrer les mouvements de la langue) et de données vidéo (permettant d'enregistrer les mouvements des lèvres) a été élaborée pour pouvoir enregistrer simultanément des flux audio, video et ultrason. Le candidat devra vérifier la synchronisation des trois flux acquis lors d'un enregistrement de parole. Après avoir construit un corpus adapté soit en terme de synchronisation labiale et en terme de synchronisation ultrason trouver une méthode pour vérifier la synchronisation des différents flux. Sujet 33 : Localisation et cartographie basées vision pour les drones Type de projet : bibliographie Contact : Adrien Angeli ([email protected]), Stéphane Doncieux ([email protected]) En robotique, les algorithmes de SLAM (Simultaneous Localization And Mapping) sont couramment utilisés pour permettre la localisation d'un robot dans son environnement sans informations a priori sur celui-ci et uniquement sur la base des capteurs embarqués sur le robot. Récemment, de nombreux algorithmes de SLAM basés vision ont été développés dont certains (e.g. [Davison2003]) ont été mis à disposition sous forme de license GPL. La solution proposée dans [Davison2003] permet de localiser une caméra tenue à la main en temps réel. En disposant la caméra sur un drone, il serait en théorie possible de localiser celui-ci en temps réel. Cependant, l'algorithme de SLAM proposé dans [Davison2003] repose sur un modèle de déplacement de la caméra qui n'est pas adapté à la dynamique d'un drone. Le but de ce projet est donc d'essayer de trouver par quels moyens cette contrainte peut être levée. Deux axes de recherche sont à privilégier ici : - l'utilisation d'une centrale inertielle pour permettre une observation locale du déplacement du drone [Davison2007] - la mise en place d'une méthode de filtrage plus adaptée à la dynamique du drone pour remplacer "l'Extended Kalman Filter, EKF" (on envisage notament l'utilisation d'un "Unscented Kalman Filter, UKF") Par une étude bibliographique, le projet devra permettre de faire le point sur les méthodes existant et mettant en oeuvre au moins une des deux alternatives proposées. Sujet 34 : Evitement d'obstacles pour un drone en milieu intérieur. Type de projet: Bibliographie Contact : Stéphane Doncieux ([email protected]), Adrien Angeli ([email protected]) Le développement récent de petits hélicoptères bi-rotors à hélices contra-rotatives rend désormais envisageable l'utilisation de drones en environnement intérieur. L'encombrement de ce type d'environnement rend indispensable la capacité à éviter des obstacles efficacement. Le but de ce projet est de faire une étude bibliographique sur cette problématique dans le contexte de drones de petite taille. Les différents capteurs et stratégies possibles seront identifiées et répertoriées. Les critères déterminants seront l'encombrement, la consommation énergétique et les capacités de calcul requises. Les technologies à étudier seront, par exemple, celles basées sur le flux optique [Muratet 2005] ou sur des capteurs infra-rouge [Roberts2007]. L'étude pourra intégrer des capteurs panoramiques ou des capteurs plus récents. Sujet 35 : Asservissement visuel pour un drone en milieu intérieur. Type de projet: Bibliographie Contact : Adrien Angeli ([email protected]), Stéphane Doncieux ([email protected]) Le développement de mini-drones capables d'évoluer en milieu intérieur permet d'envisager de nouvelles applications comme la surveillance d'un site ou l'exploration d'une zone accidentée d'accès dangereux. Ces applications nécessitent de pouvoir positioner le drone avec précision sur des cibles visuelles afin qu'un opérateur puisse en extraire les informations pertinentes. Dans cette optique, les différentes stratégies d'asservissement visuel seront identifiées et répertoriées. Les critères déterminants seront les capacités de calcul requises ainsi que les contraintes de la méthode, comme par exemple le nombre de degrés de liberté pouvant être pris en compte, le type de cible pouvant être utilisée pour l'asservissement (e.g. plan texturé, objet complexe...), ou encore la complexité (essentiellement en termes de mise en oeuvre pratique) du contrôleur proposé. Un exemple de technologie visée est l'ESM (http://esm.gforge.inria.fr/). Sujet 36 : reconstruction de mouvements humains et simulation Type de projet : Bibliographie et développement Contact : Bertrand Bru ([email protected]) et Sébastien Barthélemy ([email protected]) On s'intéresse à la reconstruction de mouvements humains à partir de données issues de capteurs optiques (type Viccon, codamotion) et éventuellement de capteurs d'efforts. Les techniques actuelles reconstruisent la cinématique du mouvement, mais rien ne garantit que le mouvement résultant respecte les lois de la mécanique : très souvent dans le mouvement reconstruit, le personnage plane au dessus du sol ou au contraire y est légèrement enfoncé. Nous souhaitons améliorer ces techniques pour proposer une solution plus complète : reconstruction à partir des capteurs optiques, détection de la présence des contacts par capteur d'effort, modification a posteriori du mouvement pour satisfaire les conditions de contact, utilisation de ce mouvement comme consigne en simulation L'étudiant devra améliorer la méthode de reconstruction : nous disposons déjà d'une méthode de reconstruction frame par frame par moindres carrés, et nous souhaitons évaluer l'intérêt de fitter des splines sur les données, déterminer une heuristique pour la détection de la présence de contact (logique floue ?), implémenter la méthode dans arboris et l'évaluer à partir de données issues de mouvements préenregistrés, puis reproduire ces mouvements en simulation (le simulateur et la loi de contrôle seront fournis). Un très bon niveau de programmation matlab est requis ainsi qu'un bon niveau en mécanique du solide. Merci de nous contacter avant le choix définitif pour s'assurer de l'adéquation entre le candidat et le sujet. Sujet 37 : Développement de l'interface graphique d'arboris Contact : Sébastien Barthélemy ([email protected]) Type : bibliographie et développement Le laboratoire ISIR et le CEA développent Arboris, un simulateur dédié à la robotique. Arboris est programmé sous Matlab. Nous souhaitons développer une interface graphique pour la génération de trajectoire. Ce sujet présente deux difficultés théoriques que l'étudiant devra étudier à partir de la bibliographie fournie : comment interpoler des déplacements de solides et comment, à partir d'une interface 2d (écran et souris) l'utilisateur peut-il spécifier des mouvements 6d (translation et rotation). L'étudiant devra ensuite implémenter les méthodes retenues sous arboris. Un très bon niveau de programmation matlab et requis, ainsi qu'un bon niveau mathématique. Merci de nous contacter avant le choix définitif pour s'assurer de l'adéquation entre le candidat et le sujet. Sujet 38 : Création de TP de robotique arboris Contact : Sébastien Barthélemy ([email protected]) Type : bibliographie et développement Le laboratoire et le CEA développent Arboris, un simulateur dédié à la robotique. Arboris est programmé sous Matlab. Nous souhaitons développer des applications pédagogiques à partir de ce simulateur : TP et/ou démonstrations. L'étudiant devra - étudier et comprendre 3 méthodes de contrôle de robot à illustrer en TP ou démon (le choix n'est pas encore complètement arrêté), - les implémenter dans arboris il faudra notamment, modéliser des robots industriels (puma, staubli), programmer la loi de contrôle, programmer les interfaces graphiques nécessaires. Arboris est programmé sous matlab. Un très bon niveau de programmation matlab est requis. Ainsi qu'un bon niveau en mécanique / robotique / automatique. Merci de nous contacter avant le choix définitif pour s'assurer de l'adéquation entre le candidat et le sujet et discuter des exemples qu'il souhaite implémenter. Sujet 39 : Estimation de la pose du visage Contact : Kevin Bailly, [email protected] Type : bibliographie et/ou développement Dans le cadre du Programme International pour le Langage de l’Enfant (en partenariat avec l’hôpital Necker Enfants Malades et la fondation EADS), nous analysons les regards et les mouvements des mains de bébés filmés par un réseau de caméras. L’estimation de la pose (position et orientation) de la tête dans une image est une étape clé dans notre étude et pour de nombreuses autres applications orientées visage (biométrie, analyse d’expressions, interfaces homme machine, suivi de regard,…). L’objectif du projet bibliographique est de faire une synthèse des travaux existants dans ce domaine (des références seront fournies par l’encadrant). L’aspect développement concerne la mise en œuvre des méthodes les plus performantes. Elles seront testées sur des séquences de bébés acquises lors du programme PILE. Les développements seront effectués indifféremment en Matlab ou en C/C++. Sujet 40 : caractérisation spectrale non-paramétrique Contact : Jean-Luc Zarader, [email protected] Type : développement Ce travail se place dans le cadre de la séparation de sources audio et plus spécifiquement de signaux issus d'instruments de musique. D'un point de vue pratique, l'objectif est de mettre en oeuvre une technique de caractérisation spectrale non-paramétrique (SFFT, ondelettes,WV,..) de ces signaux suivi d'une technique de classification. On se placera dans le cas monophonique ( 1 seul instrument à la fois) Sujet 41 : séparation de sources audio en musique Contact : Jean-Luc Zarader, [email protected] Type : développement Ce travail se place dans le cadre de la séparation de sources audio et plus spécifiquement de signaux issus d'instruments de musique. D'un point de vue pratique, l'objectif est de mettre en oeuvre une technique de caractérisation paramétrique (LMS, NLMS, RML,..) de ces signaux suivi d'une technique de classification. On se placera dans le cas monophonique ( 1 seul instrument à la fois). Sujet 42 : Séparation et classification de signaux instrumentaux Contact : Jean-Luc Zarader, [email protected] Type : bibliographique Séparation et classification de signaux instrumentaux dans le cas monophonique et polyphonique . (l'étudiant disposera d'une thèse récente sur le sujet). Sujet 43 : Interface vidéo pour la capture de tableaux artistiques en cours de réalisation Contact : Xavier clady, [email protected] Type : développement L’objectif de ce projet est de filmer à l’aide d’un système multi-caméras, un artiste peintre en pleine création de sa toile. Grâce à ce système, nous devrions être capable de reproduire tout le processus qui va de la toile vierge au tableau fini, simplement en enregistrant de manière synchrone l’apparition de la peinture sur la toile et en éliminant le peintre ainsi que tous les autres objets occultants. L’oeuvre ne sera plus non seulement le tableau fini mais tout son processus créateur. Un premier prototype de ce système a été codé en MatLab en proposant une adaptation astucieuse d’un algorithme classique de soustraction de fond. Cependant ce système ne fonctionne pas en temps réel (car il utilise MatLab). Le travail de l’étudiant consistera dans un premier temps à traduire le code MatLab en un logiciel utilisant une bibliothèque matricielle en C++, NT2, mais qui se présente sous la forme d’une interface proche de MatLab. Ensuite, l’étudiant pourra faire évoluer le système de manière à améliorer la qualité du résultat fini.