Projets SSIR RSI-TSSI 2007/2008 Informations à - ISIR

Transcription

Projets SSIR RSI-TSSI 2007/2008 Informations à - ISIR
Projets SSIR RSI-TSSI 2007/2008
Remarques importantes :
 L’étudiant devra effectuer soit deux projets, un « bibliographique » et un
« développement », soit un projet « bibliographique et développement ».
 Les mêmes sujets peuvent être choisis par plusieurs étudiants. Le travail pourra alors être
réalisé individuellement ou en binôme (après accord du contact enseignant).
 Les étudiants peuvent aussi proposer des sujets de projet personnels. Dans ce cas, ils
doivent les soumettre à l’approbation du responsable de l’UE projets, puis déterminer un
contact enseignant (qui sera en charge de l’encadrement et de l’évaluation du projet).
 Afin d’obtenir plus de renseignements sur certains sujets proposés, il vous est vivement
recommandé de vous mettre en relation par email avec les enseignants
correspondants avant de faire votre choix.
 Chaque étudiant devra fournir une liste d’au moins 3 vœux ordonnés de sujets de projet
avant le 10 janvier 2008 au responsable des UE projets : Xavier CLADY,
[email protected]
Informations à transmettre pour les vœux de projets :
NOM :
Prénom :
Formation (RSI ou TSSI):
bibliographique
1er vœu
2e vœu
3e vœu
4e vœu
Si vous proposez un (des) projet(s) personnel(s) :
Titre :
Contact enseignant désiré :
Type (bibliographique ou/et développement) :
Description ( 5 à 10 lignes environ) :
développement
PROPOSITIONS DE SUJET
Sujet 1 : Implémentation d'un module de commande prédictive linéaire
pour un mannequin virtuel
Contact : Olivier Sigaud, professeur UPMC ([email protected])
Type : développement
La commande prédictive semble un bon modèle pour la commande motrice humaine.
Dans le cadre de nos travaux sur l'apprentissage de la commande motrice humaine,
nous souhaitons mettre en place un module de commande prédictive dans le cas où
la dynamique du système est approchée par un modèle linéaire. L'objet du travail
consistera à réaliser l'implémentation de cette commande en s'appuyant sur une
formalisation pré-existante et sur une boîte à outil destinée spécifiquement à ce type
d'usage, puis à mener quelques expérimentations de validation dans des cas simples.
Sujet 2 : Evaluation et amélioration d’un détecteur de voyelles pour la
reconnaissance d’émotions
Contact : [email protected]
Type : bibliographique & développement
Un système de détection automatique de voyelles a été développé au sein de l’ISIR.
Celui-ci s’appuie sur un algorithme de segmentation de la parole en unité du
discours. Il a été testé avec succès sur des corpus de parole anglais et allemand, et
est actuellement utilisé comme support d’analyse de diverses émotions primaires
(joie, tristesse, colère, …), en contexte multilingue (allemand et danois). Afin
d’évaluer le détecteur de voyelles sur le corpus danois, nous vous proposons de
réaliser un programme de transcription des données phonétiques contenues dans ce
corpus (transcription : phonème → silence/voyelle/consonne, programme
d’évaluation fourni). Ces résultats seront ensuite analysés selon le contenu
linguistique des corpus étudiés. Une amélioration du système pourra également être
envisagé, par l’implémentation de critères supplémentaires portants sur la mesure
conjointe des trajectoires des formants et de leur énergie. Le projet pourra
déboucher sur un stage. Mots clefs : Traitement automatique de la parole, analyse
de corpus multilingue, détection de voyelles, trajectoires formantiques.
Sujet 3 : Etude de motifs prosodiques pour la reconnaissance d’émotions
en contexte multilingue
Contact : [email protected]
Type : bibliographique & développement
La prosodie décrit la façon dont un locuteur transmet son message oral, et renseigne
de ce fait sur bon nombre d’informations de différentes natures qui lui sont propres
(style discursif, état émotionnel, condition physique, etc.). Les systèmes de
reconnaissance d’émotions actuels reposent pour une grande majorité sur l’étude
statistique de paramètres prosodiques tels que le pitch (hauteur de voix), l’énergie et
la durée des sons produits. Bien que ces études produisent de bons résultats (~
80%), elles ne prennent toutefois pas en compte certaines caractéristiques du
discours, puisque peu d’entres elles s’intéressent aux motifs formés par ces
paramètres prosodiques. Dans ce sens, nous vous proposons d’étudier, via des
modèles probabilistes de type n-gram, l’intérêt et la robustesse des enchaînements
d’unités prosodiques dans une tâche de reconnaissance automatique d’émotions, en
contexte multilingue (Ces unités vous seront fournies, ainsi que les algorithmes ngram). Le projet pourra déboucher sur un stage. Mots clefs : Traitement
automatique de la parole, reconnaissance automatique d’émotions en contexte
multilingue, modélisation de la prosodie - prosody modeling, modèles probabilistes.
Sujet 4 : Infant and Robot Directed Speech
Contact : Mohamed Chetouani ([email protected])
Type : bibliographique & développement
La robotique sociale vise à mettre en œuvre des robots interagissant de manière
naturelle avec les humains. La conception de ces robots est aussi importante que
leurs capacités d’interaction. En effet, nos interactions verbales ou non verbales vont
différer selon la morphologie du robot. Des comportements similaires sont observés
lors de l’interaction avec des enfants ou des adultes. Avec des enfants, nous utilisons
un registre de parole simplifié (vocabulaire) et modulé (exagération des phonèmes et
de la prosodie) alors qu’avec des adultes, notre registre est beaucoup plus complexe.
Nous proposons dans ce projet de caractériser et de comparer les interactions que
l’on peut avoir avec un bébé (infant-directed speech) de celles que l’on peut avoir
avec un robot social KISMET (robot-directed speech). Après une étude
bibliographique des interactions ainsi que des méthodes de caractérisation, il s’agira
de développer un algorithme de détection d’unités prosodiques saillantes. Les
premières unités reconnues par le bébé sont justement ces unités prosodiques
viennent ensuite les voyelles, puis les syllabes. La mise en œuvre des algorithmes
développés se fera sur le robot AIBO.
Sujet 5: Analyse des expressions faciales
Contact : Lionel Prévost, [email protected]
Type : bibliographie
La communication humaine passe par les voies verbale (le discours) et non verbales
(le ton, les gestes, les expressions faciales, le regard). Des études ont montré que la
modalité verbale véhicule moins de 10% des « messages » que nous transmettons
en communiquant. Parmi les modalités non verbales, les émotions faciales (peur,
joie, dégout …) sont un puissant vecteur de communication qu’il convient d’analyser
et de mettre en relation avec les autres modalités.
L’objectif du projet est d’établir une liste des équipes de recherche (nationales et
internationales) travaillant sur le sujet et un panorama des principales méthodes
mises en œuvre pour résoudre ce problème.
Sujet 6 : Capture et traitement d’images pour robot préhenseur
Type : développement
Contact : Guillaume Walck ([email protected])
Dans le cadre de la saisie d'objets dans un environnement complexe par une
main robotisée, un robot muni d'une pince surmontée par une mini-caméra (in-hand
camera) "découvre" l'objet à saisir en effectuant une trajectoire autour de ce dernier
pour capturer des images. La capture d'une image et le relevé de la position de la
caméra doivent être fait simultanément pour permettre une calibration de l'ensemble
grâce aux mesures du robot et ainsi procéder à la reconstruction 3D de l'objet.
Le projet consiste donc tout d'abord à développer un ensemble de fonctions en
C/C++ sous Linux pour capturer des images d'une caméra industrielle Sony XCDV50CR sur bus ieee1394a/b (firewire). Il faudra notamment pouvoir "déclencher" la
prise de vue à un instant précis au moyen de commandes respectant le standard
DCAM (bibliothèques libdc1394 et libraw1394) et pouvoir récupérer les images du
buffer de la caméra. Une validation du processus de capture pourra être mise en
place (images d'un chronomètre en marche ou d'un plateau tournant par exemple)
Dans un second temps, l'étudiant construira une mini-application de traitement
d'image permettant principalement d'extraire la position d'une "boite enveloppante"
(bounding box) autour d'un objet de l'image suivant divers critères (couleur,
luminosité etc...) en s'aidant de la bibliothèque OpenCV. La maitrise du C/C++ est
indispensable et les connaissances de développement sous linux sont vivement
souhaitées
Sujet 7 : Programmation dynamique et appariement dense d’images.
Contact : Edwige Pissaloux, [email protected], Eléanor Fontaine,
[email protected]
Type : développement
Le but de ce stage est de développer une version Windows de l’algorithme (déjà)
implanté en C (environ 400 lignes), et de la tester sur des images réelles.
L’algorithme détaillé et la documentation seront à réaliser.
Sujet 8 : Appariement : image –carte IGN
Contact : Edwige Pissaloux, [email protected],
[email protected]
Type : bibliographique
Eléanor
Fontaine,
Le but de ce projet est de faire une étude bibliographique sur différentes méthodes
existantes de l’appariement des images de scènes urbaines avec données fournies
par des cartes IGN.
Sujet 9 : Appariement : dessin – modèles de figures géométriques.
Contact : Edwige Pissaloux, [email protected], Eléanor Fontaine,
[email protected]
Type : bibliographique
Le but de ce projet est de faire une étude bibliographique sur différentes méthodes
existantes de l’appariement des images réalisées à la main avec leurs modèles
géométriques idéaux.
Sujet 10 : Modèle de vision chez des vertébrés simples.
Contact : Edwige Pissaloux, [email protected],
[email protected]
Type : bibliographique
Eléanor
Fontaine,
Le but de ce TER bibliographique est d’étudier les schémas perceptuels de
l’environnement chez crapauds proposés par Arbib (lecture et analyse critique de
l’article de Cliff, D., Computational ethology, in Handbook of Brain Theory and Neural
Netoworks, 2nd ed, M.A. Arbib (ed) MIT Press, 2003).
Sujet 11 : Etude de la forme des lèvres en fonction du phonème produit par
un locuteur en français
Contact : M.Milgram ([email protected])
Type : bibliographique et développement
A partir de plusieurs séquences vidéos d'une personne (avec les lèvres teintes
en bleu) prononçant certains phonèmes, on extraira des points sur les lèvres pour
avoir une "vérité terrain" (donc habileté en Traitement des Images) ; on cherchera
ensuite à caractériser les formes obtenues (donc la position des lèvres) en fonction
du phonème produit. Typiquement, on se contentera de mesurer l'ouverture,
l'élongation horizontale et éventuellement la protusion et de travailler sur les voyelles
Sujet 12 : Recouvrement de la profondeur d’une scène 3D.
Contact : Edwige Pissaloux, [email protected], Eléanor
[email protected]
Type : développement
Fontaine,
Le but de ce TER « développement » est d’apporter quelques modifications à
l’affichage des images de recouvrement de la profondeur d’une scène 3D réalisée à
l’aide de la triangulation de Delaunay (utilisation de la bibliothèque OpenCV et de
Matlab).
Sujet 13 : Localisation d’objet par suivi du regard et du geste
Contact : Xavier Clady ([email protected])
Type : bibliographique et développement.
Lors du mouvement de préhension d’un objet, un homme dirige sa main et son
regard vers l’objet. Aussi en triangulant les données concernant la direction du geste
et celle du regard, on devrait être capable de localiser dans l’espace, la position de
l’objet. Le but de ce projet sera donc d’utiliser des systèmes de suivi de regard et de
mains fournis afin de vérifier cette hypothèse. La bibliographie qui lui sera adjointe
consistera en une étude des systèmes qui mixent analyse du geste et du regard,
prioritairement ceux qui se situent dans ce même domaine (quelques références
seront fournies par l’encadrant comme point de départ).
Sujet 14 : Robot d’assistance à personnes âgées à domicile ou en milieu
hospitalier.
Contact : Xavier Clady ([email protected])
Type : bibliographique
L'essence de ce projet est de proposer un robot d'assistance à personnes âgées (ou
simplement médicalisées) ayant besoin d'être constamment reliées à un appareillage
médical (bouteilles d'oxygène, goutte-à-goutte, etc.). La tendance actuelle est de
miniaturiser au maximum ce type d'appareillage afin que la personne âgée puisse
l'embarquer sur soi (dans une veste spéciale, etc.). Cependant, ceci n'est efficace
essentiellement que pour les appareils électroniques. Quant il s'agit de fournir un
produit en grande quantité (oxygène,...), il faut recourir à solution déportée. Or cela
s'avère très handicapant et très encombrant (poids, maniabilité) pour la personne
âgée si elle se déplace en dehors de son domicile ou de sa chambre d'hôpital. L'idée
est donc de proposer un robot qui se chargerait de transporter l'appareil médical tout
en restant « à portée filaire » de la personne âgée lors de ses déplacement. Par
exemple, une personne âgée devant être constamment sous oxygène (suite à une
crise cardiaque ou des problèmes pulmonaires), si elle veut quitter son appartement,
soit elle doit le faire que pendant une courte durée (une ou deux heures ; durée
limitée par l'autonomie de la réserve d'oxygène qu'elle est capable de transporter
elle-même), soit, pour des durées plus longues (un ou plusieurs jours - séjour en
famille, etc.), elle doit recourir constamment à l'assistance d'une autre personne pour
transporter une bouteille trop lourde pour elle d'un endroit à l'autre (cela peut être
simplement d'aller du salon à la table à manger,...). Il y a donc une perte complète
de l'autonomie de la personne âgée dans ses déplacements. Le robot, que nous
voulons proposer, permettrait de restaurer une autonomie, même que partiellement.
Attention, ce projet demande aux étudiants intéressés de grandes capacités de
créativité et d’autonomie, ainsi qu'un fort esprit de synthèse. En effet, il s'agira
d'analyser et décomposer le problème (mécanique, perception, navigation,
planification, contrôle,...), puis de bien identifier et formaliser les verrous
technologiques, techniques et méthodologiques et de proposer des pistes de
résolution de ces verrous, en s'appuyant sur une solide recherche bibliographique. Ce
sujet peut s'adresser à une équipe d'étudiants ou à un seul. Selon ses goûts et ses
connaissances, chaque étudiant pourra se focaliser uniquement sur un point en
particulier : navigation du robot (localisation du robot/obstacles/personne,
détermination d'une trajectoire d'un robot suiveur), asservissement d'un robot
suiveur (sur les mouvements de la personne), modélisation mécanique de la liaison
robot-personne (conception, capteur de force, modélisation des efforts,...), systèmes
de perception (choix des capteurs, mise en oeuvre,...), etc.
Il est important de bien argumenter chaque problème et inventorier les différentes
solutions potentielles, en soulignant leurs points forts et leurs points faibles
(contraintes, limitations, mise en oeuvre, coût,...). Les recherches entreprises dans le
cadre des robots Nursebot du CMU, Wakamaru de Mitsubishi et Peoplebot de
Robosoft, pourront servir de base à cette étude, bien qu'elles n'y répondent pas
spécifiquement.
Sujet 15 : Méthodes à base de « bag of features ».
Contact : Xavier Clady ([email protected])
Type : bibliographique
Récemment, une technique, appelée « bag of features », est devenue très populaire
dans le domaine de la caractérisation automatique d’images (classer des images nonlabélisées en fonction de leur contenu : si elle contient certains objets tels des
voitures, de personnes, des bicyclettes,…). Cette technique est simple à mettre en
œuvre et obtient de bonnes performances, en dépit d’une grande variabilité d’objets,
de poses, d’occlusion, de scènes et d’éclairages. Elle ne requiert de plus aucun
modèle géométrique global de l’objet. Cette technique a été aussi étendue à la
détection et la localisation d’objets. L’étude bibliographique demandée consistera à
répertorier un maximum d’articles utilisant cette technique récente (depuis 2005) et
à en identifier les évolutions récentes (voire en déduire les défis futurs).
Sujet 16 : Capteurs fovéaux, capteurs de résolution variable quelconque.
Contact : Sio-Hoï Ieng ([email protected])
Type : bibliographique.
La vision robotique s'oriente progressivement vers des applications de plus en plus
exigeantes en précision et rapidité d'acquisition. Ce projet se propose d'examiner les
travaux menés sur le problème des capteurs de résolution spatiale variable,
reconfigurable ou non. L'objectif est de proposer un panorama des techniques
existantes et des applications, auxquelles elles sont prédestinées.
Sujet 17 : Systèmes d’inspection visuelle, multi-vues et automatique.
Contact : Xavier Clady ([email protected])
Type : bibliographique.
Sur la base d’un ensemble d’articles fournis par l’encadrant, l’étudiant devra faire une
comparaison des différents systèmes d’inspection visuelle d’objets manufacturés
(détection de défauts) à base de vision.
Sujet 18 : Descripteurs visuels pour la détection de véhicules en vision
embarquée.
Contact :
Xavier
Clady
([email protected]),
Lionel
Prévost
([email protected])
Type : développement.
Nous avons développé un algorithme de détection de véhicules sur des images
embarquées, en utilisant certains descripteurs visuels (Haar/discriminant et
Histogramme de Gradients Orientés/génératif). L’étudiant devra implémenter et
tester d’autres descripteurs dans cet algorithme (pratique du C/C++ requise).
Sujet 19 : Détection de véhicules : méthode de clustering.
Contact :
Xavier
Clady
([email protected]),
Lionel
([email protected])
Type : développement.
Prévost
L’étudiant devra intégrer une méthode de clustering (k-means certainement) dans un
algorithme de détection de véhicules (pratique du C/C++ requise).
Sujet 20 : La rééducation avec Robot: Méthodes et commandes.
Contact : Viviane Pasqui ([email protected])
Type : bibliographique.
La rééducation pour certaines pathologies, comme l'hémiplégie, la sclérose en
plaques, la paraplégie, etc., est fondée sur la répétition de gestes que le patient ne
peut plus exécuter seul. Cette répétition permet, a minima d'entretenir les fonctions
physiologiques et de fait de minimiser l'apparition de complications et, dans l'idéal,
de retrouver l'intégralité de la fonction. Les robots permettent de reproduire, un
grand nombre de fois, un même geste avec précision et sans lassitude. De plus, leur
présence peut motiver, voire rassurer le patient. Les robots sont donc rentrés par la
grande porte (vue leur taille!!) des salles de rééducation. Il s'agit dans le cadre de ce
projet de faire une liste des systèmes robotiques utilisés pour la rééducation. Cette
liste tiendra compte de différentes caractéristiques comme : les fonctions à
rééduquer visées, les méthodes de rééducation, les commandes mises en oeuvre, les
évaluations cliniques faîtes, la commercialisation,…
Sujet 21 : Evaluation de la programmation génétique pour la biomécanique
de la verticalisation.
Contact : Ludovic Saint-Bauzel ([email protected])
Type : bibliographique et développement
L'étudiant devra faire une petite bibliographie sur la programmation génétique puis
au regard de cette dernière implémenter cette méthode pour essayer de contrôler un
modèle 3R plan (représentation d'une personne dans le plan sagittal) afin qu'il
ressemble à un comportement enregistré de verticalisation sur des personnes saines.
Sujet 22 : Développement d’un suivi de personnes.
Contact : Catherine Achard ([email protected])
Type : développement
Ce projet a pour but de suivre des personnes dans une scène en temps réel.
L'algorithme utilisé sera composé de plusieurs parties. Tout d'abord une détection
des zones en mouvement par soustraction d'une image de "fond", puis une
recherche de visage dans la scène (algorithme fourni) afin de retrouver les
personnes et les suivre au cours de la séquence. Cet algorithme devra être mis en
place sous openCV, et fonctionner en temps réel à partir d'une webcam. Il nécessite
donc une bonne connaissance des langages C et C++.
Sujet 23 : Modèle d'apparence pour la reconnaissance et le suivi de
personnes.
Contact : Catherine Achard ([email protected])
Type : bibliographique
De plus en plus d'applications demandent de suivre des personnes ou des objets à
travers des caméras dont les champs ne se recouvrent pas. Il est alors nécessaire de
construire une signature caractérisant le passage de la personne afin de pouvoir la
retrouver dans d'autres séquences d'images. Bien des problèmes apparaissent
comme les changements d'éclairage, de points de vue, ... Des travaux très récents
abordent cette nouvelle problématique et je propose, à travers cette étude
bibliographique, d'en faire une synthèse.
Sujet 24 : Stéréovision pour le comptage de personnes.
Contact : Maurice Milgram ([email protected]),
([email protected])
Type : développement
Catherine
Achard
Compter des personnes qui passent sous une caméra n'est pas trop compliqué, si les
conditions d'éclairages sont stables, si les personnes ne sont pas "en contact" etavec
des caméras filmant la scène vue d'en haut. L’objectif de ce projet est d'utiliser
deux caméras pour capter le flux vidéo, puis de recourir à un calcul de disparité
restreinte (connaissant approximativement la disparité associée aux têtes puisqu'on
connaît leur hauteur approximative). L’étudiant disposera de codes de calcul de
disparité, développés (en MatLab) au sein du laboratoire, ainsi que des codes de
suivi. Il devra les combiner et en tester le résultat sur des séquences.
Sujet 25 : Mise au point d'un "détecteur de publicité" pour la radio FM.
Contact : Bruce Denby, professeur UPMC ( [email protected])
Type : bibliographique et développement
Notre groupe a developpé le "Navigateur Multimédia Radiologicielle" qui applique des
algorithmes d'indexage audio à la bande radio FM. Les premiers tests d'un
discriminateur musique/parole avec ce navigateur se sont montrés peu satisfaisants
à cause des nombreuses annonces publicitaires présentes sur la bande FM. Dans ce
projet, l'étudiant appliquera les techniques de traitement du signal et de
reconnaissance de formes à une base contenant des clips de musique, de parole, et
de publicités, afin de réaliser un "détecteur de publicité" basé sur les caracteristiques
spectrales et temporelles des signaux audio. Le projet pourra continuer en stage sur
un sujet connexe.
Sujet 26 : Apprentissage Semi-Supervisé pour la Localisation dans des
Réseaux WiFi.
Contact : Bruce Denby, professeur UPMC ( [email protected]), Yacine Oussar
Type : bibliographique et développement
Il y a récemment un intérêt accru en localisation automatique des personnes et
d'objets par la méthode de "radio fingerprint," dans laquelle la localisation se fait en
comparant l'environnment radio actuel avec une base de mesures étiquetées de ses
coordonnées GPS. Tout en donnant de bons résultats, la difficulté d'obtenir la base
d'apprentissage a freiné le déploiement de cette méthode. Une solution possible est
l'utilisation de techniques d'apprentissage "semi-supervisé," dans lesquels seul une
fraction réduite des données ont besoin d'être étiquetées. Le projet propose
d'exploiter une base de données WiFi pour expérimenter les techniques
d'apprentissage semi-supervisé. L'étudiant fera d'abord une étude bibliographique de
ces méthodes, puis implémentera une méthode originale et évaluera ses
performances en les comparant à des résultats existants sur la même base de
données. Le projet pourra continuer en stage sur un sujet connexe.
Sujet 27 : Application de la Radio Logicielle à la RFID
Contact : Bruce Denby, professeur UPMC ([email protected] )
Type : bibliographique et développement
L'étiquetage des produits et des objets du monde avec des "tags" RFID devient de
plus en plus répandu. En même temps l'existence de plusieurs normes RFID aux
fréquence et protocoles différents rend difficile l'interopérabilité des systèmes. La
"radio logicielle," dans laquelle le signal radio est numérisé en début de chaine et
tout traitement est fait en soft, a été proposé comme solution pour adresser
l'interobérabilité des normes de télécommunication - GSM, UMTS, WiFi, etc..
Toutefois, on trouve dans la littérature peu d'application de la radio logicielle à la
RFID, où elle pourra sans doute aussi se montrer très intéressante. Le projet
consistera en une étude bibliographique du fonctionnement de la RFID et une
recherche de possibles applications existantes de a radio logicielle à la RFID. Ensuite,
l'étudiant dévéloppera un petit simulateur logiciel (Matlab) RFID et exploréra la
possibilité d'appliquer certaines techniques de la radio logicielle, par exemple le souséchantillonnage. Le projet pourra continuer en stage sur un sujet connexe.
Sujet 28 : Localisation en temps réel du visage et des lèvres d'un locuteur
pour le projet d'interface de communication silencieuse Ouisper
Contact : Bruce Denby ([email protected]), Thomas Hueber
Type : bibliographique et développement
Le projet Ouisper vise à réaliser un système de synthèse de la parole à partir
d'imagerie ultrasonore et optique de l'appareil vocal pour des personnes ayant perdu
l'usage de leurs cordes vocales. Le dispositif envisagé s'appuie notamment sur le
suivi des lèvres du locuteur. En laboratoire, il est aisé de fixer la tête de ce dernier ;
la localisation des lèvres dans l'image ne présente donc aucune difficulté. Cependant,
cette tâche est un véritable enjeu pour la réalisation d'un système mobile « réaliste
». L'objectif de ce projet est donc la conception et l'évaluation d'une méthode de
localisation des lèvres d'un locuteur, dans un flux vidéo temps réel. La méthode
proposée sera implémentée au sein du logiciel d'acquisition et de traitement
Ultraspeech, développé au laboratoire d'électronique de l'ESPCI. L'implémentation
s'effectuera en langage C et sera facilitée par l'utilisation de la bibliothèque de
traitement d'image OpenCV développée par Intel. Le projet pourra continuer en
stage sur un sujet connexe.
Ouisper Website - http://www.neurones.espci.fr/ouisper/ Librairie OpenCV - http://opencvlibrary.sourceforge.net/
Sujet 29 : Développement d'un système électronique embarqué
permettant l'estimation de son propre mouvement dans l'espace pour le
projet d'interface de communication silencieuse Ouisper
Contact : Bruce Denby ( [email protected]), Thomas Hueber
Type : bibliographique et développement
Le projet Ouisper vise à réaliser un système de synthèse de la parole à partir
d'imagerie ultrasonore et optique de l'appareil vocal pour des personnes ayant perdu
l'usage de leurs cordes vocales. Actuellement, le protocole d'acquisition des données
d'étude requiert l'immobilisation de la tête du locuteur. Dans le cadre du prototype
envisagé, le locuteur tiendrait « lui-même » un dispositif intégrant la sonde
échographique. On se propose de détecter et de quantifier le mouvement relatif de la
sonde échographique à l'aide d'un dispositif électronique embarqué. Au cours du
projet, l'étudiant devra concevoir et réaliser une carte électronique réalisant
l'interface entre une série de capteurs de position (accéléromètres, magnétomètre,
…) et un PC. Ces informations seront utilisées pour recadrer l'image ultrasonore dans
un référentiel fixe par rapport à la tête du locuteur.
Ouisper Website - http://www.neurones.espci.fr/ouisper/
Sujet 30 : Méthode de détection des mouvements des lèvres
Contact : Bruce Denby, professeur UPMC ([email protected]), Angélique
Amelot
Type : bibliographique et développement
Le sujet proposé s'insère dans le cadre du projet OUISPER. Ce projet consiste a faire
de la reconnaissance de parole à partir de mouvements articulatoires : articulation
labiale et linguale, sans activation des plis vocaux. Le travail s'effectuera en
collaboration avec les membres du projet et au sein du Laboratoire d'éElectronique.
Le traitement des images montrant les mouvements des lèvres à partir de séquences
vidéo est une application importante tant en reconnaissance de la parole qu'en
phonétique, les lèvres ayant une part active dans le processus langagier. Dans un
premier temps, le candidat devra faire une recherche bibliographique sur les
méthodes disponibles pour le traitement des images montrant les mouvements des
lèvres (méthode des lèvres bleues à l'ICP de Grenoble, méthode de suivi de point à
l'ENST et au LPP de Paris,…). Dans un second temps et en gardant à l'esprit que le
projet OUISPER à pour but de développer une méthode souple et adapter à tous, le
candidat devra proposer de nouvelles pistes (par exemple lumière blanche)
permettant de traquer le plus efficacement possible les mouvements des lèvres avec
le plus de contraste possible et en éliminant autant que faire se peut les problèmes
d'ombre.
Sujet 31 : Estimation de la de robustesse d'une station d'acquisition
ultrason
Contact : Bruce Denby, professeur UPMC ([email protected]), Angélique
Amelot
Type : bibliographique et développement
Le sujet proposé s'insère dans le cadre du projet OUISPER. Ce projet consiste a faire
de la reconnaissance de parole à partir de mouvements articulatoires : articulation
labiale et linguale, sans activation des plis vocaux. Le travail s'effectuera en
collaboration avec les membres du projet et au sein du Laboratoire d'Electronique.
L'enregistrement d'importants corpus de données articulatoires à partir d'un système
ultrason est une priorité du projet et pour cela il est nécessaire d'utiliser un système
d'acquisition adéquate et de tester sa robustesse.
Les données issues d'un système ultrason donnent une indication des mouvements
de la langue et il est ensuite possible d'extraire les mouvements articulatoires à partir
des images fournies par le système ultrason. Cependant, les analyses nécessitent
que la configuration du conduit vocal soit similaire au début et à la fin de
l'enregistrement (ce qui passe par une position stable du locuteur et de la sonde). La
priorité pour ce type de données est de pouvoir limiter ou de déterminer l'ampleur
des mouvements du sujet. Dans un premier temps, le candidat devra faire une
recherche bibliographique sur les problèmes posés par les données Ultrasons
notamment en terme de suivis de contour (cf. Maureen Stone). Dans un second
temps en se basant sur les travaux de Barillas et al. (2007), et à partir d'un corpus
d'environ 10 minutes, d'estimer la robustesse de la station d'acquisition ultrason.
Sujet 32 : Vérification de la synchronisation de données Ultrason, audio et
vidéo
Contact : Bruce Denby, professeur UPMC ([email protected]), Angélique
Amelot
Type : bibliographique et développement
Le sujet proposé s'insère dans le cadre du projet OUISPER. Ce projet consiste a faire
de la reconnaissance de parole à partir de mouvements articulatoires : articulation
labiale et linguale, sans activation des plis vocaux. Le travail s'effectuera en
collaboration avec les membres du projet et au sein du Laboratoire d'Electronique.
Une station d'acquisition de données ultrason (permettant d'enregistrer les
mouvements de la langue) et de données vidéo (permettant d'enregistrer les
mouvements des lèvres) a été élaborée pour pouvoir enregistrer simultanément des
flux audio, video et ultrason. Le candidat devra vérifier la synchronisation des trois
flux acquis lors d'un enregistrement de parole. Après avoir construit un corpus
adapté soit en terme de synchronisation labiale et en terme de synchronisation
ultrason trouver une méthode pour vérifier la synchronisation des différents flux.
Sujet 33 : Localisation et cartographie basées vision pour les drones
Type de projet : bibliographie
Contact : Adrien Angeli ([email protected]), Stéphane Doncieux
([email protected])
En robotique, les algorithmes de SLAM (Simultaneous Localization And Mapping) sont
couramment utilisés pour permettre la localisation d'un robot dans son
environnement sans informations a priori sur celui-ci et uniquement sur la base des
capteurs embarqués sur le robot. Récemment, de nombreux algorithmes de SLAM
basés vision ont été développés dont certains (e.g. [Davison2003]) ont été mis à
disposition sous forme de license GPL. La solution proposée dans [Davison2003]
permet de localiser une caméra tenue à la main en temps réel. En disposant la
caméra sur un drone, il serait en théorie possible de localiser celui-ci en temps réel.
Cependant, l'algorithme de SLAM proposé dans [Davison2003] repose sur un modèle
de déplacement de la caméra qui n'est pas adapté à la dynamique d'un drone. Le but
de ce projet est donc d'essayer de trouver par quels moyens cette contrainte peut
être levée. Deux axes de recherche sont à privilégier ici :
- l'utilisation d'une centrale inertielle pour permettre une
observation locale du déplacement du drone [Davison2007]
- la mise en place d'une méthode de filtrage plus adaptée à la
dynamique du drone pour remplacer "l'Extended Kalman Filter, EKF"
(on envisage notament l'utilisation d'un "Unscented Kalman
Filter, UKF")
Par une étude bibliographique, le projet devra permettre de faire le point sur les
méthodes existant et mettant en oeuvre au moins une des deux alternatives
proposées.
Sujet 34 : Evitement d'obstacles pour un drone en milieu intérieur.
Type de projet: Bibliographie
Contact : Stéphane Doncieux ([email protected]), Adrien Angeli
([email protected])
Le développement récent de petits hélicoptères bi-rotors à hélices contra-rotatives
rend désormais envisageable l'utilisation de drones en environnement intérieur.
L'encombrement de ce type d'environnement rend indispensable la capacité à éviter
des obstacles efficacement. Le but de ce projet est de faire une étude
bibliographique sur cette problématique dans le contexte de drones de petite taille.
Les différents capteurs et stratégies possibles seront identifiées et répertoriées. Les
critères déterminants seront l'encombrement, la consommation énergétique et les
capacités de calcul requises. Les technologies à étudier seront, par exemple, celles
basées sur le flux optique [Muratet 2005] ou sur des capteurs infra-rouge
[Roberts2007]. L'étude pourra intégrer des capteurs panoramiques ou des capteurs
plus récents.
Sujet 35 : Asservissement visuel pour un drone en milieu intérieur.
Type de projet: Bibliographie
Contact : Adrien Angeli ([email protected]), Stéphane Doncieux
([email protected])
Le développement de mini-drones capables d'évoluer en milieu intérieur permet
d'envisager de nouvelles applications comme la surveillance d'un site ou l'exploration
d'une zone accidentée d'accès dangereux. Ces applications nécessitent de pouvoir
positioner le drone avec précision sur des cibles visuelles afin qu'un opérateur puisse
en extraire les informations pertinentes. Dans cette optique, les différentes stratégies
d'asservissement visuel seront identifiées et répertoriées. Les critères déterminants
seront les capacités de calcul requises ainsi que les contraintes de la méthode,
comme par exemple le nombre de degrés de liberté pouvant être pris en compte, le
type de cible pouvant être utilisée pour l'asservissement (e.g. plan texturé, objet
complexe...), ou encore la complexité (essentiellement en termes de mise en oeuvre
pratique) du contrôleur proposé. Un exemple de technologie visée est l'ESM
(http://esm.gforge.inria.fr/).
Sujet 36 : reconstruction de mouvements humains et simulation
Type de projet : Bibliographie et développement
Contact : Bertrand Bru ([email protected]) et Sébastien Barthélemy
([email protected])
On s'intéresse à la reconstruction de mouvements humains à partir de données
issues de capteurs optiques (type Viccon, codamotion) et éventuellement de capteurs
d'efforts. Les techniques actuelles reconstruisent la cinématique du mouvement, mais
rien ne garantit que le mouvement résultant respecte les lois de la mécanique : très
souvent dans le mouvement reconstruit, le personnage plane au dessus du sol ou au
contraire y est légèrement enfoncé.
Nous souhaitons améliorer ces techniques pour proposer une solution plus complète
: reconstruction à partir des capteurs optiques, détection de la présence des contacts
par capteur d'effort, modification a posteriori du mouvement pour satisfaire les
conditions de contact, utilisation de ce mouvement comme consigne en simulation
L'étudiant devra améliorer la méthode de reconstruction : nous disposons déjà d'une
méthode de reconstruction frame par frame par moindres carrés, et nous souhaitons
évaluer l'intérêt de fitter des splines sur les données, déterminer une heuristique
pour la détection de la présence de contact (logique floue ?), implémenter la
méthode dans arboris et l'évaluer à partir de données issues de mouvements préenregistrés, puis reproduire ces mouvements en simulation (le simulateur et la loi de
contrôle seront fournis).
Un très bon niveau de programmation matlab est requis ainsi qu'un bon niveau en
mécanique du solide. Merci de nous contacter avant le choix définitif pour s'assurer
de l'adéquation entre le candidat et le sujet.
Sujet 37 : Développement de l'interface graphique d'arboris
Contact : Sébastien Barthélemy ([email protected])
Type : bibliographie et développement
Le laboratoire ISIR et le CEA développent Arboris, un simulateur dédié à la robotique.
Arboris est programmé sous Matlab. Nous souhaitons développer une interface
graphique pour la génération de trajectoire.
Ce sujet présente deux difficultés théoriques que l'étudiant devra étudier à partir de
la bibliographie fournie : comment interpoler des déplacements de solides et
comment, à partir d'une interface 2d (écran et souris) l'utilisateur peut-il spécifier des
mouvements 6d (translation et rotation). L'étudiant devra ensuite implémenter les
méthodes retenues sous arboris.
Un très bon niveau de programmation matlab et requis, ainsi qu'un bon niveau
mathématique. Merci de nous contacter avant le choix définitif pour s'assurer de
l'adéquation entre le candidat et le sujet.
Sujet 38 : Création de TP de robotique arboris
Contact : Sébastien Barthélemy ([email protected])
Type : bibliographie et développement
Le laboratoire et le CEA développent Arboris, un simulateur dédié à la robotique.
Arboris est programmé sous Matlab. Nous souhaitons développer des applications
pédagogiques à partir de ce simulateur : TP et/ou démonstrations.
L'étudiant devra
- étudier et comprendre 3 méthodes de contrôle de robot à illustrer en TP ou démon
(le choix n'est pas encore complètement arrêté),
- les implémenter dans arboris il faudra notamment, modéliser des robots industriels
(puma, staubli), programmer la loi de contrôle, programmer les interfaces
graphiques nécessaires.
Arboris est programmé sous matlab. Un très bon niveau de programmation matlab
est requis. Ainsi qu'un bon niveau en mécanique / robotique / automatique. Merci de
nous contacter avant le choix définitif pour s'assurer de l'adéquation entre le
candidat et le sujet et discuter des exemples qu'il souhaite implémenter.
Sujet 39 : Estimation de la pose du visage
Contact : Kevin Bailly, [email protected]
Type : bibliographie et/ou développement
Dans le cadre du Programme International pour le Langage de l’Enfant (en
partenariat avec l’hôpital Necker Enfants Malades et la fondation EADS), nous
analysons les regards et les mouvements des mains de bébés filmés par un réseau
de caméras. L’estimation de la pose (position et orientation) de la tête dans une
image est une étape clé dans notre étude et pour de nombreuses autres applications
orientées visage (biométrie, analyse d’expressions, interfaces homme machine, suivi
de regard,…). L’objectif du projet bibliographique est de faire une synthèse des
travaux existants dans ce domaine (des références seront fournies par l’encadrant).
L’aspect développement concerne la mise en œuvre des méthodes les plus
performantes. Elles seront testées sur des séquences de bébés acquises lors du
programme PILE. Les développements seront effectués indifféremment en Matlab ou
en C/C++.
Sujet 40 : caractérisation spectrale non-paramétrique
Contact : Jean-Luc Zarader, [email protected]
Type : développement
Ce travail se place dans le cadre de la séparation de sources audio et plus
spécifiquement de signaux issus d'instruments de musique. D'un point de vue
pratique, l'objectif est de mettre en oeuvre une technique de caractérisation
spectrale non-paramétrique (SFFT, ondelettes,WV,..) de ces signaux suivi d'une
technique de classification. On se placera dans le cas monophonique ( 1 seul
instrument à la fois)
Sujet 41 : séparation de sources audio en musique
Contact : Jean-Luc Zarader, [email protected]
Type : développement
Ce travail se place dans le cadre de la séparation de sources audio et plus
spécifiquement de signaux issus d'instruments de musique. D'un point de vue
pratique, l'objectif est de mettre en oeuvre une technique de caractérisation
paramétrique (LMS, NLMS, RML,..) de ces signaux suivi d'une technique de
classification. On se placera dans le cas monophonique ( 1 seul instrument à la fois).
Sujet 42 : Séparation et classification de signaux instrumentaux
Contact : Jean-Luc Zarader, [email protected]
Type : bibliographique
Séparation et classification de signaux instrumentaux dans le cas monophonique et
polyphonique . (l'étudiant disposera d'une thèse récente sur le sujet).
Sujet 43 : Interface vidéo pour la capture de tableaux artistiques en cours
de réalisation
Contact : Xavier clady, [email protected]
Type : développement
L’objectif de ce projet est de filmer à l’aide d’un système multi-caméras, un artiste
peintre en pleine création de sa toile. Grâce à ce système, nous devrions être
capable de reproduire tout le processus qui va de la toile vierge au tableau fini,
simplement en enregistrant de manière synchrone l’apparition de la peinture sur la
toile et en éliminant le peintre ainsi que tous les autres objets occultants. L’oeuvre ne
sera plus non seulement le tableau fini mais tout son processus créateur. Un premier
prototype de ce système a été codé en MatLab en proposant une adaptation
astucieuse d’un algorithme classique de soustraction de fond. Cependant ce système
ne fonctionne pas en temps réel (car il utilise MatLab). Le travail de l’étudiant
consistera dans un premier temps à traduire le code MatLab en un logiciel utilisant
une bibliothèque matricielle en C++, NT2, mais qui se présente sous la forme d’une
interface proche de MatLab. Ensuite, l’étudiant pourra faire évoluer le système de
manière à améliorer la qualité du résultat fini.