M - Les Thèses de l`INSA de Lyon
Transcription
M - Les Thèses de l`INSA de Lyon
Numéro d’ordre : 2006-ISAL-00119 Année 2006 THÈSE présentée devant L’Institut National des Sciences Appliquées de Lyon pour obtenir LE GRADE DE DOCTEUR ÉCOLE DOCTORALE : ÉLECTRONIQUE, ÉLECTROTECHNIQUE, AUTOMATIQUE FORMATION DOCTORALE : IMAGES ET SYSTÈMES par Bertrand DELHAY Ingénieur de l’INSA de Lyon Estimation spatio-temporelle de mouvement et suivi de structures déformables. Application à l’imagerie dynamique du cœur et du thorax Soutenance prévue le 13 décembre 2006 Composition du Jury : M. Grégoire MALANDAIN Mme. Isabelle BLOCH M. Jérôme POUSIN M. Jyrki LÖTJÖNEN M. Patrick CLARYSSE Mme. Isabelle MAGNIN DR INRIA Professeur Professeur d’université PhD, Researcher VTT CR CNRS DR Inserm Rapporteur externe Rapporteur externe Co-directeur de thèse Co-directeur de thèse i i SIGLE ECOLE DOCTORALE CHIMIE DE LYON M. Denis SINOU E2MC ECONOMIE, ESPACE ET MODELISATION DES COMPORTEMENTS M. Alain BONNAFOUS E.E.A. ELECTRONIQUE, ELECTROTECHNIQUE, AUTOMATIQUE M. Daniel BARBIER E2M2 EVOLUTION, ECOSYSTEME, MICROBIOLOGIE, MODELISATION http ://biomserv.univ-lyon1.fr/E2M2 M. Jean-Pierre FLANDROIS EDIIS INFORMATIQUE ET INFORMATION POUR LA SOCIETE http ://www.insa-lyon.fr/ediis M. Lionel BRUNIE EDISS INTERDISCIPLINAIRE SCIENCES-SANTE http ://www.ibcp.fr/ediss M. Alain Jean COZZONE MATERIAUX DE LYON M. Jacques JOSEPH Math IF MATHEMATIQUES ET INFORMATIQUE FONDAMENTALE http ://www.ens-lyon.fr/MathIS M. Franck WAGNER MEGA MECANIQUE, ENERGETIQUE, GENIE CIVIL, ACOUSTIQUE http ://www.lmfa.eclyon.fr/autres/MEGA/index.html M. François SIDOROFF NOM ET COORDONNEES DU RESPONSABLE M. Denis SINOU Université Claude Bernard Lyon 1 Lab Synthèse Asymétrique UMR UCB/CNRS 5622 Bât 308 2ème étage 43 bd du 11 novembre 1918 69622 VILLEURBANNE Cedex Tél : 04.72.44.81.83 Fax : 04.78.89.89.14 [email protected] M. Alain BONNAFOUS Université Lyon 2 14 avenue Berthelot MRASH M. Alain BONNAFOUS Laboratoire d’Economie des Transports 69363 LYON Cedex 07 Tél : 04.78.69.72.76 [email protected] M. Daniel BARBIER INSA DE LYON Laboratoire Physique de la Matière Bâtiment Blaise Pascal 69621 VILLEURBANNE Cedex Tél : 04.72.43.64.43 Fax : 04.72.43.60.82 [email protected] M. Jean-Pierre FLANDROIS UMR 5558 Biométrie et Biologie Evolutive Equipe Dynamique des Populations Bactériennes Faculté de Médecine Lyon-Sud Laboratoire de Bactériologie BP 1269600 OULLINS Tél : 04.78.86.31.50 Fax : 04.72.43.13.88 [email protected] M. Lionel BRUNIE INSA DE LYON EDIIS Bâtiment Blaise Pascal 69621 VILLEURBANNE Cedex Tél : 04.72.43.60.55 Fax : 04.72.43.60.71 [email protected] M. Alain Jean COZZONE IBCP (UCBL1) 7 passage du Vercors 69367 LYON Cedex 07 Tél : 04.72.72.26.75 Fax : 04.72.72.26.01 [email protected] M. Jacques JOSEPH Ecole Centrale de Lyon Bât F7 Lab. Sciences et Techniques des Matériaux et des Surfaces 36 Avenue Guy de Collongue BP 163 69131 ECULLY Cedex Tél : 04.72.18.62.51 Fax : 04.72.18.60.90 [email protected] M. Franck WAGNER Université Claude Bernard Lyon1 Institut Girard Desargues UMR 5028 MATHEMATIQUES Bâtiment Doyen Jean Braconnier Bureau 101 Bis, 1er étage 69622 VILLEURBANNE Cedex Tél : 04.72.43.27.86 Fax : 04.72.43.16.87 M. François SIDOROFF Ecole Centrale de Lyon Lab. Tribologie et Dynamique des Systèmes Bât G8, 36 avenue Guy de Collongue, BP 163 69131 ECULLY Cedex Tél : 04.72.18.62.14 Fax : 04.72.18.65.37 [email protected] ii Résumé Cette étude a pour cadre l’extraction de paramètres quantitatifs caractérisant la dynamique d’organes (thorax & cœur) en mouvement à partir de séquences d’images tridimensionnelles acquises en imagerie médicale. Notre approche s’appuie sur des techniques de recalage non-linéaires paramétriques et des transformations dites déformations de formes libres. Une représentation multi-résolution et multi-échelle de recalage non-linéaire 3D dans une base de fonctions B-splines est d’abord proposée. Nous constatons les limites de l’approche 3D pour l’estimation et le suivi de mouvement dans une séquence d’images et la nécessité d’introduire des contraintes temporelles. Nous avons contribué à la construction d’un modèle dynamique probabiliste des 4 cavités cardiaques. Le modèle géométrique des structures est constitué d’un ensemble de pseudo-marqueurs qui décrit l’évolution des surfaces cardiaques. Un échantillonnage des trajectoires de ces pseudo-marqueurs adapté à la séquence d’images à traiter permet d’obtenir, pour chacun des instants, un modèle statistique composé d’une forme moyenne et de variations estimées par une méthode de fenêtrage de Parzen. Un modèle d’état paramétrique et continu des transformations spatio-temporelles est ensuite introduit. Un algorithme basé sur le filtrage de Kalman estime les paramètres de ce modèle sous la contrainte de périodicité du mouvement. L’avantage principal de cette méthode est de prendre en compte de manière globale l’ensemble des images de la séquence. Le cadre théorique proposé permet également l’adaptation locale de la complexité du modèle au mouvement à estimer. Afin de diminuer les temps de calcul, une version parallèle et diverses stratégies ont été mises en oeuvre, en particulier sur une architecture multiprocesseurs. Enfin, une évaluation de l’influence des paramètres est proposée sur des cas synthétiques et réels en imagerie cardiaque. La mise en place d’un cadre d’évaluation permet d’effectuer des comparaisons avec d’autres méthodes dans un contexte de prise en compte du mouvement dans la préparation de traitements en radiothérapie des poumons. Mots-clés : Analyse d’images, Estimation spatio-temporelle de mouvement, Recalage non linéaire d’images, imagerie 4D, Contrainte temporelle, Filtrage de Kalman, Multirésolution, Modèle statistique de forme 4D, Imagerie thoracique et cardiaque. Abstract This motivation of this study is the extraction of quantitative parameters characterizing the dynamics of moving organs (thorax structures & heart) from three-dimensional medical image sequences. Our approach is based on non-linear parametric registration technique. The deformation model, known as free form deformation transformation, is based on a hierachical multi-scale parametric representation using B-Spline basis functions. We quickly noticed the limits of this 3D approach for motion estimation and tracking in sequences and the need for introducing temporal constraints. First of all, we contributed to the construction of a probabilistic dynamic model of the 4 cardiac chambers. The geometrical model of the structures consists of a set of pseudo-markers which describe the evolution of cardiac surfaces. A sampling of the trajectories of these pseudo-markers is adapted to the image sequence of images. This results in a statistical model made up of an iii average shape and variations estimated by Parzen windowing at each time points. A parametric and continuous state model of the spatio-temporal transformations is introduced. An algorithm based on the Kalman filter estimates the parameters of this model under the constraint of motion periodicity. The principal advantage of this method is to take into account all the images in the sequence. This proposed framework allows the contextual adaptation of the complexity of the motion model. In order to decrease computing times, a parallel version and various strategies were implemented, in particular on a multiprocessors architecture. Lastly, an evaluation of the parameters influence is proposed on synthetic and real cases in the context of cardiac imaging. An evaluation framework has been also settled to carry out comparison with other motion estimation methods in the context of motion compensated radiotherapy of lung tumors. Keywords : Medical Imaging, Spatio-temporal motion estimation, Non linear image registration, 4D Imaging, Temporal constraint, Kalman Filtering, Multiresolution, 4D statistical model of the shape. iv Table des matières Introduction Générale 3 I Contexte médical et méthodologique 5 1 Contexte médical 1.1 Introduction . . . . . . . . . . . . . . . . . 1.2 Anatomie et Physiologie cardiaque . . . . . 1.2.1 Description de l’anatomie cardiaque 1.2.2 Physiologie cardiaque . . . . . . . 1.2.3 Les mouvements cardiaques . . . . 1.2.4 Défauts de l’activité cardiaque . . . 1.3 Le système respiratoire . . . . . . . . . . . 1.3.1 Physiologie respiratoire . . . . . . 1.3.2 Fonction ventilatoire . . . . . . . . 1.3.3 Pathologies pulmonaires . . . . . . 1.3.4 Radiothérapie . . . . . . . . . . . . 1.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Imagerie médicale d’organes en mouvement 2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . 2.2 Modalités d’imagerie d’organes en mouvement . . . 2.3 Exploration de l’activité cardiaque en IRM . . . . . . 2.3.1 Formation des images par RM . . . . . . . . 2.3.2 Les séquences de base en imagerie cardiaque 2.3.3 Les séquences IRM rapides et ultra rapides . 2.3.4 Images par RM utilisées dans cette thèse . . 2.3.5 IRM de marquage tissulaire . . . . . . . . . 2.4 La Tomodensitométrie à Rayons X . . . . . . . . . . 2.4.1 Caractérisation des images TDM . . . . . . . 2.4.2 Dispositifs d’acquisition . . . . . . . . . . . 2.4.3 TDM dynamique . . . . . . . . . . . . . . . 2.4.4 TDM 4D . . . . . . . . . . . . . . . . . . . 2.4.5 Images TDM utilisées dans cette thèse . . . . v . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 9 9 10 12 13 14 14 16 18 18 20 . . . . . . . . . . . . . . 21 21 22 26 26 28 28 30 31 33 33 33 35 36 36 TABLE DES MATIÈRES vi 2.5 3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Etat de l’art 3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Estimation de mouvement . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Les méthodes différentielles . . . . . . . . . . . . . . . . . . 3.2.2 Mise en correspondance de blocs (MCB) . . . . . . . . . . . 3.2.3 Les méthodes statistiques . . . . . . . . . . . . . . . . . . . . 3.3 Recalage d’images médicales . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Principe du recalage d’images . . . . . . . . . . . . . . . . . 3.3.2 Les primitives . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.2.1 Approches par primitives géométriques . . . . . . . 3.3.2.2 Approches par primitives iconiques . . . . . . . . . 3.3.2.3 Approches hybrides . . . . . . . . . . . . . . . . . 3.3.3 Modèles de transformation . . . . . . . . . . . . . . . . . . . 3.3.3.1 Approches paramétriques . . . . . . . . . . . . . . 3.3.3.2 Approches non-paramétriques . . . . . . . . . . . . 3.3.4 Optimisation . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Suivi d’objets et de mouvement dans une séquence . . . . . . . . . . 3.4.1 Alignement de séquences . . . . . . . . . . . . . . . . . . . . 3.4.2 Estimation spatio-temporelle de mouvement . . . . . . . . . . 3.4.3 Suivi de structures déformables dans des séquences d’images . 3.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 41 41 42 43 43 44 44 45 45 45 46 47 47 47 49 50 51 51 51 53 54 II Contributions Méthodologiques 55 4 57 57 58 58 59 60 60 62 63 64 64 65 65 65 65 67 69 72 72 Estimation de mouvement par recalage 4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Recalage de deux images . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 Motivations . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.2 Problématique . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Modèle de transformation . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.2 Modèle non-linéaire de transformation . . . . . . . . . . . . 4.3.3 Fonctions splines . . . . . . . . . . . . . . . . . . . . . . . 4.3.4 Calcul pratique de la transformation FFD B-Spline . . . . . 4.3.4.1 Calcul des coordonnées locales . . . . . . . . . . 4.3.4.2 Influence des fonctions d’interpolation . . . . . . 4.3.4.3 Calcul de la déformation . . . . . . . . . . . . . 4.3.5 Approche bi-pyramidale de l’estimation de la transformation 4.3.5.1 La pyramide d’images . . . . . . . . . . . . . . . 4.3.5.2 La pyramide de transformations . . . . . . . . . . 4.3.6 Propriétés de la transformation . . . . . . . . . . . . . . . . 4.3.7 Régularisation . . . . . . . . . . . . . . . . . . . . . . . . 4.3.7.1 Énergie de membrane élastique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . TABLE DES MATIÈRES 4.4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 73 76 76 76 80 81 81 83 83 84 89 5 Including prior shape in segmentation tracking 5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Motivations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Geometric modeling of the cardiac cavities . . . . . . . . . . . . . . 5.3.1 3-D shape model construction [Lötjönen et al., 2004] . . . . . 5.3.2 Dynamic models construction . . . . . . . . . . . . . . . . . 5.3.2.1 4D dataset segmentation . . . . . . . . . . . . . . . 5.3.2.2 Normalization and resampling of the temporal axis . 5.3.2.3 Dynamic models relevance . . . . . . . . . . . . . 5.4 Time-dependent statistical modeling of the shape variability . . . . . 5.5 Integrating the SDM into the segmentation tracking process . . . . . . 5.5.1 Time-dependent prior shape . . . . . . . . . . . . . . . . . . 5.5.2 First frame initialization . . . . . . . . . . . . . . . . . . . . 5.5.3 SDM adapted cost function . . . . . . . . . . . . . . . . . . . 5.6 Proposal summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 91 93 93 95 98 98 99 99 100 103 103 105 105 107 . . . . . . . . . . . . . . . . 109 109 110 110 111 111 113 113 114 115 116 117 119 119 122 122 122 4.5 4.6 Critères de mise en correspondance . . . . . . . . . . . . . . . . 4.4.1 terme d’appariement . . . . . . . . . . . . . . . . . . . . 4.4.2 Choix des opérateurs . . . . . . . . . . . . . . . . . . . . 4.4.2.1 Opérateur D1 . . . . . . . . . . . . . . . . . . 4.4.2.2 Opérateur D2 . . . . . . . . . . . . . . . . . . 4.4.2.3 Opérateur D3 . . . . . . . . . . . . . . . . . . Optimisation et implantation . . . . . . . . . . . . . . . . . . . . 4.5.1 La stratégie d’optimisation . . . . . . . . . . . . . . . . . 4.5.2 Accélération des calculs . . . . . . . . . . . . . . . . . . 4.5.2.1 Réduction de l’espace d’analyse . . . . . . . . 4.5.2.2 Implantation sur architecture multi-processeurs Discussion et résumé de la contribution . . . . . . . . . . . . . . vii . . . . . . . . . . . . 6 Estimation spatio-temporelle de mouvement 6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Définitions préalables . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.1 Notion de Trajectoire . . . . . . . . . . . . . . . . . . . . . . 6.2.2 Description Lagrangienne du mouvement . . . . . . . . . . . 6.2.3 Description Eulérienne du mouvement . . . . . . . . . . . . . 6.2.4 Périodicité . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 Techniques d’estimation et de filtrage de signaux stochastiques . . . . 6.3.1 Processus markovien et modèle d’état . . . . . . . . . . . . . 6.3.2 Estimateur d’état de Kalman . . . . . . . . . . . . . . . . . . 6.4 Application à l’estimation de mouvement dans une séquence d’images 6.4.1 Modèle spatio-temporel de mouvement . . . . . . . . . . . . 6.4.2 Vecteur d’état . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.3 Prédiction et Filtrage . . . . . . . . . . . . . . . . . . . . . . 6.4.4 Critère d’arrêt . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.5 Contrainte de passage à l’origine . . . . . . . . . . . . . . . . 6.4.6 Approche Multiéchelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . TABLE DES MATIÈRES viii 6.5 6.4.7 Trajectoires de complexité adaptative 6.4.8 Remarques complémentaires . . . . . 6.4.9 Prétraitement des données . . . . . . Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 124 124 127 III Evaluation 129 7 . . . . . . . . . . . . . . . 131 131 132 132 133 133 133 134 134 134 135 135 136 137 138 139 . . . . . . . . 143 143 146 146 149 151 151 151 156 . . . . . . . . . . . 157 157 158 159 160 160 161 163 163 163 164 165 8 9 Méthodologie d’évaluation 7.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Brève revue des méthodes d’évaluation . . . . . . . . . . . . . . . . . 7.2.1 Références synthétiques . . . . . . . . . . . . . . . . . . . . . 7.2.2 Détermination d’un bronze standard . . . . . . . . . . . . . . . 7.2.2.1 Références obtenue par analyse d’experts . . . . . . . 7.2.2.2 Références obtenues algorithmiquement . . . . . . . 7.2.3 Qualité de la transformation . . . . . . . . . . . . . . . . . . . 7.2.3.1 Inspection visuelle . . . . . . . . . . . . . . . . . . . 7.2.3.2 Propriétés de la déformation . . . . . . . . . . . . . . 7.2.3.3 Transport d’atlas . . . . . . . . . . . . . . . . . . . . 7.3 Méthodes d’évaluation utilisées dans cet ouvrage . . . . . . . . . . . . 7.3.1 Evaluation du mouvement . . . . . . . . . . . . . . . . . . . . 7.3.2 Evaluation dans une séquence d’images . . . . . . . . . . . . . 7.3.3 Evaluation du suivi de mouvement par recalage spatio-temporel 7.3.3.1 Séquences de synthèse . . . . . . . . . . . . . . . . . Résultats 8.1 Evaluation du compromis précision / temps de calcul . . . . 8.1.1 Résultats . . . . . . . . . . . . . . . . . . . . . . . 8.1.2 Discussion . . . . . . . . . . . . . . . . . . . . . . 8.2 Evaluation de l’estimation de mouvement spatio-temporelle . 8.2.1 Résultats . . . . . . . . . . . . . . . . . . . . . . . 8.2.1.1 Evaluation sur des données synthétiques . 8.2.1.2 Evaluation sur des données réelles . . . . 8.2.2 Discussion . . . . . . . . . . . . . . . . . . . . . . Comparaison d’algorithmes 9.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2 Le mouvement en radiothérapie . . . . . . . . . . . . . . . 9.3 Matériel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.4 Procédure d’évaluation . . . . . . . . . . . . . . . . . . . . 9.4.1 Sélection des amers . . . . . . . . . . . . . . . . . . 9.4.2 Evaluation quantitative de la précision des méthodes 9.4.3 Analyse des trajectoires . . . . . . . . . . . . . . . 9.4.3.1 Modélisation du cycle respiratoire . . . . 9.4.3.2 Erreur spatio-temporelle . . . . . . . . . . 9.4.3.3 Trajectoires directes et indirectes . . . . . 9.4.4 Méthodes d’estimation de mouvement comparées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . TABLE DES MATIÈRES 9.5 9.6 9.7 ix 9.4.4.1 Notre méthode : m1 . . . . . . . . . . . . . . . . . . . 9.4.4.2 Flux optique optimisé : m2 . . . . . . . . . . . . . . . 9.4.4.3 Méthode par modèle déformable biomécanique : m3 . . Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.5.1 Résultats relatifs au critère T RE . . . . . . . . . . . . . . . . . . 9.5.2 Résultats relatifs au ST E . . . . . . . . . . . . . . . . . . . . . Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.6.1 Précision des méthodes . . . . . . . . . . . . . . . . . . . . . . . 9.6.2 Etude des trajectoires . . . . . . . . . . . . . . . . . . . . . . . . 9.6.2.1 La métrique ST E pour l’évaluation des méthodes . . . 9.6.2.2 La métrique ST E pour l’évaluation de l’apport du mouvement en radiothérapie . . . . . . . . . . . . . . . . . 9.6.2.3 Comparaison de la T RE et de la ST E . . . . . . . . . Conclusion partielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 166 166 167 167 170 170 173 174 174 175 175 176 Conclusion et Perspectives 181 Bilan des contributions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 Perspectives méthodologiques . . . . . . . . . . . . . . . . . . . . . . . . . . 182 Perspectives applicatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 Annexes 189 A La Tomodensitométrie à rayons X 189 A.1 Principe Physique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 A.2 Formation des Images . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 B L’Imagerie par Résonance Magnétique B.1 Fondements Physiques . . . . . . . B.2 Formation des Images par RM . . . B.2.1 Encodage spatial . . . . . . B.2.2 Les séquences d’écho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 193 195 196 196 C Filtrage de Kalman 199 C.1 Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 C.2 Prédicteur à l’horizon 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 Bibliographie 205 Bibliographie personelle 205 Bibliographie 220 TABLE DES MATIÈRES x Notations D’une manière générale, les vecteurs et les matrices seront notés en gras, les lettres minuscules désignent des vecteurs et les lettres majuscules designent des matrices. Termes généraux : Rd ϕ M x t j u u(x, t) v ΓM ∇ ∇x espace de dimension d transformation géométrique Point matériel Point géométrique de l’espace Variable continue du temps Variable discrète du temps Déplacement Déplacement du point x à l’instant t vitesse Trajectoire du point matériel M Gradient Gradient suivant la direction x Termes relatifs au recalage d’images : Ic Is Pk ξk βr A R C PImg PT rans Image cible Image source Point de contrôle k Déplacement du point de contrôle Pk B-Spline de degré r Terme d’appariement Terme de régularisation Terme de constrainte Pyramide d’images Pyramide de transformations Termes relatifs au modèle dynamique cardiaque : L(i) S(p) D(p) xi,p K() Pseudo marqueur i Modèle géométrique du cœur pour le sujet p Modèle géométrique dynamique du cœur pour le sujet p Coordonnées du pseudo marqueur i pour le sujet p Noyau de convolution TABLE DES MATIÈRES Termes relatifs au filtrage de Kalman : x z A C v w Sξk Uk Vecteur d’état Mesure Matrice de transition d’état Matrice de mesure Bruit d’état Bruit de mesure Série de Fourier du point de contrôle Pk Vecteur de paramètres de la trajectoire du point Pk 1 2 TABLE DES MATIÈRES Introduction Générale Ce mémoire présente des contributions méthodologiques pour l’estimation du mouvement et le suivi de structures déformables dans des séquences d’images. Ces travaux sont motivés par deux contextes applicatifs médicaux. Le premier concerne l’estimation de la dynamique du cœur en IRM pour l’aide à la détection d’anomalies dans des pathologies cardiaques comme l’ischémie myocardique. La seconde concerne la prise en compte du mouvement respiratoire dans la préparation de séances de radiothérapie de tumeurs pulmonaires. Le fil conducteur de mes travaux concerne la prise en compte du temps dans les traitements proposés afin d’apporter une cohérence sur l’ensemble des estimations de mouvement dans une séquence temporelle. La description de mes travaux fait l’objet de la seconde partie de ce mémoire. Ce travail de thèse s’inscrit dans le cadre d’une collaboration entre le laboratoire Creatis, le VTT1 à Tampere et le laboratoire BME2 à Helsinki, Finlande. Un séjour doctoral de 6 mois à Helsinki (du 01/10/04 au 31/03/05), financé en partie par la bourse régionale Eurodoc (Région Rhônes Alpes) et par l’ambassade de France à Helsinki m’a permis de découvrir d’autres méthodes de travail. Nous avons dans ce cadre envisagé l’apport d’une information a priori de forme grâce à la construction d’un modèle dynamique statistique de structures cardiaques. Pour cette raison, l’ensemble de ce document sera rédigé en français, excepté le chapitre 5, qui concerne la construction et l’utilisation d’un tel modèle et qui sera rédigé en anglais. Ce mémoire est structuré de la manière suivante : • La première partie s’attache à présenter les fondements médicaux de ce travail de recherche. La chapitre 1 propose un exposé des contextes applicatifs, et des notions d’anatomie et de physiologie qui seront présentes tout au long de mes travaux. Il en ressort un certain nombre d’hypothèses dont nous devrons tenir compte par la suite (étude de la déformation d’organes mous, périodicité des phénomènes étudiés). Le chapitre 2 décrit les dispositifs d’acquisition permettant de fournir des séquences d’images qui traduisent le comportement physiologique d’organes en mouvement. Le chapitre 3 propose une synthèse des méthodes capables d’estimer le mouvement entre deux ou plusieurs images. Nous insisterons plus particulièrement sur les méthodes d’estimation de mouvement sur une séquence entière d’images. • La seconde partie est dédiée aux contributions méthodologiques. Le chapitre 4 1 2 http ://www.vtt.fi/ http ://biomed.tkk.fi/image/index.html 3 4 TABLE DES MATIÈRES concerne la mise en place d’une méthode d’estimation de mouvement entre deux images 2D ou 3D quelconques d’une séquence. Le modèle de transformation paramétrique et non-linéaire repose sur une approche multi-échelle. Il s’agit d’une représentation de déformations de forme libre exprimée dans une base de fonctions B-Splines. Nous introduisons un filtre dont la sortie traduit le caractère stationnaire local de l’intensité des pixels. Ce filtre est utilisé dans le but de fournir un terme d’appariement vectoriel robuste et de réduire notablement les temps de calcul. Le chapitre 5 concerne la construction d’un modèle statistique de forme dynamique utilisé dans le cadre de l’application cardiaque pour contraindre la méthode de recalage et pour assurer le suivi des structures du cœur dans une séquence d’images. Dans le chapitre 6, nous proposons de considérer l’algorithme de recalage décrit dans le chapitre 4 comme la mesure d’un filtre de Kalman. Pour cela, nous introduisons un modèle de mouvement spatio-temporel. Ce modèle est l’extension à l’axe temporel du modèle de transformation d’images. Ce modèle garantit la continuité et la périodicité des mouvements estimés. L’estimation des paramètres repose sur la contribution de tous les instants de la séquence. Finalement, nous introduisons une stratégie d’adaptation locale des modèles de trajectoires en fonction de l’amplitude de la déformation. • La dernière partie est consacrée à l’évaluation des méthodes proposées. Nous discutons tout d’abord l’impact des paramètres les plus importants des méthodes d’estimation de mouvement entre deux images. Afin d’évaluer la précision de la méthode pour l’ensemble d’une séquence, un contexte d’évaluation est proposé (chapitre 8) plus spécifiquement pour évaluer l’apport du recalage et comparer différentes techniques de recalage sur l’ensemble d’une séquence dans un contexte de prise en compte du mouvement dans la radiothérapie des poumons. Enfin, nous présentons les premières évaluations de la méthode d’estimation spatio-temporelle de mouvement introduite au chapitre 6. Une conclusion synthétisera les contributions et les résultats obtenus et proposera des perspectives à mes travaux. Première partie Contexte médical et méthodologique 5 Chapitre 1 Contexte médical Sommaire 1.1 1.2 1.3 1.4 Introduction . . . . . . . . . . . . . . . . Anatomie et Physiologie cardiaque . . . . 1.2.1 Description de l’anatomie cardiaque 1.2.2 Physiologie cardiaque . . . . . . . 1.2.3 Les mouvements cardiaques . . . . 1.2.4 Défauts de l’activité cardiaque . . . Le système respiratoire . . . . . . . . . . 1.3.1 Physiologie respiratoire . . . . . . 1.3.2 Fonction ventilatoire . . . . . . . . 1.3.3 Pathologies pulmonaires . . . . . . 1.3.4 Radiothérapie . . . . . . . . . . . . Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 9 9 10 12 13 14 14 16 18 18 20 1.1 Introduction C e chapitre est consacré au contexte général de mes travaux de recherche. Notre problématique porte sur deux points : 1. l’étude individualisée de la cinétique cardiaque pour l’aide au diagnostique et la détection d’anomalies et de pathologies telles que l’ischémie myocardique. 2. le suivi de cibles tumorales en mouvement dans des structures thoraciques, en particulier les poumons, pour la mise en place de traitements adaptés comme la radiothérapie. Afin d’en comprendre les enjeux, nous commençons la partie dédiée à la description des contextes applicatifs de mes travaux avec des rapports publiés récemment (2003-2005) sur le site de l’Organisation Mondiale de la Santé 1 (OMS). Ces rapports concernent les 1 http ://www.who.int/en 7 CHAPITRE 1. CONTEXTE MÉDICAL 8 défis actuels de la santé dans le monde et l’importance, sans cesse croissante, des maladies non transmissibles telles que les maladies cardio-vasculaires ou le cancer. Il y a encore de cela 25 ans, le traitement et la prévention des maladies cardio-vasculaires (MCV) ne faisaient pas parti des priorités sanitaires à l’échelle mondiale. Les MCV étaient considérées comme des maladies des pays industrialisés liées au mode de vie totalement différent de celui de pays en voie de développement. Actuellement la réalité est tout autre. Si elles constituent toujours la première cause de mortalité dans les pays industrialisés (la seconde cause étant les tumeurs malignes), contrairement aux idées reçues, les MCV ont fait leur apparition dans presque tous les pays pauvres venant s’ajouter aux maladies transmissibles qui continuent de sévir. En 2002, sur 32 millions de décès recensés liés aux maladies non transmissibles, plus de la moitié (16.7 millions) sont d’origines cardio-vasculaires. Dorénavant, ces décès sont deux fois plus nombreux dans les pays en développement que dans les pays développés. Un second rapport2 décrit de manière quantitative l’influence des MCV à l’échelle mondiale : • Avec 16.7 millions de morts en 2002, les MCV représentent 29.2% de la mortalité globale recensée. • 80% des MCV sont intervenues dans les pays développés. • D’ici à 2010, les MCV pourraient être la cause principale de mortalité dans les pays en voie de développement. • Les maladies cardiaques n’ont pas de frontières géographiques ou socioéconomiques. Sur les 16.7 millions de morts dues aux MCV, 7.2 millions sont liées à l’ischémie myocardique. Une étude économique issue d’articles publiés dans l’European Heart Journal [Leal1 et al., 2006], établit le constat du coût engendré par le traitement et la prise en charge des maladies cardio-vasculaires au sein de l’Union Européenne (UE). D’après les auteurs, les dépenses des maladies cardio-vasculaires pourraient culminer à 181 milliards d’euros pour 2005 dans l’UE. Ce chiffre comprend les soins de santé, les pertes de productivité et les soins informels. Concernant l’impact du cancer sur la morbidité mondiale, un article paru en 20053 nous fournit les informations suivantes : "Le cancer occupe une place de plus en plus importante dans la charge de morbidité mondiale. Quelque 24.6 millions de personnes vivent actuellement avec un cancer ; on estime qu’elles seront 30 millions en 2020. D’ici à 2020, le cancer pourrait faire plus de 10 millions de victimes par an. Si cette tendance perdure, on estime que le nombre annuel de nouveaux cas passera de 10.9 millions en 2002 à 16 millions en 2020. Quelque 60 % de ces cas surviendront dans les pays les moins avancés du monde. Près de 7 millions de personnes succombent actuellement chaque année au cancer. Dans les pays industrialisés, le cancer se situe au deuxième rang des causes de mortalité après les maladies cardiovasculaires et, selon les données épidémiologiques, cette tendance est en voie d’émerger dans les pays les moins avancés. C’est le cas en particulier des pays "en transition", comme en 2 3 http ://www.who.int/dietphysicalactivity/publications/facts/cvd/en/ http ://www.who.int/features/qa/15/fr/index.html 1.2. ANATOMIE ET PHYSIOLOGIE CARDIAQUE 9 Amérique du sud et en Asie. Aujourd’hui déjà, plus de la moitié de tous les cas de cancer surviennent dans les pays en développement. Le cancer des poumons fait plus de victimes que tout autre cancer." Après l’exposé de ces faits, la suite de ce chapitre donne des éléments d’anatomie et de physiologie cardiaque et pulmonaire. Pour chacun de ces deux organes, nous insistons sur le comportement physiologique lié plus particulièrement à leur dynamique et sur les mouvements observables avec les techniques d’imagerie actuelles. 1.2 Anatomie et Physiologie cardiaque Cette section est consacrée à l’étude du cœur, moteur de la circulation sanguine. Une description de l’anatomie et de la physiologie cardiaque est d’abord proposée. Puis nous exposerons brièvement les pathologies liées à la diminution de la fonction contractile du myocarde. 1.2.1 Description de l’anatomie cardiaque Le cœur est un muscle creux chargé de la circulation du sang grâce à des contractions périodiques. Son rôle est de pomper le sang automatiquement afin de le redistribuer dans les organes du corps humain. Situé dans le médiastin, entre les poumons et au dessus du diaphragme, il pèse de 250 à 350 grammes chez l’adulte et mesure environ 13 cm de long sur 8 cm de large. Le cœur est composé de quatre cavités (Fig. 1.1). On distingue les oreillettes gauche (OG) et droite (OD) en haut, à paroi mince, et les ventricules gauche (VG) et droit (VD), en bas, à paroi épaisse. Ces cavités sont délimitées par une nappe musculaire (la paroi interauriculaire sépare les deux oreillettes et le septum interventriculaire, plus épais, sépare les deux ventricules) Le cœur est principalement composé d’un tissu musculaire strié, le myocarde, qui ne ressemble à aucun autre tissu musculaire du corps. Les cavités et les valves sont tapissées par l’endocarde qui constitue la couche interne du cœur. La surface externe du cœur est recouverte par une membrane à deux feuillets. Le premier d’entre eux, l’épicarde, est collé au muscle cardiaque. Le second, le péricarde, est un "sac" qui contient le cœur et le départ de l’aorte et de l’artère pulmonaire. Ces deux tissus sont séparés par une couche de liquide d’environ 10 à 15 ml dont le rôle est de lubrifier les contacts durant le cycle cardiaque. Ces feuillets péricardiques facilitent les mouvements de la masse cardiaque au cours de son cycle. L’OG et le VG constituent la partie gauche du cœur qui recueille le sang oxygéné sortant des poumons par les veines pulmonaires pour le propulser dans l’aorte et ses divisions. La partie gauche et notamment le ventricule assure donc la distribution du sang (environ 25 litres par minute) dans l’ensemble du corps humain à travers un réseau vasculaire d’environ 100 km ! On comprend donc l’intérêt que suscite l’étude de cette cavité. L’OD et le VD constituent la partie droite du cœur qui assure la circulation du sang chargé en dioxyde de carbone recueilli par les veines caves. Le sang carboné aboutit dans l’oreillette droite puis est transmis au ventricule droit. Il est ensuite éjecté dans l’artère pulmonaire vers les poumons. La circulation du sang au sein du cœur est assurée par la présence d’un CHAPITRE 1. CONTEXTE MÉDICAL 10 ensemble de valvules unidirectionnelles. Le sang circule ainsi toujours dans la même direction grâce à ces quatre valves cardiaques, appelées respectivement tricuspide, pulmonaire, mitrale, et aortique. Ces valves sont des structures fibreuses très souples, implantées sur des anneaux qui constituent les orifices qu’elles viennent obstruer. Elles sont amarrées aux parois ventriculaires par des cordages nommés piliers du cœur. En position fermée, elles sont hermétiques et empêchent le passage du sang. Elles s’ouvrent toutes dans un sens bien défini, empêchant ainsi tout reflux. Voici leur description respective : • la valve tricuspide s’ouvre dans le sens de l’oreillette droite vers le ventricule droit. • la valve pulmonaire s’ouvre dans le sens du ventricule droit vers l’artère pulmonaire. • la valve mitrale s’ouvre dans le sens de l’oreillette gauche vers le ventricule gauche. • la valve aortique s’ouvre dans le sens du ventricule gauche vers l’aorte. F IG . 1.1. Description anatomique du cœur (source : www.medecine-et-sante.com/anatomie/coeur.html). 1.2.2 Physiologie cardiaque Le fonctionnement du muscle cardiaque est complexe et présente de nombreuses facettes. Nous résumons ici les principales phases de la pompe cardiaque qui règlent la circulation du sang dans l’organisme, sa fonction primordiale. Pour un exposé approfondi de la physiologie cardiaque, nous invitons le lecteur à se référer à des ouvrages plus spécialisés [Houdas, 1990]. Un cycle cardiaque se déroule en deux étapes. Dans un premier temps, la diastole correspond au remplissage des ventricules. Les valves auriculoventriculaires (mitrale et tricuspide) sont alors ouvertes et les valves sigmoïdes (aortique et pulmonaire) sont fermées. Le durée d’une diastole est d’environ 600 ms. Dans un second temps, la systole correspond à la contraction des ventricules. Les valves sigmoïdes 1.2. ANATOMIE ET PHYSIOLOGIE CARDIAQUE 11 s’ouvrent pour permettre l’évacuation du sang accumulé durant la diastole vers les organes du corps humain. Les valves auriculoventriculaires se ferment pour éviter tout reflux du sang vers les oreillettes. La phase systolique se déroule en 300 ms environ. Les deux instants de télédiastole et de télésystole indiquent respectivement le relâchement maximum et la contraction maximale du ventricule gauche. Le fonctionnement du muscle cardiaque est périodique et totalement automatique dans le sens où il n’a besoin d’aucun stimulus externe. L’amplitude des mouvements impliqués lors des cycles cardiaques est constante. La Figure 1.2 illustre l’évolution de quelques paramètres physiologiques du cœur au cours du cycle cardiaque, en particulier les courbes de pressions et de volumes des cavités en regard de l’électrocardiogramme, signal électronique périodique représentant le cycle cardiaque. F IG . 1.2. Quelques paramètres physiologique du cœur au cours du cycle cardiaque La partie B de la Fig. 1.2 correspond à la variation des volumes ventriculaires au cours du cycle. Le volume d’éjection systolique (VES ) représente le volume de sang éjecté pendant chaque contraction. Chez l’homme, il varie entre environ 70ml au repos à 150ml chez le sportif en plein effort. Il se calcule par une simple différence entre le volume de sang dans le ventricule gauche en fin de diastole avant éjection, ou volume télédiastolique (VT D ) et le volume de sang dans le ventricule gauche en fin de systole, après éjection du sang ou volume télésystolique (VT S ). De ces mesures, on peut également définir le débit cardiaque : DC = VES ∗ Fc où Fc représente la fréquence cardiaque. Une importance particulière est généralement 12 CHAPITRE 1. CONTEXTE MÉDICAL portée à la fraction d’éjection (FE ) exprimée en pourcentage : VT D − VT S × 100%. (1.1) FE = VT D La fraction d’éjection du VG est normalement d’environ 65% ce qui signifie que 65% du sang qui est contenu dans le ventricule gauche en télédiastole est éjecté. Un chiffre plus bas indique un mauvais fonctionnement du myocarde. Il s’agit donc d’un critère global permettant de mesurer le degré de l’insuffisance cardiaque. Ces indicateurs sont très utilisés en routine clinique mais ils ne sont basés que sur deux états extrêmes du muscle cardiaque. L’étude des déformations cardiaques sur l’ensemble du cœur et du cycle cardiaque doit permettre une identification plus précise des régions pathologiques [Götte et al., 2001]. L’ouverture et la fermeture de chacune des valves sont passives. Elles dépendent de la différence de pression de chaque côté des membranes vasculaires (Fig. 1.2, A). Lors de l’éjection, la différence de pression est assurée par la fonction mécanique du cœur, elle-même pilotée par la propagation d’une onde électrique de dépolarisation dans les tissus nodaux. L’activité électrique devient dès lors un excellent indicateur de son état à un instant précis. Quand l’onde électrique traverse le cœur, une infime partie de ce courant se propage à la surface du corps. En installant des électrodes aux poignets, aux chevilles et sur la peau du thorax, il est possible d’acquérir un signal électrique en temps réel. Cet examen est appelé électrocardiogramme (ECG) (voir Fig. 1.2,C). La forme générale de l’ECG présente un ensemble d’ondes caractéristiques indexées par des lettres et correspondant à des phases bien déterminées. Ainsi, l’onde de dépolarisation auriculaire porte la dénomination P. La dépolarisation ventriculaire recouvre les ondes appelées Q, R et S. Lorsqu’une onde a une amplitude égale ou supérieure à 5 mm, la lettre la désignant est majuscule, sinon elle est minuscule. La déflexion négative débutant une dépolarisation ventriculaire porte la lettre Q (ou q). Celle ne débutant pas une dépolarisation ventriculaire porte la lettre S (ou s). L’onde positive porte la lettre R (ou r). L’ ECG est fondamental en cardiologie. Il permet en effet au médecin de poser, par l’analyse de ce signal, des diagnostics précis (troubles du rythme, infarctus, péricardite, etc.), sans entraîner la moindre contrainte ou traumatisme pour le malade. L’électrocardiogramme est, en effet, un examen indolore non invasif et sans aucune contre-indication. Une autre raison, plus adaptée à notre contexte, consiste à se servir de ce signal pour renseigner en temps réel les algorithmes de reconstruction d’images de la configuration du cœur. Il permettra ainsi de déclencher des acquisitions ou de trier des informations à des moments précis du cycle cardiaque. La fermeture des valves est responsable des bruits caractéristiques que l’on associe au cœur. Le premier bruit, appelé B1, correspond à la fermeture des valves mitrales et tricuspides et le second bruit, B2, correspond à la fermeture des valves aortiques et pulmonaires (Fig. 1.2, D). 1.2.3 Les mouvements cardiaques Le mouvement du cœur est extrêmement complexe du fait de l’hétérogénéité des tissus qui le composent. D’une manière simplifiée, on peut considérer qu’il y a 3 couches. Une 1.2. ANATOMIE ET PHYSIOLOGIE CARDIAQUE 13 couche centrale prépondérante où les fibres sont orientées de manière circonférentielle et deux couches périphériques où les fibres sont inclinées d’environ ±60◦ , respectivement (Fig. 1.3). Cette configuration permet notamment la torsion du cœur pour une meilleure efficacité de l’éjection du sang. Ventricule Gauche Endocarde 111111 000000 000000 111111 000000 111111 000000 111111 000000 111111 000000 111111 000000 111111 000000 111111 000000 111111 11111 00000 00000 11111 00000 11111 00000 11111 0000 1111 0000 1111 00000 0000 11111 1111 0000 1111 00000 11111 0000 1111 0000 1111 00000 0000 11111 1111 0000 1111 00000 Epicarde 0000 11111 1111 0000 11111 1111 00000 0000 1111 0000 1111 00000 11111 0000 1111 0000 11111 1111 00000 0000 1111 0000 1111 0000 1111 F IG . 1.3. Orientation des fibres musculaires du ventricule gauche, schéma inspiré de [Petitjean, 2003] On ne dispose pas de modèle précis des mouvements cardiaques. Cependant il est possible de donner une description globale et qualitative des principaux mouvements du cœur [Han, 1999]. Ainsi la systole cardiaque est caractérisée par : • Une contraction radiale et l’épaississement de la paroi de VG • Une torsion autour du grand axe formé par l’apex et la base • Une déformation et diminution du grand axe 1.2.4 Défauts de l’activité cardiaque Evaluation de la fonction contractile Il existe un grand nombre de pathologies cardiaques. Celles qui nous intéressent particulièrement sont celles liées au défaut de la fonction contractile myocardique, directement reliée à l’état fonctionnel de la pompe cardiaque. Une altération de cette fonction contractile est caractérisée par la variation de paramètres physiologiques et d’un ensemble de signaux. Le fraction d’éjection (1.1) et la fraction de raccourcissement définie par : FR = DT D − D T S DT D où DT D et DT S sont les diamètres de la cavité ventriculaire gauche en télédiastole et télésystole, respectivement. Ce paramètre physiologique permet une description quantitative globale de la fonction contractile du cœur. CHAPITRE 1. CONTEXTE MÉDICAL 14 Ischémie myocardique Lorsque les artères coronaires, chargées de vasculariser le myocarde se bouchent, le myocarde ne reçoit plus de sang et manque d’oxygène ; c’est l’ischémie myocardique. L’ischémie myocardique peut intéresser une région du cœur ou l’ensemble du muscle cardiaque. D’un point de vue dynamique, l’ischémie myocardique représente un déséquilibre entre les apports et la demande en oxygène du myocarde. L’infarctus du myocarde est la nécrose d’une zone plus ou moins étendue du muscle cardiaque. Les cellules musculaires cardiaques de ce territoire ne parviennent plus à se contracter par manque d’apport en oxygène et meurent en quelques heures. La gravité de l’infarctus tient surtout à son étendue : plus l’artère obstruée irrigue une zone importante, plus l’infarctus est grave. Si l’atteinte est très étendue, le fonctionnement de toute la pompe cardiaque est altéré et les contractions deviennent anormales. On distingue deux catégories d’ischémies : l’ischémie réversible pour laquelle, dans les secondes qui suivent le début de l’ischémie, une diminution très brutale de l’activité contractile se produit : l’épaississement / raccourcissement du myocarde est remplacé par un amincissement / dilatation passif. Pendant les premières minutes d’ischémie, les dommages cellulaires restent réversibles : si la perfusion coronaire est rétablie, il n’y aura pas de nécrose. Les cellules qui ont été sous-perfusées retrouvent un fonctionnement normal dans les heures qui suivent cette reperfusion. l’ischémie irréversible apparaît si le manque en oxygène est plus prolongé (durée supérieure à 30 minutes en moyenne chez l’homme). Les myocytes cardiaques sont irréversiblement endommagés. Le sous-endocarde est le plus sensible à l’ischémie. Si l’occlusion de l’artère coronaire persiste pendant trois heures, la nécrose se développe du sous-endocarde vers le sous-épicarde. L’analyse spatio-temporelle de la déformation du muscle cardiaque, permet la détection d’anomalies cardiaques et favorise la mise en évidence et la localisation de pathologies ischémiques. Les méthodes d’estimation de forme et de mouvement que nous proposons dans ce mémoire sont développées dans ce but. 1.3 Le système respiratoire 1.3.1 Physiologie respiratoire La respiration est un phénomène complexe qui implique un grand nombre d’organes et de tissus présents dans la cage thoracique. L’action commune de ces différents protagonistes est nécessaire au bon déroulement de la respiration et la défaillance de l’un d’entre eux entraîne des insuffisances respiratoires plus ou moins prononcées. La notion de respiration regroupe en fait deux processus physiologiques bien distincts que sont la ventilation, responsable des mouvements observables, et l’échange gazeux, intervenant au niveau de la paroi des poumons. Dans ce qui suit nous nous intéresserons uniquement à la ventilation, même si parfois, par abus de langage, nous emploierons le terme respiration 1.3. LE SYSTÈME RESPIRATOIRE 15 pour désigner ce processus. La ventilation dépend de l’activité des muscles respiratoires (diaphragme, muscles intercostaux, muscles de la paroi de l’abdomen) qui modifie la géométrie et le volume du thorax. C’est par l’intermédiaire de ces variations que les échanges gazeux s’effectuent. F IG . 1.4. Coupe schématique des poumons Voici une description des principaux acteurs de la ventilation : Le diaphragme est un muscle très important dans la mécanique respiratoire. Il se situe juste en dessous des poumons (Figure 1.4). Les différentes fibres de ce muscle sont dirigées vers le haut et viennent se plaquer sur la surface interne de la partie inférieure de la cage thoracique. Sa forme générale est un cylindre coiffé d’un dôme. Lorsqu’il se contracte, il s’aplatit, créant ainsi un vide dans la cavité thoracique en exerçant une pression dans la cavité abdominale. C’est lui le moteur de la respiration. Contrairement à ce que l’on pourrait penser, le poumon est un organe passif de la respiration, même si c’est à lui que l’on doit la totalité des échanges gazeux. Il est doté d’une élasticité considérable et s’adapte à la paroi de la cavité thoracique. Son mouvement dépend donc de l’action musculaire au niveau du tronc. Les poumons sont comparables à deux sacs spongieux mobiles fixés au niveau du hile pulmonaire (point d’arrivée de la bronche souche, de l’artère pulmonaire et d’autres vaisseaux). Le poumon droit est constitué de trois lobes : lobe supérieur, lobe moyen, lobe inférieur, alors que le poumon gauche n’en possède que deux : lobe supérieur et lobe inférieur, laissant ainsi un espace plus important pour le cœur. La cage thoracique est composée de 10 paires de côtes reliées au sternum par des cartilages et de deux paires de côtes flottantes. Les muscles qui interviennent de façon significative pendant la respiration sont les scalènes et les sternomastoïdiens. Les scalènes élèvent la cage thoracique lors de l’inspiration et sont très utiles au repos. 16 CHAPITRE 1. CONTEXTE MÉDICAL 1.3.2 Fonction ventilatoire D’un point de vue fonctionnel, les échanges gazeux sont liés à l’action d’un piston et d’un cylindre [Promayon, 1997] stabilisés à chaque instant par des forces élastiques. La mesure de l’élasticité est une mesure statique puisqu’elle ne dépend pas de la vitesse. Le poumon et le thorax sont deux entités élastiques couplées par l’intermédiaire de la poche pleurale. Le liquide pleural est un liquide visqueux où règne une pression légèrement négative favorisant ainsi le contact glissant, sans frottement entre les poumons et le thorax. Ce glissement se retrouve également à l’interface médiastin/poumon permettant ainsi un désynchronisme entre les mouvements cardiaques et les mouvements ventilatoires. Il n’y a, à priori, aucune coordination entre ces deux mouvements même si généralement on admet qu’il se passe environ 4 cycles cardiaques pour un cycle respiratoire. Le fait qu’il n’y ait pas de coordination ne veut pas dire qu’il n’y ait pas de relation entre ces deux mouvements. Pour commencer, d’un point de vue physiologique, l’augmentation du cycle cardiaque entraîne un besoin accru en oxygène ce qui se traduit également par une augmentation de la fréquence ventilatoire. Enfin, la déformation du cœur introduit localement une déformation des poumons au niveau de leurs interfaces avec l’enveloppe cardiaque. La déformation locale des poumons est donc tributaire du mouvement cardiaque. A l’état de repos, sans aucune action musculaire, ces corps élastiques (poumons, thorax) sont repérés par un état de référence (la capacité résiduelle fonctionnelle -CRF- ou functional residual capacity en anglais sur la Fig. 1.6). F IG . 1.5. Représentation schématique des organes thoraciques durant l’expiration (à gauche) et l’inspiration (à droite) et radiographies respectives associées Dans ces conditions, l’inspiration (Fig. 1.5, à droite) est nécessairement un processus actif, conséquence de l’action combinée des muscles respiratoires : 1. Contraction des muscles respiratoires 2. Déplacement vertical du diaphragme vers le bas et déplacement de la cage thoracique vers l’avant et vers le haut (action des muscles intercostaux) 3. Le volume de la cage thoracique augmente et la pression pleurale décroît légèrement 4. Les poumons sont attirés vers la paroi de la cage thoracique 5. La pression de l’air dans les poumons diminue ce qui entraîne un flux d’air dirigé de l’extérieur vers les poumons L’expiration (Fig. 1.5, à gauche), en revanche, est un processus passif résultant du relâchement des muscles respiratoires et du retour à l’équilibre des corps élastiques (force rétractile du poumon importante et force expansible du thorax faible) : 1.3. LE SYSTÈME RESPIRATOIRE 17 1. Relâchement des muscles respiratoires 2. Les organes abdominaux remontent 3. Le volume de la cage thoracique diminue 4. La pression de l’air dans les poumons augmente 5. Flux d’air dirigé vers l’extérieur de la cage thoracique Il est important d’apporter une appréciation quantitative des mouvements engendrés par la ventilation : • Le déplacement principal se situe dans l’axe cranio-caudal (axe vertical). • Le déplacement au niveau du diaphragme est de 2 à 4 cm. • On compte 12-14 cycles par minutes et environ 4 cycles cardiaques par respiration • L’inspiration et l’expiration ne sont pas exactement des phénomènes inverse l’un de l’autre. En terme de mouvement, cette asymétrie des deux phases engendre un cycle d’hystérésis. F IG . 1.6. Volumes pulmonaires échangés lors de différents types de respiration Détaillons maintenant les autres descripteurs illustrés sur la Fig. 1.6. Le volume courant (tidal volume) est le volume mobilisé par une inspiration et une expiration normale (0.5L). Le volume de réserve inspiratoire (resp. expiratoire) (3L , resp. 1.5L) est le volume mobilisable après inspiration (resp. expiration) normale pour une inspiration forcée (resp. expiration). Enfin le volume résiduel (1.5L) est le volume restant après expiration forcée. Ces échanges d’air sont mesurés par des spiromètres. Tout comme l’ECG pour l’appréciation de la fonction cardiaque, les données fournies par les spiromètres sont d’une grande utilité pour la reconstruction de séquences d’images de thorax respirant. Pour plus de renseignements concernant la physiologie respiratoire, le lecteur pourra se référer à [Murray, 1986]. CHAPITRE 1. CONTEXTE MÉDICAL 18 (a) (b) F IG . 1.7. Illustration d’une tumeur pulmonaire sur une coupe transversale (a) et sagittale (b) d’une image en fin d’expiration extraites d’une séquence d’images tomodensitométriques 4D 1.3.3 Pathologies pulmonaires Les pathologies broncho-pulmonaires sont fréquentes et potentiellement gravissimes chez la personne âgée. Leur diagnostic est souvent difficile, de par la rareté des symptômes, entraînant un retard du diagnostic et donc du traitement. Parmi les principales pathologies pulmonaires recensées on trouve : les tumeurs, les pneumopathies, la bronchite chronique, l’asthme et la tuberculose. Le cancer des bronches est responsable de plus de 25 000 nouveaux cas chaque année en France. Il est plus fréquent chez l’homme que chez la femme. Les chiffres impressionnants rappelés en début de chapitre rappellent qu’il est essentiel de développer des moyens de prévention et de traitement adaptés. On distingue les cancers primitifs, qui apparaissent d’abord dans les poumons puis gagnent éventuellement d’autres parties du corps, des cancers secondaires, qui suivent le cheminement inverse. L’évolution de ces cancers peut être divisée en quatre étapes : • Le premier stade est un cancer très localisé, qui n’a pas envahi les ganglions lymphatiques. • Au second stade, le cancer s’est étendu aux ganglions lymphatiques de voisinage. • Pour le troisième stade, le cancer s’est étendu à des organes voisins de sa localisation initiale (paroi thoracique, diaphragme). • Le quatrième stade représente une extension du cancer à un organe de localisation éloignée (métastase). Enfin, ll existe deux grands types de cancer du poumon : 1) les cancers dits à petites cellules et 2) ceux dits non à petites cellules. Les données que nous traiterons seront obtenues sur des patients souffrant de cancers bronchiques non à petites cellules. Ce type de pathologie représente 80% des cancers broncho-pulmonaires. Il se caractérise par son évolutivité très lente. 1.3.4 Radiothérapie Actuellement, la radiothérapie est l’une des principales techniques thérapeutiques du cancer avec la chirurgie et la chimiothérapie. Environ deux tiers des malades cancéreux sont traités par radiothérapie. L’objectif de la radiothérapie est de détruire par rayonnement ionisant des cellules tumorales. La Fig. 1.7 montre une tumeur pulmonaire en to- 1.3. LE SYSTÈME RESPIRATOIRE 19 modensitométrie. Le traitement consiste à exposer la tumeur à des radiations ionisantes. Lorsque la zone à irradier est statique, elle peut être déterminée précisément et le plan de traitement mis en place s’appuie sur une bonne localisation des cellules cibles. Par contre lorsque la tumeur se situe dans une région en mouvement, comme la cage thoracique, la mise en place du plan de traitement devient difficile. Actuellement, en routine clinique, il y a peu de prise en compte réelle du mouvement durant la thérapie. Il peut en résulter une irradiation importante de cellules saines avoisinant la région tumorale. Plusieurs solutions sont actuellement à l’étude. Selon Boldea [Boldea, 2006], on peut les regrouper en diverses catégories : • Ajout de marge de sécurité lors de la thérapie. A l’heure actuelle, les plans de traitements s’appuient sur une acquisition tomodensitométrique (TDM) 3D réalisée avant irradiation des tumeurs. Si le scanneur est lent, cette acquisition n’est qu’un moyennage à un instant donné de ce qui se passe durant l’ensemble du cycle respiratoire. Si le scanneur est rapide l’acquisition n’est pas floue mais elle ne représente qu’un instant particulier. Dans les deux cas, ce n’est pas le reflet des déplacements et déformations intervenants durant la respiration. Il en résulte une incertitude liée à la position des cellules cancéreuses durant le protocole et la définition d’un volume cible prévisionnel statique qui servira durant l’ensemble du traitement. D’une manière idéale, les plans de traitements ne devraient pas être établis à partir d’image 3D mais à partir d’images 4D et devraient être synchronisés pendant l’irradiation. • Le blocage respiratoire. Il s’agit de bloquer la respiration à des positions prédéfinies et d’irradier la zone tumorale rendue statique ou quasiment statique. Le blocage peut être volontaire et c’est le patient qui décide de passer en apnée à certains moments de la respiration, généralement fin d’inspiration car à cet instant, le tissu pulmonaire est moins dense ce qui entraîne une diminution de l’irradiation des cellules saines. Le patient est secondé par un spiromètre qui le renseigne en temps réel sur son cycle respiratoire. Le blocage de la respiration peut également se faire par intervention d’un dispositif extérieur. Le dispositif Active Breath Control (ABC) utilisé au Centre Léon Bérard à Lyon en est un exemple. Cet appareil se sert également de l’information délivrée par un spiromètre pour bloquer la respiration durant 8 à 20 secondes lorsque le patient lui en donne le signal. Cet appareil peut s’avérer gênant pour certains patients et son utilisation passe par une phase d’entraînement préalable afin d’éviter toute angoisse ou réaction non contrôlée. • D’autres approches visent à synchroniser l’activation du faisceau irradiant avec le signal respiratoire [Mageras and Yorke, 2004] pendant une durée prédéterminée du cycle respiratoire. La synchronisation est réalisée grâce à un signal externe obtenu à partir de marqueurs sur le thorax du patient ou grâce à l’information délivrée par un spiromètre. Ce type de traitement est beaucoup plus confortable pour les patients qui peuvent respirer librement mais de façon régulière. • Le suivi en temps-réel est l’un des enjeux actuels du traitement radiothérapeutique de tumeurs mobiles. Il nécessite la prise en compte du processus respiratoire durant la thérapie [Boldea, 2006] [Shimizu et al., 2000] [Shirato et al., 2003] afin d’éviter aux patients hospitalisés des contraintes supplémentaires telles que le blocage de la respiration. La prise en compte du mouvement doit conduire à la réduction des incertitudes concernant la position de la cible cancéreuse et donc diminuer l’irradiation des régions saines du poumon [Goitein, 2004] tout en augmentant la dose CHAPITRE 1. CONTEXTE MÉDICAL 20 délivrée à la tumeur pour un temps de traitement identique. Pour cela, le dispositif doit être renseigné en temps réel de la position des cellules cancéreuses, des poumons et des autres structures thoraciques afin d’asservir la direction des faisceaux irradiants pendant le traitement. La prise en compte des mouvements respiratoires pendant les traitements radiothérapeutiques des cancers du poumon est devenue un challenge [Goitein, 2004]. La réduction des incertitudes quant à la position des cellules pathologiques devrait permettre de réduire l’irradiation de cellules saines et d’augmenter localement la dose émise sur les cellules cancéreuses. Des approches sont actuellement en cours d’investigation mais toutes ces méthodes manquent cruellement d’une information de mouvement respiratoire spécifique à chaque patient. L’utilisation des algorithmes de recalage d’images dans le domaine de la radiothérapie est relativement récente et en constante progression [Sarrut, 2006]. Le but final est de proposer des solutions pour le contrôle et la planification des doses délivrées en temps réel. Le suivi en temps réel, qui constitue une procédure idéale, a donc besoin d’une information spatio-temporelle du mouvement et doit être adaptée à chaque patient. Les méthodes d’estimation de mouvement et de forme que nous proposerons s’inscrivent donc également dans ce contexte particulier. 1.4 Conclusion Nous résumons ici les principales hypothèses concernant les organes et les pathologies qui constituent le contexte médical de ce mémoire. L’ensemble des organes qui constituent le corps humain sont des structures élastiques qui se déforment suivant certaines propriétés en contraintes. Ceci nous donne un a priori sur la façon d’appréhender le mouvement complexe de ces structures dont la caractéristique principale est qu’il est non-rigide. De plus, les phénomènes dynamiques étudiés sont des phénomènes pseudopériodiques que nous assimilerons à des phénomènes périodiques. En effet, la périodicité n’est pas stricte dans le sens où l’on peut observer des variations de fréquence d’un cycle à l’autre que ce soit dans le cas de la respiration que dans le cas du battement cardiaque. Cependant il n’existe pas de discontinuité prononcée et la variation de la durée du cycle se fait généralement de manière progressive. L’hypothèse de périodicité est justifiée dans le sens où, comme nous le verrons par la suite, les techniques de reconstruction de séquences d’images 3D synchronisent les acquisitions sur des repères physiologiques explicites (ECG pour le cœur et courbe ventilatoire ou position remarquable du diaphragme pour le thorax respirant). La séquence ainsi obtenue ne couvre qu’un cycle ou une partie du cycle étudié. Enfin, les avancées matérielles constatées ces dernières années permettent aujourd’hui une imagerie dynamique 3D. Le prochain chapitre est consacré à ces techniques d’imagerie d’organes en mouvement en insistant plus particulièrement sur la prise en compte du temps dans la formation des images. Chapitre 2 Imagerie médicale d’organes en mouvement Sommaire 2.1 2.2 2.3 2.4 2.5 Introduction . . . . . . . . . . . . . . . . . . . . . Modalités d’imagerie d’organes en mouvement . . Exploration de l’activité cardiaque en IRM . . . . 2.3.1 Formation des images par RM . . . . . . . . 2.3.2 Les séquences de base en imagerie cardiaque 2.3.3 Les séquences IRM rapides et ultra rapides . 2.3.4 Images par RM utilisées dans cette thèse . . 2.3.5 IRM de marquage tissulaire . . . . . . . . . La Tomodensitométrie à Rayons X . . . . . . . . . 2.4.1 Caractérisation des images TDM . . . . . . . 2.4.2 Dispositifs d’acquisition . . . . . . . . . . . 2.4.3 TDM dynamique . . . . . . . . . . . . . . . 2.4.4 TDM 4D . . . . . . . . . . . . . . . . . . . 2.4.5 Images TDM utilisées dans cette thèse . . . . Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 22 26 26 28 28 30 31 33 33 33 35 36 36 38 2.1 Introduction C e chapitre est consacré à la description des techniques d’imageries tomographiques dont les images sont utilisées lors de mes travaux à savoir l’Imagerie par Résonance Magnétique (IRM) et la TomoDensitoMétrie (TDM). De nombreux ouvrages et articles décrivent ces techniques et leur principe dans le détail. Nous insisterons plus particulièrement dans cette section sur les adaptations et les méthodes mises en œuvre pour l’analyse d’organes en mouvement. Les fondements physiques ne varient pas par rapport aux techniques plus classiques destinées à l’acquisition d’organes statiques. En revanche, la formation des images est, elle, adaptée aux mouvements que l’on désire mettre en évidence. 21 22 CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT Ce chapitre est organisé de la manière suivante : d’abord, nous faisons un tour d’horizon des enjeux et des techniques d’exploration d’organes en mouvement. Puis les deux sections suivantes sont consacrées plus particulièrement à l’IRM et à la TDM en insistant plus particulièrement sur la formation des images ainsi que leurs caractéristiques. Le lecteur trouvera en annexes A et B un résumé des principes physiques associés à ces deux types d’imagerie. 2.2 Modalités d’imagerie d’organes en mouvement Avant d’aborder la prise en compte du temps pour l’étude des organes en mouvement, il convient de resituer brièvement les techniques d’exploration les plus utilisées en clinique. Généralement, on distingue les techniques d’imagerie dites anatomiques qui visent à apporter une information géométrique détaillée des structures et des tissus et les techniques d’imagerie dites fonctionnelles qui permettent d’obtenir des informations relatives au fonctionnement des organes. Pour accéder à la morphologie cardiaque ou thoracique, on fait généralement appel à l’IRM, à la TDM ou à l’imagerie ultrasonore (US). Chacune de ces modalités possèdent leurs propres caractéristiques. Ainsi, l’IRM est préconisée pour l’examen des tissus mous, alors que la TDM (ou Computed Tomography - CT - en anglais) est particulièrement bien adaptée à l’étude des structures osseuses. Cette dernière permet de mettre en évidence des infections ou des hémorragies et de guider des ponctions d’organes profonds. L’un des avantages de l’IRM par rapport à la TDM est son caractère non-invasif. L’examen par IRM génère des images de qualité, mais, étant moins diffusé, il peut être plus difficilement accessible pour le patient et coûte plus cher. L’imagerie US trouve tout son intérêt pour l’analyse d’organes en mouvement. Sa simplicité d’utilisation, son faible coût en font une technique de choix pour les premiers examens d’imagerie, en cardiologie notamment. L’information fonctionnelle liée au métabolisme peut être explorée en utilisant la Tomographie à Emission de Positons (TEP) [Hartiala and Knuuti, 1995] alors que l’information liée à la perfusion est explorée en Tomographie à Emission MonoPhotonique (TEMP), en IRM, en imagerie US ou en TEP. La complexité des phénomènes est telle qu’elle ne peut être explorée par une seule modalité d’acquisition. Dans un contexte clinique, ces techniques s’avèrent être complémentaires pour le clinicien qui doit détecter les zones pathologiques et affiner le traitement. Dans un contexte de recherche, toutes ces modalités sont intéressantes pour comprendre, in vivo, le comportement d’organes sains et pathologiques. La Figure 2.1 illustre des images issues de quelques unes de ces modalités. L’intégration du temps dans le principe d’acquisition de ces images prend une place particulière compte tenu des contextes médicaux de ma thèse. Aujourd’hui, les progrès matériels et logiciels sont tels que chaque grande famille de modalités peut prétendre obtenir des séquences d’images dynamiques restituant des phénomènes qui évoluent au cours du temps. Le but d’une série d’images acquises dans le temps est de permettre l’étude d’un processus physiologique dynamique ou l’étude dynamique d’organes déformables. Ainsi, 2.2. MODALITÉS D’IMAGERIE D’ORGANES EN MOUVEMENT (a) (c) (e) 23 (b) (d) (f) F IG . 2.1. Illustration des différentes modalités d’acquisitions utilisées en clinique au travers de leurs images : (a)-Coupe sagittale du thorax en IRM (pondération T1) (b)-Coupe sagittale du thorax en IRM (pondération T2) (c)-Image TEP de VG cardiaque (d)-Image ultrasonore apicale 4 cavités du cœur (e)-Coupe transversale tomodensitométrique du thorax (f)-Image SPECT du cœur en orientation petit axe. CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT 24 pour l’exploration d’organes en mouvement, nous distinguons quatre grandes familles de modalités. L’IRM et plus particulièrement le ciné IRM et l’IRM de marquage tissulaire [Zerhouni et al., 1988,Axel and Dougherty, 1989] sont particulièrement bien adaptées à l’étude de la fonction contractile du cœur. Elles permettent d’estimer le comportement dynamique du cœur. La TDM constitue également un moyen d’explorer des organes mobiles. On distingue la TDM dynamique qui intègre directement des informations de mouvement lors de la reconstruction [Roux, 2004, Bonnet et al., 2003] et la TDM 4D qui trie les différentes acquisitions à partir de repères externes [Vedam et al., 2003]. L’imagerie US n’est pas une modalité tomographique au sens des deux précédentes mais elle mérite d’être mentionnée puisqu’elle permet d’explorer des organes en temps réel. Notons l’existence de systèmes échocardiographiques 3D pour l’étude du cœur1 . Ce type d’imagerie ne sera pas pris en compte dans la suite de ce document. L’imagerie nucléaire constituée de la TEMP et de la TEP, synchronisée sur des signaux physiologiques comme l’ECG, peut générer des séries d’images. Ces modalités ne seront pas davantage décrites. Dans la suite, nous nous focaliserons sur les techniques tomographiques dont le principe général consiste à obtenir la distribution spatiale d’une quantité physique par mesure indirecte. La construction des images requiert de nombreuses mesures et peut demander du temps. Le temps de reconstruction est un facteur important et peut être limitant pour des acquisitions dynamiques d’où la nécessité de développer des techniques spécifiques. Cette reconstruction géométrique (ie. la formation de l’image) nécessite une acquisition complète de l’objet et souffre donc de limitations temporelles. Les deux modalités à partir desquelles l’ensemble de mes expérimentations seront effectuées sont l’IRM où la détection du signal à reconstituer se fait de manière électronique et la TDM où la mécanique (rotation de l’ensemble source-détecteur) entre également en jeu. L’un des enjeux actuels de ces techniques tomographiques repose sur la prise en compte du temps car l’utilisation de techniques d’acquisition et de reconstruction standards conduisent généralement à des images présentant des artefacts de mouvement [Shepp et al., 1979, Ritchie et al., 1992]. D’une manière générale, la résolution temporelle dépend des processus physiologiques que l’on souhaite mettre en évidence et de l’agent de contraste éventuellement utilisé [Bonnet et al., 2003]. Par exemple, d’après les descriptions données au chapitre 1, un cycle respiratoire complet s’effectue en 5 s et le cycle cardiaque varie de 0.9 à 0.5 s selon que l’on soit au repos ou à l’effort. Un autre mouvement intervient également mais n’entre pas dans le cadre de ce mémoire : il s’agit de la déglutition qui s’effectue en environ 1 s. Si la résolution temporelle dépend des processus physiologiques à imager, elle dépend également des contraintes technologiques qui peuvent s’avérer être un facteur limitant et ce, plus particulièrement pour la TDM également tributaire du temps de rotation de l’arc. La reconstruction d’images dynamiques est fortement conditionnée par le fait que l’on désire (ou non) reconstruire les images en ligne. En effet, la reconstruction d’images en ligne, lors d’interventions chirurgicales par exemple, nécessite de considérer les acquisi1 http ://www.medical.philips.com/main/products/ultrasound/cardiology/sonos7500/index.html 2.2. MODALITÉS D’IMAGERIE D’ORGANES EN MOUVEMENT 25 tions de manière causale (seules les acquisitions obtenues antérieurement à l’instant de reconstruction peuvent être prises en compte) et la reconstruction d’images à la volée se fait souvent au détriment de la qualité des images (résolution moindre, prise en compte partielle de l’information). Ces limitations sont moins présentes lorsque la séquence d’images peut être reconstruite a posteriori, où le temps de reconstruction est moins contraignant et où l’on dispose de toutes les données acquises pour construire la séquence d’images en chaque instant. Deux moyens peuvent être employés pour limiter les artefacts de mouvement : 1) pour réduire les mouvements respiratoires, on peut demander au patient de suspendre sa respiration durant les acquisitions. Ce blocage n’est jamais vraiment parfait et il arrive que les patients ne soient pas en mesure d’effectuer ce blocage ; 2) dans le cas de la tomodensitométrie, on peut augmenter la vitesse de l’arc tout en sachant qu’il existe une limite d’ordre matériel à cette augmentation [Ritchie et al., 1992]. Actuellement en TDM dynamique, la rotation de l’arc peut atteindre une vitesse de 0.33 à 0.5 seconde. D’une manière générale, si l’objet évolue pendant l’acquisition, les données deviennent inconsistantes, comme s’il s’agissait d’objets différents (comme lorsqu’on prend une photo et que le sujet bouge). On constate ainsi l’apparition d’artefacts de mouvements qui se caractérisent par des flous localisés sur les régions animées comme le montre la Figure 2.2. Sur cette illustration, l’ensemble des projections a été obtenu durant le blocage volontaire de la respiration ce qui explique que l’interface entre les poumons et les autres structures soit clairement définie. En revanche, le mouvement cardiaque n’a pas été pris en compte. Les projections ont été obtenues pour des états différents du cœur entraînant un flou sur l’image reconstruite. Ce phénomène est mis en évidence par la zone cerclée de rouge sur cette illustration. Ce type d’artefact peut dissimuler des éléments importants de l’image et conduire à de mauvaises interprétations. Cette nécessité de prendre en compte le mouvement durant l’acquisition ne se limite pas au domaine cardiaque, c’est une problématique générale qui s’applique à l’acquisition de tout objet en mouvement. F IG . 2.2. Coupe transversale d’une acquisition tomographique 3D obtenue par blocage de la respiration. La zone entourée de rouge correspond à la mise en évidence d’un flou localisé sur le cœur dont le mouvement, plus rapide, ne peut être restitué par la reconstruction Des solutions algorithmiques ont été proposées en médecine nucléaire où les temps d’acquisition sont généralement assez longs (de quelques minutes pour l’imagerie TEP 26 CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT à 20 minutes pour l’imagerie TEMP) pour lesquelles le blocage de la respiration est inenvisageable. Ces solutions visent à compenser a posteriori le mouvement respiratoire à partir des données elles-même ou à partir d’appareils de systèmes externes. Dans le cas de mouvements périodiques comme la respiration ou le battement cardiaque, il est possible de trier les acquisitions à partir d’une référence physiologique (débit respiratoire avec un spiromètre, ECG pour le cœur) afin de répartir les acquisitions en sous intervalles temporels. Ces méthodes tendent également à réduire le bruit dans les images par moyennage des données [Murcia, 1996]. Les principes d’acquisition détaillés en 2.3.3 et 2.4.4 appartiennent à cette catégorie. D’autres méthodes de reconstruction, également à l’étude, sont basées sur une compensation du mouvement estimé a priori [Roux, 2004, Bonnet et al., 2003]. Plus de détails seront donnés sur cette méthode au paragraphe 2.4.3. Dans les parties suivantes, nous nous intéressons plus particulièrement à la prise en compte des mouvements cardiaques dans les séquences d’images par RM et la prise en compte des mouvements respiratoires dans la reconstruction d’images TDM. 2.3 Exploration de l’activité cardiaque en IRM La définition et l’explication des différents paramètres caractérisant une image par RM sont disponibles dans l’Annexe B, en l’occurrence les constantes de temps T1 et T2 , les temps d’échos et de répétition T E et T R et la formation du signal Radio-Fréquence (RF). 2.3.1 Formation des images par RM L’intensité des pixels des images par RM dépend de paramètres intrinsèques des tissus imagés que sont la densité de spin, les constantes de temps T1 et T2 et également de paramètres extrinsèques liés à l’appareil de mesure et à la séquence choisie pour l’acquisition (séquence d’impulsions RF, T E et T R...). En choisissant les valeurs de T E et de T R, on peut mettre en évidence diverses propriétés du milieu observé. Le temps T R détermine l’influence du paramètre T1 . En effet, si le temps entre deux impulsion RF est long, la composante Mz devient quasiment nulle, mais l’application de séquences d’échos permettra d’en détecter la composante tangentielle. La valeur T E détermine la pondération du contraste en T2 . Quatre paramètres principaux sont indispensables à la description d’une séquence : – l’angle de basculement du signal d’excitation RF – le type d’écho utilisé – le temps d’écho T E – le temps de répétition T R Il existe un très grand nombre de séquences, chacune étant adaptée à l’organe et à la pathologie étudiée. Il revient donc au clinicien de paramétrer correctement les séquences. 2.3. EXPLORATION DE L’ACTIVITÉ CARDIAQUE EN IRM 27 F IG . 2.3. Imageur par RM (source : clinique sauvegarde de Lyon la duchère, www.cliniquesauvegarde.fr/images/IRM.jpg). La qualité des images par RM, peut être caractérisée par le rapport signal sur bruit (RSB), donnée par l’équation [Wright, 1997] : √ B0 Ta (2.1) RSB ∝ Rimg On tire de cette équation deux principaux enseignements. Le premier concerne l’intensité du champ statique dans lequel est plongé le patient. Plus ce champ est intense, meilleure est la qualité de l’image. Le problème pour l’instant est que l’on ne connaît pas vraiment l’influence d’un tel champ sur le corps humain et les intensités les plus couramment utilisées se situent entre 0.5 et 1.5 T. Des expérimentations sont actuellement réalisées sur des petits animaux avec des dispositifs de plus haut champ magnétique (de 7 à 9 T). La seconde remarque importante concerne le compromis très souvent observable dans le domaine de l’imagerie entre le temps d’acquisition Ta et la résolution Rimg de l’image. Le bruit dans les images provient à la fois d’une force électro-motrice générée par le corps lui-même [Wright, 1997] et du mouvement Brownien d’électrons libres à l’intérieur des composants électriques [Liang and Lauterbur, 2000]. En pratique, un modèle gaussien de moyenne nulle est généralement utilisé pour décrire le bruit dans l’image. Sa variance dépend de l’impédance de la bobine réceptrice. Grâce aux possibilités d’imagerie rapide qu’offrent les appareils à haut champ magnétique, le développement des examens d’IRM cardiaque est possible et l’étude de la contraction cardiaque est accessible par des examens de type cine-IRM. Son caractère non-invasif (contrairement à la radiologie traditionnelle ou à la tomodensitométrie) en fait une technique de choix de plus en plus utilisée pour l’exploration in vivo du cœur. Elle permet d’accéder assez facilement à des informations comme des volumes ou la fraction d’éjection (1.1) et la masse myocardique, ce qui est plus difficile en imagerie ultrasonore. 28 CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT 2.3.2 Les séquences de base en imagerie cardiaque La description des séquences décrites dans ce paragraphe n’est pas exhaustive. Pour plus de détails le lecteur pourra se référer à [Pettigrew et al., 1999, Earls et al., 2002] ou sur le site suivant : http ://www.mr-tip.com. Il existe deux séquences de base qui sont généralement utilisées de manière complémentaire : les séquences en Echo de Spin (ES). Lorsqu’elles sont appliquée au cœur, ces séquences sont synchronisées sur l’électrocardiogramme. Le signal RM apparaît environ 20 à 30 ms après l’impulsion RF. Le temps T E est alors typiquement choisi entre 50 et 90 ms (soit de 1/16 à 1/8 du cycle cardiaque) sachant que plus cette constante de temps est longue, plus l’image est pondérée en T 2, ceci au prix d’une réduction du RSB. Les images obtenues par ce type de séquence sont dites de sang noir (ou dark blood en anglais) car le délai entre l’impulsion RF et la lecture du signal RM est trop important pour que les hématies excitées (dont le mouvement dépend du flux sanguin) par la première impulsion se retrouvent au même endroit lors de la formation de l’image. les séquences en Echo de Gradient (EG). On se réfère généralement à cette seconde approche par une variété d’acronismes qui dépendent du constructeur de l’imageur (FFE : Fast Field Echo chez Philips, GRE chez General Electric et Siemens). Ce type de séquence n’utilise qu’une seule impulsion RF (voir Annexe B) et un signal cohérent est obtenu par application successive de gradients de champ. Le signal RM apparaît alors beaucoup plus rapidement (1-10ms). Les dispositifs d’acquisition permettent désormais des commutations de gradient de champ très rapides ce qui permet d’obtenir des temps d’écho très faibles (8 à 10 ms). Le sang apparaît blanc sur ce type de séquences. Lorsque l’acquisition est synchronisée sur l’ECG, les échos peuvent être obtenus toutes les 20 à 40 ms sur tout le cycle cardiaque. On est alors capable d’imager de nombreuses phases du cycle cardiaque permettant une visualisation en mode ciné. 2.3.3 Les séquences IRM rapides et ultra rapides Les deux techniques de base décrites en 2.3.2 ont donné naissance à des techniques plus rapides. Le gain en vitesse d’acquisition a été rendu possible grâce aux progrès matériels (bobines de gradient, électronique, informatique permettant le traitement de volumes de données toujours plus importants). Mais ces accélérations sont également basées sur un remplissage et un échantillonnage adaptés de l’espace des K. Cet espace est l’espace de Fourier qui contient toutes les informations nécessaires à la formation de l’image (par transformation de Fourier inverse). Chaque signal RM capté contribue au remplissage de cet espace. Une prise en compte partielle de cet espace ou/et un remplissage adapté permet d’accélérer nettement les acquisitions. Ces progrès matériels et algorithmiques combinés à l’application des hypergradients (gradient d’intensité élevée de 20-30mT/m à temps de commutation courts, 0.2 - 0.4 msec) constituent le point de départ des nouvelles séquences et de l’imagerie par RM ultra-rapide. Ainsi la séquence turbo ES ou Fast Spin Echo est une version nettement accélérée de 2.3. EXPLORATION DE L’ACTIVITÉ CARDIAQUE EN IRM 29 F IG . 2.4. Illustration schématique du principe d’acquisition pour des séquences rapides en écho de gradient. Pour chaque phase, plusieurs segments de l’espace des K sont obtenus par une génération rapide d’échos de gradient. En acquérant 8 segments à la fois, 1/16 de l’image est obtenue à chaque battement cardiaque. Ainsi, 16 battements de cœur suffisent à acquérir l’ensemble de la série d’images. (issu de [Pettigrew et al., 1999].) la séquence ES mais au prix d’un contraste affaibli pour les tissus mous. Le principe de ce type de séquence est non plus de considérer un écho mais un train d’écho par une succession d’impulsions à 180◦ . Chaque écho, encodé en phase permet de remplir une ligne différente dans l’espace des K en se focalisant sur les lignes centrales correspondant aux basses fréquences. Chaque écho est séparé temporellement de 10 ms. Grâce à ce type de séquence, il est possible d’acquérir une image de taille 256 × 256 en un temps de 0.1 à 1 seconde. De la même façon, les séquences rapides en écho de gradient permettent d’accélérer nettement les temps d’acquisition. Pour ce faire, le gradient d’écho est répété toutes les 20 à 30 ms pour imager une ou plusieurs coupes sur l’ensemble d’un cycle cardiaque. Si l’on considère que l’intervalle entre les ondes R de l’ECG est d’environ 800ms, on est capable d’obtenir pour une coupe une séquence d’images constituée de 40 images. Si la taille de l’image est de 128 × 128, l’acquisition s’effectue sur 128 battements cardiaques. Si l’on fait le choix d’acquérir 2 coupes à la fois, il est possible d’obtenir 20 images par cycle cardiaque. En général, chaque image doit être acquise deux fois pour permettre d’augmenter le RSB (soit 256 battements cardiaques et un temps d’acquisition d’environ 3 à 4 minutes). Ce temps d’acquisition peut encore être réduit si le nombre de bobines réceptrices augmente. A l’heure actuelle, les accélérations logicielles et matérielles permettent des acquisitions en ciné-IRM avec une résolution temporelle de l’ordre de 10 à 20 ms. Les séquences d’images pour une coupe donnée sont réalisées en un unique blocage de la respiration. On comprend alors tout l’intérêt de telles acquisitions et la qualité des séquences obtenues où les artefacts de respiration sont considérablement réduits (en tout cas pour une coupe particulière). Ces acquisitions ont été rendues possibles pour deux raisons : 1) les temps d’écho de gradient sont devenus extrêmement faibles (environ 1 ms) et surtout 2) 30 CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT le remplissage de l’espace des K ne se fait plus sur une mais plusieurs lignes à la fois par battement cardiaque et pour chaque phase du cycle (voir Fig 2.4). En acquérant 8 lignes par battement cardiaque, le temps est significativement diminué. Il y a donc un compromis à trouver entre la résolution spatiale de l’image et la résolution temporelle de la séquence obtenue. La méthode actuellement la plus rapide est celle de l’écho planar (EPI) avec un balayage en dent de scie de l’espace de Fourier. L’acquisition d’une image 256 × 256 se fait en moins d’une seconde mais le RSB est assez faible et on constate souvent des artefacts de décalage chimique (Chemical Shift en anglais). Ces dernières années, l’arsenal des séquences IRM s’est considérablement étoffé. Celles-ci permettent désormais des études morphofonctionnelles complètes. Cependant, si les acquisitions sont de plus en plus rapides, le volume d’informations généré s’est également considérablement accru. Cela pose un problème de traitement et d’interprétation auquel il convient de répondre avec pertinence. 2.3.4 Images par RM utilisées dans cette thèse Les images par RM cardiaques sur lesquelles ont porté mes travaux ont été acquises dans le cadre de notre collaboration avec la Helsinki University of Technology (HUT) et le VTT Technical Research Centre of Finland. La base de données de séquences IRM dont nous disposons a été acquise au Helsinki Medical Imaging Center (Helsinki University Central Hospital, HUCH). Cette base de données est constituée d’examens de 15 sujets. Ceux ci ont été choisis parmi une population adulte et saine. Pour chacun de ces sujets, nous disposons de coupes en petit axe et en grand axe. La visualisation de quelques images pendant la phase systolique de l’un de ces sujets est donnée en Figure 2.5. Les images ont été obtenues sur un dispositif Siemens Vision et Siemens Sonata à 1.5 T (Siemens, Erlangen, Germany). Les séquences utilisées sont de types écho de gradient ultra-rapides avec apnée (Ultrafast GRE). Elles se caractérisent par de courts temps T R et T E. L’acquisition d’une image complète se fait en moins d’une seconde. Voici les paramètres qui décrivent ces images : – épaisseur de coupes en petit axe : 6 − 7 mm – distance inter-coupe en petit axe : 7 − 8 mm – épaisseur de coupes en grand axe : 6 − 7 mm – distance inter-coupe en grand axe : 3 − 4 mm – TR : 30 − 40 ms – TE : 4.8 ms – angle de basculement : 20◦ – taille de l’image : 256 × 256 pixels – champ de vue : 250 − 300 mm – résolution spatiale en petit axe : 1.0 × 1.0 mm – résolution spatiale en grand axe : 1.4 × 1.4 mm – nombre de coupes petit axe : 4 − 5 – nombre de coupes grand axe : 4 − 7 – résolution temporelle : 30 − 40 ms La variation de paramètres entre deux sujets différents s’explique par les différences 2.3. EXPLORATION DE L’ACTIVITÉ CARDIAQUE EN IRM 31 de forme du cœur observées au sein de la population choisie. t = 0ms t = 90ms t = 150ms t = 240ms F IG . 2.5. Acquisitions cine-IRM obtenues par blocage de la respiration et par synchronisation sur l’ECG (HUCH, Finland). En haut, coupes en petit axe et en bas, coupes quatre cavités. Les paramètres des séquences sont disponibles dans la section 2.3.4. Il est important de noter que les séquences obtenues ne sont cohérentes spatialement qu’au niveau des coupes. En effet, une information volumique peut être obtenue en empilant l’ensemble des coupes obtenues en mode ciné. L’acquisition ciné de chaque coupe correspond cependant à un blocage respiratoire différent. Malgré les efforts réalisés pour reproduire fidèlement ce blocage pour l’acquisition de toutes les coupes et pour éviter le mouvement du patient entre deux acquisitions, il n’est pas rare de constater des artefacts de mouvement inter-coupes dus à la respiration qui se traduisent par un décalage géométrique entre ces différents niveaux de coupe. Ce type d’artefact peut être corrigé grâce à la méthode proposée par Lötjönen [Lötjönen et al., 2004], qui propose de s’appuyer à la fois sur les acquisitions en petit axe et en grand axe pour recaler rigidement les coupes entre elles grâce à une mesure de similarité de type information mutuelle. La Figure 2.6 illustre ce type d’artefact. En haut sont représentées une coupe en petit axe et une coupe en grand axe. Le ligne du milieu visualise l’artefact proprement dit, observable par l’empilement des coupes en petit axe et en grand axe. La ligne du bas illustre l’effet de la correction de l’artefact et le réalignement des différentes coupes. Toutes les séquences issues de la base de données dont nous disposons ont été corrigées par cette méthode puis interpolées selon l’algorithme d’interpolation dit ’Shape-based’ [Grevera and Udupa, 1996] au sein du Laboratory of Biomedical Engineering en Finlande. L’interpolation nous permet, à partir des coupes acquises, d’obtenir une information volumique. 2.3.5 IRM de marquage tissulaire L’IRM de marquage tissulaire (ou Tagged MRI en anglais) n’entre pas dans le contexte de ce mémoire. Cependant, cette technique d’imagerie [Zerhouni et al., 1988, Axel and 32 CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT F IG . 2.6. Illustration des artefacts de mouvement inter-coupes. A gauche sont représentées les coupes en petit axe et à droite, les coupes en grand axe. Les figures du milieu (c)(d) montrent les artefacts observables par empilement des coupes petit axe et grand axe. Les figures du bas (e)(f) illustrent la correction des artefacts et le réalignement des différents niveaux de coupes (illustration issue de [Lötjönen et al., 2004]). 2.4. LA TOMODENSITOMÉTRIE À RAYONS X 33 Dougherty, 1989] est particulièrement intéressante pour étudier la déformation du myocarde. Le principe du marquage tissulaire consiste à appliquer une impulsion RF sélective accompagnée d’un champ de gradient à des endroits prédéfinis du tissu. On simule ainsi un quadrillage régulier (motif de marquage) sur l’instant de référence d’une structure en mouvement avant une acquisition cine-IRM standard. Le marquage simulé se déforme en même temps que le muscle cardiaque permettant ainsi d’accéder aux différentes composantes de sa déformation. La superposition d’une grille virtuelle constitue une importante source d’information qui se fait de plus de manière non invasive. Cette modalité, initialement dédiée à l’étude du mouvement cardiaque, a récemment été envisagée pour l’étude des déformations pulmonaires [Napadow et al., 2001]. 2.4 La Tomodensitométrie à Rayons X Les principes physiques permettant la compréhension de la formation d’une image ou d’un volume TDM sont brièvement rappelés dans l’Annexe A. D’une façon générale, la TDM est un système d’imagerie qui exploite les différences d’atténuation des rayons X au sein des différents constituants de l’organisme. Il s’agit, comme en radiologie conventionnelle, d’un système d’imagerie par transmission, pour lequel le patient est placé entre une source de rayons X et un détecteur. L’appareil est constitué d’un tube à rayons X qui tourne et émet autour du patient. Un ensemble de détecteurs, dont le mouvement est solidaire de la source à rayons X, permet de recueillir des images de projection qui sont communiquées à un ordinateur. Celui-ci reconstruit une image représentant une coupe ou un ensemble de coupes de la structure étudiée. 2.4.1 Caractérisation des images TDM L’utilisation de détecteurs performants permet d’enregistrer des différences d’atténuation très fines entre les différentes structures. Les informations recueillies sont placées dans une matrice qui constitue la "carte topographique" de la coupe en question. Une échelle utilisant des Unités Hounsfield (UH), en l’honneur de l’inventeur de la tomodensitométrie Sir Godfrey Newbold Hounsfield, permet de quantifier l’atténuation de chaque pixel entre -1000 (air) et + 1000 (os compact). Par définition, l’eau pure a une atténuation de 0 UH. Une classification de éléments est exprimée en fonction des UH dans le tableau 2.1. L’intensité des pixels est donc directement reliée à la densité électronique des matériaux imagés. Pour terminer, une description détaillée des propriétés statistiques intervenant dans le processus de formation d’images TDM est donnée dans [Lei and Sewchand, 1992]. D’après l’auteur, la distribution de probabilité des projections suit une loi de Poisson. Le bruit dans l’image résultante peut être asymptotiquement décrit par une distribution Gaussienne. 2.4.2 Dispositifs d’acquisition Lors d’une récente étude [Kalender, 2006], Kalender propose un historique et une classification des différentes générations de scanneurs à rayon X depuis leur introduction 34 CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT Matériau air poumons gras eau sang muscles os métal Niveau de gris (Unité Hounsfield) -1000 -500, -200 -200, -50 0 25 25, 40 200, 1000 > 1000 TAB . 2.1. Echelle de Hounsfield F IG . 2.7. Tomodensitomètre à rayon X (source : http ://www.usoncology.com) en clinique dans les années 1970. Les imageurs peuvent être distingués suivant certains critères : – Vitesse de rotation du portique – Résolution spatiale dans le plan d’acquisition – Épaisseur de coupe – Nombre de barrettes du récepteur – Géométrie d’acquisition (Faisceaux divergents ou parallèles, en éventail ou coniques) La technologie des tomodensitomètres a énormément évolué pour obtenir des images de qualité et de résolution toujours plus intéressantes. Actuellement, la période de rotation des portiques est de l’ordre de 0.5 sec, voire 0.33 sec. La résolution spatiale est typiquement d’environ 0.5 mm et la distance inter-coupe peut-être inférieure au millimètre. Le nombre de barrettes du récepteur est intimement lié au nombre de coupes obtenues à chaque rotation. Elle peut atteindre 64 voire 256 pour certains prototypes. Les performances actuelles des scanners rendent désormais possible l’acquisition d’organes en mouvement comme nous allons le voir avec la TDM dynamique et la TDM 4D. 2.4. LA TOMODENSITOMÉTRIE À RAYONS X 35 2.4.3 TDM dynamique L’idée principale de la tomodensitomètrie dynamique est de prendre en considération une information de mouvement pendant la reconstruction des images [Bonnet et al., 2003] et de tenir compte de l’évolution dynamique de l’objet que l’on veut acquérir. La finalité de ce type d’imagerie est de reconstruire une séquence d’images représentant l’objet au cours de son évolution sous certaines critères : – la résolution temporelle – la résolution spatiale – le rapport signal sur bruit – la dose délivrée au patient Les principales applications concernées par la TDM dynamique sont les interventions chirurgicales guidées par l’image, les études fonctionnelles (agent de contraste) et l’imagerie cardiaque. L’introduction technologiques de portiques multi-détecteurs à vitesse de rotation rapide a permis les récents développements liés à l’imagerie d’organes en mouvement. Un état de l’art complet de la tomographie dynamique est proposé dans [Roux, 2004] avec une description des techniques récentes d’acquisition. Dans [Bonnet et al., 2003], l’auteur propose d’utiliser de longues périodes d’acquisitions avec compensation dynamique des organes en mouvement. Des acquisitions obtenues à basse résolution sur plusieurs demi-tours sont utilisées pour reconstruire une séquence à haute résolution spatiale tout en diminuant la dose délivrée au patient. Pour cela, la notion de trajectoire d’un objet en déformation est considérée. ϕtref ,t représente la transformation d’un objet entre son état de référence tref (considéré comme l’instant de reconstruction) et un instant quelconque t (voir la section 6.2 pour plus de détails concernant les notions de trajectoires). Le principe général de la TDM dynamique repose sur l’intégration du temps dans l’équation (A.3) pour exprimer la transformée de Radon dynamique : Z Rf (θ, p, t) = f (M , t)dM (2.2) M∈D(θ,p) où f représente l’objet à imager. Cette équation traduit le fait que la fonction d’atténuation varie au cours du temps. La difficulté majeure réside dans le fait que les projections sont obtenues à des instants différents. Le pas temporel entre chaque acquisition et l’angle de projection θ sont directement reliés à la vitesse de rotation du portique du scanneur. Toujours dans [Bonnet et al., 2003], l’état de l’objet à l’instant t est approché au premier ordre par la relation : D E ∂f f (ϕtref ,t (M ), t) ≈ f (M , tref ) + ϕ̇tref ,t (M ), grad f + (M , tref ) (t − tref ) ∂t (2.3) L’information de mouvement nécessaire pour la reconstruction apparaît avec le terme ϕ̇tref ,t (M ) qui traduit la vitesse instantanée de la particule M à l’instant t. La trajectoire est supposée être linéaire par morceau. Le mouvement peut alors être estimé à partir d’images en basse résolution obtenues tous les demi-tours et réintroduites dans les algorithmes de reconstruction afin d’obtenir des séquences d’images en haute résolution, avec une réduction des artefacts de mouvement pour une meilleure qualité d’image. Une reconstruction en temps réel a été proposée dans le cas où les déplacements linéaires sont CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT 36 connus a priori. Lorsque cette information de mouvement n’est pas disponible (ce qui est le cas en pratique), il faut utiliser des algorithmes d’estimation de mouvement et la reconstruction en temps réel semble à l’heure actuelle plus délicate. Cependant, ce type méthode est potentiellement adapté à la reconstruction de séquences cardiaques et thoraciques tout en limitant l’exposition aux rayons X des patients. 2.4.4 TDM 4D Le principe des acquisitions TDM 4D est différent même si la finalité reste la même : dans [Endo et al., 2003], Endo et al décrivent la TDM 4D comme un protocole d’acquisition permettant d’acquérir des séquences d’images d’objets animés avec une qualité d’image comparable à la TDM 3D classique. Dans [Vedam et al., 2003, Pan et al., 2004, Rietzel et al., 2005b], cette définition générale est plus particulièrement adaptée au problème particulier de la reconstruction de séquences de thorax respirant. Contrairement à ses analogues tridimensionnels nécessitant un blocage de la respiration à des instants prédéfinis, la TDM 4D fournit une réponse intéressante à l’acquisition de séquences de qualité malgré un mouvement respiratoire laissé libre (voir section 1.3.4). Le reconstruction nécessite alors des informations supplémentaires comme une courbe respiratoire délivrée par un spiromètre [Low et al., 2003] ou un dispositif vidéo permettant de suivre en temps réel des capteurs placés sur la surface du thorax afin de trier les données correspondant à une même phase respiratoire. Un exemple de tri est illustré sur la Figure 2.8. Sur cet exemple, le cycle respiratoire est subdivisé en quatre phases principales permettant ainsi la construction d’une séquence de 4 images. D’autres études actuellement en cours tentent de trier les acquisitions sans aucun signal externe. Le tri se fait grâce à l’extraction de repères anatomiques dans les projections elles-mêmes (par exemple le haut du diaphragme) [Rit et al., 2005]. On distingue généralement les acquisitions en mode hélicoïdal, où la table sur laquelle est allongé le patient se déplace continûment et les acquisitions en mode axial ciné, où la table ne se déplace que lorsque le portique ne tourne pas. Dans ce cas, sa position reste la même pendant quelques tours. 2.4.5 Images TDM utilisées dans cette thèse La base de données TDM 4D que nous utiliserons dans ce mémoire a été obtenue au département d’oncologie du Massachussetts General Hospital, Boston, grâce à un tomodensitomètre General Electric LightSpeed QX/i. Nous avons eu accès à ces images dans le cadre d’une collaboration scientifique entre le Centre Léon Bérard2 à Lyon et le Massachussetts General Hospital. Une description précise du protocole d’acquisition est donnée dans [Pan et al., 2004, Rietzel et al., 2005b, Boldea, 2006]. Pour ces acquisitions, le signal externe est apporté par une caméra CCD qui capture la position de réflecteurs positionnés sur le thorax du patient (appareillage de type RPMReal Time Position Management) et la courbe de respiration est déduite de la position des différents capteurs au cours du temps . Le scanneur fonctionne en mode axial ciné dans la direction cranio-caudale et un ensemble de 1000 à 1500 projections est acquis pour reconstruire l’ensemble de la séquence. In exemple d’une coupe frontale d’un des différents 2 http ://oncora1.lyon.fnclcc.fr/ 2.4. LA TOMODENSITOMÉTRIE À RAYONS X 37 F IG . 2.8. Processus de sélection des données en TDM 4D [Rit et al., 2005]. L’acquisition est réalisée alors que le patient respire librement. Le signal respiratoire est acquis en même temps que les données afin de pouvoir les trier. Chaque reconstruction 3D correspond à une phase du cycle respiratoire, l’ensemble conduisant à une séquence couvrant l’ensemble du cycle respiratoire. L’ensemble des données 3D constitue l’image 4D. volumes acquis durant la phase d’expiration est visible en Figure 2.9. Notre base de donnée est composée de 3 séquences, chacune comportant dix instants. Ces dix instants sont répartis de manière non uniforme sur l’ensemble du cycle respiratoire. Deux volumes TDM 3D correspondent aux phases extrêmes de la respiration (fin d’expiration et fin d’inspiration), 4 volumes sont répartis sur la phase d’inspiration et 4 volumes sont répartis sur la phase d’expiration. Les caractéristiques des séquences sont les suivantes : – dimension des images : 512 × 512 – nombre de coupes : 80 à 130 (selon l’espace couvert par les poumons) – résolution dans le plan : 0.977 × 0.977mm2 – épaisseur de coupe : 2.5 mm – résolution temporelle : variable en fonction du signal ventilatoire obtenu. Il faut noter toutefois que ce protocole d’acquisition est toujours à l’étude et qu’il arrive parfois de constater l’apparition d’artefacts caractéristiques comme celui représenté sur la Figure 2.10. Ce type de défaut est dû à la fois à l’irrégularité du cycle et au nombre 38 CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT parfois trop faible de reconstructions disponibles pour une coupe donnée. Les phases intermédiaires sont donc particulièrement sensibles à ce genre d’artefact. Des expériences sont actuellement menés pour sélectionner différemment les projections. F IG . 2.9. Coupes frontales du thorax à 6 instants reconstruits durant la phase d’expiration selon le protocole défini en 2.4.5. F IG . 2.10. Artefact de reconstruction caractéristique de la TDM 4D. Cette image correspond à une reconstruction 3D en fin d’expiration. 2.5 Conclusion Dans ce chapitre, nous avons décrit les principales modalités permettant l’exploration des organes en mouvement. Nous avons insisté sur deux techniques tomographiques (cinéIRM et TDM 4D) dont les principes d’acquisition très différents permettent d’obtenir des séquences d’images. C’est sur des séquences d’images issues de ces deux modalités que portent les développements méthodologiques décrit dans ce mémoire, en lien, bien sûr, 2.5. CONCLUSION 39 avec les deux contextes applicatifs présentés au chapitre 1. Ainsi, mes recherches portent sur des techniques d’estimation de mouvement dans des séquences d’images monomodales. Il faut préciser que l’on considère que ces séquences comportent au minimum 2 images, mais typiquement plus. Le fait que les processus physiologiques puissent être différents et que deux modalités d’acquisition sont considérées orientera mes choix lors des développements méthodologiques. Enfin, en vue d’une utilisation effective dans les deux cadres applicatifs présentés, les temps de calculs des algorithmes proposés constitueront également une contrainte à prendre en considération. Lors du précédent chapitre nous avions exposé l’intérêt de la prise en compte du mouvement dans les traitements radiothérapeutiques et de l’estimation spatio-temporelle du mouvement et de la forme d’organes en évolution. Ce chapitre complète notre problématique et montre que les champs de mouvement que nous obtiendront pourraient également être utilisés à des fins de reconstruction de séquences d’images.Pour l’évaluation des méthodes que je propose dans ce mémoire de thèse, les données IRM et TDM seront exploitées pour évaluer l’influence des paramètres d’un algorithme d’estimation de mouvement entre deux images que j’ai développé (chapitre 8, section 8.1). Les données TDM serviront à la comparaison de trois méthodes dans le contexte de la radiothérapie (chapitre 9). La méthode d’estimation spatio-temporelle de mouvement (nombre d’images de la séquence > 2) que nous proposons dans ce mémoire sera évaluée dans le cadre de l’application cardiaque uniquement en modalité IRM (chapitre 8, sections 8.2). Nous envisageons cependant, dans un avenir proche, de tester cette méthode sur les données TDM thoraciques dont nous disposons. Le chapitre suivant propose un état de l’art des méthodes d’estimation et de suivi de mouvement dans des séquences d’images. 40 CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT Chapitre 3 Etat de l’art Sommaire 3.1 3.2 3.3 3.4 3.5 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Estimation de mouvement . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Les méthodes différentielles . . . . . . . . . . . . . . . . . . 3.2.2 Mise en correspondance de blocs (MCB) . . . . . . . . . . . 3.2.3 Les méthodes statistiques . . . . . . . . . . . . . . . . . . . . Recalage d’images médicales . . . . . . . . . . . . . . . . . . . . . 3.3.1 Principe du recalage d’images . . . . . . . . . . . . . . . . . 3.3.2 Les primitives . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.3 Modèles de transformation . . . . . . . . . . . . . . . . . . . 3.3.4 Optimisation . . . . . . . . . . . . . . . . . . . . . . . . . . Suivi d’objets et de mouvement dans une séquence . . . . . . . . . 3.4.1 Alignement de séquences . . . . . . . . . . . . . . . . . . . . 3.4.2 Estimation spatio-temporelle de mouvement . . . . . . . . . . 3.4.3 Suivi de structures déformables dans des séquences d’images . Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 42 43 43 44 44 45 45 47 50 51 51 51 53 54 3.1 Introduction L ’estimation de mouvement dans des séquences temporelles d’images est un des problèmes fondamentaux en traitement et analyse d’images. Il s’agit d’un problème inverse mal posé, pour lequel de très nombreux développements ont été proposés. Cependant, devant les difficultés théoriques et pratiques, cela reste un problème ouvert. Parmi les domaines d’applications concernés, nous pouvons mentionner à titre d’exemple : – la compression de vidéos pour la télévision numérique. – la robotique et l’interprétation de scènes animées. – la météorologie avec le suivi de masses nuageuses sur des images satellitaires. – la médecine avec l’estimation de mouvement d’organes mobiles notamment des structures cardiaques et thoraciques. 41 CHAPITRE 3. ETAT DE L’ART 42 Les applications de traitement d’images satellitaires sont les plus proches de notre application car elles doivent également tenir compte du caractère non-rigide du mouvement à détecter. Ce chapitre présente une synthèse bibliographique de méthodes d’estimation et suivi de mouvement. La suite de ce chapitre est organisée de la manière suivante : dans la section 3.2 nous décrivons le principe des méthodes d’estimation de mouvement entre deux images. Une attention particulière sera ensuite portée sur la notion de recalage d’images (section 3.3), ce type de méthode constituant le cœur méthodologique de ce mémoire. La fin de cette section sera consacrée à la prise en compte du temps dans les algorithmes de recalage. Enfin, dans le but d’aborder la notion de suivi d’objet dans des séquences d’images, nous décrirons, dans la section 3.4.3, quelques méthodes proposées récemment qui ont attiré notre attention. 3.2 Estimation de mouvement Dans cette partie, nous ne décrirons pas de manière détaillée l’ensemble des méthodes, dites classiques, d’estimation de mouvement. En effet, de nombreux rapports et articles existent sur le sujet. Nous invitons le lecteur à se référer à [Stiller and Konrad, 1999] ou à [Grava, 2003], par exemple. D’un manière générale, les méthodes d’estimation de mouvement sont basées sur l’hypothèse de conservation de l’intensité lumineuse des objets en déplacement au cours du temps. Si on note I(x, t) la fonction d’intensité (niveau de gris) d’un point de coordonnées x dans une image à l’instant t, la contrainte de conservation peut être traduite par l’équation de la DFD (Displaced Frame Difference) DF D(x, t, t + dt) = I(x + dx, t + dt) − I(x, t) = 0 (3.1) où dx représente le déplacement vectoriel du point x. Si on considère deux images d’une séquence aux instants t et t + ∆t, l’équation (3.1) devient : DF D(x, t, t + ∆t) = I(x + u(x), t + ∆t) − I(x, t) = 0 (3.2) où u(x) correspond au déplacement du point x entre les deux images. Si v(x) est la vitesse instantanée du point x, nous avons la relation : v(x) = u(x) ∆t (3.3) Le problème de l’estimation de mouvement consiste à estimer un champ u (ou v) à partir de la donnée d’un ensemble fini d’images que l’on peut considérer comme des clichés instantanés réalisés à des instants précis au cours du mouvement. On distingue généralement les méthodes non-paramétriques et les méthodes faisant intervenir des modèles paramétriques de mouvement. La suite de cette section concerne la description des principales classes de méthodes non-paramétriques. Les méthodes paramétriques seront expliquées en détail dans la section 3.3.3.1 lorsque la notion de recalage sera abordée. 3.2. ESTIMATION DE MOUVEMENT 43 3.2.1 Les méthodes différentielles Ces méthodes, très populaires, visent à estimer le flux optique entre deux images à partir de l’estimation de gradients spatio-temporels de l’intensité en chacun des pixels de l’image. Le flux optique est défini comme la distribution de mouvement ou de vitesse apparent dans une image. Son estimation dans une séquence d’images est un sujet de recherche intense dans le domaine du traitement d’images, en particulier depuis l’article fondateur de Horn & Schunck [Horn and Schunck, 1981]. Un développement de Taylor du premier ordre de l’équation (3.2), permet d’obtenir l’équation de contrainte de mouvement : It + ∇I · v = 0 (3.4) où v représente la vitesse, ∇I le gradient spatial de l’intensité et It la dérivée temporelle de l’intensité I. La simplicité de l’approche dissimule un inconvénient majeur. Nous sommes confrontés au problème d’ouverture qui ne donne que la composante normale du champ de déplacement. En deux dimensions, cette seule équation à deux inconnues ne permet pas de définir de manière unique les deux composantes du déplacement. De nombreux auteurs se sont intéressés à ce problème. Horn et Schunck [Horn and Schunck, 1981] ont proposé d’ajouter une contrainte globale de lissage du champ de mouvement. Ils font l’hypothèse que les points voisins sont animés d’une vitesse similaire et que le flux varie continûment. Cela revient à minimiser l’équation intégrale suivante : Z (It + ∇I · u)2 + α k∇uk2 dx (3.5) x∈Ω Dans la partie de gauche, nous retrouvons l’équation du flux optique tandis que le terme de droite est la contrainte de lissage. D’autres auteurs ont proposé des lissages anisotropes sous l’hypothèse de correspondance entre les frontières photométriques et les frontières de mouvement [Nagel, 1987, Ghosal and Vanek, 1996] dans le but de prendre en compte les discontinuités des champs de mouvement. D’autres développements intéressants ont été réalisés afin d’introduire la notion de discontinuité de mouvement dans un cadre variationnel [Deriche et al., 1996]. En 3D, il faut une équation supplémentaire. Gorce et al ont proposé d’ajouter une contrainte de divergence nulle [Gorce et al., 1997]. Il faut enfin souligner que les méthodes différentielles sont intéressantes pour la mesure de petits déplacements. Pour la prise en compte de déplacements importants, une analyse multi-résolution est généralement préconisée. 3.2.2 Mise en correspondance de blocs (MCB) Ces méthodes sont couramment employées dans les algorithmes de compression des normes H261 ou MPEG. Le principe de base des méthodes MCB est de découper une image de référence en blocs de pixels. Pour chacun de ces blocs, on essaie de trouver celui qui lui ressemble le plus dans l’image suivante de la séquence. L’hypothèse sous jacente est que le mouvement est localement translationnel. Les caractéristiques associées à cette catégorie de méthodes sont les tailles des blocs et de la fenêtre de recherche, le critère de similarité et la stratégie de recherche du bloc correspondant [Stiller and Konrad, 1999]. Ces méthodes permettent de traiter de grands déplacements mais elles ont, au mieux, une CHAPITRE 3. ETAT DE L’ART 44 précision équivalente au pixel contrairement aux méthodes différentielles. Dans le cadre de mon travail de DEA, nous avons mis au point une méthode basée sur les méthodes MCB qui prend en compte la notion d’objet [Delhay et al., 2004]. 3.2.3 Les méthodes statistiques Parmi les méthodes statistiques, les méthodes Markoviennes ou Bayesiennes sont les plus répandues. Elles reposent sur la formulation probabiliste du champ U . L’estimation finale u est considérée comme étant une réalisation particulière d’un champ aléatoire U . Une formulation très répandue du problème d’estimation de mouvement repose sur l’estimateur de maximum a posteriori (MAP) [Gee et al., 1995, Odobez and Bouthemy, 1995, Stiller and Konrad, 1999] : û = arg max p(u, It+1 , It ) u (3.6) Cette distribution a posteriori est exprimée en utilisant la règle de Bayes : p (U = u|It+1 , It ) = p(It+1 |U = u) · p(U = u) p(It+1 , It ) (3.7) Le terme p(It+1 |U = u) représente la vraisemblance d’obtenir It+1 connaissant le champ de déplacement u. Il s’agit donc d’un terme d’attache aux données grâce auquel il est possible d’introduire des a priori sur l’acquisition de l’image It+1 (prise en compte d’un modèle de bruit dans l’image notamment). Le terme p(U = u) permet d’introduire un a priori sur le champ de déplacement. Comme dans le cas de méthodes variationnelles, il est possible d’introduire dans ce cadre des discontinuités du champ de mouvement via les processus de ligne explicites ou implicites1 [Orkisz and Clarysse, 1996, Planat, 1999, Stiller and Konrad, 1999] 3.3 Recalage d’images médicales Le recalage d’images joue un rôle très important pour l’analyse et l’interprétation d’images médicales. On distingue quatre objectifs majeurs du recalage : • Recalage intra-patient multi-modalités. Il s’agit de fusionner des informations issues de modalités différentes afin de confronter des informations anatomiques (e.g. TDM, IRM imagerie US) et/ou fonctionnelles (e.g. SPECT, TEP, IRM fonctionnelle). Les images considérées sont des acquisitions effectuées sur un même patient et impliquent donc des méthodes de recalage dites rigides ou affines. • Recalage inter-patient. Il permet de mettre en correspondance des informations complémentaires disponibles au sein d’une population pour la construction d’atlas anatomiques ou fonctionnels. Il permet également la construction de modèles anatomo-fonctionnels individualisés. Le recalage est dans ce cas généralement non rigide 1 http ://www.creatis.insa-lyon.fr/˜clarysse/Cours/Discontinuity4.pdf 3.3. RECALAGE D’IMAGES MÉDICALES 45 • Recalage intra-patient mono-modalité. Ce type de recalage intervient pour évaluer l’évolution d’une pathologie sur des images d’un même patient obtenues à des périodes différentes. Il permet également d’estimer in vivo des comportements physiologiques à des fins diagnostiques ou thérapeutiques. • Recalage atlas-données. Il permet notamment l’étiquetage ou la segmentation automatique d’attributs par transport de cartes (atlas). Notre travail exploite le principe de recalage d’images pour estimer une transformation spatio-temporelle à partir d’un ensemble d’images. En ce sens, il se rapproche de la troisième catégorie et considère une même modalité d’imagerie et un même sujet. 3.3.1 Principe du recalage d’images Le recalage d’images (ou mise en correspondance d’images) consiste à déterminer la transformation (au sens mathématique) d’une image afin qu’elle ressemble le plus possible à une autre. Cette principe général soulève un certain nombre de questions. Quelles sont les informations disponibles et utilisables pour aider la mise en correspondance ? Quel est le critère qui peut nous renseigner sur la ressemblance entre deux images ? Par quelle type de transformation allons nous établir cette mise en correspondance ? Comment rechercher la meilleure correspondance ? Ces questions débouchent sur la définition des composants des méthodes de recalage. La suite de cette description propose un rappel des principales approches de recalage d’images classées selon 3 critères : le type de primitives/terme d’appariement, le modèle de transformation et les méthodes d’optimisation. Cette description n’est sans doute pas exhaustive compte tenu du nombre considérable de publications où le mot "recalage" compte parmi les mots clefs. Des états de l’art concernant le recalage d’images en imagerie médicale sont disponibles dans [Maurer and Fitzpatrick, 1993,Viergever and Maintz, 1998, Crum et al., 2004] et, plus particulièrement pour l’imagerie du cœur, dans [Mäkelä et al., 2002]. Des thèses soutenues récemment dans ce domaine [Kybic, 2001, Camara, 2003, Petitjean, 2003, Noblet, 2006] ainsi que certains livres [Hajnal et al., 2001, Modersitzki, 2004] proposent également des synthèses détaillées des méthodes de recalage proposées en imagerie médicale. Comme nous proposons d’estimer une transformation spatio-temporelle sur l’ensemble d’une séquence, nous nous focaliserons plus particulièrement sur les méthodes de suivi d’objet et de mouvement dans la section 3.4. 3.3.2 Les primitives Les primitives représentent l’information sur laquelle s’appuie l’estimation de la transformation entre les images. On distingue généralement les primitives géométriques et les primitives iconiques. 3.3.2.1 Approches par primitives géométriques Ces approches nécessitent l’extraction de sous ensembles de points homologues (primitives) dans les images à recaler. L’idée de base de cette méthode consiste à trouver une CHAPITRE 3. ETAT DE L’ART 46 transformation qui met en correspondance une paire d’ensembles finis de primitives extraites dans chacune des images. [Maurer and Fitzpatrick, 1993]. L’extraction des primitives peut s’effectuer manuellement par intervention d’experts ou automatiquement grâce à des outils de détection (voir par exemple [Rohr, 2001]). Les primitives géométriques peuvent être des points, des courbes ou des surfaces. Les méthodes généralement employées pour apparier deux ensembles de primitives sont l’interpolation/l’approximation par des bases de fonctions radiales et les algorithmes de type ICP (Iterative Closest Point). Fonctions de base radiales Les fonctions de base radiales sont largement utilisées pour l’approximation et l’interpolation de fonctions dans les domaines de la géologie, de la météorologie ou de l’imagerie médicale notamment. Pour plus de détails, nous invitons le lecteur à se référer à une description détaillée proposée dans [Wendland, 2004]. Le principe de cette méthode est de trouver une transformation spatiale interpolante/approximante qui permet de mettre en correspondance deux ensembles de points [Duchon, 1976, Bookstein, 1989, Sprengel et al., 1996]. Les fonctions radiales étant à support infini, elles ont une influence sur l’ensemble de l’image. D’autres fonctions à support compact ont été proposées (voir [Wendland, 2004]). L’algorithme du point le plus proche itéré (ICP - Iterative Closest Point - en anglais) Cet algorithme introduit par [Besl and McKay, 1992] est destiné au recalage rigide de deux ensembles de primitives géométriques. Pour chaque point de l’espace de départ, les points les plus proches de l’espace d’arrivé sont recherchés. Une technique de moindres carrés est utilisée pour estimer la transformation rigide à partir des correspondances de points. Cette transformation est ensuite appliquée à l’ensemble des points de départ. Ces deux étapes sont réitérées jusqu’à ce que la distance entre les deux ensembles soit considérée comme suffisamment faible. Dans [Camara, 2003], les auteurs proposent de combiner les transformations linéaires obtenues par ICP et des transformations non-linéaires pour initialiser la position des points d’une grille de déformation (de type Free Form Deformation - voir section 3.3.3.1) afin d’obtenir un déplacement cohérent sur l’ensemble du volume. Une généralisation au cas non-rigide est également proposé dans [Chui and Rangarajan, 2003] avec l’algorithme TPS-RPM (Thin Plate Spline Robust Point Matching). 3.3.2.2 Approches par primitives iconiques Le principe de ces méthodes repose sur la prise en compte de l’information intensité attachée en chaque pixel de l’image. Le choix du critère dépend de la nature des images à recaler. Ainsi, un recalage monomodal ou multimodal va généralement conduire à des critères tout à fait différents. Dans la littérature, quelques articles proposent une étude comparative de différents critères [Roche et al., 1999, Penney et al., 1998]. Les critères couramment utilisés en recalage monomodal d’images reposent sur l’hypothèse de conservation de l’information photométrique. Parmi ces critères, on note entre autres : • Critère de similarité en valeur absolue basé sur une distance de norme L1 entre l’image source déformée et l’image cible. 3.3. RECALAGE D’IMAGES MÉDICALES 47 • Critère de similarité quadratique (Sum of Squared Difference, SSD - en anglais) qui est son analogue avec une norme L2 . Elle est robuste aux bruits gaussiens mais pas aux points aberrants. • Critères de similarité robuste [Rousseeuw and Leroy, 1987, Geman and McClure, 1987]. Les méthodes de recalage s’appuyant sur ce type de critères présentent a priori une moindre sensibilité aux points aberrants [Kim and Fessler, 2004, Noblet, 2006]. La mesure de similarité quadratique est un cas particulier des estimateurs robustes. Dans le cas du recalage multimodal, l’hypothèse précédente n’est plus fondée. La relation entre les intensités n’est pas connue a priori. Les critères doivent alors prendre en compte des relations plus complexes entre les distributions d’intensité des deux images. Ainsi, dans le cas d’une relation linéaire ou affine, on considère le coefficient de corrélation [Brown, 1992]. Dans le cas d’une dépendance fonctionnelle, Roche et al [Roche et al., 1998] ont introduit le rapport de corrélation. Enfin pour exprimer la dépendance statistique, l’information mutuelle, normalisée ou non, a reçu beaucoup d’intérêt [Viola, 1995, Maes et al., 1997]. 3.3.2.3 Approches hybrides Certains auteurs ont proposé des approches hybrides où des primitives géométriques et iconiques sont utilisées conjointement. Le terme d’appariement permettant de mettre en correspondance les objets à recaler est alors composé d’une contribution liée aux informations iconiques et d’une contribution liées aux amers géométriques [Hellier and Barillot, 2000, Cachier et al., October 2001, Johnson and Christensen, 2002]. 3.3.3 Modèles de transformation Le choix de la transformation est orienté par la nature de la correspondance géométrique que l’on désire établir entre les images à recaler. Son choix est fondamental dans le sens où il va définir l’espace de recherche pour l’algorithme de recalage. On distingue généralement les transformations paramétriques et les transformations non-paramétriques. Si la transformation s’appuie sur un modèle paramétrique, ce modèle définit l’ensemble des solutions acceptables et le nombre de degrés de liberté (DDL) accordé à la transformation. Ce modèle de déformation peut être global s’il s’applique à l’ensemble de l’image, semi-local si la transformation résulte d’un ensemble de contributions appliquées à des sous régions de l’image. Dans le cas non-paramétrique, la transformation est discrète et locale car elle est définie explicitement en chaque pixel de l’image. On distingue aussi généralement les transformations rigides/affines et non-rigides qui peuvent se décliner dans les différents cas du global au local. Une description détaillée des différentes transformations est donnée dans [Viergever and Maintz, 1998]. 3.3.3.1 Approches paramétriques Transformation globale Par définition, les modèles de transformation globale ont une influence sur l’ensemble de l’espace. Les transformations rigides/affines appartiennent à CHAPITRE 3. ETAT DE L’ART 48 cette catégorie. Elles s’écrivent sous la forme : ϕ(x) = Ax + t , x ∈ Rd (3.8) Les transformations sont dites rigides lorsque seules les rotations et les translations sont prises en compte. Les distances, les angles et le parallélisme sont alors conservés et nous avons det A = 1. Si cette condition n’est pas respectée, la transformation est dite affine. Elle permet alors, en plus des rotations et des translations, l’étirement et le cisaillement des structures à recaler. Dans ce cas, seul le parallélisme est conservé. Ce type de transformation est très intéressant dans le cas de recalages intra-patient multi-modalités car seul le positionnement doit être corrigé. Pour étudier une variation de morphologie, on préférera des modèles autorisant un plus grand nombre de degrés de liberté. Les méthodes polynomiales [Woods et al., 1998] constituent une extension des modèles linéaires. Des modèles quadratiques (second ordre) voire d’ordre supérieur peuvent être pris en compte. L’influence des polynômes s’étend à l’ensemble de l’image rendant l’estimation de déplacements localisés difficile. De plus, des phénomènes d’oscillations rendent cette approche en général peu satisfaisante. Cette transformation globale non-linéaire ne conserve plus la géométrie. Elle est dite non-rigide. Transformation semi-locale Les transformations semi-locales ou non-linéaires autorisent la variation de la géométrie des structures et donc de modifier leur forme globale. Pour ces raisons on les appelle également transformations non-rigides ou déformables. Elle sont donc particulièrement intéressantes pour étudier les variations de forme de structures entre plusieurs patients ou pour étudier l’évolution d’une structure au cours du temps. Dans ce cas, le nombre de DDL requis est beaucoup plus important. Parmi les modèles non-linéaires, on peut citer : • Les transformations sur bases de fonctions radiales que nous avons décrites dans le cas du recalage par primitives géométriques. Elle constituent un moyen d’appréhender les déformations semi-locales de manière paramétrique. • Les déformations dites de formes libres (ou Free Form Deformation - FFD - en anglais) ont été introduites par Sederberg et Parry en 1986 [Sederberg and Parry, 1986]. Le principe de la déformation FFD consiste à plonger l’image (ou un objet quelconque) que l’on désire déformer, dans une grille régulière composée d’un ensemble de K points de contrôle (PDC). Leur déplacement entraîne un déplacement sur l’ensemble ou une partie du domaine de définition selon la base de fonctions choisie. La déformation continue de l’espace se calcule par interpolation des déplacements ponctuels attribués aux PDC. L’avantage principal des FFD réside dans leur aptitude à estimer des déformations très localisées. Ces travaux ont ensuite été repris par Coquillart [Coquillart, 1990] et étendus à des géométries de grille plus complexes de type cylindriques ou sphériques. L’idée a été reprise dans la communauté de l’imagerie médicale à la fin des années 90 pour la modélisation de transformations dédiées à la segmentation d’images thoraciques [Lötjönen et al., 1998], au recalage d’images du cerveau [Rueckert et al., 1999], à la déformation de surfaces implicites de type super-quadriques pour la segmentation d’images TDM 3.3. RECALAGE D’IMAGES MÉDICALES 49 à rayons X cardiaques [Bardinet et al., 1998] ou pour le recalage de surfaces dans des images TEP et TDM [Camara et al., 2003]. Régularisation Lorsque le nombre de paramètres est important, il devient difficile de maîtriser le comportement du modèle de transformation. La régularisation de la transformation permet de pénaliser les variations brusques du champs de déplacement. Ainsi dans [Horn and Schunck, 1981, Gee et al., 1997] une énergie de membrane est considérée pour minimiser les dérivées premières du champ de déplacement estimé. Dans [Bookstein, 1989, Rueckert et al., 1999, Rohlfing et al., 2003, Ashburner and Friston, 1999] ce sont les dérivées secondes qui sont considérées pour minimiser une énergie de flexion de plaques minces. Dans [Miller et al., 1993] une énergie élastique linéaire est introduite. Elle a été réutilisée ensuite dans de nombreux articles. Enfin dans [Cachier and Ayache, 2004], les auteurs proposent de considérer le terme général suivant pour unifier les formes différentielles du premier ordre : q(u) = a tr(∇uT ∇u) + b tr(∇u∇u) + c tr2 (∇u) (3.9) où a, b et c sont trois coefficients réels et u représente de déplacement. 3.3.3.2 Approches non-paramétriques Dans le cas non-paramétrique, la transformation est définie explicitement en chaque pixel de l’image par un vecteur de déplacement (ou de vitesse). Flux optique La méthode de flux optique, largement utilisée en estimation de mouvement, établit un lien direct entre les méthodes de recalage et les méthodes d’estimation de mouvement qui peuvent être considérées comme un cas particulier des méthodes de recalage au sens large. L’hypothèse d’invariance de l’intensité des méthodes de flux optique est utilisé dans le cas du recalage monomodal. Démons L’algorithme des démons [Thirion, 1998] est une méthode de mise en correspondance basé sur la notion de modèle de diffusion. Ce modèle de diffusion est utilisé pour déformer l’image alors considérée comme une grille déformable. Cette méthode a été récemment utilisée pour estimer le mouvement de structures thoraciques dans le cadre de traitements radiothérapeutiques [Boldea et al., 2003] ou pour le recalage multimodalités du cerveau avec correction d’intensité [Guimond et al., 2001]. Modèles basés sur des lois physiques Le choix d’un modèle comportemental peut s’avérer intéressant d’un point de vue méthodologique pour contrôler la déformation de la façon désirée. Cependant, on peut toujours se poser la question de la validité physique des modèles choisis par rapport aux phénomènes étudiés. • Les modèles élastiques [Broit, 1981] [Bajcsy and Broit, 1982] considèrent le recalage comme un problème de déformation élastique. La déformation est contrôlée par les équations de Navier par le biais de deux paramètres, les coefficients de Lamé. Ces méthodes conservent la topologie uniquement dans le domaine continu CHAPITRE 3. ETAT DE L’ART 50 et ne sont applicables que pour les petits déplacements dans le cas de l’élasticité linéaire [Bajcsy and Kovacik, 1989, Ferrant et al., 2001]. • Les modèles fluides [Christensen et al., 1996] [Christensen, 1999] [Miller et al., 1999] permettent de gérer les grands déplacements. Ces modèles s’appuient sur la formulation Eulérienne du déplacement. Les équations aux dérivées partielles sont identiques à celles du modèle élastique à ceci près qu’elles agissent sur la vitesse plutôt que le déplacement (Equations de Navier-Stokes). Ces méthodes sont très coûteuses en temps de calcul. 3.3.4 Optimisation La transformation de recalage résulte de la minimisation d’une fonction de coût qui dépend des primitives sélectionnées. Selon le nombre de DDL et les images, la minimisation peut s’avérer rapidement un problème complexe. Des stratégies d’optimisation doivent être mises en œuvre afin de garantir l’obtention d’une solution correcte dans un temps raisonnable. La difficulté majeure de l’optimisation des problèmes de recalage nonrigide résident dans la non-convexité de la fonction de coût dans l’espace des paramètres et donc dans la possibilité de converger vers des minima locaux. L’initialisation du processus d’optimisation est ainsi très importante. Les approches multi-échelles et multi-résolutions constituent une alternative à la non-convexité sans pour autant garantir l’optimalité de la solution. Les méthodes directes sont envisageables lorsque le nombre de paramètres à estimer est faible. Le recalage rigide/affine à partir de deux ensembles de marqueurs ou le recalage non-rigide à partir de la mise en correspondance de primitives géométriques et des transformations de type RBF peut se formuler par un problème de moindres carrés [Rhor et al., 2001]. Les méthodes exhaustives reposent sur la discrétisation arbitraire ou adaptée de l’espace de recherche et sur un balayage empirique de l’espace de recherche discrétisé [Mäkelä et al., 2003]. Pour un nombre élevé de paramètres, ces méthodes sont extrêmement coûteuses en temps de calcul. Les méthodes numériques itératives sont envisagées lorsque la fonction de coût à minimiser est une fonction non-linéaire des paramètres à optimiser. Ces méthodes reposent sur le calcul du gradient de la fonction de coût (descente de gradient (DG) ou descente de gradient conjugué (DCG)) ou, pour les méthodes dites de Newton, sur le calcul du gradient et de la matrice Hessienne. Ces dernières sont réputées être plus rapides mais nécessitent une bonne initialisation. Les méthodes basées sur le gradient souffrent d’une vitesse de convergence trop lente au voisinage du minimum. Les méthodes de LevenbergMarquardt [Marquardt, 1963] permettent de combiner les avantages des deux précédentes sans pour autant garantir un minimum global. D’autres algorithmes de type Powell ou simplexe effectuent des recherches itératives en fonction des résultats obtenus précédemment et ne nécessitent pas le calcul explicite du gradient de la fonction de coût. Ces méthodes ne sont pas optimales [Press et al., 1992]. 3.4. SUIVI D’OBJETS ET DE MOUVEMENT DANS UNE SÉQUENCE 51 Les méthodes stochastiques de type recuit simulé [Kirkpatrick et al., 1983] ou les algorithmes génétiques garantissent une solution optimale malgré la non-convexité de l’espace de recherche. Cependant, les temps d’exécution sont souvent très élevés. 3.4 Suivi d’objets et de mouvement dans une séquence Cette section est consacrée aux méthodes dont le but est d’appréhender le mouvement sur l’ensemble d’une séquence. Nous distinguerons trois approches différentes. La première concerne les méthodes de recalage qui intègrent l’espace et le temps dans le but d’aligner des séquences d’images entre elles. La seconde concerne plus particulièrement l’étude du mouvement sur l’ensemble d’une séquence. Enfin, nous décrirons brièvement les méthodes qui visent à suivre des structures déformables dans des séquences d’images. Ces méthodes ont été plus spécifiquement développées dans le cadre de l’estimation du mouvement et le recalage de séquence d’images cardiaques. Certaines d’entre elles ont été utilisées également en imagerie thoracique. 3.4.1 Alignement de séquences Des méthodes d’alignement de séquence ont fait leur apparition dans la communauté de la vision par ordinateur. Dans [Caspi and Irani, 2002], le but est d’établir une correspondance spatio-temporelle entre deux séquences vidéos afin de compenser le mouvement ou la mauvaise calibration de caméras qui observent une scène de façon simultanée. Plus particulièrement, dans le cas de l’analyse de la fonction cardiaque, Perperidis et al proposent d’utiliser une grille 4D et des déformations de forme libre à base de B-Splines [Perperidis et al., 2003, Perperidis et al., 2005]. Ces méthodes sont mal adaptées à notre contexte applicatif, car leur but est de fournir une correspondance entre deux séquences d’images. Elles sont particulièrement intéressantes pour la comparaison de comportements physiologiques au sein d’une population ou pour la construction d’atlas dynamiques mais elles ne donnent pas directement d’information sur le mouvement. 3.4.2 Estimation spatio-temporelle de mouvement En imagerie cardiaque, l’IRM de marquage tissulaire a suscité de nombreux travaux pour l’extraction d’informations quantitatives de mouvement. Historiquement, les premiers étaient basés sur l’estimation du mouvement du motif de marquage préalablement extrait. Dans [Young et al., 1995, Reynard et al., 1995], le mouvement dense du cœur est estimé en suivant les lignes de marquage extraites sur l’ensemble d’une séquence. Clarysse et al estiment les paramètres d’un modèle spatio(2D)-temporel de mouvement du motif de marquage dont on peut déduire facilement des paramètres caractéristiques comme les déformations principales ou les déformations dans les directions radiales et circonférentielles. Des modèles de forme et de mouvement ont été proposé pour caractériser la fonction cardiaque. Ainsi dans [Matheny and Goldgof, 1995], les auteurs utilisent une décomposition harmonique de la surface pour modéliser la forme et le mouvement du ventricule gauche du cœur. Declerck et al ont proposé un modèle de transformation planisphérique pour assurer la continuité du mouvement spatio-temporel estimé. Cette estimation CHAPITRE 3. ETAT DE L’ART 52 est issue de la prise en compte de primitives géométriques [Declerck et al., 1996,Declerck et al., 1998]. Oumsis et al ont proposé un modèle d’état harmonique spatio-temporel dans le but de détecter des zones d’anomalie de mouvement du cœur [Oumsis et al., 2003]. Gorce et al estiment le mouvement du cœur en 3D avec une méthode de flux optique avec des contraintes supplémentaires de conservation de la masse et de divergence nulle [Gorce et al., 1997]. De la même façon, Amini et Duncan proposent d’estimer le mouvement entre deux instants consécutifs d’une séquence et de régulariser les champs obtenus en prenant en compte l’ensemble de la séquence [Amini and Duncan, 1992]. Dans un contexte plus général, d’autres auteurs ont proposé de considérer une extension spatiotemporelle de la régularisation spatiale généralement utilisée en estimation de mouvement par flux optique [Weickert and Schnörr, 2001]. Cette méthode garantit l’existence et l’unicité de la solution. Elle a été étendue pour l’étude des grand déplacements dans [Alvarez et al., 2000]. Dans [Klein, 2000], un algorithme d’estimation de mouvement 4D est proposé. La prédiction est basée sur l’hypothèse de continuité de la vitesse entre deux instants cardiaques successifs. Keeling et Ring présentent une méthode de recalage dans laquelle l’idée est de rajouter une dimension z aux images pour créer un domaine Q : Q = {(x1 , . . . , xN , z) = (x, z) : 0 < x1 , . . . , xN , z < 1} dans lequel il est possible de contrôler l’évolution de la transformation entre deux extrêmes [Keeling and Ring, 2005]. La méthode décrite dans [LedesmaCarbayo et al., 2005] est également une méthode de recalage spatio-temporelle. Elle est destinée à l’étude et la quantification de l’élasticité du myocarde dans des séries d’images ultrasonores 2D. C’est sans doute la méthode la plus avancée à l’heure actuelle en recalage spatio-temporel d’images. L’image est définie de manière continue par I(x, t) qui représente l’intensité de l’image à l’instant t et à la position x. Le but est d’estimer un champ dense de déplacement sur l’ensemble d’une série d’images ultrasonores 2D du cœur. Le mouvement compensé est exprimé en fonction de l’instant de référence par une transformation ϕ(x, t). La transformation est exprimée par un modèle paramétrique défini par une base de Bsplines séparables en temps et en espace : XX ϕ(x, t) = ξ j,l βj (x)βl (t) (3.10) l∈L j∈J où l ∈ Z et j ∈ Z correspondent aux indices des paramètres temporels et spatiaux, respectivement. L’estimation de ces paramètres est réalisée conjointement en prenant en compte l’ensemble de la séquence par la minimisation d’une énergie de type SSD (norme L2 ) étendue à l’ensemble de la séquence : T −1 1X E = Et T t=0 Z Et = (I(ϕ(x, t), t) − I(x, 0))2 dx (3.11) (3.12) x∈Ω où T est le nombre total d’images dans la séquence. L’optimisation de ce problème est réalisée par une méthode de descente de gradient. Cette approche est très intéressante car elle a la particularité d’individualiser clairement le 3.4. SUIVI D’OBJETS ET DE MOUVEMENT DANS UNE SÉQUENCE 53 temps et l’espace dans le modèle de déformation et dans sa façon d’appréhender le terme d’appariement. L’ensemble des images de la séquence est utilisé simultanément pour fournir une estimation réellement spatio-temporelle. L’un des avantages dans notre contexte par rapport à la méthode décrite dans le paragraphe précédent, est que l’estimation finale propose une information de mouvement de l’ensemble des points matériels et non une mise en correspondance entre deux séquences. Des améliorations peuvent cependant être envisagées. La périodicité des mouvements n’est pas prise en compte. Il en résulte une discontinuité de la vitesse à l’instant de référence. De plus, le nombre de paramètres décrivant l’évolution temporelle est uniforme sur l’ensemble de l’image. Pour des applications 2D+t, cela n’est pas très pénalisant mais pour des approches 3D+t le nombre de paramètres peut vite définir un facteur limitant. La méthode de recalage spatio-temporelle que nous proposons dans le chapitre 6 s’appuiera sur ces constations. 3.4.3 Suivi de structures déformables dans des séquences d’images Les méthodes de suivi de structures dans des séquences d’images ne permettent pas de fournir une information dense de mouvement. Cependant, les modèles spatio-temporels mis en place et leur façon d’appréhender l’ensemble des images d’une séquence les rendent particulièrement intéressantes dans notre contexte. Ainsi Jacob et al estiment les déplacements entre deux instants successifs d’une séquence ultrasonore. Les estimations sont initialisées grâce à un algorithme de prédiction [Jacob et al., 1998]. D’autres auteurs ont proposé la segmentation de structures déformables dans une séquence d’images par modèle markovien [Boukerroui et al., 1999], par logique floue [Sanchez-Ortiz et al., 2000] ou par des méthodes par éléments finis [McInerney and Terzopoulos, 1995, Pham et al., 2001, Mäkelä et al., 2003] Dans le cadre de sa thèse, Murcia propose une méthode de reconstruction d’images TEP à partir de l’estimation de mouvement spatio-temporelle obtenue à partir d’images bruitées [Murcia, 1996]. La reconstruction s’inscrit dans le cadre théorique du filtrage de Kalman. L’algorithme récursif repose sur des opérations de type filtrage-rétroprojection. L’ensemble des phases est reconstruit simultanément. La reconstruction de la séquence est effectuée par minimisation d’une fonctionnelle quadratique établie dans le cadre d’une régularisation spatio-temporelle. La technique proposée dans [Comaniciu et al., 2004] est adaptée à l’étude de séquences d’images ultrasonores. Un estimateur de Kalman y est proposé comme un moyen du fusionner différentes sources d’informations. Dans [Montagnat and Delingette, 2005], Montagnat propose une méthode de segmentation de structures déformables dans des images 3D et 4D médicales. Elle se base sur une formulation discrète des surfaces par des maillages dits simplexes permettant notamment un contrôle intéressant de la courbure des surfaces reconstruites. L’évolution et la déformation de ces surfaces sont régularisées en espace et en temps grâce à des contraintes faibles où chaque sommet est attiré vers le milieu du segment défini par ses deux voisins temporels ainsi que des contraintes fortes où l’ensemble des trajectoires est régularisé. La méthode a été appliquée au ventricule gauche du cœur sur plusieurs modalités d’images. CHAPITRE 3. ETAT DE L’ART 54 3.5 Conclusion Dans ce chapitre, nous avons proposé une synthèse des méthodes d’estimation de mouvement et des principales méthodes de recalage d’images. Nous avons présenté les principes et concepts de base sans trop entrer dans le détail, compte tenu des nombreux documents et ouvrages existant sur le sujet que se soit sur l’estimation de mouvement et le recalage d’images. Nous avons ensuite fait état de travaux plus récents qui tendent à prendre en compte non plus seulement deux images mais plusieurs images d’une séquence. Nous avons vu que dans le cadre du recalage, on peut distinguer les approches paramétriques et non paramétriques. Les approches paramétriques présentent l’avantage de fournir une représentation du champ de mouvement sous la forme d’un modèle à partir duquel il est aisé d’extraire des paramètres quantitatifs caractéristiques du mouvement. c’est un atout important dans nos deux contextes applicatifs. On constate aussi qu’il existe un compromis entre la complexité du modèle (i.e. son nombre de paramètres) et la localité de l’estimation. Plus on cherche à estimer un mouvement ponctuel, plus le nombre de paramètres requis augmente pour avoisiner celui des méthodes non paramétriques. Il en résulte que pour assurer la résolution du problème paramétrique en temps raisonnable, on cherche le plus possible à adapter le modèle et le nombre de paramètres au cas étudié. Deuxième partie Contributions Méthodologiques 55 Chapitre 4 Estimation de mouvement entre deux images par recalage Sommaire 4.1 4.2 4.3 4.4 4.5 4.6 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Recalage de deux images . . . . . . . . . . . . . . . . . . . . . . 4.2.1 Motivations . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.2 Problématique . . . . . . . . . . . . . . . . . . . . . . . . Modèle de transformation . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.2 Modèle non-linéaire de transformation . . . . . . . . . . . . 4.3.3 Fonctions splines . . . . . . . . . . . . . . . . . . . . . . . 4.3.4 Calcul pratique de la transformation FFD B-Spline . . . . . 4.3.5 Approche bi-pyramidale de l’estimation de la transformation 4.3.6 Propriétés de la transformation . . . . . . . . . . . . . . . . 4.3.7 Régularisation . . . . . . . . . . . . . . . . . . . . . . . . Critères de mise en correspondance . . . . . . . . . . . . . . . . 4.4.1 terme d’appariement . . . . . . . . . . . . . . . . . . . . . 4.4.2 Choix des opérateurs . . . . . . . . . . . . . . . . . . . . . Optimisation et implantation . . . . . . . . . . . . . . . . . . . . 4.5.1 La stratégie d’optimisation . . . . . . . . . . . . . . . . . . 4.5.2 Accélération des calculs . . . . . . . . . . . . . . . . . . . Discussion et résumé de la contribution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 58 58 59 60 60 62 63 64 65 69 72 73 73 76 81 81 83 89 4.1 Introduction L e but de ce chapitre est de décrire en détail la méthode de recalage d’images qui sera utilisée comme base dans ce mémoire. Elle est utilisée dans notre contexte comme estimateur de mouvement. La méthode décrite dans ce chapitre ne concerne que le déplacement entre deux images. La prise en compte d’a priori de forme sera abordée au chapitre 57 58 CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE 5 et le chapitre 6 sera consacré à la prise en compte de séquences entières d’images pour une estimation spatio-temporelle des déformations. La transformation pour la mise en correspondance de deux images appartient à la catégorie des déformations non-linéaires. Elle est représentée de manière paramétrique dans une base de fonctions B-splines et hiérarchisée à travers une approche multi-échelle. Cette manière d’appréhender le modèle de déformation, a déjà été utilisée dans d’autres contextes, notamment par Musse et Noblet [Musse et al., 2001, Noblet et al., 2005] pour de la mise en correspondance d’images du cerveau avec contrainte de préservation de topologie. Rohlfing [Rohlfing et al., 2003] a envisagé ce type de transformation pour le recalage d’images du sein avec contrainte d’incompressibilité et Kybic [Kybic, 2001] l’utilise pour la mise en correspondance d’images RM anatomiques et fonctionnelles. Nos contributions dans ce chapitre concernent la mise en correspondance de primitives statistiques de l’image issues de l’information photométrique pour le recalage intra-modalités d’images par RM ou TDM. L’extraction des caractéristiques statistiques de l’image est également mise à profit pour l’accélération des calculs dans le contexte de la modélisation multi-échelle de la déformation. Enfin, cette méthode, et plus particulièrement le terme d’appariement, a été parallélisée pour une exécution sur une architecture multi-processeurs ou de fermes de PC. L’organisation de ce chapitre est la suivante : dans un premier temps, nous décrivons le modèle de transformation utilisé et ses propriétés. Nous insisterons ensuite sur le terme de mise en correspondance basé sur l’information iconique de l’image et sur des propriétés statistiques de stationnarité qui en découle. Enfin, nous exposerons l’optimisation de ce terme d’appariement et l’accélération des calculs. 4.2 Recalage de deux images 4.2.1 Motivations Nous avons introduit dans le chapitre 3 les principaux composants des méthodes de recalage d’images. Nous en redonnons ici une brève description en insistant sur les orientations que nous avons choisies. Ces orientations sont motivées par les contraintes imposées par nos deux domaines applicatifs. Le choix de la transformation est orienté par la nature de la correspondance géométrique que l’on désire établir entre les images à recaler. Son choix est fondamental dans le sens où il va définir l’espace des solutions pour l’algorithme de recalage. Dans le cadre de nos applications médicales, nous nous intéressons à la déformation conjointe d’organes mous. La déformation est loin d’être uniforme sur l’ensemble de l’image et l’amplitude du déplacement varie selon les régions de l’image. On prend également en considération une certaine inter-dépendance entre les mouvements des structures anatomiques voisines comme le cœur et les poumons. Pour ces raisons, notre choix de modèle s’est orienté vers des modèles de transformation semi-locale. De plus, la volonté d’introduire des contraintes spatio-temporelles de déformations, nous a incité à considérer plutôt des approches paramétriques. Enfin, si les phases considérées correspondent à des états physiologiques très différents (ie. recalage d’une image en télé-diastole et d’une image en télé-systole pour l’imagerie cardiaque, ou le recalage d’une image en fin d’inspiration et d’une image 4.2. RECALAGE DE DEUX IMAGES 59 en fin d’expiration pour l’imagerie thoracique), il n’est pas rare de constater des amplitudes de mouvements de l’ordre d’une vingtaine de pixels, ce qui nous situe dans un cadre de grands déplacements. Les stratégies multi-échelles sont un moyen d’appréhender de tels comportements. Les primitives sont les éléments sur lesquels s’appuie le calcul de la transformation de recalage. Dans notre cas, les données dont nous disposons ne nous offrent pas la possibilité d’utiliser des repères externes et l’information photométrique est la seule dont nous disposons. Dans ce chapitre, nous utilisons donc des primitives iconiques. Notre méthode doit être applicable aussi bien à des données IRM que des données CT et la seule information de l’intensité du pixel n’est pas suffisante. L’hypothèse de conservation de cette intensité sur l’ensemble des images d’une séquence peut en effet être discutée. Nous envisagerons un second critère basé sur la stationnarité spatiale de l’intensité qui traduit le contraste entre les structures au sein d’une sousrégion. Le critère d’appariement évalue la distance entre les primitives de chaque image. Il constitue donc le cœur de l’algorithme de recalage puisque la minimisation ou la maximisation de ce critère doit aboutir à l’estimation de la déformation recherchée. Dans la mesure où l’estimation de mouvement repose sur la conservation (ou la quasi-conservation) de l’intensité photométrique au cours du déplacement, nous choisissons d’utiliser une mesure qui traduit le rapprochement entre les primitives iconiques. La norme L2 semble donc adaptée à notre problématique et nous utilisons une métrique simple qui est la moyenne des différences des intensités au carré ou Intesity Mean Squared Difference (MSD) en anglais. L’optimisation ou stratégie de recherche définit la méthode qui va permettre de converger progressivement vers l’estimation finale en explorant l’espace des solutions. Le choix d’un modèle paramétrique semi-local de déplacement entraîne un nombre significatif de paramètres à estimer. Une recherche de type exhaustive est donc inenvisageable du fait de la taille considérable de l’espace de recherche. Les algorithmes de recherche de type stochastique (recuit simulé, algorithmes génétiques) garantissent une solution optimale malgré la non-convexité de l’espace de recherche. Cependant, les temps d’exécution sont souvent très élevés et risquent d’être considérablement longs pour les espaces que nous considérons. Même si la convexité de l’espace de recherche est loin d’être garantie dans notre cas, les approches multiéchelles permettent d’augmenter graduellement la complexité de ces espaces. Les basses échelles/résolutions du modèle de déformation et des images offrent une version "lissée" de la fonction de coût qui tend ainsi à la convexité. Les échelles plus élevées exploiterons les résultats obtenus sur les versions plus lissées des espaces inférieurs évitant ainsi certains minima locaux. La dérivée de notre fonction de coût étant calculable de façon analytique, nous mettrons en œuvre une méthode d’optimisation numérique générique de type descente de gradient. 4.2.2 Problématique La problématique générale du recalage d’images est illustrée sur la Figure 4.1. Considérons une image source Is définie sur un domaine Ωs et à valeur dans R et une image 60 CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE cible Ic définie sur Ωc et également à valeur dans R. Les deux domaines Ωc et Ωs sont tous deux des sous-espaces d’un même espace Rd . Le but du recalage est d’estimer une transformation ϕ : Rd → Rd entre Ic et Is de telle manière que Is ◦ ϕ soit similaire à Ic selon un critère prédéfini. La transformation est recherchée sur un espace T de transformations admissibles. Le critère d’appariement est une fonction d’énergie J qui dépend à la fois des images à recaler et de la transformation de mise en correspondance (ie. J (Is , Ic , ϕ)). La phase d’optimisation consiste à estimer une transformation ϕ ∈ T qui minimise l’énergie J afin de garantir la meilleure mise en correspondance entre les deux images. Le problème du recalage peut donc se résumer par l’équation (4.1) : ϕ̂ = arg min J (Is , Ic , ϕ). ϕ∈T (4.1) Selon le formalisme définit par Modersitzki et Fischer [Modersitzki, 2004], le terme général de la fonctionnelle à minimiser (ou à maximiser selon les cas) peut s’écrire de manière générale sous la forme : J (Ic , Is , ϕ) = A(Ic , Is , ϕ) + αR(ϕ) + γC(ϕ). (4.2) A est le terme d’appariement qui évalue la distance entre les deux images Ic et Is . La dérivée de ce terme par rapport aux paramètres de la transformation fournit un champ de force dans l’espace des paramètres destiné à attirer les primitives de l’image source vers leurs correspondantes dans l’image cible. R est un terme de lissage qui permet de régulariser l’espace des solutions et enfin C est un opérateur de contrainte. Dans ce qui suit, nous détaillons plus particulièrement le premier terme. Nous reviendrons sur le terme de lissage dans la suite et sur le terme de contrainte dans le chapitre 5. 4.3 Modèle de transformation 4.3.1 Définition La transformation fait correspondre un point géométrique x de l’espace de départ Ω ⊂ R vers son image x′ dans l’espace d’arrivée Rd (Figure 4.2). Considérons l’application ϕ de Ω ⊂ Rd vers ϕ(Ω) ⊂ Rd que nous cherchons à estimer : d ϕ = I + u, (4.3) où u représente le déplacement. Nous choisissons volontairement de ne pas imposer la contrainte ϕ(Ω) = Ω. Cette contrainte impliquerait la préservation des bords ∂Ω de l’image et donc ϕ = 0 pour x ∈ ∂Ω. En effet, les acquisitions dont nous disposons ne couvrent pas la totalité des organes en mouvement et, pour quelques images de la séquence, certains d’entre eux peuvent partiellement sortir du champ de vue défini pendant l’acquisition. La transformation ϕ est la composition de l’identité et d’un terme de déplacement u. Nous cherchons donc à estimer le champ de déplacement u en tout point x ∈ Rd tel que : (Is ◦ ϕ)(x) = Is (ϕ(x)) = Is (x + u(x)) soit ’similaire’ à Ic (x). (4.4) 4.3. MODÈLE DE TRANSFORMATION Pré− traitements 61 Mesure d’appariement Image Cible ϕ Pré− traitements Optimisation Interpolation Image Source ϕ F IG . 4.1. Schéma du principe général du recalage d’images. Le principe général consiste en l’estimation d’un champ de transformation de manière à ce que l’image source déformée soit la plus proche possible de l’image cible au sens d’un certain critère d’appariement. Les principaux blocs que sont le critère d’appariement, la transformation ϕ, l’optimisation de cette transformation et l’interpolation de l’image source sont à définir en fonction du contexte applicatif. 62 CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE Dans l’ensemble de ce rapport, le domaine de définition Ω est un sous espace de R3 . Ainsi, de manière générale, la transformation ϕ est décomposée suivant ses trois composantes spatiales ϕx , ϕy , ϕz ; de même, le champ de déplacement u est formé des trois composantes ux , uy , uz et ce pour chaque point x = [x, y, z]t de l’espace. Pour un modèle de transformation paramétrique de vecteur de paramètres ξ ∈ Rp , l’équation (4.1) peut être réécrite sous la forme : ξ̂ = arg minp J (Is , Ic , ξ). (4.5) ξ∈R 4.3.2 Modèle non-linéaire de transformation Le modèle de déformation que nous utilisons s’apparente à des déformations dites de forme libre ou Free Form Deformation (FFD) en anglais. Il s’agit d’une modélisation paramétrique non-rigide de la transformation. Ce modèle semi-local génère des déformations non-linéaires de l’espace dans le sens où les longueurs et la géométrie ne sont pas conservées (une droite peut devenir courbe). Le principe de la déformation FFD consiste à plonger l’image (ou un objet quelconque) que l’on désire déformer, dans une grille régulière composée d’un ensemble de K points de contrôle (PDC). Dans la suite, nous noterons Pk le PDC d’indice k. Le déplacement ξ k = [ξx;k , ξy;k , ξz;k ]t de Pk entraîne un déplacement sur l’ensemble ou une partie du domaine de définition selon la base de fonctions choisie. La déformation continue de l’espace se calcule par interpolation des déplacements ponctuels attribués aux PDC. Notons que dans le cas du recalage d’images, l’ensemble des déplacements des PDC constitue l’ensemble des paramètres ξ qu’il s’agit d’estimer. ϕ Ω ϕ(Ω) F IG . 4.2. Description schématique de l’espace de départ et de l’espace d’arrivée mis en correspondance par la transformation ϕ Selon les notations introduites dans [Kybic, 2001], dans un espace mono-dimensionnel, le déplacement s’exprime par la combinaison linéaire d’un terme de déplacement et d’une fonction d’interpolation dont la taille du support est à définir : X u(x) = ξk β k (x), (4.6) k∈Kinf 4.3. MODÈLE DE TRANSFORMATION 63 où ξk représente le déplacement de Pk . Kinf ⊂ K représente le sous-ensemble des PDC qui influence le déplacement du point x. On verra dans la section 4.3.3 que cet ensemble dépend directement du choix de la fonction d’interpolation. Ceci sera reprécisé dans la section 4.3.5.2. Considérons que l’expression (4.6) correspond à la décomposition de u sur un espace vectoriel dont la base est formée par l’ensemble des fonctions β(x). Dans le cas multidimentionel, on introduit généralement une hypothèse de séparabilité des dimensions de l’espace pour exprimer une base engendrée par produit tensoriel des espaces unidimensionnels correspondants (4.8). X u(x) = ξ k β k (x) (4.7) k∈Kinf modélise le champ de déplacement en trois dimensions. Dans l’équation (4.7), la base β k (x) = βxk (x)βyk (y)βzk (z). (4.8) pondère le déplacement ξ k associé à Pk en fonction de l’influence que celui-ci exerce sur le point x. Intuitivement, nous voyons que la densité des PDC va avoir une grande influence sur le caractère local de la déformation estimée et donc sur l’espace paramétrique associé. La densité des PDC est directement corrélée à la résolution de la grille de déformation. La modification de la densité de cette grille permet d’approcher des comportements de mouvement plus ou moins globaux et donc de proposer une hiérarchie dans les déformations estimées. Nous allons dans la suite décrire la fonction d’interpolation choisie, ses propriétés et les raisons qui ont motivé notre choix. 4.3.3 Fonctions splines Dans l’ensemble de mes travaux, la fonction d’interpolation β est de type B-Spline. Une B-Spline de degré r est définie de manière récursive par : βr = β ∗ β0 ∀ r ∈ N r−1 1 si x ∈ − 12 , 21 β0 = 0 sinon (4.9) (4.10) où ∗ est l’opérateur de convolution. En vertu du théorème central limite, lorsqu’une fonction (β0 dans notre cas) est r fois convoluée par elle-même, elle tend vers une fonction gaussienne. L’opérateur de convolution peut être alors considéré comme un opérateur de lissage et β4 est une fonction plus lisse que β3 elle même plus lisse que β2 . Les fonctions de base jusqu’au degré 3 (r = 0, 1, 2, 3) sont représentées sur la Figure 4.3. Dans la suite, nous ne considérons que les fonctions de degré impair (i.e. 1 et 3) car leur support correspond à un nombre entier de cellules sur la grille de déformation. Le support d’une fonction B-Spline est donc compact et s’étend sur l’intervalle (−r/2 − 1/2; r/2 + 1/2). Cette modélisation décrit le champ de déplacement analytiquement. Cette propriété est particulièrement intéressante dans notre cas et ce pour trois raisons. La première est qu’elle permet, grâce aux propriétés inhérentes à la fonction d’interpolation, d’approcher 64 CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE β0 β1 β2 β3 F IG . 4.3. Représentation des fonctions B-Splines pour les quatre premiers ordres (ordre = degré + 1) les termes de vitesse et d’accélération de manière exacte alors que les méthodes variationnelles ont recours à des approximations par des convolutions. La seconde concerne plus particulièrement la fonction B-Spline et la compacité de son support. Il est ainsi possible d’estimer un déplacement localisé sur une partie de l’image sans influencer le déplacement sur l’ensemble du domaine. Enfin, et ce sera détaillé dans le chapitre 6, cet ensemble de paramètres est particulièrement bien adapté pour la représentation de la transformation sous forme de modèle d’état permettant un filtrage des paramètres sur l’ensemble de la séquence d’images. 4.3.4 Calcul pratique de la transformation FFD B-Spline Pour le modèle de transformation décrit à la section précédente, le calcul pratique de la déformation se décompose en trois étapes que nous décrivons dans les paragraphes 4.3.4.1, 4.3.4.2 et 4.3.4.3. 4.3.4.1 Calcul des coordonnées locales Cette étape détermine les coordonnées locales xloc = [xloc , yloc , zloc ]T d’un point x dans l’élément de la grille de déformation dans laquelle il se situe (Figure 4.4). Ces coordonnées sont dépendantes de la géométrie du motif de la grille de déformation, de son origine et des pas de résolution tridimensionnelle δx, δy, δz. Le premier point de cet élément est repéré par les coordonnées {i, j, k} : xloc i = ⌊x/δx⌋ ; j = ⌊y/δy⌋ ; k = ⌊z/δz⌋ = x/δx − i; yloc = y/δy − j; zloc = z/δz − k ⌊.⌋ représente l’opération d’arrondi par valeur inférieure. (4.11) (4.12) 4.3. MODÈLE DE TRANSFORMATION 65 δx δy (i,j+1,k) (i,j,k+1) x zloc δz y loc (i,j,k) x loc (i+1,j,k) F IG . 4.4. Détermination des coordonnées locales d’un point x. 4.3.4.2 Influence des fonctions d’interpolation Cette influence dépend du degré r de la fonction β et des coordonnées locales précédemment calculées. Cette étape détermine l’ensemble Kinf des PDC qui auront une influence sur le déplacement de xloc ∈ [0; 1]. Pour clarifier l’explication, une illustration est donnée en 1D dans le tableau 4.1 mais l’extension en 3D est immédiate. 4.3.4.3 Calcul de la déformation La déformation est calculée à partir des équations (4.7) et (4.8) limitées au sous ensemble Kinf . Dans la suite, afin d’alléger les notations, nous ne mentionnerons plus les indices relatifs au degré de la B-Spline, sauf lorsque cela est nécessaire. 4.3.5 Approche bi-pyramidale de l’estimation de la transformation Le terme bi-pyramidal est utilisé pour désigner le fait qu’une série d’approximations est réalisée à la fois sur les images à recaler et sur la transformation à estimer. 4.3.5.1 La pyramide d’images La décomposition multi-résolution des images est très utilisée dans le domaine du traitement d’images, notamment en compression d’images. Dans notre cas, il y a au moins deux intérêts à utiliser une telle approche. La première concerne le coût calculatoire. Les données à traiter sont souvent très volumineuses ( ≈ 512 × 512 × 100 pour les données CT). Le parcours de plusieurs MVoxels à chaque itération de l’optimisation est coûteux en temps de calcul. Une prise en compte progressive des détails de l’image au cours du recalage est donc fortement appréciable. Le second intérêt concerne la qualité du champ estimé et notamment l’évincement de certains minima locaux. En compression d’images, de nombreux travaux ont été réalisés afin de réduire le support de l’image tout en gardant le maximum d’information disponible dans les images sous-résolues. Dans notre cas, la perte de détails n’a pas de conséquence majeure puisque l’estimation finale repose sur les images initiales. Les pyramides PImg associées à Ic et Is sont construites par filtrages et souséchantillonnages successifs. Un filtrage passe-bas (gaussien) supprime les détails dans CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE TAB . 4.1. Description des fonctions d’interpolation et des sous-ensemble des points influants pour les B-Splines de degrés 1 et de degré 3 r=3 i β3 (u) i β1 (u) i+1 β1 (u) i+1 β3 (u) Fonctions d’interpolation β3 (u) i−1 i i+1 i+2 β3 (u) i Sous ensemble points influents des Valeur des fonctions à l’abscisse a 66 r=1 Degré de la B-Spline Kinf = {i; i + 1} β1i (a) = 1 − a β1i+1 (a) = a Kinf = {i − 1; i; i + 1; i + 2} β3i−1 (a) = (−a3 + 3a2 − 3a + 1)/6 β3i (a) = (3a3 + 6a2 + 4)/6 β3i+1 (a) = (−3a3 + 3a2 + 3a + 1)/6 β3i+2 (a) = a3 /6 i+1 4.3. MODÈLE DE TRANSFORMATION 67 l’image et la décimation résultante réduit le support de l’image. La pile d’images est connu sous le nom de pyramide gaussienne. Soient NImg le nombre de niveaux dans PImg et I NImg −1 = I, l’image en pleine résolution. Les images correspondant aux différents niveaux de PImg sont calculées récursivement selon : I ni −1 = (I ni ∗ Gσ ) ↓2 , (4.13) où Gσ est un noyau gaussien de variance σ qui satisfait les contraintes de séparabilité, de normalisation et de symétrie. ↓2 représente l’opérateur de décimation par 2. Pratiquement, le nombre NImg d’étages de la pyramide est calculé de telle manière que les dimensions de I 0 soient encore suffisamment grandes pour pouvoir en extraire des informations exploitables. Nous proposons de fixer cette taille minimum à la valeur de 16 pixels par dimension. Le fait que les dimensions de l’image soient différentes suivant les directions ne perturbe pas cette contrainte puisque le filtrage est séparable et peut être adapté suivant direction. 0 chaque 1 NImg −1 PImg = I ; I ; . . . I est calculée à la fois pour l’image source et pour l’image cible suivant le même ordonnancement et l’algorithme commence par recaler les images les plus grossières. Le résultat obtenu pour un niveau donné est ensuite utilisé comme initialisation pour le niveau supérieur de la pyramide et ainsi de suite jusqu’à ce que l’on arrive au niveau 0 de la pyramide, qui correspond à l’image en pleine résolution de départ. 4.3.5.2 La pyramide de transformations Une représentation multi-échelle de la déformation est ici envisagée. Cette représentation va permettre un raffinement progressif de la transformation estimée et donc d’accéder à une hiérarchisation des mouvements observés par construction d’une pyramide de transformation Ptrans . Pour décrire cette approche multi-échelle, nous nous appuyons sur les travaux dans [Musse et al., 2001] repris dans [Noblet et al., 2005]. Pour cela, reconsidérons l’espace T des transformations admissibles, comme étant un espace de Hilbert1 des transformations d’énergie finie de Rd dans Rd (d = 3 dans notre cas). La transformation finale estimée ϕ̂ = I + û appartient à cette espace de Hilbert et nous considérons la décomposition de u sur un ensemble de sous-espaces emboîtés T0 ⊂ T1 ⊂ . . . ⊂ Tl . . . ⊂ T permettant une description multi-échelle de u suivant le formalisme de Mallat [Mallat, 1998]. Lorsque l tend vers l’infini, l’espace emboîté tend vers l’espace de Hilbert et, lim ul = u. (4.14) l→∞ Pour une échelle donnée l, nous avons : P l β k;l (x, y, z) ξx;k k∈Kinf l ux (x, y, z) P l k;l ξy;k β (x, y, z) ul (x, y, z) = uly (x, y, z) = k∈Kinf l uz (x, y, z) P l k;l ξz;k β (x, y, z) (4.15) k∈Kinf 1 Un espace vectoriel muni d’un produit scalaire est un espace de Hilbert s’il est complet pour la norme associée au produit scalaire. 68 CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE u0 u1 111111111111111111 000000000000000000 000000000000000000 111111111111111111 000000000000000000 111111111111111111 11111111111111111111111 00000000000000000000000 00000000000000000000000 11111111111111111111111 00000000000000000000000 11111111111111111111111 u2 u3 PTrans (a) (b) I4 I3 I2 I1 I0 u0 u1 (c) u2 u3 F IG . 4.5. Schéma des deux pyramides utilisées pour le recalage et ordonnancement des transitions entre les différents niveaux. En haut, une illustration de la pyramide d’images PImg (a) et de la pyramide de transformation PT rans (a) sont données. Un ordonnancement est proposé en (c). Ce schéma décrit la façon de naviguer à travers les différents niveaux des pyramides. Dans l’application que nous proposons, cet ordonnancement est définissable par l’utilisateur qui est libre de choisir la manière dont il veut enchaîner les différents niveaux. 4.3. MODÈLE DE TRANSFORMATION 69 où le champ ul−1 est une approximation de ul . Dans la suite, lorsqu’il n’y aura pas d’ambiguïté, les indices d’échelle neseront pas mentionnés afin d’alléger les notations. k;l L’ensemble des produits tensoriels β (x, y, z) ; k ∈ K constitue la base de l’espace Tl et tout champ de déplacement ul d’énergie finie à l’échelle l, peut être exprimé comme une combinaison linéaire de cette base. Grâce à l’analyse multi-échelle du champ de déplacement, il est possible de créer une série d’approximations du champ u. Par analogie avec les algorithmes de compression d’images, il est ainsi possible de fournir des informations hiérarchisées de mouvement qui peuvent être exploitées (voir section 2.4.3). De la même façon que pour la pyramide d’images PImg , les résultats obtenus à l’échelle l sont utilisés pour initialiser l’estimation à l’échelle l + 1. Cette initialisation est fournie par projection des estimations obtenues sur l’espace Tl sur le nouvel espace Tl+1 . L’initialisation des paramètres sur T0 correspond au vecteur nul 0. Le nombre de paramètres augmente avec la complexité du champ suivant le schéma défini au paragraphe 4.3.6. Cette approche à l’avantage d’éviter d’être piégé dans des minima locaux lors de l’optimisation de la fonction de coût. Pour la mise en pratique de la projection un espace supérieur, considérons une l sur l l estimation du vecteur de paramètres ξ = ξ x , ξ y , ξ lz à l’échelle l. Cette estimation peut être directement projetée à l’échelle l+1 grâce à la transition d’échelle obtenue par convolution d’un filtre H appelé miroir conjugué [Noblet et al., 2005] [Mallat, 1998]. Selon la théorie de Mallat, la fonction B-Spline satisfait aux critères de fonctions d’échelles et le principe de causalité (Tl ⊂ Tl+1 ) garantit que la projection se fait de manière exacte et sans approximation. l+1 l ξ x = ↑2 ξ x ∗ H (4.16) ξ l+1 = ↑2 ξ ly ∗ H yl+1 l ξ z = ↑2 ξ z ∗ H ↑2 est l’opérateur de sur-échantillonnage qui consiste à intercaler des zéros entre chaque coefficient estimé au niveau l. Les coefficients du filtre miroir H correspondent aux coefficients de la décomposition linéaire de l’équation de raffinement propres aux fonctions d’échelles qui traduit la notion de contraction et de décalage [Mallat, 1998] : X 1 √ β(x/2) = αi β(x − i) 2 i Ainsi pour une spline de degré r, les nous avons : 1 1 1 H = √ pour r = 1, 1 2 2 2 1 1 1 3 1 1 H = √ pour r = 3. 2 8 2 4 2 8 4.3.6 Propriétés de la transformation D’une façon générale, la transformation paramétrique est définie par : (4.17) CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE 70 ϕ: Rd × Rp −→ Rd (x, ξ) 7−→ ϕ (x, ξ) = x′ (4.18) où p est le nombre de paramètres utilisés pour décrire la transformation. Dans notre cas, p = d(2l+1 + r)d . (4.19) Afin de sensibiliser le lecteur au nombre de DDL intrinsèque au modèle de déformation choisi, le nombre de paramètres nécessaires pour modéliser la transformation est donné dans le tableau 4.2 en fonction de la dimension de l’espace d, du facteur d’échelle l et du degré de la spline r. Il varie exponentiellement avec la dimension de l’espace et le facteur d’échelle. TAB . 4.2. Nombre de paramètres nécessaires à la description de la transformation paramétrique FFD multi-échelle en fonction de la dimension de l’espace d, du facteur d’échelle l et du degré de la spline r. r=1 r=3 l=0 l=1 l=2 l=3 l=4 l=0 l=1 l=2 l=3 l=4 d=2 d=3 d=4 18 50 163 578 2178 50 98 242 722 2450 81 375 2187 14739 107811 375 1029 3993 20577 128625 324 2500 26244 334084 4743684 2500 9604 58564 521284 6002500 Les propriétés de continuité et de dérivabilité comptent parmi les avantages des modèles de déformation paramétriques par rapport aux modèles non paramétriques. L’équation (4.18) établit que la transformation est fonction du point x et du vecteur de paramètres ξ. On distingue alors deux types de matrice jacobienne. La première, J1 , est composée des dérivées partielles des coordonnées du point transformé par rapport aux paramètres de la transformation. Cette matrice peut être interprétée comme un indicateur, pour un point dans Ωc , de la façon dont sera modifiée la fonction de transformation en réponse à un petite variation de l’un des paramètres de la transformation : 4.3. MODÈLE DE TRANSFORMATION 71 ! ∂uw (x, ξ) ∂w = J1 (x, ξ) = w = {x, y, z} ∂ξ w,k ϕ(x,ξ) w = {x, y, z} ∂ξ w,k k = {0, · · · , p − 1} k = {0, · · · , p − 1} ∂ux (x, ξ) ∂ux (x, ξ) ∂ux (x, ξ) ... ... ∂ξx;0 ∂ξx;k ∂ξx;p−1 ∂uy (x, ξ) ∂u (x, ξ) ∂u (x, ξ) y y ... ... = ∈ Rd×p ∂ξy;0 ∂ξ ∂ξ y;k y;p−1 ∂uz (x, ξ) ∂uz (x, ξ) ∂uz (x, ξ) ... ... ∂ξz;0 ∂ξz;k ∂ξz;p−1 ∂ux (x, ξ) représente donc l’in∂ξx;k fluence de ce paramètre sur le déplacement suivant l’axe x. On constate que la somme de l’influence de l’ensemble des paramètres suivant chaque ligne (ie. chaque direction de l’espace) vaut 1. Cette propriété, connue sous le nom de partition de l’unité, est une propriété que la fonction d’échelle doit remplir. La vérification ci-dessous est donnée pour w = x mais reste valable pour les autres dimensions. ξx;k représente le déplacement suivant l’axe x de Pk . X ∂x X ∂x = = ∂ξ ∂ξ x;k ϕ(x,ξ) x;k ϕ(x,ξ) k∈K k∈K inf X ∂ (ux (x, ξ)) ∂ξx;k k∈K inf X ∂ξx;k β k (x) = ∂ξx;k k∈Kinf X = β k (x) = 1 (4.20) k∈Kinf La seconde matrice jacobienne J2 est celle couramment rencontrée en mécanique des milieux continus. Elle est composée des dérivées partielles des coordonnées du point transformé par rapport aux coordonnées du point avant transformation. La matrice J2 est donc un tenseur du second ordre qui décrit localement la transformation autour du point x. Son expression est donnée par : ! ∂v J2 (x, ξ) = ∂w ϕ(x,ξ) v = {x, y, z} w = {x, y, z} P ∂β k (x) si ξv;k 1+ ∂w k∈Kinf = P ∂β k (x) ξ sinon v;k ∂w k∈Kinf ∈ Rd×d v=w (4.21) CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE 72 Les dérivées des fonctions d’interpolation sont immédiates dans notre cas du fait de leurs représentations polynomiales. Si le degré de la spline utilisée vaut r = 3 alors la dérivée est continue. En revanche, pour le degré 1, la dérivée est continue par morceau. 4.3.7 Régularisation Les modèles à faible nombre de paramètres ne nécessitent généralement pas de régularisation car celle-ci est imposée de manière implicite par le modèle. C’est le cas des modèles de déformation rigide, affine ou même pour les faibles niveaux d’échelles de l’approche que nous décrivons dans ce chapitre. Lorsque le nombre de DDL augmente, le modèle est capable d’accéder à des déformations beaucoup plus fines et localisées. Quand ce nombre devient très important (tableau 4.2), l’information portée par l’image n’est plus suffisante pour estimer correctement l’ensemble des paramètres. Au sens de Hadamard [Hadamard, 1923], le problème du recalage d’images devient alors mal posé2 . On préconise généralement l’introduction d’un terme de régularisation afin de garantir l’unicité de la solution. L’ajout d’un terme de régularisation dans la fonction de coût introduit une cohérence spatiale sur les déformations estimées, notamment dans les régions homogènes où des déformations artificielles peuvent apparaître du fait du manque d’information dans cette zone de l’image. 4.3.7.1 Énergie de membrane élastique Le choix du terme de régularisation est délicat et il existe un grand nombre de régularisations différentes dans la littérature. Il est difficile dans le cas du recalage d’images d’établir si une méthode de régularisation de champs de déformation est plus efficace qu’une autre. Cette difficulté réside dans l’absence de vérité terrain pour le recalage d’images réelles et donc la difficulté de conclure sur la qualité des méthodes face à la complexité des comportements physiologiques étudiés. En effet, la connotation mécaniste des différentes régularisations proposées n’offrent qu’un aperçu de la réelle complexité des mouvements naturels. A l’heure actuelle, même si elles évoluent en ce sens, les techniques d’imagerie n’offrent toujours pas la possibilité d’explorer les organes en mouvement à un niveau suffisamment fin pour appréhender et comprendre les mouvements. Dans notre cas, nous avons choisi de coupler le terme d’appariement à une régularisation de type membrane élastique. Notre choix a été motivé par le faible coût calculatoire engendré par le calcul des dérivées premières de la déformation. En posant v = {x, y, z} et w = {x, y, z}, cette expression peut se mettre sous la forme condensée : R(ϕ) = 2 Z X ∂uv (x) Ω v;w ∂w dx. (4.22) L’expression de la dérivée de ce terme de régularisation par rapport aux paramètres de la transformation est donnée par : 2 Un problème est dit mathématiquement bien posé s’il existe une solution, que cette solution est unique et qu’elle dépend de manière continue des données. Si une de ces conditions n’est pas respectée, le problème est dit mal posé. 4.4. CRITÈRES DE MISE EN CORRESPONDANCE ∂R(ϕ) =2 ∂ξ avec Z X ∂uv (x) ∂ 2 uv (x) · dx. ∂w ∂w∂ξ Ω v;w X ∂uv (x) ∂β k (x) = ξv;k ∂w ∂w k∈K inf et ∂ 2 uv (x) ∂β k (x) = . ∂w∂ξv ∂w 73 (4.23) (4.24) 4.4 Critères de mise en correspondance 4.4.1 terme d’appariement Le choix du critère de mise en correspondance est important pour le recalage d’images et la littérature abonde à ce sujet (voir chapitre 3). Son choix doit être motivé par la prise en compte de la modalité des images à analyser et des primitives que l’on désire mettre en correspondance. Le terme général de la fonctionnelle à minimiser est donnée par l’équation (4.2) [Modersitzki, 2004]. Dans le cadre de la mise en correspondance d’images monomodales, l’utilisation de primitives issues de l’intensité des pixels (primitives iconiques) est justifiée. L’hypothèse sous-jacente consiste à considérer que les intensités d’un même point sont similaires dans les deux images. On peut s’interroger sur la validité de cette hypothèse. En imagerie tomographique à rayons X, le niveau de gris (en unité Hounsfield) est directement relié à la notion de densité des structures imagées, le niveau de référence étant la densité de l’eau. Sur la coupe transversale du thorax et le profil associé de la Figure 4.6, il est possible de distinguer les tissus, les poumons et les structures osseuses. Dans [Sarrut et al., 2006], les auteurs tiennent compte de la variation de densité des poumons plus ou moins remplis d’air au cours de la respiration et proposent de corriger cette variation sur les régions pulmonaires pour améliorer les performances d’un algorithme de recalage. Dans le cas de l’imagerie par RM, cette hypothèse n’est pas non plus parfaitement vérifiée et la notion de contraste est sans doute plus pertinente compte tenu du principe d’acquisition des images. Considérons le terme d’appariement suivant : Z A(IC , IS , ϕ) = L(DIc (x) − DIs (ϕ(x))dx. (4.25) Ω L’opérateur D : Rd −→ Rg permet d’extraire des primitives locales de l’image (géométriques ou statistiques). Pour un point x du domaine Ω, celui-ci fournit un ensemble de g primitives issues de l’image. L : Rl −→ R est une norme permettant de quantifier l’écart entre les primitives. Il est à noter que ces opérateurs sont tous deux non-linéaires. Dans l’approche classique, la norme L2 est utilisée et consiste à minimiser la somme des différences au carré entre les intensités ou entre les caractéristiques issues de l’image. Celle-ci est cependant peu robuste aux points aberrants. Dans [Noblet et al., 2006], Noblet et al proposent d’utiliser d’autres normes issues des statistiques robustes [Rousseeuw and Leroy, 1987] pour rendre le critère de similarité plus robuste 74 CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE 1500 Profil de la coupe CT 1000 500 0 -500 -1000 0 50 100 150 (a) 200 250 300 350 400 (b) F IG . 4.6. Coupe transversale d’un volume 3D tomographique du thorax et un profil extrait. 220 Profil de la coupe IRM 200 180 160 140 120 100 80 60 40 20 0 0 (a) 20 40 60 80 100 120 140 (b) F IG . 4.7. Coupe transversale d’un volume 3D IRM du cœur en petit axe et un profil extrait. 4.4. CRITÈRES DE MISE EN CORRESPONDANCE 75 vis à vis des points aberrants. L’image source Is est délivrée sous forme discrète à l’issu de son acquisition. Elle doit cependant pouvoir être décrite de manière continue pour fournir une information de niveau de gris à des coordonnées ne correspondant pas à des valeurs entières de pixels. Une version continue de l’image source Isc sur l’espace continu de son domaine d’acquisition peut être exprimée par l’interpolation suivante : X β1 (x)Is (4.26) Isc (x) = K où β1 est une spline de degré 1. Dans nos travaux, l’interpolation tri-linéaire a été choisie car elle est plus rapide à calculer. En utilisant la norme L2 , le terme d’appariement devient : Z A(Ic , Is , ϕ) = (DIc (x) − DIsc (ϕ(x))2 dx (4.27) Ω A(Ic , Is , ϕ) = Z Ω (DIc (x) − DIsc (ϕ(x))T (DIc (x) − DIsc (ϕ(x))dx. (4.28) Si ϕ est exprimée de manière paramétrique, ξ étant le vecteur de paramètres à estimer (dans notre cas, ce vecteur de paramètres est le déplacement des points de contrôle), on peut écrire : A(Ic , Is , ξ) = Z Ω (DIc (x) − DIsc (ϕ(x, ξ))T (DIc (x) − DIsc (ϕ(x, ξ))dx. (4.29) La dérivée de A par rapport aux paramètres p de la transformation constitue la force que ce critère engendre pour guider les recalages et donc l’influence de la variation des paramètres sur l’opérateur A. ∂A(Ic , Is , ξ) = −2 ∂ξ Z Ω ∂DIsc (ϕ(x, p)) (DIc (x) − DIsc (ϕ(x, ξ))T dx ∂ξ (4.30) avec, ∂DIsc (ϕ(x, ξ)) ∂ϕ(x, ξ) = × ∇DIsc (ϕ(x, ξ)) ∂ξ ∂ξ (4.31) Le terme intégré dans l’équation (4.30) représente la force dans l’espace des paramètres. Sa direction est normale au gradient de l’opérateur D (gradient classique de l’image si D ne renvoie que l’intensité du pixel). Cette direction est pondérée par la différence observée entre les primitives correspondantes dans les deux images. Lorsque les vecteurs de primitives sont parfaitement identiques, la contribution du point x sur l’évolution des paramètres est nulle. Le terme ϕ(x,ξ) ∂ξ correspond à la matrice jacobienne J1 . CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE 76 4.4.2 Choix des opérateurs Dans cette partie nous allons définir les deux opérateurs que nous utilisons dans notre algorithme. Le premier opérateur D1 est l’opérateur "standard" qui ne renvoie que l’information de l’intensité du pixel pour un point donné. Le second opérateur D2 aura pour but d’extraire des paramètres statistiques locaux de l’image pour une meilleure robustesse au bruit. Cet opérateur sera également exploité dans la section 4.5.2. 4.4.2.1 Opérateur D1 On définit D1 de la manière suivante : D1 I : Rd −→ R x 7−→ I(x) (4.32) (4.33) C’est l’opérateur le plus simple que l’on puisse imaginer puisqu’il renvoie l’intensité de l’image au point considéré. Dès lors, le terme d’appariement (4.29) et sa dérivée (4.30) deviennent respectivement : Z A(Ic , Is , ξ) = (Ic (x) − Isc (ϕ(x, ξ))2 dx (4.34) Ω et ∂A(Ic , Is , ξ) = −2 ∂ξ avec, Z Ω ∂Isc (ϕ(x, ξ)) (Ic (x) − Isc (ϕ(x, ξ))T dx ∂ξ ∂ϕ(x, ξ) ∂Is (ϕ(x, ξ)) = × ∇Is (ϕ(x, ξ)) {z } | ∂ξ ∂ξ | {z } gradient de l’imageIs (4.35) (4.36) J1 4.4.2.2 Opérateur D2 Nous avons envisagé un autre opérateur qui puisse extraire des informations de contours afin de distinguer les différentes structures présentes dans les images. La plupart de ces opérateurs sont basés sur le gradient de l’image ∇I(x) ou de son amplitude |∇I(x)|. Dans [Liu et al., 1995a], deux catégories de filtres sont identifiées afin d’extraire les zones de rupture dans les images. Les premiers essaient de détecter les changements de paramètres dans l’image [Hinkley, 1971]. Les seconds lissent l’image et appliquent des opérateurs différentiels pour obtenir des valeurs de gradients [Canny, 1986, Deriche, 1990, Shen and Castan, 1992]. Notre choix s’est porté sur l’opérateur initialement proposé dans [Liu et al., 1992] que nous noterons D2 . Dans son article [Liu et al., 1995a], l’auteur compare son opérateur à un opérateur de référence [Deriche, 1990] et en déduit que, dans les cas théoriques et simulés, les pics de détection sont plus nets et d’amplitude supérieure. Cet opérateur s’appuie sur les propriétés de stationnarité locale du signal et donne de meilleurs résultats sur les signaux bruités et non bruités. Lorsque le signal est stationnaire alors la réponse 4.4. CRITÈRES DE MISE EN CORRESPONDANCE 77 de l’opérateur est très proche de zéro. En revanche, l’amplitude de la réponse sera forte en cas de rupture du signal. Cet opérateur a été utilisé par Florez et al [Flórez Valencia, 2006] pour le rehaussement de contours artériels dans des images angiographiques par RM et TDM. Nous avons testé ce filtre sur nos images (Figures 4.6 et 4.7). Description Considérons xe (t) : R → R comme étant un processus localement stationnaire et ergodique. Le filtrage du signal se déroule en deux étapes comme le montre la Figure 4.8. h 2 (t) ( )2 xe(t) h 1 (t) ^2 + σ ( t) = xs (t) ^µ( t) − h 2 (t) ( )2 F IG . 4.8. Diagramme de l’algorithme de détection de ruptures proposé dans [Liu et al., 1992]. ()2 est l’opérateur de mise au carré. Le premier filtre (h1 (t)) est une estimation du moment statistique d’ordre θ du signal d’entrée x(t). Dans la suite, nous utiliserons le moment d’ordre 1 (θ = 1) qui correspond donc à un filtre moyenneur classique permettant de mettre en évidence les ruptures entre des régions d’intensité moyenne différentes : µ̂(t) = (h1 ∗ x)(t) (4.37) ou ∗ est un opérateur de convolution. La seconde partie du filtre est un estimateur de la variance du signal µ̂(t) sur un horizon de temps fini : σ̂µ̂2 (t) = h2 (t) ∗ [µ̂(t)]2 − [h2 (t) ∗ µ̂(t)]2 (4.38) Ainsi pour une entrée stationnaire, le signal µ̂ est quasi-constant. L’estimation de sa variance prend alors une valeur très proche de zéro. S’il y a un changement de moyenne, on constate une transition dans le signal µ̂ et l’augmentation localisée σ̂µ̂2 traduit une mauvaise estimation du signal µ̂. Cette mauvaise estimation est due à la rupture de la stationnarité du signal. Liu propose de choisir les filtres suivants : h1 (t) = h2 (t) = t 1 rect( ) L L (4.39) où L représente la taille de l’horizon. Le comportement du filtre est illustré sur un signal 1D. Son principe est facilement généralisable à des dimensions supérieures comme les images ou les volumes car il consiste en une succession de convolutions. Le paramètre unique de ce filtre est la taille de la fenêtre L. Elle correspond au nombre d’échantillons qui seront pris en compte pour chacune des estimations. Les Figures 4.9 et 4.10 représentent les réponses du filtre de Liu sur CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE 78 2000 2000 Niveau de gris de la coupe CT RØponse du filtre de Liu sur le signal Niveau de gris de la coupe CT RØponse du filtre de Liu sur le signal 1500 1500 1000 1000 500 500 0 0 -500 -500 -1000 -1000 0 50 100 150 200 250 300 350 400 0 50 100 (a) L = 3 150 200 250 300 350 400 (b) L = 5 2000 2000 Niveau de gris de la coupe CT RØponse du filtre de Liu sur le signal Niveau de gris de la coupe CT RØponse du filtre de Liu sur le signal 1500 1500 1000 1000 500 500 0 0 -500 -500 -1000 -1000 0 50 100 150 200 (c) L = 7 250 300 350 400 0 50 100 150 200 250 300 350 400 (d) L = 9 F IG . 4.9. Réponse du filtre de Liu sur un signal 1D issu d’un volume TDM (Fig. 4.6). Le filtre est appliqué pour différentes tailles de fenêtres. La valeur du signal de sortie a été divisée par 100 pour permettre la superposition avec le signal d’entrée. Lorsque L est grande, l’espérance de la sortie du filtre est indépendante du bruit et les petites ruptures, assimilées à du bruit, ne sont pas détectées mais les pics correspondant aux transitions plus lentes augmentent. Inversement, les petites valeurs de L rendent la réponse au filtre plus sensible aux hautes fréquences du signal et fournissent un fort signal de sortie pour les ruptures très prononcées de xe (transition observable sur L échantillons). Lorsque L augmente, cette amplitude est réduite car la moyenne est calculée sur un horizon plus grand. L’amplitude maximum du signal de sortie est observée lorsque la taille de L correspond approximativement au nombre d’échantillons nécessaires à la transition. 4.4. CRITÈRES DE MISE EN CORRESPONDANCE 1000 79 1000 Niveau de gris de la coupe IRM RØponse du filtre de Liu sur le signal Niveau de gris de la coupe IRM RØponse du filtre de Liu sur le signal 800 800 600 600 400 400 200 200 0 0 0 20 40 60 80 100 120 140 0 20 40 (a) 60 80 100 120 140 (b) 1000 1000 Niveau de gris de la coupe IRM RØponse du filtre de Liu sur le signal Niveau de gris de la coupe IRM RØponse du filtre de Liu sur le signal 800 800 600 600 400 400 200 200 0 0 0 20 40 60 (c) 80 100 120 140 0 20 40 60 80 100 120 140 (d) F IG . 4.10. Réponse du filtre de Liu pour un signal 1D issu d’une image par RM (Fig. 4.7). La valeur du signal de sortie a été ici divisée par 4. CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE 80 les profils visibles sur les Figures 4.6 et 4.7, respectivement. Voici quelques remarques concernant la réponse du filtre : • La signal de sortie xs pour un échelon idéal est de la forme d’une cloche dont la hauteur et la largeur dépendent de la valeur de L. Dans le cas d’un échelon unité, la largeur du pic vaut 2L • La taille L de h1 et h2 établit un compromis entre la détection des ruptures et la robustesse au bruit dans l’image. Dans son article [Liu et al., 1995b], Liu propose une taille 7 × 7 pour des images échographiques car, pour ce type d’image, le filtre fournit suffisamment d’information sur les changements statistiques. • La hauteur du pic est proportionnelle à la valeur absolue du contraste supposé entre deux structures. Ni le signe de la variation ni la valeur absolue des niveaux de gris n’a d’influence sur la réponse. Comportement sur les images L’expression analytique du signal de sortie pour x2e 2 les filtres donnés dans (4.39) est xs = 12L − 1) [Flórez Valencia, 2006]. Cette 2 (L expression est également valable en 3D. L’interprétation du problème en 3D peut se faire en considérant qu’un noyau de taille 3 × 3 × 3 placé sur une région de rupture entraîne la même valeur de discontinuité si chaque moitié de la région d’intérêt est située de part et d’autre de cette rupture. Cela correspondrait à un signal 1D avec une taille de noyau de 33 . Les Figures 4.11(a) et 4.11(b) représentent respectivement le filtrage d’un volume TDM du thorax et d’un volume IRM du cœur. On définit D2 de la manière suivante : D2 I : Rd × R −→ R x, L 7−→ B(x, L) (4.40) (4.41) Le terme d’appariement et sa dérivée sont identiques à ceux définis pour D1 ((4.34) et (4.35) respectivement) à ceci près qu’il faut remplacer I par B. L’opérateur D2 sera également utilisé afin de limiter le temps de calcul (section 4.5.2) et afin d’adapter l’optimisation du problème aux régions de l’image qui présentent le plus d’information (section 4.5). 4.4.2.3 Opérateur D3 Nous définissons l’opérateur D3 comme étant l’opérateur vectoriel issu de la composition de l’opérateur D1 et D2 : Rd × R −→ R x, L 7−→ [I(x) B(x, L)]T D3 I : (4.42) (4.43) Dès lors, le terme d’appariement (4.29) et sa dérivée (4.30) deviennent respectivement : Z A(Ic , Is , ξ) = k(D3 Ic (x, L) − D3 Isc (ϕ(x, ξ), L)k2 dx (4.44) Ω 4.5. OPTIMISATION ET IMPLANTATION 81 et ∂A(Ic , Is , ξ) = −2 ∂ξ Z Ω (D3 Ic (x) − D3 Isc (ϕ(x, ξ))T ∂D3 Isc (ϕ(x, ξ), L) dx ∂ξ (4.45) avec, ∂ϕ(x, ξ) ∂Is (ϕ(x, ξ)) = × ∇D I (ϕ(x, ξ)) | 3 s {z } ∂ξ ∂ξ | {z } gradient de l’image vectorielle D3 Is (4.46) J1 L’intérêt de cet opérateur est d’apparier de manière encore plus prononcée les frontières des objets tout en s’affranchissant des bruits d’acquisitions des imageurs. L’opérateur permet donc d’envisager un recalage moins dépendant de la modalité des images traitées à la condition que le recalage soit, lui, monomodal. 4.5 Optimisation et implantation Résoudre le problème du recalage d’images revient à minimiser (4.5) où J est la fonctionnelle, dépendant des paramètres de la transformation. Il s’agit d’un problème classique d’optimisation non-linéaire en dimension finie. On trouve dans [Press et al., 1992], une description assez complète des différentes méthodes d’optimisation. Une étude des performances de différents optimiseurs (descente de gradient (GD), descente de gradient optimisée, gradient conjugué (GC), et Levenberg-Marquardt) est présentée dans [Kybic and Unser, 2003] dans ce contexte du recalage non-rigide d’images. La méthode GC trouve son principal intérêt lorsque l’estimation de ∇ξJ est 10 à 100 fois plus rapide que J . La méthode DG converge moins rapidement que la méthode DGO. Finalement, la méthode ML devient très lente quand le nombre de paramètres augmente à cause de l’inversion de la matrice hessienne. 4.5.1 La stratégie d’optimisation Nous avons mis en œuvre, comme dans [Kybic and Unser, 2003], une méthode classique de descente de gradient. Considérons le vecteur de paramètre ξ it à l’itération it. A l’itération suivante, nous avons : ξ it+1 = ξ it + ∆ξ it , (4.47) ∆ξ it = −µit ∇ξit J , (4.48) avec où J est la fonctionnelle définie par (4.2). Le pas initial µit est fixé à 1. Ce pas est divisé par 2 lorsque ∇ξit · ∇ξit−1 < 0. Lorsque trois pas successifs n’inversent pas le signe du gradient alors µit est multiplié par deux. 82 CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE (a) (b) F IG . 4.11. Exemple de filtrage proposé par l’opérateur D2 de Liu avec L = 3 sur a) un volume TDM du thorax de dimension 400 × 300 × 90 et b) un volume RM de dimension 160 × 160 × 80. 4.5. OPTIMISATION ET IMPLANTATION 83 4.5.2 Accélération des calculs Les données à traiter sont de plus en plus volumineuses et, le recalage d’images est un processus relativement lent. Cette lenteur est directement reliée à la taille des images à traiter (plusieurs millions de voxels). A titre d’exemple, un recalage peut nécessiter entre 200 et 500 itérations, où, à chaque itération, le terme d’appariement est calculé ainsi que sa dérivée première et seconde selon le choix de l’optimiseur. Environ 95% du temps consacré au recalage est imparti à ce calcul proprement dit. Malgré l’approche bipyramidale (section 4.3.5), le temps de calcul reste élevé. Nous proposons ici quelques techniques pour réduire notablement le temps de calcul. Dans la section 4.5.2.1, nous décrivons comment réduire l’espace d’analyse au prix d’un compromis entre la précision du recalage et le temps de calcul. La section 4.5.2.2 décrit la parallélisation de l’algorithme sans de perte de précision sur l’estimation finale de la déformation. 4.5.2.1 Réduction de l’espace d’analyse La réduction de l’espace d’analyse consiste à ne pas parcourir la totalité de l’image cible mais seulement une partie de cette image. En effet, lorsque l’algorithme se situe au niveau 0 de la pyramide PImg , l’image à parcourir est alors en pleine résolution ce qui signifie que le nombre de pixels à scruter est souvent de l’ordre de plusieurs millions à chaque itération. Il n’est pas rare de constater des temps de calculs d’environ 1 à 2 minutes pour chaque itération (cette valeur variant bien sûr avec la dimension de l’image et la configuration de la machine). On atteint ainsi des temps de calcul qui sont inenvisageables pour une utilisation en routine et qui nous pénalisent aussi pour nos propres expérimentations en vue de l’étude de l’impact des paramètres de la méthode. Focalisation sur les zones riches en information Nous décrivons ici la manière de prendre en compte le pré-traitement par l’opérateur D2 (section 4.4.2.2) pour réduire l’espace d’analyse. Cette réduction est également adaptée au niveau de la pyramide PImg . La réponse de cet opérateur nous renseigne sur la non-stationnarité de l’intensité des voxels d’une image tridimensionnelle. En plus de réduire le bruit dû aux conditions d’acquisition des images, il permet d’extraire les zones de fort gradient de l’image et donc les zones qui sont susceptibles de porter l’information utile pour guider le recalage. La mise à jour des paramètres dépend en effet directement du gradient de l’intensité de l’image à recaler. Un seuillage du signal de sortie de l’opérateur D2 permet donc de générer une image binaire, qui met en évidence les zones de l’image que nous garderons pour estimer les paramètres de la transformation. La valeur du seuil, exprimée en % de l’intensité max du signal de sortie, est donc un paramètre sensible. L’espace d’analyse est réduit de manière d’autant plus significative que le seuil sera élevé. La mise en correspondance n’est plus assurée par l’ensemble de l’image mais par un sous ensemble de l’image de référence. Intuitivement, on peut donc s’attendre à une accélération de l’algorithme mais également à une perte de précision sur le champ estimé. L’étude du compromis entre le gain calculatoire et la précision du recalage fera l’objet d’une étude dans la section 8.1 du chapitre 8. La Figure 4.12 illustre les masques binaires obtenus sur des images par RM pour deux valeurs de seuil de l’image filtrée et le tableau 4.3 représente la réduction CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE 84 de l’espace d’analyse (en % de voxels) de l’espace initial Ω. Sur ce tableau, les valeurs inférieures et supérieures (en niveaux de gris), retenues pour le seuillage dans ce cas précis sont également indiquées. (a) (b) (c) (d) (e) (f) F IG . 4.12. Illustration des masques binaires utilisés pour réduire l’espace d’analyse. En haut, une coupe en petit axe de l’image par RM. En bas, une coupe en grand axe. De gauche à droite sont illustrés l’image, les résultats du seuillage de la réponse au filtre D2 avec un seuillage à 5% de l’intensité maximale de la sortie de D2 (b et e) et un seuillage à 10% de cette intensité maximale (c et f). Adaptation à la stratégie multirésolution L’adaptation de ce principe de seuillage à la multi-résolution peut s’avérer judicieux. La réduction de l’espace d’analyse est une solution appliquée pour accélérer le calcul dans le cas où les données à traiter sont très volumineuses. Pour les bassesrésolutions de l’image, cette réduction n’est pas indispensable. Nous proposons d’adapter ce seuillage au niveau de résolution de l’image considérée. Une fonction de pondération peut être utilisée afin de réduire progressivement cet espace de recherche en privilégiant des espaces de recherche peu réduits pour les faibles résolutions. Une solution proposée est une pondération de type S(ni ) = a × n3i (voir Figure 4.13) où a est un coefficient qui dépend du seuillage maximum que l’on désire appliquer en pleine résolution et du niveau de cette pleine résolution. ni correspond au iieme niveau de la pyrapide d’images PImg de ni taille NImg Dans la suite, nous noterons IBin , le masque binaire considéré pour le niveau ni de la pyramide d’images PImg . 4.5.2.2 Implantation sur architecture multi-processeurs Nous décrivons dans cette section, l’implantation de l’algorithme de recalage sur une machine parallèle (SGI SMP NUMA 12 processeurs) qui nous a permis de réduire consi- 4.5. OPTIMISATION ET IMPLANTATION 85 TAB . 4.3. Evolution de l’espace de recherche en fonction du seuil appliqué. Sur la colonne de gauche sont représentées les valeurs de seuil en pourcentage de l’intensité maximale (Imax ) de la réponse du filtre D2 . La colonne du milieu correspond aux bornes inférieure et supérieure (en valeur de niveau de gris) retenues pour le seuillage. La dernière colonne représente le pourcentage de l’espace d’analyse finalement considéré par rapport à l’espace initial qui correspond à la discrétisation de Ω. La Figure sur la partie de droite est la représentation de la réduction de l’espace en fonction du seuil appliqué sur une échelle logarithmique. % Imax 50 20 10 5 3 1 0.5 0.1 0 Imin − Imax Ωs (%) 1689-3375 675-3375 338-3375 169-3375 101-3375 34-3375 17-3375 3-3375 0-3375 0.1 2.4 7.1 12.9 18.0 29.8 38.8 67.1 100 0.012 0.01 Valeur du seuil 0.008 0.006 0.004 0.002 0 0 1 2 Niveau de resolution de l’image 3 4 F IG . 4.13. Exemple de fonction de pondération pour l’adaptation du seuillage pour la réduction de l’espace d’analyse dans une approche multi-résolution. La fonction est définie par 0.01 S(ni ) = a × n3i avec, dans ce cas, a = 3 . 4 86 CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE Algorithme 1 Algorithme de recalage B UT: Estimer les paramètres ξ de la transformation ϕ pour chaque niveau d’échelle l qui assurent la mise en correspondance des images Is et Ic . E NTRÉES : Is , Ic PARAMÈTRES : TImg : taille de la pyramide d’images TT rans : taille de la pyramide de transformations S : valeur du seuil pour la détermination des pixels à prendre en compte α : terme de pondération entre le terme d’appariement et le terme de régularisation NM ax : Nombre maximum d’itérations par niveau D ÉBUT DE L’ ALGORITHME : Calcul de la pyramide d’image PImg Pour ni ∈ [0, · · · , TIm − 1] Faire Calculer D2 Icni pour extraire les zones de fortes ruptures spatiales ni En déduire IBin pour Is Calculer le gradient de chaque image Isni Fin Pour TT ot ← TIm + TT rans − 1 ni ← 0 /* niveau courant dans la pyramide d’images */ nt ← 0 /* niveau courant dans la pyramide de transformations */ ng ← 0 /* niveau courant global */ µit ← 1 Tant Que ng < TT ot Faire it ← 0 Répète ni Pour Tout les pixels de IBin Faire Calcul de la contribution sur J et sa dérivée Fin Pour Mise à jour de µit t = ξ nitt − µit ∆ξ nitt ξ nit+1 it ← it + 1 Jusqu’à convergence des ξ nt ou si it = NM ax Si Mettre à jour le niveau de transformation Alors nt Calcul des paramètres ξ nt +1 en fonction des ξ̂ nt ← nt + 1 ; ng ← ng + 1 Sinon ni ← ni + 1 ; ng ← ng + 1 Fin Si Fin Tant Que 0 1 TT rans−1 S ORTIES : ξ̂ , ξ̂ , · · · ξ̂ 4.5. OPTIMISATION ET IMPLANTATION 87 dérablement le temps de calcul de l’algorithme dont nous détaillons le fonctionnement dans l’algorithme 1. Une analyse du temps d’exécution de l’algorithme confirme que la majeure partie du temps de calcul est dédiée au calcul du terme d’appariement et de sa dérivée. Dans [Rohlfing and Maurer, 2003] (dont les travaux ont été repris dans [Fumihiko et al., 2005]), l’auteur propose la parallélisation du calcul du critère d’information mutuelle entre deux images dans le cadre d’un recalage 3D d’images avec déformations non-linéaires. Dans notre implantation, nous adaptons cette parallélisation pour notre propre terme d’appariement et optimisons la répartition des données en fonction de la réduction de l’espace d’analyse. Sur une machine de type SMP NUMA, certaines séquences de l’algorithme au temps de calcul important peuvent être parallélisées en utilisant le principe du multithreading 3 . La particularité de ce type de calculateur est que tous les processeurs partagent la même mémoire et peuvent donc travailler simultanément et indépendamment sur les mêmes données partagées. Les tâches parallèles peuvent alors accéder en lecture à des espaces mémoires identiques (par exemple le gradient de l’image) sans perturber les autres tâches. Pour une itération donnée, l’algorithme doit calculer séquentiellement la mesure de similarité et sa dérivée puis mettre à jour les paramètres de la transformation en fonction des résultats obtenus. Le calcul de la mesure de similarité est effectué sur l’ensemble ou sur une partie de l’image. Nous parallélisons cette étape en découpant les données à parcourir en plusieurs sous partitions. Chaque thread ou processus léger (PL) est assigné à une sous-partition et calcule son influence sur la mesure de similarité et sa dérivée. L’ensemble de ces calculs peut être réalisé par chaque PL de manière indépendante. En revanche, la confrontation de l’ensemble des résultats nécessite une synchronisation de l’ensemble des PL afin d’avoir accès à toutes les contributions. La caractère sommatoire de ces contributions (voir équations (4.29) et (4.30)) permet une implantation très efficace et sans perte de précision du calcul global. Une première version de la parallélisation effectuait une découpe naïve par tranches du volume à traiter. Cette partition n’était pas réellement optimisée en fonction de l’image à parcourir. Comme l’illustre la Figure 4.14, il en résulte une période de latence qui provient du fait que les PLs associés aux sous-régions moins volumineuses terminent plus rapidement les calculs. La version que nous utilisons à l’heure actuelle consiste à stocker, une fois la réduction de l’espace d’analyse effectuée, l’ensemble des pixels à considérer sous forme de liste et de scinder cette liste en parts égales pour les distribuer aux différentes PLs. Le temps de synchronisation est ainsi beaucoup moins élevé. Dans [Rohlfing and Maurer, 2003], on propose d’approximer le temps d’exécution total du recalage par une équation du type : B (4.49) n où n représente le nombre de PL utilisés. Cette approximation est vérifiée aussi dans notre T (n) = A + 3 Les processus légers (en anglais, thread), sont similaires aux processus en cela qu’ils représentent tous deux l’exécution d’un ensemble d’instructions du langage machine d’un processeur. Toutefois là où chaque processus possède sa propre mémoire virtuelle, les processus légers appartenant au même processus père partagent une même partie de sa mémoire virtuelle (http ://www.techno-science.net). Le multithreading correspond à l’exécution en parallèle de plusieurs processus légers appartenant au même processus père et partageant une même partie de sa mémoire virtuelle. 88 CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE temps Début de l’itération Creation des différents PLs Synchronisation− récupération des résultats F IG . 4.14. Illustration du temps de synchronisation nécessaire à la mise en commun de l’ensemble des contributions issues des PL cas (voir Figure 4.15) ce qui indique que les temps de synchronisation ne perturbent pas les performances de la version parallèle de notre algorithme. F IG . 4.15. Temps de calcul en secondes pour un recalage 3D d’une image de taille 160×160×80. L’ensemble de l’image est considéré (pas de réduction de l’espace d’analyse). Le nombre de niveaux d’images Nimg et de transformations Ntrans est 4 et 5 respectivement. Le temps de calcul est inversement proportionnel au nombre de PL utilisés. Cela signifie qu’il existe une limite au gain fourni par la parallélisation de l’algorithme. Ce gain dépend directement de la proportion entre la partie parallélisée et la partie non parallélisée du code. Les performances de l’algorithme deviennent désormais très intéressantes (moins de 15 minutes sur une image de taille 160 × 160 × 80 et sans réduction de l’espace d’analyse, voir chapitre 8) ce qui nous permet d’envisager son utilisation en situation clinique. La principale limitation, cependant, est liée au prix très élevé des machines SMP NUMA. Ceci nous amène à considérer son implantation sur d’autres stations de travail et sur des grilles de calculs. Cela nécessite de trouver un compromis car, si le nombre de processeurs disponibles devient beaucoup plus élevé, la mémoire n’est plus nécessairement commune 4.6. DISCUSSION ET RÉSUMÉ DE LA CONTRIBUTION 89 à l’ensemble des processeurs et les données doivent être échangées. Il faut alors prendre en considération la communication et les échanges d’information entre les différents noeuds. 4.6 Discussion et résumé de la contribution Dans ce chapitre, nous avons décrit la méthode de recalage d’images qui va nous permettre d’estimer une transformation non rigide entre deux images d’une séquence. La transformation est représentée de manière paramétrique dans une base de B-splines et hiérarchisée à travers une approche bi-pyramidale images-transformations. La navigation dans cette hiérarchie est définie par l’utilisateur. Nos contributions dans ce chapitre concernent la mise en correspondance de propriétés statistiques locales de l’image issues de l’information photométrique pour le recalage intra-modalités d’images par RM ou TDM. Les trois opérateurs D1 , D2 et D3 proposés constituent différentes façons d’appréhender l’information iconique dans le cas où il n’existe pas de variation fonctionnelle entre les intensités d’un même point sur l’ensemble de la séquence. L’opérateur D3 introduit un critère vectoriel de mise en correspondance, où l’intensité et le descripteur statistique local de l’intensité dans une région sont considérés conjointement. Si l’opérateur D2 permet l’extraction des caractéristiques statistiques de l’image, il est également mis à profit pour l’accélération des calculs. La réduction de l’espace d’analyse diminue considérablement les temps de calcul tout en conduisant à des résultats d’une précision quasiment identique. Cette réduction est adaptée à la description multi-résolution des images de manière à limiter son effet sur les basses résolutions. Enfin, cette méthode, et plus particulièrement le terme d’appariement, a été rendue parallèle pour une exécution sur une architecture multi-processeurs ou de fermes de PC réduisant encore les temps de calcul sans perte de précision cette fois ci. Le découpage des données à traiter est optimisé en fonction du nombre de processeurs disponibles. Une évaluation de l’algorithme sera proposée dans la section 8.1 du chapitre 8. 90 CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE Chapitre 5 Including prior shape in cardiac sequential segmentation tracking This chapter concerns the work done in collaboration between the Creatis Laboratory, VTT1 in Tampere, Finland and the BME Laboratory2 in Helsinki, Finland where I spent 6 months from 01/10/04 to 31/03/05 thanks to an Eurodoc Grant (Rhônes Alpes Region). This is the reason why this chapter is written in English. Sommaire 5.1 5.2 5.3 5.4 5.5 5.6 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . Motivations . . . . . . . . . . . . . . . . . . . . . . . . . . . . Geometric modeling of the cardiac cavities . . . . . . . . . . 5.3.1 3-D shape model construction [Lötjönen et al., 2004] . . 5.3.2 Dynamic models construction . . . . . . . . . . . . . . Time-dependent statistical modeling of the shape variability Integrating the SDM into the segmentation tracking process 5.5.1 Time-dependent prior shape . . . . . . . . . . . . . . . 5.5.2 First frame initialization . . . . . . . . . . . . . . . . . 5.5.3 SDM adapted cost function . . . . . . . . . . . . . . . . Proposal summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 93 93 95 98 100 103 103 105 105 107 5.1 Introduction T o segment and track the heart in an image sequence, it is possible to apply a sequence of registrations with the method described in the previous chapter. However, such a strategy may lead, as it will be seen, to unsatisfactory results : some parts of the heart shape may derive considerably. To avoid this phenomenon, inclusion of additional information is required. This can be envisaged through various means. One approach can be to impose 1 2 http ://www.vtt.fi/ http ://biomed.tkk.fi/image/index.html 91 92 CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING an overall temporal constraint to the segmentation process [Montagnat and Delingette, 2005]. This constraint can be a continuity constraint on the overall motion of the heart’s structures but if too general, such a constraint may give unrealistic behaviors as well. To improve the temporal consistency, prior knowledge about cardiac dynamics can be used. Some recently introduced models incorporate dynamic features of ventricles and myocardium : In [Wierzbicki et al., 2004], Wierzbicki et al use the first frame of a 4D MRI data to build a dynamic model. Manual segmentations from several slices are used to build a static geometrical model. Then, this static model is warped according to the transformations between consecutive frames provided by a non-linear image registration algorithm. However the authors do not consider the large variability of subjects’ heart dynamics and only short axis scans have been used. In [Perperidis et al., 2004], the authors describe the construction of 4D atlas of human heart using tagged as well as untagged MR image sequences from 11 healthy volunteers. A spatio-temporal registration algorithm is used to produce a 4D probabilistic model of the cardiac anatomy. In addition, the tagged MR image sequences are used to derive motion fields between the end-diastolic and the end-systolic frames which describe myocardial contraction patterns in each subject. These motion fields are also mapped into a spatio-temporal reference coordinate system to produce a 4D statistical model of cardiac function. In this chapter, we propose a new Statistical 3D Dynamic Model (SDM) of the heart by learning through a population of healthy individuals. This SDM is composed of a set of semi-landmarks which statistically describe the spatio-temporal evolution of the heart structure surfaces (ventricles and atria). For each semi-landmark, a mean trajectory and the variability around it are derived. The SDM provides a reasonable constraint for a temporally regularized segmentation and tracking algorithm. Our model is built from both short- and long-axis cine MRI acquisitions of 15 healthy subjects to represent the statistical distribution of identified semi-landmarks over space and time. This chapter describes the following contributions : • A new statistical dynamic model is built using both Short Axis (SA) and Long Axis (LA) MR slices of 15 healthy volunteers. • The temporal behavior of the shape is exploited to model a spatial distribution of each semi-landmark over time. • Prior shape model is introduced in the algorithm described in Chapter 4 to propose a subject-dependent shape and motion estimation algorithm whose temporal consistency is therefore increased. In Section 5.3, we give the details of the SDM construction. In particular, we emphasize the spatial (Section 5.3.1) and temporal consistency (Section 5.3.2) of each semi-landmark through the database. Then a model is proposed for semi-landmark location at each time point of the sequence (Section 5.4). Finally, we describe, in section 5.5, how to introduce these prior constraints into equation (4.2) to formulate a shape tracking algorithm. 5.2. MOTIVATIONS 93 5.2 Motivations The previous chapter was dedicated to the estimation of a dense displacement field between two consecutive images issued from a sequence. All the considered sequences aim to describe a physiological process for which it is necessary to take into account the temporal axis. In the following, we denote (Itj )0≤j≤J an image sequence where Itj is the j th image in a sequence and where J denotes the number of frames in the sequence. Basically, there are two main approaches to consider the motion in image sequences. The Lagrangian or material description is faced with the Eulerian or spatial one. These two descriptions are described in details in the next chapter. However, a short description and an illustration of the two points of view are given in Figure 5.1. The Lagrangian point of view (lower part of the Figure 5.1) focuses on trajectory and displacement of material points. All the displacements are expressed from a reference state. Since mesh points of geometrical structures remain coincident with material points, in the Lagrangian description, elements deform with the material and therefore can become severely distorted. The Eulerian point of view describes what is happening at each geometrical location (upper part of the Figure 5.1). The motion is generally described with velocity or acceleration. In the Eulerian description, the motion estimation errors accumulate and lead to noisy and unrealistic shapes. An illustration of this phenomenon is given in Figure 5.2. In this example, a manual segmentation was realized on the first image of the sequence It0 . The initial mesh was warped according to successive estimations within an Eulerian framework. The segmentation results for j = 5 (Figure 5.2, left) and j = 15 (Figure 5.2, right) illustrate the error accumulation. We would also like to limit another undesirable effect. Cardiac MR images have a very good resolution in the slice planes (here 160 × 160). The inter-slice distance is however lower. Due to the small number of slices in cine-MRI acquisitions, an image interpolation (section 2.3.4) is applied to obtain a three-dimensional image. However, the resulting volume still suffers from an inter-slice anisotropy and a lack of information can be observed in the direction orthogonal to the imaging plane (Figure 5.2). This disturbs the motion estimation in this particular direction. Thus, image information, alone, is not sufficient to properly handle the segmentation tracking through the 3D sequence. The 3D Statistical Dynamic Model proposed hereafter attempts to – regularize the motion in a cardiac sequence to compensate for the error accumulation – constrain the shape of the different heart’s structures throughout the cardiac cycle. 5.3 Geometric modeling of the cardiac cavities through the cardiac cycle Cine-MR Image sequences of 15 healthy volunteers formed the reference dataset. For each of them, both SA and LA images have been acquired according to the protocol described in Section 2.3.4. All the images in the data set were preprocessed using in-slice 94 CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING ϕt t ϕt t 0 1 It0 ϕt t 0 1 ϕt t 1 2 2 3 It1 It2 ϕt t 5 6 It6 ϕt t 0 2 ϕt t 0 6 F IG . 5.1. Volumetric transformation estimations within an image sequence. In the Eulerian description (upper part), the motion is estimated between two consecutive frames (ϕtj ;tj+1 ) iteratively. In the Lagrangian description (lower part), the displacement is estimated between the reference image at t0 and any other image in the sequence through ϕt0 ;tj . F IG . 5.2. Illustration of the error accumulation of errors with motion estimation between successive frames. A manual segmentation is realized on the first frame. The resulting mesh is warped according to the successive estimations. The resulting segmentation for j=5 is given on the left and for j=15 on the right. 5.3. GEOMETRIC MODELING OF THE CARDIAC CAVITIES (a) 95 (b) (c) F IG . 5.3. Illustration of the ’stair effect’ (more details are given in the text). a) shows a 2D slice of a 3D reconstructed volume in the orthogonal direction of the slice planes. The subfigures b) and c) represent the two arbitrary gray-level profiles in (a). To this aim, a manual segmentation is realized on the first frame and the resulting mesh is warped according to the estimated transformation. motion compensation [Lötjönen et al., 2005]. 3D shape-based interpolation [Grevera and Udupa, 1996] was used to provide SA and LA volume sequences with reduced motion artifacts. For more details, see Section 2.3.4 or [Lötjönen et al., 2004]. The first following subsection concerns the construction of the statistical threedimensional shape model. This stage is fully described in [Lötjönen et al., 2004] but the main steps of this construction will be briefly recalled in order to make the reader familiar with the notations and to underline the spatial consistency of each semi-landmark from one subject to the other. The second subsection describes the temporal extension of this geometrical statistical model. Once again, we underline the consistency between each subject : the trajectory of each semi-landmark is normalized for all the subjects to make them comparable and to merge the information. As a result, we obtain a fully 4D statistical shape model that will be used in order to constrain the sequential motion estimations (Section 5.5). 5.3.1 3-D shape model construction [Lötjönen et al., 2004] Let us define the notation used in the sequel : – Let p = 1, · · · , n (n ∈ N) be the subject number in the database (n = 15 in our case). – Let L(i) denotes the ith semi-landmark (SL) in the geometric model where 1 ≤ i ≤ m, with m ∈ N the number of SL in the model. – xi,p denotes the coordinates of L(i) for the pth subject in the database. 96 CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING – For a given subject p, a whole set of SL makes up a 3D shape model, S(p) defined by : S(p) = xi,p 1 ≤ i ≤ m (5.1) The Statistical 3-D cardiac surface model was generated for the end-diastolic (ED) cardiac phase which corresponds to the first time frame of each image series. Let (It0 (p))1 ≤ p ≤ n be the set of these ED Images. Ventricles, atria and epicardium from each case were manually segmented from both SA and LA images by a medical expert by deforming a 3-D surfacic mesh in these images using a dedicated software tool (developed at the BME laboratory) allowing for interactive local non-rigid deformation. For each subject, the manual segmentation was iteratively performed in SA image, and in corresponding LA image until no deformation was needed. Accurate instructions were given to the expert to perform the final segmentation. The guidelines are fully described in [Lötjönen et al., 2004]. F IG . 5.4. Manual segmentation result for one subject shown on few slices. Intersection between the 3D meshed model and the corresponding image is displayed in red. Top : SA slices and Bottom : LA slices From all the resulting meshes (see Figure 5.4 for an example), a set of corresponding SL was determined for each subject p according to the method described in [Frangi et al., 2002]. By corresponding, we mean that L(i) is assumed to correspond to the same anatomical point for each subject p. In the following, we give the different steps to build such a set of corresponding SL. 1. In order to match all the segmentations, an artificial volume Iart (p), with 1 ≤ p ≤ n, was generated for each segmented data by assigning a gray level for each object in the model. One of the volumes Iart (pref ) was arbitrarily chosen 5.3. GEOMETRIC MODELING OF THE CARDIAC CAVITIES 97 to be a reference to which all other volumes were affinely aligned by maximizing a normalized mutual information measure. 2. This reference was non-rigidly registered using the method described in [Lötjönen and Mäkelä, 2001]. The output transformations ϕpref ;p map the reference volume Iart (pref ) to each remaining Iart (p). 3. The set S(pref ) is considered as the reference set of SL which is propagated to the remaining IED (p) according to the estimated ϕpref ;p In order to reduce the bias introduced by the arbitrary choice of a reference subject, a mean shape (see Figure 5.6) was computed from the semi-landmarks of all the subjects according to : n n 1X 1 X i,p S̄ = S(p) = x 1≤i≤m. (5.2) n p=1 n p=1 F IG . 5.5. Surfaces of all the database subjects. One can notice the large shape variability between subjects. The previous procedure (steps 1 to 3) was repeated using the mean model as the reference. A new artificial reference volume Iart was computed from S̄ and the final sets of corresponding SL, S(p) = (L(i))p1 ≤ i ≤ m , were computed by propagating S̄ to all the database subjects according to the new estimated transformations. In our case, all the 3D 98 CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING (a) (b) F IG . 5.6. Geometrical Mean Model with (left), and without pericardium (right) shape models are composed of m = 2086 points. In order to highlight the four chambers and epicardium shape variability within the database, the surface of all subjects are displayed in Figure 5.5. A statistical description of large shape variability and its application in cardiac or brain image segmentation can be found in [Lötjönen et al., 2004, Koikkalainen and Lötjönen, 2004]. 5.3.2 Dynamic models construction The geometrical shape model has been used to dynamically describe the motion of the heart structures. Starting from each subject-specific geometrical model S(p), a segmentation of the heart’s structures has been performed for each image in the sequence. The segmentation was achieved in a semi-automatic way. To avoid any confusion, for each subject we compute a specific dynamical model D(p). All the models are normalized and the final statistical dynamic model (SDM) results by accounting for all the specific model to compute statistical information. This section is dedicated to the different steps of the construction of the dynamic model for one subject. 5.3.2.1 4D dataset segmentation As in [Lorenzo-Valdés et al., 2003, Wierzbicki et al., 2004], for each subject p, a non-rigid registration was applied to extract volumetric transformations ϕptj ;tj+1 , between two successive images (Itj and Itj+1 ) in a 4D data set according to the method described in [Lötjönen and Mäkelä, 2001]. The estimated motion fields were prone to error accumulations (see Figure 5.2) and the 3-D transformations were manually corrected to accurately refine the segmentations. As a result, sequential segmentations for 23-29 time points, depending on the subject, were achieved for each of the 15 subjects. 5.3. GEOMETRIC MODELING OF THE CARDIAC CAVITIES 5.3.2.2 99 Normalization and resampling of the temporal axis In order to ensure the dynamic consistency between all the subjects, let consider the i SL L(i) for the pth subject. The notation introduced in section 5.3.1 is extended with respect to the temporal axis : th xi,p (t), 1 ≤ i ≤ m, 1 ≤ p ≤ n, {i, p} ∈ N × N, t ∈ R (5.3) denotes the coordinates of L(i) at time t. n = 15 is the number of subjects in the database and m = 2086 is the number SL in one mesh. The signal, (xi,p (tj ))j∈N (5.4) corresponds to the successive locations of L(i) for the pth subject provided by the semi automatic segmentations (Figure (5.7) : raw line). This discrete 3D trajectory is expressed at uniform temporally spaced time points. Each discrete trajectory was interpolated with cubic B-Splines in order to get continuous and smooth paths (Fig.(5.7) : dotted line) : i,p P β3 (t)xi,p (tj ) x (t) j P y i,p (t) = j β3 (t)y i,p (tj ) (5.5) P i,p i,p z (t) j β3 (t)z (tj ) Moreover, the number of phases and the systolic time points differs from one subject to the other. Therefore, in order to construct the dynamic cardiac surface model, we must take into account the inter-subject cardiac cycle variability. This is the reason why all the trajectories must be normalized and resampled to obtain unified and temporally consistent semi-landmarks paths. A normalization is first performed according to the number of time points in the sequence in such a way that the cardiac cycle is ranged between 0 and 1. Then, all the normalized trajectories were resampled to set the detected end systolic time point to 1/3 the cardiac cycle (Fig.(5.7). dashed line). For each subject p, a dynamic geometrical model is now available and will be denoted D(p, t). This model is fully described by : (5.6) D(p, t) = xi,p (t) 1 ≤ i ≤ m with t ∈ [0 , 1] An important boundary condition is given for t = 0 by imposing the correspondence between the dynamical model at time 0 and the static shape model : D(p, 0) = xi,p (0) 1 ≤ i ≤ m = S(p). (5.7) 5.3.2.3 Dynamic models relevance The result of the normalization stage is illustrated in Figure 5.8 where the volume curve of the left ventricle of each subject is given. We can observe the strong coherency of all these curves. In particular, all the systole time points are in correspondence. The resampling stage is essential for the quality of the prior information provided by the final SDM. Indeed, this model aims to describe the shape variability of the heart structures at 100 CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING F IG . 5.7. X coordinate of one semi-landmark’s trajectory during the resampling stage. The solid line displays the raw trajectory which is the result of all the successive segmentations. The dotted line shows the interpolated smooth trajectory and the dashed line represents the resampled trajectory relatively to the end-systole time point. any given time. Without this stage, the shape variability should have been weaken by the fact that the n different heart geometries would correspond to different cardiac phases. In other terms, temporal normalization enables to compare hearts at corresponding physiological phases of the cardiac cycle. In order to emphasize this important property, an average model D̄ which describes a mean trajectory for each semi-landmark L(i) has been computed as : n n 1 X i,p 1X D(p, t) = x (t) 1 ≤ i ≤ m . D̄(t) = n p=1 n p=1 (5.8) An illustration of the LV volume curves of D̄ is given in Figure 5.9. These curves are in good agreement with the one found in the medical literature (see for example Figure 1.2, in chapter 1). The ejection fraction (equation (1.1)) of D̄ is equal to 60%. According to the medical experts it corresponds to the minimum acceptable value for an healthy subject. An explanation of this weak value can be the smoothing effect of the average model computation. For comparison purpose, the ejection fraction value of the average model without trajectory resampling was only 52%. 5.4 Time-dependent statistical modeling of the shape variability Thanks to the previous modeling steps, instead of having a prior shape information at a fixed time (end-diastolic time point for example), we are able to model the shape variability at any time of the cardiac cycle. In this section, we propose a statistical repre- 5.4. TIME-DEPENDENT STATISTICAL MODELING OF THE SHAPE VARIABILITY101 F IG . 5.8. Volume curve of the left ventricle for all the 15 subjects. Thanks to the trajectories resampling, we can observe the strong temporal consistency of the LV volume curves through the population. 102 CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING F IG . 5.9. Volumic curves of the 4 chambers of the average dynamic model of the beating heart sentation of the shape variability of the heart’s cavities leading to the so called Statistical Dynamic Model (SDM) of the heart. Let consider the state of the SDM at time t, t ∈ [0 1] and a given semi-landmark L(i). The variability of the location of L(i) is available from a set of n geometrical points (xi,p (t))1 ≤ p ≤ n . The location of L(i) is assumed to be a stochastic random vector X i . In this section we intend to model its spatial distribution. p(X i (t) = xi (t)) p(X i (t) = xi (t)) = p(Y i (t) = y i (t)) p(Z i (t) = z i (t)) 1 ≤ i ≤ m (5.9) denotes the probability for L(i) to appear at the geometrical coordinates xi at time t. In the following, we will write p(xi (t)) for p(X i (t) = xi (t)) in order to lighten the equations. We consider that xi,p (t) is the instance of the random variables X i (t). In order to constrain the motion estimation algorithm (chapter 4), we are interested in differential measure. This is not available from the set a discrete points. In order to circumvent this disadvantage, the joint density is approximated by a smooth differentiable approximation function. Very often, a Gaussian distribution is assumed for the landmark location. But in our case, such a representation may not be realistic for instance to represent the twisting component of the heart’s motion. Therefore, we preferred to consider non-linear probability distributions which are approximated from n samples using Parzen windowing technique [Parzen, 1962] to more realistically model the variability of each semi-landmark. The probability density functions are estimated by taking the samples (xi,p (t))1 ≤ p ≤ n and convoluating kernel functions K() centered on the different elements : ! n 2 i i,p X 1 kx (t) − x (t)k p(xi (t)) = , (5.10) K nh p=1 h 5.5. INTEGRATING THE SDM INTO THE SEGMENTATION TRACKING PROCESS103 where K(.) is a non negative absolutely integrable function defined by : Z K(x) dx = 1. (5.11) R3 If K is an isotropic gaussian kernel, K(x) = 1 T 1 exp 2 x x . 2π (5.12) the equation (5.10) becomes : 1 T n X − 2 (xi (t) − xi,p (t)) (xi (t) − xi,p (t)) 1 p(x (t), h) = √ n . exp 2h h 2π × n p=1 i (5.13) The parameter h is a scale parameter for the kernel functions. Its influence is of particular importance. The bigger the value of h, the more smooth the probability density function. An illustration is given in Figure 5.10, where we can observe that, the larger the smoothing parameter, the wider the kernel function and hence the smoother the density estimate. If the parameter is too large the distribution becomes too diffuse. On the other hand, if the smoothing parameter is too small, the resulting density may be too localized and be seen as a sum of dirac functions. The modeling of the point locations density functions with Parzen windows allows to control the smoothness of the function with the unique parameter h. This property can be used to progressively constrain the segmentation tracking. The mean model D̄ and the set of probabilities p(X i (t) = xi (t)), 1 ≤ i ≤ m, t = [0 , 1] constitute the statistical dynamic model (SDM) of the heart. The probabilistic framework is well-adapted to model the variability of shape and cardiac chambers deformations. The introduction of the SDM within shape tracking algorithms allows to constrain the results according to the dynamic evolution of the cardiac structures. The next section is then dedicated to its introduction in the registration based method described in chapter 4. 5.5 Integrating the statistical model into the segmentation tracking process Considering a new patient image set, the problem is to exploit the previously described SDM model for the heart segmentation tracking purpose throughout the image sequence. The first issue to consider is the temporal alignment of the data. Then, we will adapt the registration cost function by incorporating an additional term based on the SDM model. 5.5.1 Time-dependent prior shape We recall that (Itj )0≤j≤J denotes an image sequence. As a convention, we consider that j = 0 corresponds to the end-diastolic time point, that j = l is the last frame in 104 CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING F IG . 5.10. One 2D slice of a 3D non linear probability density function for one SL at time point 0.2 with different variance values for the kernel function : a) h = 2.0, b) h = 5.0, c) h = 10.0, d) h = 20.0 5.5. INTEGRATING THE SDM INTO THE SEGMENTATION TRACKING PROCESS105 the sequence and that j = jsys corresponds to the end-systolic time point. The consistent trajectories of the SL are resampled in order to adapt the prior information to the sequence to process. The SDM is linearly discretized according to the jsys and l values so that jsys = 1/3 and l = 1. Figure 5.11 illustrates this temporal resampling. 5.5.2 First frame initialization The segmentation of the first frame with mean model D̄(0) at time t = 0 is a key point for the processing of the whole sequence. In the case of a new sequence, the segmentation also includes the registration of the segmented model with the SDM. We can for instance register the synthetic volume Iart (see section 5.3.1) to the end-diastolic time frame of the sequence and then warp the SDM according to the estimated transformation. 5.5.3 SDM adapted cost function The SDM can be easily introduced as an additional constraint term in the costfunction. The prior knowledge of the shape can be taken into account through the term C(ϕ) in the cost function (4.2). In this section, we focus on the last term, C, whose expression is based on the prior shape variability information provided by the SDM. The shape constraint energy term is elaborated from the probability density function (5.13) : m with 1X C(ϕ, h) = (1 − p(xi (tj ), h))2 2 i=1 xi (tj ) = ϕt0 ;tj (xi (0), ξ) (5.14) (5.15) Combining (5.14) and (5.15), we obtain : m C(ξ, h) = 1X (1 − p(ϕt0 ;tj (xi (0), ξ), h))2 2 i=1 (5.16) In order to minimize the global energy term in our framework, the first derivative of this constraint energy term is computed as : m ∂C(ξ, h) 1 X ∂Ci (ξ, h) = ∂ξ 2 i=1 ∂ξ (5.17) with h i p(ϕt0 ;tj (xi (0), ξ), h)) ∂Ci (ξ, h) i = −2 × 1 − p(ϕt0 ;tj (x (0), ξ), h)) × J1 × , (5.18) ∂ξ ∂x where J1 corresponds to the first jacobian matrix described in section 4.3.6. The last derivative terms denote the derivative value of the probability term with respect to spatial dimensions at transformed point. CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING 106 F IG . 5.11. Illustration of the SDM resampling in order to adapt the prior information to the new sequence to process. 5.6. PROPOSAL SUMMARY 107 5.6 Proposal summary In this chapter, we built a new statistical dynamic model of the heart from 15 healthy volunteers. This model includes representations of ventricles, atria and pericardium. The evaluation of cavities volumes over the full cardiac cycle is realistic. In particular, the asymmetric temporal behavior of atria and ventricles is clearly observed. Probabilistic framework is well-adapted to model the variability of shape and cardiac chambers behaviors. However, with this kind of method, the more cases in the data set, the more relevant the a priori information. Therefore, the enrichment of the data set with additional experiments is still needed. The influence of parameter h is of particular importance. The bigger the value of h, the more smooth the probability density functions. The introduction of the SDM in the registration algorithm allows to constrain the results according to the shape variability of cardiac structures learned from samples. The method introduced in this chapter allows us to temporally constraint the segmentation over the whole image sequence. However the estimation is still not truly spatio-temporal in the sense that for a given time point previous and future estimations do not influence the result. The next chapter gives a method which allows to take into account the whole temporal image sequence. 108 CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING Chapitre 6 Estimation spatio-temporelle de mouvement Sommaire 6.1 6.2 6.3 6.4 6.5 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 Définitions préalables . . . . . . . . . . . . . . . . . . . . . . . . . . 110 6.2.1 Notion de Trajectoire . . . . . . . . . . . . . . . . . . . . . . . 110 6.2.2 Description Lagrangienne du mouvement . . . . . . . . . . . . 111 6.2.3 Description Eulérienne du mouvement . . . . . . . . . . . . . . 111 6.2.4 Périodicité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 Techniques d’estimation et de filtrage de signaux stochastiques . . . 113 6.3.1 Processus markovien et modèle d’état . . . . . . . . . . . . . . 114 6.3.2 Estimateur d’état de Kalman . . . . . . . . . . . . . . . . . . . 115 Application à l’estimation de mouvement dans une séquence d’images116 6.4.1 Modèle spatio-temporel de mouvement . . . . . . . . . . . . . 117 6.4.2 Vecteur d’état . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 6.4.3 Prédiction et Filtrage . . . . . . . . . . . . . . . . . . . . . . . 119 6.4.4 Critère d’arrêt . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 6.4.5 Contrainte de passage à l’origine . . . . . . . . . . . . . . . . . 122 6.4.6 Approche Multiéchelle . . . . . . . . . . . . . . . . . . . . . . 122 6.4.7 Trajectoires de complexité adaptative . . . . . . . . . . . . . . 123 6.4.8 Remarques complémentaires . . . . . . . . . . . . . . . . . . . 124 6.4.9 Prétraitement des données . . . . . . . . . . . . . . . . . . . . 124 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 6.1 Introduction L a méthode que nous proposons dans ce chapitre est une extension au domaine spatiotemporel de l’algorithme de recalage d’images proposé au chapitre 4. Le problème de l’estimation de mouvement repose sur l’étude des trajectoires et sur une modélisation 109 110 CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT spatio-temporelle de la transformation sur l’ensemble de la séquence. Les paramètres de la transformation sont considérés comme des signaux stochastiques. Nous utilisons une formulation d’état de ces paramètres pour proposer un algorithme basé sur un estimateur et un prédicteur de Kalman qui permet d’estimer séquentiellement les mouvements et les déplacements des organes étudiés sur l’ensemble d’une séquence. Afin de réduire l’espace des solutions, certaines contraintes ont été ajoutées, comme la périodicité des mouvements et des contraintes de déplacement nul aux instants de référence. Ce chapitre est organisé de la manière suivante : dans un premier temps, nous donnons un complément des notions de transformation et de déplacement introduites dans le paragraphe 4.3.1. Ces bases sont nécessaires pour pouvoir exprimer de manière convenable et sans ambiguïté les déformations spatio-temporelles estimées sur des séquences entières d’images. Puis, nous présentons les techniques d’estimation et de filtrage que nous utilisons en focalisant plus particulièrement sur le filtrage de Kalman dont les principales équations sont rappelées dans l’annexe C. Ensuite, nous proposerons un moyen de combiner cet outil de filtrage et notre algorithme de recalage en prenant en compte la périodicité des trajectoires. Pour finir, nous introduirons des éléments pour adapter la complexité des trajectoires en fonction de l’énergie qu’elles véhiculent dans le but de réduire le nombre de paramètres du modèle aux endroits qui ne justifient pas une grande précision. 6.2 Définitions préalables Les définitions que nous proposons ici sont pour la plupart issues d’un document téléchargeable à l’adresse suivante : http ://jgarrigues.perso.egim-mrs.fr/mmc.html 6.2.1 Notion de Trajectoire La trajectoire ΓM d’un point matériel M de l’espace est définie comme étant l’ensemble des positions géométriques occupées par ce point au cours de son déplacement. Si l’on considère un domaine matériel D représentant un ensemble de points matériels {M}, à chaque instant t, le domaine D est repéré géométriquement par le domaine géométrique Ωt . A chaque instant t, la position d’un point matériel M est donc repérable par un point géométrique identifiable par ses coordonnées x dans un repère fixe. On définit l’application ϕt,t′ qui, à tout point x ∈ Ωt à l’instant t fait correspondre de manière unique un point x′ ∈ Ωt′ à l’instant t′ . ϕt,t′ : Ωt ⊂ Rd → Ωt′ ⊂ Rd x 7−→ x′ = ϕt,t′ (x) (6.1) Pour être en accord avec les propriétés physiques des objets considérés, cette application doit être bijective (i.e. tout élément xt′ de Rd doit admettre un antécédent unique xt de Rd par ϕt,t′ ). Cette application doit être au moins de classe C 0 pour éviter la rupture dans la trajectoire des points matériels. Enfin, ϕ doit être transitive. Il y a deux façons principales d’appréhender le mouvement d’objets animés. Ces deux descriptions sont succinctement décrites section 6.2.2 et 6.2.3. Pour plus de détails, le lecteur pourra se référer à l’adresse http ://jgarrigues.perso.egim-mrs.fr/mmc.html ou [Linder, 2003]. 6.2. DÉFINITIONS PRÉALABLES 111 6.2.2 Description Lagrangienne du mouvement Cette description consiste à observer les modifications des propriétés d’un point matériel M que l’on suit dans son mouvement. Ces propriétés peuvent être de type scalaire (pression, densité, température), vectoriel (déplacement, vitesse1 , accélération) ou tensoriel (contraintes, déformation). Cette description est directement liée à la notion de trajectoire puisqu’elle vise à suivre au cours du temps des objets d’intérêts repérés par un état de référence Ωt0 à un temps de référence t0 . Si l’on note x0 la position géométrique d’un point matériel M à l’instant de référence t0 , alors l’application (6.1) devient : ϕt0 ,t : Ωt0 ⊂ Rd → Ωt ⊂ Rd x0 7−→ x(t) = ϕt0 ,t (x0 ). (6.2) Afin d’alléger ces écritures, nous utiliserons la notation suivante, ϕ: Ωt0 ⊂ Rd × R → Ωt ⊂ Rd x0 , t 7−→ x(t) = ϕ(x0 , t) (6.3) soit pour reprendre les notations utilisées dans (4.3) : x(t) = ϕ(x0 , t) = x0 + u(x0 , t). (6.4) 6.2.3 Description Eulérienne du mouvement Dans cette seconde approche, le domaine de référence n’est plus le domaine matériel, mais le domaine géométrique qui est ’traversé’ par un objet en évolution. Chaque point géométrique de coordonnées x constitue donc un point d’observation. L’ensemble des propriétés scalaires, vectorielles et tensorielles observables en x au cours du temps correspondent donc à des points matériels différents. La description d’Euler du mouvement se prête d’avantage à l’étude des vitesses. On définit v E (x, t) comme la description Eulérienne du champ de vitesse. Malgré des points de vu différents, il existe une relation évidente entre ces deux descriptions. En effet, on peut connaître la position d’une particule particulière à l’instant t grâce à l’équation (6.3). La vitesse de cette particule est donnée, en vertu de la description lagrangienne, par la relation suivante : ∂ϕ(x0 , t) ∂u(x0 , t) = . (6.5) ∂t ∂t Pour obtenir la description Eulérienne, il faut exprimer le champ de vitesse en fonction des positions actuelles. Autrement dit, il faut être capable d’exprimer la position de chaque particule à l’instant t. Considérons pour cela le point x. Puisque ϕ est bijective et donc inversible, il est possible de savoir quel point matériel M passe par x à l’instant t grâce à la relation : x0 = ϕ−1 (x, t) (6.6) v L (x0 , t) = 1 Le terme exact devrait être vélocité lequel regroupe à la fois la notion de direction et d’amplitude qui elle doit être appelée vitesse. Cependant par abus de langage, le mot vitesse est généralement employé. 112 CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT En substituant cette relation dans l’équation 6.5, on obtient : v E (x, t) = ∂ϕ(ϕ−1 (x, t), t) , ∂t (6.7) ΓM1 M0 ΓM 2 M1 vL (x0;M1 , t3 ) M2 vL (x0;M2 , t0 ) vL (x0;M , t4 ) 0 vL (x0;M2 , t1 ) ΓM 0 vL (x0;M , t0 ) 1 vL (x0;M , t0 ) 0 vE (x , t ) t0 t1 t2 t3 t4 F IG . 6.1. Correspondance entre la description Lagrangienne et Eulérienne du mouvement. Sur la partie haute de la figure, les trajectoires de 3 points différents (M0 , M1 et M2 ) sont représentées sur l’ensemble d’une séquence. Au cours de leur déplacement, ces trois points matériels se retrouvent sur une même position géométrique particulière x mais à des instants différents. La partie basse du schéma décrit le vecteur vitesse que l’on voit lorsqu’on ne s’intéresse qu’à cette position particulière aux différents instants. qui représente une description Eulérienne de la vitesse à partir de la fonction ϕ qui décrit la trajectoire de l’ensemble des points d’intérêt. Ces notions sont résumées sur la Figure 6.7 où les trajectoires de 3 points différents (M0 , M1 et M2 ) sont représentées. 6.3. TECHNIQUES D’ESTIMATION ET DE FILTRAGE DE SIGNAUX STOCHASTIQUES113 Ces trois points sont amenés à passer en un même point géométrique à des instants différents. Le passage inverse de la formulation Eulérienne à la notion de trajectoire passe par la résolution de l’équation différentielle ∂x(t) = v E (x(t), t) ∂t (6.8) avec la contrainte x = x0 à t = t0 . On accède alors à l’ensemble des positions occupées par M. Ces notations vont être prépondérantes dans la suite de ce chapitre pour décrire le modèle spatio-temporel que nous proposons ainsi que pour évaluer les performances de la méthode que nous proposons. 6.2.4 Périodicité Comme on l’a vu au chapitre 1, le domaine applicatif concerne l’étude des mouvements physiologiques tels que la respiration ou le mouvement cardiaque. Ces phénomènes sont considérés comme étant pseudo-périodiques dans le sens où ils ne sont pas exactement reproductibles et où la durée du cycle peut varier sur l’ensemble de l’acquisition. Cependant les techniques d’imagerie auxquelles nous nous intéressons ne permettent pas une acquisition en temps réel comme c’est le cas pour l’imagerie ultrasonore. Ainsi les séquences d’images obtenues couvrent au mieux un cycle cardiaque ou respiratoire. Dès lors, le bouclage de ces séquences nous permet de périodiser ces phénomènes. On note alors I = {Ij , j = 0..J} où j ∈ N fait référence à l’axe temporel discrétisé et où l’image Ij est définie sur Rd . I est alors un d−signal périodique bruité que nous allons filtrer pour en extraire l’information qui nous intéresse, ici, un champ dense de mouvement spatiotemporel. 6.3 Techniques d’estimation et de filtrage de signaux stochastiques Le problème du filtrage consiste à déterminer des estimateurs des variables d’un système lorsque l’environnement présente des perturbations aléatoires. Pour estimer le déplacement et le mouvement spatio-temporel des organes en évolution, nous proposons de nous positionner dans le cadre des filtrages et de prédictions de signaux stochastiques où le bruit d’acquisition et les variations des intensités d’un même point matériel au cours de la séquence peuvent représenter des perturbations aléatoires . Dans la suite, nous notons j la variable discrète de temps. L’estimation d’un signal utile xj à partir de l’observation d’un signal qui lui est corrélé zj est un problème fondamental en traitement du signal et en automatique. Dans certains cas, le signal zj n’est qu’une version bruitée du signal utile que l’on cherche à estimer, dans d’autre cas, ce signal sera totalement différent mais contiendra de l’information sur xj pour conduire à son estimation. 114 CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT 6.3.1 Processus markovien et modèle d’état Un processus aléatoire est dit markovien si l’état xj de ce processus et l’équation d’état qui lui est associée contiennent toute l’information nécessaire sur le passé pour prédire le comportement futur du système. En d’autres termes, l’état constitue une mémoire du système depuis son initialisation jusqu’à l’instant présent. Ainsi la probabilité pour que l’état du système prenne une certaine valeur p(xj ) à un instant donné t = tj ne dépend que de sa valeur la plus récente : p(xj |xj−1 , xj−2 , xj−3 , · · · , x0 ) = p(xj |xj−1 ) (6.9) Si l’état ne peut prendre qu’un ensemble fini de valeur, on parle alors de chaîne de Markov. Cependant, nous nous situerons uniquement dans le cadre de processus markovien car l’espace des solutions admissibles pour les processus que nous décriront sera infini. D’une manière générale, l’évolution de l’état d’un système s’écrit sous la forme [Arulampalam et al., 2002] : xj = f j (xj−1 , vj−1 ) (6.10) où f j : Rnx × Rnv → Rnx est une fonction non linéaire de l’état xj−1 ∈ Rnx , et du bruit d’état vj−1 ∈ Rnv . L’état x du système dynamique étudié est estimé récursivement grâce à une succession de mesures dont le principe est résumé sur la figure 6.2. L’équation zj = hj (xj , wj ) (6.11) détermine la mesure du système, où hj : Rnx × Rnw → Rnz est également une fonction non linéaire de l’état xj ∈ Rnx , et du bruit de mesure wj ∈ Rnw . La considération conjointe des équations (6.10) et (6.11) constitue ce que l’on appelle le modèle d’état. Il s’agit là bien entendu d’une définition très générale. Des distinctions peuvent être effectuées selon la nature des processus étudiés (gaussiens ou autres) ou selon la linéarité du modèle. Un résumé des outils de filtrage a été proposé par Monin 2 et synthétisé dans le tableau 6.1. Dans la suite, nous nous placerons dans le cadre de l’estimateur d’état de Kalman. wj système dynamique X j+1 = f ( Xj , wj ) Xj vj Capteur Zj Estimateur Xj Z j = h( Xj , vj ) F IG . 6.2. Diagramme d’un système dynamique décrit sous forme d’état. 2 Nous n’avons pas trouvé de référence concernant ce résumé. Celui-ci a été établi dans le cadre d’une réunion du projet Picasso visant au développement d’une plateforme d’intégration au sein du laboratoire LAAS (www.laas.fr/ monin/TAS.ppt) 6.3. TECHNIQUES D’ESTIMATION ET DE FILTRAGE DE SIGNAUX STOCHASTIQUES115 TAB . 6.1. Synthèse des différents types de filtrage dynamique en fonction des modèles utilisés (issue de www.laas.fr/ monin/TAS.ppt). Filtres numériques Filtre de Kalman Filtre de Kalman étendu Filtrage polynomiale Filtre de Kalman étendu en parallèle Mélange de gaussiennes Filtre particulaire Modèle/Bruit Nature Linéaires gaussiens/Bruits gaussiens Localement linéaires/ Bruits gaussiens Analytique/ Bruits linéaires non gaussiens Localement linéaires/ Bruit gaussiens Optimal Localement linéaire/ Bruits quelconques Quelconque Coût algorithmique Faible Approximation analytique Sous optimal Faible Approximation analytique Moyen Approximation numérique Approximation numérique Moyen à fort Très fort Moyen 6.3.2 Estimateur d’état de Kalman Le but du filtrage de Kalman [Kalman, 1960, Welch and Bishop, 2004] est de déterminer un système optimal au sens de la minimisation de la variance d’erreur entre la variable réelle et son estimation. Le filtre de Kalman (approche temporelle) est une généralisation du filtre de Wiener (approche fréquentielle) dans le cas d’un système non stationnaire multivariable. Celui-ci permet d’appréhender le problème générale de l’estimation d’un état de dimension finie d’un processus discret (ou d’un processus continu mesurable de manière discrète) dans le cas où l’équation d’état (6.10) et l’équation de mesure (6.11) sont linéaires par rapport à leurs variables. L’estimateur est gouverné par les équations d’état : xj = Aj xj−1 + Bj uj + vj (6.12) zj = Cj xj + wj Les bruits vj et wj sont supposés être statistiquement indépendants entre eux. Nous faisons l’hypothèse qu’ils sont blancs et qu’ils suivent une distribution normale. p(v) ∽ N (0, Q) p(w) ∽ N (0, R) (6.13) où Q et R sont respectivement les matrices de covariance du bruit d’état et de mesure. Dans (6.12), la matrice de transition d’état Aj de taille nx × nx établit le lien entre l’état du système à l’instant précédent j − 1 et l’état à l’instant courant j. La matrice de mesure Cj de taille nx × nz relie l’information mesurable à l’état du système. Enfin, uj est un signal de commande déterministe. Dans notre cas, le système n’étant pas influencé par une commande extérieure, nous prendrons B = 0. 116 CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT Les notations qui seront utilisées par la suite sont les suivantes : – x̂j/j−1 représente la prédiction de l’état à l’instant j connaissant les mesures jusqu’à l’instant j − 1 – x̂j/j représente l’estimation de l’état à l’instant j connaissant les mesures jusqu’à l’instant j – x̃j/j = x̂j/j − x̂j/j−1 représente l’erreur d’estimation à l’instant j L’algorithme de l’estimateur d’état de Kalman, résumé dansi Algorithme 2, minimise h l’erreur quadratique sur l’état du système (i.e. E x̃j/j · x̃Tj/j , voir l’Annexe C). La prédiction du vecteur d’état x̂j/j−1 à l’instant j s’obtient en projetant son estimation x̂j−1/j−1 obtenue à l’instant j −1. La prédiction de la mesure ẑj/j−1 est également obtenue par projection. La différence entre cette prédiction et la mesure effective courante zj s’appelle l’innovation car elle représente l’apport d’information, la partie non prédictible de la mesure. On la note z̃j/j = zj − ẑj/j−1 . Cette nouvelle mesure, pondérée par le gain de Kalman Kj , est ajoutée à la prédiction x̂j/j−1 afin d’obtenir l’estimation filtrée de l’état x̂j/j à l’instant j. Algorithme 2 Algorithme d’estimateur d’état de Kalman tel qu’il est décrit dans [Welch and Bishop, 2004] Initialisation de Q et de R Initialisation de x0 Initialisation de P0 Tant Que Critère d’arrêt = faux Faire uj ← LoadInput() ( = 0 dans notre cas ) /* Lecture de l’entrée courante */ x̂j/j−1 = Aj · x̂j−1/j−1 /* Prédiction de l’état courant */ Pj/j−1 = Aj · Pj−1/j−1 · Aj T + Q /* Prédiction de l’erreur d’état*/ Kj = Pj/j−1 · Cj · (Cj · Pj/j−1 · Cj T + Rj )−1 /* Mise à jour du gain de Kalman*/ ẑj/j−1 = Cj x̂j/j−1 /* Prédiction de la mesure courante */ zj ← LoadMeasure() x̂j = x̂j/j−1 + Kj · (zj − ẑj/j−1 ) /* Estimation de l’état courant */ Pj/j = (I − Kj · Cj ) · Pj/j−1 /* Mise à jour de l’erreur d’état*/ Réévaluation du critère d’arrêt Fin Tant Que 6.4 Application à l’estimation de mouvement dans une séquence d’images Cette section constitue le cœur de notre contribution dans ce chapitre. Nous y décrivons la modélisation que nous proposons dans le cadre du recalage d’images. Dans la section 6.4.1, nous commençons par la mise en place d’un modèle de mouvement spatiotemporel qui prend en compte à la fois la non-rigidité et la périodicité des phénomènes associés aux structures que nous voulons suivre au cours du temps. Ce modèle repose sur la formulation FFD et sur la trajectoire décrite par chacun des points de contrôle. La 6.4. APPLICATION À L’ESTIMATION DE MOUVEMENT DANS UNE SÉQUENCE D’IMAGES117 non-rigidité est donc assurée par la non-linéarité de la transformation utilisée tandis que la périodicité est intrinsèque à une décomposition harmonique des trajectoires. Afin de clarifier les différentes étapes de la méthode que nous proposons, une vue d’ensemble de celle-ci est résumée dans l’Algorithme 3. L’estimation spatio-temporelle du mouvement est toujours réalisée dans un contexte multiéchelle et multirésolution. Plus précisément, un filtrage de Kalman est réalisé pour chaque niveau des pyramides de transformations et d’images PT rans et PIm . La projection des paramètres spatio-temporels d’une échelle à l’échelle suivante sera décrite à la section 6.4.6. A chaque niveau d’échelle, les paramètres du modèle de transformation sont utilisés pour la construction du vecteur d’état (section 6.4.2). Le filtrage de ces paramètres est réalisé par une succession de prédictions et de mesures (section 6.4.3) où les différents instants de la séquence d’images analysée sont considérés séquentiellement mais contribuent à l’estimation du mouvement sur l’ensemble de la séquence. Ainsi, toujours pour un niveau d’échelle particulier, chaque itération de Kalman propose une initialisation pour le recalage entre l’image de référence I0 d’une séquence (par exemple l’instant télé-diastolique dans le cas du cœur) et l’image Ij dont l’estimation finale constitue la mesure de Kalman et donc l’apport d’information recherché. Cette opération est réalisée jusqu’à convergence du filtre de Kalman. Le passage à une échelle ou une résolution supérieure peut alors être enclenchée. De manière à ne pas surcharger les temps de calcul, une prise en compte partielle de l’espace d’analyse est considérée lors du calcul du terme d’appariement entre l’image I0 et l’image Ij . Préalablement au processus d’estimation, un prétraitement des données (6.4.9) permet de détecter les régions susceptibles d’être concernées par le mouvement à estimer. 6.4.1 Modèle spatio-temporel de mouvement Le modèle que nous décrivons est inspiré de [Oumsis et al., 2003]. Nous proposons de considérer les trajectoires périodiques que peuvent suivre les points de contrôle (PDC) qui pilotent la déformation (voir section 4.3.2). Dans un certain sens, cela revient à utiliser des fonctions de contrôle et non plus de simples points dans la formulation FFD. Dans un cadre Lagrangien de la description du mouvement (Eq. 6.3), la déformation spatiotemporelle est définie par : X u(x0 , t) = ξ k (t)β k (x0 ) (6.14) k∈Kinf Cette expression est un modèle continu de mouvement pour tout point x de l’espace et tout instant t. Chaque ξ k (t) est un vecteur de fonctions de dimension d. Pour un espace géométrique à deux dimensions, nous avons : ξ k (t) = [ξx;k (t) ξy;k (t)]T . (6.15) Chaque composante du vecteur représente une fonction F -périodique, continue décomposable en séries de Fourier. La décomposition Sξk de la trajectoire ξ k du PDC Pk est donnée par : Sξk (t) = a0k + N X n=1 [ank cos(nωt) + bnk sin(nωt)] . (6.16) 118 CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT Algorithme 3 Algorithme de prédiction/estimation pour l’estimation spatio-temporelle de mouvement dans une séquence d’images B UT: Estimer les paramètres de la transformation spatio-temporelle E NTRÉES : {I} (séquence d’images à analyser) TImg : taille de la pyramide d’images TT rans : taille de la pyramide de transformations NM axKalmanIteration : Nombre maximum d’itérations pour le filtre de Kalman D ÉBUT DE L’ ALGORITHME : Calcul de la pyramide d’image PImg pour chaque image de la séquence TT ot ← TIm + TT rans − 1 ni ← 0 /* niveau courant dans la pyramide d’images */ nt ← 0 /* niveau courant dans la pyramide de transformations */ ng ← 0 /* niveau courant global */ Tant Que ng < TT ot Faire Initialisation du filtre de Kalman Tant Que KalmanIteration < NM axKalmanIteration Faire Prédiction Initialisation des paramètres pour l’estimation de mouvement courante (recalage) Mesure Filtrage KalmanIteration = KalmanIteration + 1 Fin Tant Que Si Mettre à jour le niveau de transformation Alors projection des paramètres nt ← nt + 1 ng ← ng + 1 Sinon ni ← ni + 1 ng ← ng + 1 Fin Si Fin Tant Que 6.4. APPLICATION À L’ESTIMATION DE MOUVEMENT DANS UNE SÉQUENCE D’IMAGES119 où ω = 2πF . Cette formulation décrit de manière simple la trajectoire périodique d’un PDC avec un ensemble fini de paramètres. La complexité de la trajectoire augmente avec le nombre de coefficients. Ces coefficients sont représentatifs du poids accordé aux différentes fréquences servant à décrire la trajectoire. Si l’ordre N de la décomposition est faible (ie N=1) alors la trajectoire aura l’allure d’une ellipse et sera donc fortement lissée temporellement. Soit M le nombre total de PDC par dimension, le nombre total de coefficients pour décrire la transformation est (2N + 1) × d × M d . A titre comparatif, pour les extensions naturelles des algorithmes de déformations de formes libres en 4 dimensions (grille 4D, voir section 3.4), on obtient (d + 1) × M d+1 paramètres. Pour d = 3, N = 3 et M = 11, configuration typique, notre modèle nécessite 14641 paramètres contre 58564 pour les grilles 4D. 6.4.2 Vecteur d’état Nous définissons le vecteur d’état x à partir des paramètres du modèle spatio-temporel décrit dans la section précédente. Pour cela nous considérons, en 2D, le sous-vecteur suivant : T 1 N 0 N 1 N (2N +1)·d b . . . b U k = a0x;k . . . aN | a . . . a b . . . b x;k x;k x;k y;k y;k y;k ∈ R | {z } | y;k {z } ΘN ΘN x;k y;k (6.17) contenant l’ensemble des paramètres relatifs à la trajectoire du PDC Pk sur Rd . La trajectoire d’ordre N de Pk suivant l’axe x (resp y) est décrite par le vecteur de paramètres N ΘN x;k (resp Θy;k ). Le vecteur d’état x = [U 0 U 1 . . . U K ]T ∈ R(2N +1)·d·M d (6.18) est la concaténation de l’ensemble des sous-vecteurs U k . Il représente l’état global de notre système. Nous rappelons en effet que la description continue du mouvement sur l’ensemble de la séquence est totalement définie par la trajectoire empruntée par les PDC qui pilotent la déformation. Ces trajectoires sont elle mêmes totalement décrites par les coefficients de leur décomposition en séries de Fourier. 6.4.3 Filtrage de l’état sur l’ensemble de la séquence Avant de décrire les trois étapes essentielles de l’estimateur de Kalman, nous proposons un récapitulatif des différents vecteurs et matrices mis en jeux : – Le vecteur d’état x ∈ R(2N +1)·d·M paramètres de la transformation. d décrit par l’equation (6.18) contient les 120 CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT d d – La matrice A ∈ R((2N +1)·d·M )×((2N +1)·d·M ) = I. Cela signifie qu’il s’agit d’une matrice de projection. L’état prédit correspond à l’état estimé à l’instant précédent. – Le commande u = 0 ainsi que la matrice de commande B = 0. d – La mesure z ∈ Rd·M correspond à la position estimée des PDC à un instant donné dans la séquence. d d – La matrice de mesure C ∈ R(d·M )×((2N +1)·d·M ) fait le lien entre l’état du système et la position particulière des PDC à un instant donné. Les valeurs des éléments de cette matrice sont calculées à partir de l’équation (6.16). L’initialisation des matrices a été fixée de manière expérimentale. Tout d’abord, nous posons l’état initial x̂0 = 0, ce qui signifie qu’au début de l’estimation, ∀x ∈ Ω, ∀t ∈ R, ϕ(x, t) = x. Nous avons fixé les deux matrices de covariance associées au bruit d’état v et au bruit de mesure w à Q = I · 10−3 et R = I · 10−3 , respectivement. En comparant ces valeurs à celles de l’état ou de la mesure qui sont de l’ordre de quelques millimètres, ceci traduit la bonne confiance que nous accordons à l’état du système à chaque instant et à la mesure apportée. La matrice de la covariance de l’erreur d’estimation est également initialisée à P̂0 = I · 10−3 L’étape de prédiction Comme nous l’avons vu précédemment, dans notre cas, cette étape n’est qu’une retranscription de l’état estimé à l’instant précédent j − 1 dans le sens où l’ensemble des paramètres qu’il représente décrit le mouvement des organes étudiés sur l’ensemble de la séquence. Le vecteur d’état que nous proposons représente un processus stationnaire. Le vecteur d’état estimé à l’instant j à la même signification physique qu’à l’instant précédent j − 1. Le filtrage de Kalman assure la convergence et donc le régime transitoire de l’estimation sur l’ensemble de la séquence. Si le vecteur d’état représente un processus stationnaire, il n’en est pas de même du vecteur z de mesure dont la prédiction dépend de l’instant considéré dans la séquence. Ceci justifie donc l’utilisation du filtre de Kalman. Afin de ne pas trop alourdir les notations, nous ne considérons que la prédiction du vecteur de mesure pour le point Pk . Notons zk la restriction du vecteur de mesure z au PDC k et considérons le vecteur U k défini par (6.17) et la décomposition (6.16). En 2D, nous avons la relation suivante : N N Prj 0 Θx;k ξx;k (t) = zk j/j−1 = ξ k (tj ) = · N N ξy;k (t) Θy;k 0 Prj j/j−1 (6.19) ∈R représente la matrice de projection qui fait le lien entre une coordonnée d’un PDC et les coefficients de Fourier relatifs à cette trajectoire. Cette matrice PrN j 1×(2N +1) 6.4. APPLICATION À L’ESTIMATION DE MOUVEMENT DANS UNE SÉQUENCE D’IMAGES121 est entièrement décrite par : PrN j = 1 cos(wtj ) cos(2wtj ) · · · cos(N wtj ) sin(wtj ) · · · sin(N wtj ) (6.20) j PrN j dépend donc bien de l’instant considéré j. Finalement, l’étape de prédiction mobilise deux matrices : la matrice d’état I A= 2N +1 0 ··· 0 I2N +1 · · · 0 0 .. . .. . ... .. . 0 0 · · · I2N +1 (6.21) où I2N +1 est la matrice identité de taille (2N + 1) × (2N + 1) qui permet de calculer la prédiction de l’état x̂j/j−1 et la matrice de mesure PrN j 0 Cj = .. . 0 0 ··· PrN j ··· .. . ... 0 ··· 0 0 .. . N Prj (6.22) j qui nous permet d’obtenir une prédiction de la mesure ẑj/j−1 à l’instant j. L’étape de mesure L’opération ẑj/j−1 = Cj x̂j/j−1 nous permet d’obtenir une initialisation de l’algorithme de recalage. L’étape de mesure consiste à résoudre le problème suivant : ξ(tj ) = arg min p J (It0 , Itj , ξ(tj )). (6.23) ξ(tj )∈R où p = d · M d est la dimension du vecteur de paramètre ξ à l’instant j. Une fois le recalage effectué entre les image It0 et Itj , la mesure est introduite dans le filtre de Kalman. La différence entre cette mesure ξ(tj ) = zj et la prédiction ẑj/j−1 représente l’innovation à l’instant j. Elle correspond à l’apport d’information fourni par le recalage à l’instant j pour l’ensemble du modèle spatio-temporel. L’étape de filtrage L’opération de filtrage consiste à mettre à jour : – le gain de Kalman, Kj = Pj/j−1 · Cj · (Cj · Pj/j−1 · Cj T + R)−1 – l’estimation de l’état, x̂j = x̂j/j−1 + Kj · (zk − ẑj/j−1 ) (voir annexe C) 122 CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT 6.4.4 Critère d’arrêt Le filtrage de Kalman est interrompu lorsque le nombre d’itérations dépasse une valeur NM axKalmanIteration fixée par l’utilisateur. En règle générale, nous observons une convergence en un peu plus de 2 périodes (cardiaques). Nous choisissons NM axKalmanIteration = 3(J + 1). 6.4.5 Contrainte de passage à l’origine Lors de nos premières expérimentations, nous avons observé une dérive des trajectoires estimées. Nous avons donc ajouté une contrainte supplémentaire à la périodicité des trajectoires. Nous avons imposé aux PDC de revenir à leur position initiale pour t = 0 mod (F ). Ainsi nous imposons que, pour cette instant, ϕt0 = Id. En partant mod F de (6.16), ceci se traduit pour chaque PDC par l’équation suivante : ξ k (t = 0) = a0k + N X ank = 0 n=1 =⇒ N X ank = 0 (6.24) n=0 L’équation (6.16) devient, Sξk (t) = a0k + N −1 X n=1 ank cos(nωt) − N −1 X n=0 ! ank cos(N ωt) + N X bnk sin(nωt). (6.25) n=1 Cette opération a pour but de réduire de d degrés la liberté de chacune des trajectoires. Le vecteur d’état (6.17) est alors réécrit en supprimant les derniers coefficients aN x;k et N ay;k : T N −1 1 −1 1 0 by;k . . . bN bx;k . . . bN U k = a0x;k . . . aN ∈ R(2N −1)·d y;k x;k | ay;k . . . ay;k x;k (6.26) La matrice A est dorénavant composée de matrices identité de taille (2N −1)×(2N − 1). Finalement, cette contrainte de passage par zéro est traduite au sein de la matrice de mesure en modifiant les sous-matrices de projection PrN j , ainsi : PrN j = [1 − cos(N wtj ) cos(wtj ) − cos(N wtj ) cos(2wtj ) − cos(N wtj ) · · · cos((N − 1)wtj ) − cos(N wtj ) sin(wtj ) · · · sin(N wtj )]j (6.27) 6.4.6 Approche Multiéchelle La projection permettant le passage d’une échelle l à une échelle l + 1 est proche de celle décrite dans le chapitre 4. Cependant, au lieu de considérer les paramètres ξ, nous projetons l’état de notre système. (6.28) xl+1 = ↑2 xl ∗ H 6.4. APPLICATION À L’ESTIMATION DE MOUVEMENT DANS UNE SÉQUENCE D’IMAGES123 ↑2 est l’opérateur de sur-échantillonnage qui consiste à intercaler des zéros entre chaque paramètre au niveau l. Les coefficients du filtre miroir H dépendent de la fonction d’interpolation utilisée pour construire la base de notre espace de transformation. 1 1 1 1 pour r = 1, H = √ 2 2 2 1 1 1 3 1 1 H = √ pour r = 3. 2 8 2 4 2 8 6.4.7 Trajectoires de complexité adaptative Le nombre N de paramètres augmente de façon exponentielle avec le nombre de PDC et le nombre de coefficients pour décrire chaque trajectoire. Pour décrire précisément les trajectoires dans des régions animées d’une amplitude et d’une complexité de mouvement importante, nous utilisons la valeur N = 7 soit 15 paramètres en deux dimensions par PDC dans la grille de déformation. Le modèle proposé dans la section 6.4.1 implique que le nombre de paramètres est le même pour toutes les trajectoires malgré le fait que certains PDC bougeant peu ne nécessitent pas une telle description. C’est le cas notamment des PDC dont l’influence ne s’étend que sur des régions de l’image considérée comme du fond. Une solution à ce problème consiste à adapter la complexité des trajectoires en fonction de la zone d’influence que représente un PDC. De plus, la taille des matrices A et C peut être généralement ajustée dynamiquement dans les librairies spécialisées d’algèbre linéaire. En reprenant la notation de l’équation (6.22), nous nous mettons dans la situation où pour un instant donnée j les différentes trajectoires sont décrites par un nombre de coefficients différent : Cj = Pr2j 0 ··· 0 0 Pr5j ··· 0 .. . .. . ... .. . 0 0 ··· Pr3j (6.29) j Nous proposons de faire varier automatiquement l’ordre N pour chaque trajectoire après l’estimation des différents paramètres obtenus sur l’ensemble d’un cycle de la séquence. Considérons chaque vecteur ΘN x;k ; la formule de Parseval nous renseigne sur la puissance moyenne véhiculée par les trajectoires suivant chaque composante (par exemple pour x) : Px;k N 0 2 1 X 2 2 = ax;k + (anx;k + anx;k ) 2 n=1 où N représente l’ordre du modèle harmonique de la trajectoire. (6.30) 124 CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT Chaque puissance observée est normalisée suivant la puissance maximum obtenue : Pnormx;k = Px;k / max(Px;k |k ∈ K). En faisant l’hypothèse qu’une forte puissance moyenne traduit une forte amplitude de mouvement, il est possible de représenter une cartographie des puissance mises en jeux lors de la déformation. Le choix d’un critère de décision pertinent permettant de déterminer les trajectoires nécessitant davantage de paramètres est actuellement à l’étude. Pour l’instant, un simple seuillage est envisagé. 6.4.8 Remarques complémentaires Pour finir ce chapitre, il me semble important d’insister sur deux points : 1. Tout d’abord un certain nombre de matrices peut être précalculé. C’est le cas notamment de l’ensemble des matrices Cj pour j = 1 · · · J, dont les éléments ne dépendent que du nombre d’images dans la séquence. 2. L’absence de corrélation entre les PDC dans le formalisme d’état peut surprendre et on peut se demander l’intérêt d’avoir un état sur l’ensemble des PDC plutôt que d’avoir un état et donc un filtre de Kalman par PDC. Cette modélisation donne un cadre général où, par la suite, d’autres contraintes spatio-temporelles pourront être ajoutées. Dans le cadre expérimental de cette méthode, nous n’avons pas voulu séparer les différents filtres de manière à pouvoir intégrer les prochaines contributions. Je tiens à insister cependant sur le fait que les temps de calculs n’en souffrent pas du fait de l’utilisation de librairies adaptées à la manipulation de matrices creuses (VXL/VNL).3 6.4.9 Prétraitement des données Le but de ce paragraphe est d’étendre la réduction de l’espace d’analyse que nous avons décrite à la section 4.4.2.2 à la dimension temporelle. Pour rappel, le préfiltrage proposé D2 est basé sur le filtre proposé dans [Liu et al., 1992]. Nous proposons d’adapter ce filtre à l’ensemble d’une séquence temporelle grâce à ses propriétés de séparabilité. Pour illustrer le résultat de ce filtrage, nous avons "empilé" un ensemble de coupes 2D pour obtenir une image tridimensionnelle (Figure 6.3). Sur la partie haute de cette figure, une coupe de ce volume 2D+temps suivant l’axe temporel a été représentée. Nous avons appliqué le filtre D2 sur 3 profils (a), (b) et (c). Les profils (a) et (b) correspondent à la variation de l’intensité d’un point géométrique pour lequel on est sensé détecter du mouvement durant le traitement de la séquence. Le profil (c) correspond lui à une région dont le signal varie peu car il correspond à une zone de l’image peu soumise à mouvement. Les échelles sont les même pour les trois courbes et on remarque la nette différence du signal de sortie selon les différents profils. Un prétraitement des données consiste à appliquer ce type de filtre sur l’ensemble de l’image 2D+temps. On s’attend à obtenir un a priori des régions de l’image qu’il faudra prendre en compte pour estimer correctement le mouvement dans une séquence donnée. Nous avons envisagé deux filtres différents (voir figure 6.4). Le premier ne tient pas compte de la différence physique entre l’espace et le temps. Il considère l’image 2D+t comme une image 3D. Les masques de convolution du filtre de prétraitement sont 3 http ://paine.wiau.man.ac.uk/pub/doc_vxl/core/vnl/html/index.html 6.4. APPLICATION À L’ESTIMATION DE MOUVEMENT DANS UNE SÉQUENCE D’IMAGES125 600 Intensite Reponse du Filtre de Liu 500 400 300 200 100 0 0 5 10 15 20 25 a) 600 Intensite Reponse du Filtre de Liu 500 400 300 200 100 0 0 5 10 15 20 25 b) 600 Intensite Reponse du Filtre de Liu 500 400 300 200 100 0 0 5 10 15 20 25 c) F IG . 6.3. Illustration de l’intérêt du filtrage sur l’empilement d’une série d’images 2D. Sur la figure du haut, nous avons représenté une coupe du volume 2D+temps suivant l’axe temporel. Pour chacun des trois profils sélectionnés (a),(b),(c), nous avons appliqué le filtre D2 . Les graphes montrent la superposition du profil et de la réponse du filtre sur les signaux 1D ainsi obtenus. 126 CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT isotropes. Le second filtre utilise les propriétés de séparabilité de ce filtre pour distinguer l’espace et le temps. Le filtre est alors anisotrope est seul l’axe temporel est considéré pour détecter les variations d’intensité. Finalement, une opération de seuillage et de ’réduction de dimension’ est réalisée afin d’obtenir un masque binaire 2D à partir du volume obtenu. Nous notons If ilt ∈ Rd+1 l’image filtrée par le filtre isotrope ou le filtre anisotrope. Soit j = 0..J où j ∈ N représente l’indice temporel associé à la j ieme image de la séquence et soit i l’indice associé au iieme pixel d’une image, on définit l’opérateur Dmask comme étant la succession d’un opérateur de filtrage Dseuil et d’un opérateur de réduction Dred : D D red Dmask : If ilt −−seuil → Imask −→ Ibin −− | {z } |{z} |{z} Rd+1 Rd+1 Rd 1. Dseuil : ∀(xi , tj ) ∈ N2 × N , Ibin (xi , tj ) = 1 si If ilt (xi , tj ) > 0.1 × M ax(If ilt ) (seuillage à 10 % de l’intensité maximale de l’image filtrée). 2. Dred : ∀(xi ) ∈ N2 , Imask (xi ) = Ibin (xi , t0 ) OU Ibin (xi , t1 ) OU · · · OU Ibin (xi , tJ ) OU représente l’opération de ’ou’ logique. Le résultat de ce prétraitement est illustré sur la Figure 6.4. Deux masques binaires sont calculés pour une séquence d’images par RM 2D. Le masque obtenu par filtrage isotrope est représenté en Figure 6.4(b) et le masque obtenu par filtrage anisotrope en 6.4(c). On constate que le filtrage isotrope est sensible à la fois aux gradients temporels et aux gradients spatiaux de la séquence. Dans la suite, nous ne considérerons que le masque isotrope car même si tous les pixels sélectionnés ne correspondent pas nécessairement à une information présumée de mouvement, ils ont l’avantage d’offrir des points d’accroche supplémentaires pour guider l’estimation de mouvement. Ainsi, seuls les pixels de ce masque seront utilisés pour le calcul du terme d’appariement entre deux images. F IG . 6.4. Construction d’un masque binaire à partir d’une séquence en petit axe d’images par RM 2D (a). Masque binaire obtenu à partir d’un filtre isotrope (b) et d’un filtre anisotrope (c). 6.5. CONCLUSION 127 6.5 Conclusion Dans ce chapitre nous avons présenté un algorithme d’estimation spatio-temporelle de mouvement. Dans un premier temps, nous avons décrit le modèle spatio-temporel que nous proposons pour représenter la déformation de manière continue sur l’ensemble de l’espace 2D+temps ou 3D+temps selon les séquences considérées. Nous proposons d’estimer l’ensemble des paramètres grâce à un estimateur de Kalman qui permet de prédire et de corriger la position des PDC de l’algorithme de recalage entre deux images. Au delà de cette notion de prédiction et de correction, l’une des propriétés importantes de l’algorithme proposé est que l’estimation spatio-temporelle finale repose sur la contribution de tous les instants de la séquence. Ainsi les prédictions obtenues à chaque itération du filtre de Kalman apparaissent comme le résultat de la prise en compte de l’ensemble des estimations antérieures. Le modèle d’état que nous proposons repose sur des hypothèses globales sur le mouvement des phénomènes étudiés (continuité et périodicité). Une contrainte supplémentaire a été utilisée pour contraindre davantage le modèle et obliger les PDC à passer par leur position initiale lorsque t = 0 (modulo la période). Le contexte d’estimation que nous introduisons laisse place à de nombreuses perspectives dont je parlerai plus en détail dans le dernier chapitre de cette thèse. En particulier, il permet de gérer les relations entre les PDC au sein même de la matrice d’état et de proposer des régularisations spatio-temporelles plus adaptées et plus localisées. Pour finir, les trajectoires adaptatives que nous avons décrites dans la section 6.4.7 de ce chapitre vont permettre d’augmenter graduellement la complexité des trajectoires et de focaliser plus précisément sur les endroits qui le nécessitent sans considérer des paramètres peu représentatifs aux endroits qui ne le demandent pas (gain notable d’espace mémoire). Une évaluation de l’algorithme sera proposée dans la section 8.2 du chapitre 8. 128 CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT Troisième partie Evaluation 129 Chapitre 7 Méthodologie d’évaluation Sommaire 7.1 7.2 7.3 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Brève revue des méthodes d’évaluation . . . . . . . . . . . . . . . . 7.2.1 Références synthétiques . . . . . . . . . . . . . . . . . . . . . 7.2.2 Détermination d’un bronze standard . . . . . . . . . . . . . . . 7.2.3 Qualité de la transformation . . . . . . . . . . . . . . . . . . . Méthodes d’évaluation utilisées dans cet ouvrage . . . . . . . . . . . 7.3.1 Evaluation du mouvement . . . . . . . . . . . . . . . . . . . . 7.3.2 Evaluation dans une séquence d’images . . . . . . . . . . . . . 7.3.3 Evaluation du suivi de mouvement par recalage spatio-temporel 131 132 132 133 134 135 136 137 138 7.1 Introduction ujourd’hui, le clinicien dispose d’un large ensemble de techniques d’imagerie médicale devenues incontournables dans les démarches diagnostiques et thérapeutiques. Ces diverses modalités d’imagerie fournissent des images de plus en plus précises de nature anatomique et fonctionnelle. En parallèle de ces avancées technologiques, émerge un grand nombre d’outils de traitements d’images qui restent très souvent dans le domaine de la recherche. Leur transfert vers les systèmes industriels nécessite une étape importante d’évaluation. Une ’validation clinique’ est requise, en particulier, dans la démarche d’accréditation des techniques pour une utilisation en routine clinique. L’évaluation des méthodes de traitement d’images médicales reste un problème ouvert. L’absence de référence ou de "vérité terrain" constitue un véritable frein pour la comparaison de celles-ci. En particulier, pour l’évaluation de méthodes de recalage nonrigides, il est toujours délicat pour les experts de déterminer si une méthode donne de meilleurs résultats qu’une autre. La qualité d’une solution est en définitive directement dépendante de l’application visée [Crum et al., 2003]. Dans le cadre de la mise en correspondance d’images, la nature du recalage (mono-modalité ou multi-modalités, intra ou inter-patients, rigide en non-rigide) doit être prise en compte. Mais l’objectif spécifique du recalage a son importance pour la définition des critères de qualité. Dans le A 131 132 CHAPITRE 7. MÉTHODOLOGIE D’ÉVALUATION cadre de sa thèse [Pauna, 2004], N. Pauna s’appuie sur les études de [Pennec, 1996, Jannin et al., 2002] pour proposer une stratégie d’évaluation de méthodes de recalage rigide multi-modalités (IRM et TEP) en imagerie cardiaque. Cette stratégie repose sur une référence numérique réaliste. Il s’agit d’une première proposition qui ne remplit pas encore toutes les contraintes que devraient respecter les références requises pour une évaluation rigoureuse [Pauna, 2004]. Pour le recalage non-rigide, il faut pouvoir évaluer la transformation estimée avec encore plus de finesse. D’une façon générale, on peut distinguer les méthodes d’évaluation à partir de référence synthétique et les méthodes d’évaluation sur données réelles qui font généralement appel à des experts (médecins). Dans ce chapitre, nous présentons une classification des méthodes d’évaluation d’algorithmes de recalage d’images. Puis, nous détaillerons les méthodes que nous avons utilisées dans le cadre de ce mémoire. Celles-ci portent, d’une part sur la génération d’images et de séquences de synthèse puis, d’autres part, sur la proposition de métriques d’évaluation de méthodes d’estimation de mouvement non-rigide dans des séquences d’images. 7.2 Brève revue des méthodes d’évaluation Nous proposons ici une classification de ce qui est généralement utilisé dans la communauté du recalage d’images pour évaluer les performances des algorithmes selon l’information disponible. Nous retrouvons tout d’abord les évaluations établies à partir de références synthétiques où la déformation est parfaitement contrôlée. Une référence peut être établie à partir d’informations supplémentaires issues d’un protocole ou d’experts. Finalement, lorsqu’aucune information n’est disponible, la qualité de recalage peut être appréhendée de manière visuelle (essentiellement pour le recalage rigide) à partir de critères quantitatifs basés uniquement sur l’intensité dans les images ou à partir des propriétés des transformations obtenues (dans le cas de recalage non-rigide). 7.2.1 Références synthétiques La méthode la plus intuitive pour évaluer les algorithmes développés consiste à créer soit même des références en imposant des champs synthétiques sur des données réelles. Il est ainsi possible des générer des transformations possédant les propriétés désirées et de bruiter les images obtenues pour tester la robustesse au bruit des algorithmes. Il est possible d’évaluer la convergence des algorithmes et leur rapidité face à des références entièrement numérique. Bien sûr, cette démarche n’est qu’une étape préalable à la validation des algorithmes puisqu’elle ne garantit pas le bon comportement des algorithmes lorsqu’ils sont confrontés à des situations réelles. Généralement, ce type d’approche permet d’évaluer l’influence des paramètres face à certaines caractéristiques des images en terme de bruit notamment. Dans le cadre de sa thèse [Noblet, 2006], Noblet propose d’utiliser des champs de mouvement synthétiques comme première étape de l’évaluation. En imposant des contraintes de positivité du jacobien de la transformation, l’auteur assure à ces champs synthétiques la propriété de conservation de topologie. L’inconvénient principal des références synthétiques est qu’elles restent loin des situations réalistes qu’on trouve en pratique. Ainsi, dans le cas du recalage d’images, il faut pouvoir garantir la génération de transformations réalistes à appliquer à des images elles 7.2. BRÈVE REVUE DES MÉTHODES D’ÉVALUATION 133 aussi suffisamment réalistes. Les simulateurs d’images dans différentes modalités sont pour certains suffisamment avancés aujourd’hui pour produire des images réalistes. Ainsi, R. Haddad dans le cadre de sa thèse [Haddad et al., 2005b, Haddad et al., 2005a], a développé un modèle anthropomorphique réaliste de cœur battant. L’intégration d’un tel modèle numérique dans des simulateurs d’images par RM [Benoit-Cattin et al., 2005] ou TEP [Reilhac et al., 2005] permet la simulation de séquences d’images réalistes dans lesquelles le mouvement est parfaitement contrôlé et donc utilisable comme référence. 7.2.2 Détermination d’un bronze standard La référence absolue (ou vérité terrain ou gold standard en anglais) n’existe pas dans notre cas. Cependant, il est possible, en général, d’établir une référence non totalement idéale mais qui permet néanmoins d’évaluer les performances dans un contexte de comparaison. Ce type de référence est appelé bronze standard dans la littérature anglo-saxonne (on peut utiliser le terme référence approchée comme suggéré dans [Pauna, 2004]). Différents cas peuvent être envisagés. 7.2.2.1 Références obtenue par analyse d’experts La sélection de points remarquables par un ou plusieurs experts (voir Fig. 7.1) sur l’ensemble des images à étudier permet de quantifier le comportement des algorithmes en des endroits précis. Le fait qu’une faible partie seulement des quelques millions de points recalés ne soit considéré ne permet pas d’avoir un état exhaustif sur les performances du recalage, cependant cette référence constitue un bon indicateur des erreurs commises dans des régions géométriques qui intéressent particulièrement les utilisateurs. A partir d’amers extraits, Hellier a proposé une métrique d’évaluation [Hellier et al., 2003] permettant d’apprécier le comportement des algorithmes de recalage non-rigide dans un contexte de mise en correspondance d’images par RM de cerveau de différents individus. Dans le paragraphe 7.3.2, nous verrons comment nous étendons ce principe pour évaluer le comportement spatio-temporel des algorithmes d’estimation de mouvement par recalage d’images. 7.2.2.2 Références obtenues algorithmiquement Nicolau a proposé la mise en place d’un bronze standard pour évaluer les performances des algorithmes de recalage [Nicolau et al., 2003] . L’idée de base est de contourner l’absence de référence pour l’évaluation en considérant le résultat exacte comme une variable inconnue qu’il s’agit d’estimer. Cette méthode est basée sur l’exploitation d’une grande ressource calculatoire rendue disponible par la mise en place de grilles de calcul. Le recalage de toutes les paires d’images possibles par de nombreux algorithmes disponibles (différent de celui qu’il s’agit d’estimer) est mise à profit pour exploiter une redondance d’information. Les résultats obtenus par la méthode à évaluer sont comparés à la moyenne des résultats obtenus par les autres méthodes qui constitue ainsi une pseudoréférence. La distance à cette référence aléatoire est ensuite interprétée. Cette étude est envisageable dans le cas où la masse de données à traiter est très importante dans l’espoir de biaiser le moins possible les résultats et c’est précisément le but de ce projet. A l’heure actuelle, les transformations considérées sont des transformations rigides ou affines pour CHAPITRE 7. MÉTHODOLOGIE D’ÉVALUATION 134 F IG . 7.1. Exemple de sélection de point 3D par trois experts différents. La moyenne de ces sélections constitue ce que l’on appelle une pseudo-référence. Dans ce cas particulier, les trois positions sont situées sur la même coupe ce qui n’est évidemment pas toujours le cas. lesquelles il est possible de comparer les paramètres obtenus. Dans le cas de transformations non-rigides, la signification des paramètres dépend du modèle de transformation utilisé ce qui rend difficile les comparaisons à moins d’être en mesure de comparer directement les champs de déformations. 7.2.3 Qualité de la transformation 7.2.3.1 Inspection visuelle L’inspection visuelle est sans doute le premier critère utilisé pour évaluer la qualité d’une méthode de recalage car elle permet à l’utilisateur de vérifier de manière très simple le bon comportement des algorithmes. Pour des applications de mise en correspondance d’images anatomiques et fonctionnelles, des erreurs concernant la transformation rigide estimées de l’ordre de la résolution de l’image peuvent être détectées [Fitzpatrick et al., 1998]. Il est alors possible de laisser à l’expert médical le soin de juger et de comparer différents algorithmes. Quoiqu’il en soit, cette évaluation purement qualitative est d’autant plus difficile à interpréter dans le cadre du recalage non-rigide. 7.2.3.2 Propriétés de la déformation L’utilisation d’opérateur qui évaluent la cohérence de la transformation a été proposée. Ces opérateurs peuvent renseigner sur la non-réversibilité des transformations. C’est le cas notamment pour l’identification des valeurs négatives du jacobien de la transformation [Hellier et al., 2003]. Une cartographie peut être établie sur l’ensemble de l’espace de transformation afin de repérer précisément les zones présentant des anomalies. Dans [Rey et al., 2002], l’utilisation d’un tel opérateur permet de détecter automatiquement des régions où il y a une variation locale forte de volume et ainsi détecter des tu- 7.3. MÉTHODES D’ÉVALUATION UTILISÉES DANS CET OUVRAGE 135 meurs ou des lésions évolutives. L’étude de la consistance des champs est également un critère pour évaluer les transformations non-rigides. Dans [Pennec et al., 1998, Jannin et al., 2002, Boldea et al., 2005], les transformations estimées sont analysées en vérifiant la symétrie et la transitivité des transformations obtenues. Pour cela, il s’agit de vérifier que la transformation ϕ1→2 obtenue par recalage de l’image 1 sur 2 et ϕ2→1 obtenue par recalage de l’image 2 sur 1 sont bien l’inverse l’une de l’autre. On peut également comparer les transformations ϕ1→2 ◦ ϕ2→1 et ϕ2→1 ◦ ϕ1→2 avec l’application Identité. La notion de transitivité est vérifiée en comparant les ϕ2→3 ◦ ϕ1→2 avec ϕ1→3 . Cette notion de transitivité est également reprise dans [Wierzbicki et al., 2004] où l’auteur propose de comparer une image de référence (Iref ) avec l’image résultant de l’application successive des transformations estimées sur l’ensemble d’une séquence de n images (Iref − ϕn−1→n ◦ · · · ◦ ϕ3→4 ◦ ϕ2→3 ◦ ϕ1→2 (Iref )). 7.2.3.3 Transport d’atlas Lorsque l’on dispose d’une segmentation associée à l’image de référence, il est possible d’évaluer la segmentation obtenue par recalage d’une image flottante sur cette image de référence. On dit alors que l’on transporte la carte de segmentation. La segmentation de l’image recalée permet ainsi de quantifier les performances de l’algorithme proposé. Cette méthode nécessite cependant une segmentation initiale et est donc dépendante de la précision de cette segmentation. 7.3 Méthodes d’évaluation utilisées dans cet ouvrage Cette section est consacrée à la définition des procédures et critères que nous allons utiliser pour évaluer les méthodes proposées dans ce manuscrit. 1. Nous générerons des champs synthétiques (7.3.1) et proposons des métriques d’évaluation (7.3.1) pour tester l’algorithme de recalage d’images décrit au chapitre 4. On étudiera ainsi, dans le chapitre 8, l’influence des paramètres qu’il convient de fixer pour la suite des expérimentations. 2. La procédure d’évaluation est proposée au paragraphe 7.3.2 dans le but de définir une stratégie pour évaluer les performances d’algorithmes d’estimation de mouvement face au problème du suivi de tumeurs dans des séquences d’images thoraciques TDM. Les résultats relatifs à cette méthode font l’objet du chapitre 9. 3. L’évaluation du modèle spatio-temporel développé au chapitre 6 portera à la fois sur des séquences synthétiques dont la construction est décrite au paragraphe 7.3.3.1 et sur des séquences réelles. CHAPITRE 7. MÉTHODOLOGIE D’ÉVALUATION 136 QE uest utheo AE F IG . 7.2. Mesure d’erreur quadratique et angulaire entre un vecteur théorique et un vecteur estimé. 7.3.1 Evaluation de l’algorithme d’estimation de mouvement entre 2 images Des outils de la librairie ITK1 permettent de générer une déformation de type plaque mince à partir d’un ensemble de paires de marqueurs. Un ensemble de 20 marqueurs sont aléatoirement choisi sur l’ensemble de l’image. Le déplacement 3D de chacun de ces marqueurs est également choisi aléatoirement dans un intervalle de [−10 ; +10] mm suivant chaque direction. Il en résulte la génération d’une paire d’images dont le déplacement est parfaitement connu, permettant ainsi l’évaluation de certains paramètres de la méthode. Métriques d’erreurs La précision est évaluée en comparant les champs théorique et estimé de mouvement. Nous prenons en compte les notions de distorsion angulaire et d’amplitude entre le champ estimé et le champ théorique en 3D. Ces statistiques sont calculées grâce aux critères suivants : u (x) u (x) theo est AE(x) = arccos · kutheo (x)k kuest (x)k QE(x) = kutheo (x) − uest (x)k (7.1) (7.2) ou utheo (x) (resp. uest (x)) est le vecteur de déplacement théorique (resp. estimé) au point x. Le critère AE intègre l’écart angulaire entre les vecteurs estimés et les vecteurs théoriques sur l’ensemble de l’image ou d’une région d’intérêt (figure 7.2). Le critère QE mesure l’amplitude de la différence des deux ensembles de vecteurs sur l’ensemble de l’image ou d’une région d’intérêt. 1 http ://www.itk.org/ 7.3. MÉTHODES D’ÉVALUATION UTILISÉES DANS CET OUVRAGE 137 7.3.2 Evaluation de l’estimation de mouvement dans une séquence d’images Nous verrons au chapitre 9, qu’il peut s’avérer intéressant d’évaluer les mouvements et les déformations tout en prenant en compte la nature temporelle du mouvement. Pour cela, nous nous appuyons sur la mesure de l’erreur dans le suivi de mouvement de points particuliers. Mesure ponctuelle : T RE La mesure T RE (Target Registration Error) exprime une erreur entre des points correspondants dans le cas d’un recalage entre deux images [Fitzpatrick and West, 2001,Hellier et al., 2003]. Nous proposons son extension à l’estimation du mouvement dans une séquence d’images. La mise en place du cadre d’évaluation est la suivante : un ensemble de K marqueurs anatomiques est sélectionné et étiqueté par un expert médical sur la première image I0 d’une séquence {I0 , I1 , · · · , In } de telle manière qu’ils soient repérables sans ambiguïté par d’autres experts. Notons pk0 la position du k ime marqueur dans l’image I0 . Le suivi des amers sélectionnés est ensuite réalisé par plusieurs experts sans que le pointage de chacun ne soit divulgué de manière à ne pas biaiser les résultats et notamment la variation inter-opérateurs. Le nombre d’experts participant à l’étude sera noté E. On note qe,k le i ime k pointage de l’amer k dans la i image obtenu par l’expert e. La pseudo-référence pi est obtenue par moyennage de ces différents pointages : pki = E 1 X e,k q . E e=1 i (7.3) Une estimation de la variabilité inter-opérateurs est donnée par la formule : E σpki 1 X k 2 (p − qe,k = i ) . E − 1 e=1 i (7.4) Nous définissons également rki = ϕ̂i (pk0 ) comme étant l’estimation (par recalage) de la position de l’amer k à l’instant i (voir Figure 7.3). La mesure T RE pour l’instant i est définie par : T REi = K q 1 X (pki − rki )2 , K k=1 (7.5) Erreur spatio-temporelle : ST E Nous notons Γkref et Γkest la trajectoire de référence de l’amer k et son estimée, respectivement, et nous définissons un critère permettant de quantifier la différence entre ces deux trajectoires sur un intervalle de temps donné [ta ; tb ]. L’erreur spatio-temporelle (ST E) est définie de la manière suivante : ST Etka ,tb 1 = tb − ta Z tb ta dist(Γkref , Γkest )dt où dist représente ici la distance euclidienne. Soit (7.6) CHAPITRE 7. MÉTHODOLOGIE D’ÉVALUATION 138 F IG . 7.3. Description de la trajectoire d’un amer sur une séquence d’images. La contribution en un instant pour cet amer à valeur de la T RE (7.5) est représentée par la distance en noir. ST Etka ,tb 1 = tb − ta Z tb ta k xref (t) − xkest (t)2 dt (7.7) xref (t) est la position du point de référence k à l’instant t et xest (t) son estimée. Nous notons que : – ta = t0 , instant correspondant à l’image I0 (première image de la séquence) – tb = tn , instant correspondant à l’image In (dernière image de la séquence) – Pour t = ti , xkref (t) = xkref (ti ) = pki ainsi que xkest (t) = xkest (ti ) = rki Finalement, en prenant en compte toutes les contributions, nous introduisons ST Eta ,tb K 1 X ST Etka ,tb = K k=1 (7.8) Le chapitre 9 présente la comparaison de plusieurs algorithmes d’estimation de mouvement des structures thoraciques dans un contexte de prise en compte de mouvement en radiothérapie. Nous verrons notamment comment il est possible d’introduire des informations physiologiques supplémentaires comme la courbe de volume pour la détermination ’continue’ des points estimés de l’équation (7.7). 7.3.3 Evaluation du suivi de mouvement par recalage spatiotemporel L’évaluation du suivi de mouvement par recalage spatio-temporel s’appuie sur des séquences d’images de synthèse où la transformation spatio-temporelle est parfaitement 7.3. MÉTHODES D’ÉVALUATION UTILISÉES DANS CET OUVRAGE 139 connue. Nous considérons le cas de l’estimation de mouvement cardiaque dans une séquence d’images par RM 2D et nous nous appuyons sur un modèle analytique de mouvement issu de la littérature. L’intérêt de cette approche est de pouvoir agir à la fois sur les paramètres de la transformation et les caractéristiques de l’image, notamment le bruit. 7.3.3.1 Séquences de synthèse Afin de générer des séquences synthétiques de mouvement cardiaque, nous avons développé un outil permettant de déformer une image réelle de référence par une transformation définie analytiquement. Deux cercles concentrique, délimitant le myocarde ventriculaire gauche, sont positionnés sur un image réelle (Fig. 7.4(a)). L’anneau ainsi crée partitionne l’espace selon une grille régulière G à laquelle la transformation est appliquée (Fig. 7.4(b)). Les rayons internes et externes de G sont respectivement notés Rint et Rext . La loi de mouvement appliquée à la zone sélectionnée est inspirée de [Clarysse et al., 2000] et intègre plusieurs des composantes du mouvement de contraction d’une tranche de myocarde à mi-hauteur du VG (rotation, torsion, épaississement myocardique, notamment). Elle est adaptée afin d’éviter les discontinuités sur les bords de la grille et pour obtenir une séquence complète sur un cycle cardiaque. (a) (b) F IG . 7.4. Définition de la zone de déformation sur la première image d’une séquence 2D (instant télé-diastolique)(a) et superposition d’une grille G permettant d’appliquer un mouvement réaliste afin d’obtenir une séquence de transformations (b). Soient (R, θ) les coordonnées d’un point quelconque dans le repère local induit par G. On note également (R′ , θ′ ) et (x′ ,y ′ ) les coordonnées polaires et cartésiennes de ce point au cours du mouvement. Le modèle de déformation est défini de la manière suivante : q 2 R2 −Rint 2 int pour Rint ≤ R < Rext −R g(θ) + Rint , ′ λ(t) 2 q R = 2 −R2 (7.9) R2 − Rext int g(θ) pour Rext −R ≤ R < Rext , ext λ(t) 2 ′ θ = θ + ψ(t) · R + c(t), 140 CHAPITRE 7. MÉTHODOLOGIE D’ÉVALUATION où Rint et Rext sont respectivement les rayons intérieur et extérieur de la grille pour lesquelles le mouvement est nul. Les différentes fonctions sont définies de la façon suivante : k (t) ′ ′ e ell 0 R cos θ′ T rx (t) x + (7.10) · = R′ sin θ′ T ry (t) y′ 0 e−kell (t) 2π × f (t), 360 2π × f (t), c(t) = 7.167 × 360 λ(t) = 1 − 0.2 × f (t) 3π g(θ) = 1 − 0.15 cos θ + +1 4 ψ(t) = −0.278 × et 1 1 − cos πt pour 0 ≤ t < Tsys 2 Tsys f (t) = 1 1 − cos π(t+Tdia −2Tsys ) pour Tsys ≤ t < Tdia 2 Tdia −Tsys (7.11) (7.12) (7.13) (7.14) (7.15) f (t) est une fonction de pondération qui permet de déterminer l’influence des termes de rotations et de contraction au cours du temps. Tsys et Tdia sont respectivement les temps de télé-systole et de télé-diastole. L’équation (7.11) représente la variation temporelle de la rotation et dépend également de R. L’équation (7.12) est un terme de rotation globale. L’équation (7.14) permet de contrôler l’amplitude de l’épaississement myocardique suivant l’angle θ. Un pas de résolution temporelle ∆t permet de fixer le nombre de phases (images) souhaité dans la séquence. Un exemple de séquence est illustrée en Fig.7.5 pour Tsys = 280ms, Tdia = 840ms et ∆t = 40ms. Notre implantation permet également d’introduire un bruit Gaussien additif afin d’évaluer la robustesse de notre algorithme à ce type d’artefact. Le bruit est ajouté sur chaque image de manière indépendante de façon à ce qu’il n’y ait pas de corrélation entre le bruit des différentes images de la séquence. Sur la Figure 7.6, nous avons représenté l’image de référence de trois séquences pour trois rapports signal sur bruit (RSB) différents. Les critères AE et QE, introduits en 7.3.1, peuvent être utilisés afin d’estimer l’erreur de précision et d’en déduire une cartographie des erreurs commises sur l’ensemble des images de la séquence. 7.3. MÉTHODES D’ÉVALUATION UTILISÉES DANS CET OUVRAGE (a) (b) (c) (d) (e) (f) 141 F IG . 7.5. Construction d’une séquence temporelle synthétique. Le mouvement appliqué correspond au modèle analytique défini par les équations (7.9)-(7.15) avec Tsys = 280ms et Tdia = 840ms et ∆t = 40ms. Sur la colonne de gauche, le champ de déplacement théorique est superposé à l’image correspondant à l’instant de référence (télé-diastolique) pour t = 80ms (a), t = 200ms (c) et t = 280ms (télésystole)(e) par rapport à cet instant de référence. Sur la colonne de droite, les images déformées correspondantes sont représentées. CHAPITRE 7. MÉTHODOLOGIE D’ÉVALUATION 142 (a) (b) (c) F IG . 7.6. Images de référence de trois séquences après ajout d’un bruit additif gaussien. (a) RSB = 49.04dB (σ = 5)(b) RSB = 27.08dB (σ = 10) et (c) RSB =2.99dB (σ = 20). Chapitre 8 Evaluation des algorithmes d’estimation spatio-temporelle de mouvement Sommaire 8.1 8.2 Evaluation du compromis précision / temps de calcul . . . 8.1.1 Résultats . . . . . . . . . . . . . . . . . . . . . . . . 8.1.2 Discussion . . . . . . . . . . . . . . . . . . . . . . . Evaluation de l’estimation de mouvement spatio-temporelle 8.2.1 Résultats . . . . . . . . . . . . . . . . . . . . . . . . 8.2.2 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 146 146 149 151 156 Introduction ’ensemble des développements logiciels a été réalisé à partir de la librairie ITK1 . Les méthodes proposées dans cette librairie sont implantées de manière générique. Afin d’optimiser l’implantation des méthodes que nous développons, seules les structures de données (notamment la façon d’itérer sur une image) sont conservées. Le reste a été entièrement re-développé. Les manipulations de matrices et de vecteurs est réalisée grâce à l’utilisation de la librairie VXL/VNL2 . Dans ce chapitre, nous proposons d’abord d’étudier le compromis entre la précision des champs estimés et le temps de calcul nécessaire pour l’estimation. La seconde partie de ce chapitre propose une évaluation de l’apport de l’estimation spatio-temporelle de mouvement par rapport à des estimations séquentielles. L 8.1 Evaluation du compromis précision / temps de calcul Pour étudier le compromis entre la précision du champ estimé entre deux instants et le temps de calcul, nous avons généré 4 paires d’images de manière synthétique selon le procédé décrit dans la section 7.3.1. Les deux images de chaque paire sont reliées par 1 2 http ://www.itk.org/ http ://vxl.sourceforge.net 143 144 CHAPITRE 8. RÉSULTATS une transformation non rigide de type spline de plaque mince [Bookstein, 1989]. Deux paires d’images, T h1 et T h2 , ont été construites à partir d’une image TDM du thorax en fin d’expiration. Pour ces deux paires, un ensemble de 20 points est tiré aléatoirement sur la partie centrale du volume réduit au 3/4 de sa taille. Pour chacun de ces points, les composantes du déplacement sont également choisies aléatoirement √ sur un intervalle de ±20mm ce qui correspond à un déplacement maximum de 20 3 mm pour chacun des marqueurs. Selon le principe décrit dans [Sprengel et al., 1996], T h1 est généré avec un coefficient de lissage λ = 0 ce qui correspond à une interpolation exacte du déplacement de tous les marqueurs. T h2 est obtenue avec les mêmes marqueurs et les mêmes déplacements mais avec une coefficient λ = 20. Il s’agit cette fois d’une approximation et le champ synthétique obtenu est plus lisse. Les séquences Co1 et Co2 sont obtenues avec le même procédé mais à partir d’un volume cardiaque par RM en fin de diastole. Les composantes du déplacement des marqueurs sont cette fois limitées à ±10mm, l’amplitude du mouvement étant moins importante pour le cœur que pour le thorax. Une illustration des paires T h1 et Co1 est donnée sur les figures 8.1 et 8.2. F IG . 8.1. Paire synthétique d’images TDM 3D du thorax pour l’évaluation de l’estimation de transformations non rigides. 8.1. EVALUATION DU COMPROMIS PRÉCISION / TEMPS DE CALCUL 145 F IG . 8.2. Paire synthétique d’images IRM 3D du cœur pour l’évaluation de l’estimation de transformations non rigides. 146 CHAPITRE 8. RÉSULTATS 8.1.1 Résultats Pour chacune des données synthétiques, nous avons estimé le champ de déplacement avec et sans réduction de l’espace d’analyse, selon la méthode proposée en section 4.5.2.1, pour vérifier si la perte d’information ne perturbe pas la qualité des champs obtenus. Pour cette étude, la taille des pyramides de transformations NT rans est fixé à 5 et la taille de la pyramide d’images NT rans à 4. Chaque transformation est exprimée sur une base de fonctions B-Splines cubiques (degré 3) et l’opérateur D1 est utilisé pour calculer la fonction de coût. Le coefficient α pondérant la régularisation par rapport au critère d’appariement est fixé à 0.2. Concernant la réduction de l’espace d’analyse, nous savons qu’elle est dépend de l’opérateur D2 et du seuil ici fixé à 10% de l’intensité maximum de la sortie de l’opérateur D2 . Pour chacune des paires de test, nous estimons le mouvement en utilisant l’image dans sa totalité, d’une part, et en utilisant une information partielle correspondant au seuillage de la sortie du filtre D2 , d’autre part. Le tableau 8.1 résume les statistiques liées à l’écart quadratique (eq. (7.1)) et angulaire (eq. (7.2)) obtenues sur l’ensemble de l’image entre le champ théorique et le champ estimé. Pour chacune des paires, nous indiquons également le temps de calcul nécessaire pour obtenir chacune des estimations sachant que les résultats sont obtenus sur la plateforme multiprocesseurs en utilisant 10 des 12 processeurs. Pour discuter les résultats obtenus, nous avons représenté sur la figure 8.3, deux cartographies d’erreurs obtenues sur la paire Co2 . La figure 8.3(a) représente une coupe 2D du masque obtenu pour réduire l’information sur le dernier niveau de la pyramide des images. La cartographie d’erreur relative à cette coupe obtenue sans réduction de l’information est illustrée sur la figure 8.3(b). La figure 8.3(c) représente la cartographie correspondante lorsque la réduction de l’espace d’analyse est prise en compte. Enfin les courbes illustrant l’évolution de la moyenne des erreurs quadratiques en fonction des différentes échelles de la transformation sont visibles sur la figure 8.4. Sur cette figure, nous avons représenté la décroissance des erreurs obtenues pour les données T h2 et Co2 avec et sans réduction de l’espace d’analyse. 8.1.2 Discussion L’ensemble de ces résultats suggère un certain nombre de remarques. Tout d’abord, si l’on regarde le tableau 8.1, nous constatons que les valeurs obtenues sur l’ensemble des paires de test suivent la même tendance. La transformation est toujours mieux estimée lorsque tout le volume est pris en compte cependant, la différence entre les deux approches n’est jamais très significative. On remarque que l’erreur angulaire est toujours plus importante mais dans ce cas, la plage d’erreur se situe entre 0 et 180◦ alors que pour l’erreur quadratique exprimée en mm, la valeur maximum observée est de 9 mm pour Co1 et de 47 mm pour T h1. Une observation de la région correspondant à cette forte valeur (47 mm) sur T h1 nous a permis de remarquer que le caractère aléatoire des déplacements imposés nous a placé dans une configuration très défavorable dont on peut voir une partie des effets sur l’image 8.1(b) (partie haute du poumon droit). D’une façon générale, nous remarquons également que les déformations obtenues pour Co1 et T h1 (λ = 0) sont moins bien estimées que pour Co2 et T h2 (λ = 20). Le coefficient λ traduit le lissage de la déformation imposée. Les fonctions B-Splines cubiques se comportent mieux lorsque ce champ est lissé. Si la précision des champs estimés n’est que faiblement réduit pour les deux approches, nous constatons un gain de temps toujours supérieur à 2 8.1. EVALUATION DU COMPROMIS PRÉCISION / TEMPS DE CALCUL 147 TAB . 8.1. Valeurs des critères d’écarts quadratiques (QE en mm) et angulaires (AE en degré) pour quatre paires de tests. Les résultats de gauche correspondent au cas où les champs de déplacement sont estimés à partir de la totalité du volume. La partie de droite correspond au cas où une partie du volume seulement est considérée. Nous indiquons également les temps de calcul nécessaires pour obtenir ces résultats. moyenne écart type valeur max valeur min temps de calcul Co1 Prise en compte totale du volume Prise en compte partielle du volume QE AE QE AE 0.90 7.14 1.19 12.90 1.00 8.09 1.56 13.21 6.72 96.85 9.00 109.03 3.7 × 10−4 1.4 × 10−3 5.3 × 10−4 1.3 × 10−3 325 secondes 114 secondes moyenne écart type valeur max valeur min temps de calcul Co2 Prise en compte totale du volume Prise en compte partielle du volume QE AE QE AE 0.82 6.65 1.05 8.1 0.89 7.52 1.4 10.3 5.9 90.92 7.85 99.31 −4 −4 −4 2.1 × 10 6.7 × 10 1.6 × 10 1.0 × 10−3 323 secondes 119 secondes moyenne écart type valeur max valeur min temps de calcul T h1 Prise en compte totale du volume Prise en compte partielle du volume QE AE QE AE 3.9 15.7 4.0 16.0 4.2 13.9 4.3 14.0 41.0 177.9 47.1 179.0 4.2 × 10−4 2.5 × 10−3 2.4 × 10−4 9.2 × 10−4 30 mn 13 s 12 mn 24 s moyenne écart type valeur max valeur min temps de calcul T h2 Prise en compte totale du volume Prise en compte partielle du volume QE AE QE AE 2.62 12.3 2.80 13.01 2.19 11.5 2.30 11.80 15.2 178.7 15.4 177.3 5.6 × 10−4 2.7 × 10−3 4.0 × 10−4 1.1 × 10−3 29 mn 58 s 13 mn 02 s CHAPITRE 8. RÉSULTATS 148 (a) (b) moyenne de l’erreur quadratique (QE)\ sur l’ensemble de l’image (mm) F IG . 8.3. Coupe 2D de la cartographie de l’écart quadratique entre le champ synthétique de référence et (b) le champ estimé sans réduction de l’espace d’analyse, et (c) avec réduction de l’espace d’analyse. L’image en (a) représente le masque calculé pour réduire l’information pour la paire Co2 . 7 Th2 - Espace Entier Th2 - Espace Partiel Co2 - Espace Entier Co2 - Espace Partiel 6 5 4 3 2 1 0 0 1 2 3 4 echelle de transformation F IG . 8.4. Evolution de la moyenne des erreurs quadratiques en fonction des différentes échelles de la transformation pour les données T h2 et Co2 avec et sans réduction de l’espace d’analyse 8.2. EVALUATION DE L’ESTIMATION DE MOUVEMENT SPATIO-TEMPORELLE149 lorsque la réduction d’information intervient. La figure 8.3 nous aide à interpréter la répartition des erreurs due à la prise en compte partielle de l’information. Nous constatons que les fortes erreurs correspondent aux régions peu prises en compte dans le masque binaire. Pour les applications visées, ces régions où l’estimation est moins précise, ont peu d’importance puisqu’elles ne sont pas exploitées pour décider du bon/mauvais comportement dynamique des organes. De plus, ce sont ces régions qui viennent, en partie, entacher les résultats présentés dans le tableau 8.1. Pour les régions du volumes qui présentent un intérêt, la précision est quasiment identique pour un gain de temps notable. L’analyse de la figure 8.4 confirme ce qui vient d’être dit. Nous remarquons cependant que la différence entre la prise en compte totale et partielle de l’image est légèrement moins importante pour l’image du thorax obtenue par TDM, sans doute parce que le masque binaire calculé couvre l’image de manière plus uniforme que dans le cas du cœur. 8.2 Evaluation de l’estimation de mouvement spatiotemporelle Cette évaluation porte sur des séquences 2D. Dans l’ensemble de cette section, les paramètres suivants ont été utilisés : Pour cette étude, nous prenons les paramètres suivants : – – – – – – taille des pyramides de transformations : NT rans = 5. taille de la pyramide d’images : NImg = 4. degré des B-Splines pour la base de fonctions FFD : 3. opérateur pour la fonction de coût : D1 . pondération de la régularisation : α = 0.2. pas de réduction de l’espace d’analyse. En ce qui concerne la méthode spatio-temporelle, 3 cycles cardiaques par étage de pyramide sont pris en compte pour la convergence du filtre de Kalman, soit sur cette séquence, 66 itérations au maximum. Nous commençons la discussion de l’apport de l’estimation spatio-temporelle de mouvement en proposant une illustration des discontinuités observables lorsque une succession d’estimations de mouvement est réalisée (Figure 8.5). Afin d’obtenir ces trajectoires, un ensemble de recalages a été effectué dans une séquence réelle. L’image de référence a été recalée avec chacun des autres instants de la séquence 2D. Nous pouvons constater que, quelque soit la région considérée (fond de l’image, pour le point de gauche et myocarde pour le point de droite), les trajectoires illustrées présentent une forte discontinuité. Ces discontinuités montrent bien qu’il n’existe aucune relation entre les différentes estimations. Dans cette section, nous présentons une série de résultats qui montrent l’intérêt de la méthode d’estimation spatio-temporelle de mouvement. La proposition concernant l’adaptation de la complexité des trajectoires est toujours en cours de développement et ne sera pas évaluée dans le cadre de ce mémoire. 150 CHAPITRE 8. RÉSULTATS F IG . 8.5. Illustration des discontinuités de trajectoires obtenues par estimations séquentielles du mouvement. Un zoom est porté arbitrairement sur deux points, l’un appartenant au fond de l’image (à gauche), l’autre appartenant au myocarde. L’évolution des coordonnées x et y sur l’ensemble du cycle est donnée sur les courbes du bas. 8.2. EVALUATION DE L’ESTIMATION DE MOUVEMENT SPATIO-TEMPORELLE151 8.2.1 Résultats 8.2.1.1 Evaluation sur des données synthétiques La construction des données synthétiques utilisées est décrite dans la section 7.3.3.1. Nous notons Seq1, Seq2 et Seq3 les séquences 2D+temps bruitées avec un rapport signal sur bruit de 49.0dB, 27.1dB et 3.0dB, respectivement. Les critères QE et AE sont intégrés sur l’ensemble du champ estimé et sur l’ensemble des instants de la séquence. Nous décidons de considérer le champ de vitesse plutôt que le champ de déplacement pour que le résultat illustre au mieux la cohérence entre les instants de la séquence. Puisque notre méthode fournit directement le déplacement u(x, t), la vitesse est calculée par l’équation 6.5 qui établit la correspondance entre le déplacement et la vitesse dans un contexte lagrangien. La figure 8.6 compare les distributions de l’erreur quadratique (QE) sur l’ensemble de la séquence Seq1 obtenues par estimation séquentielle de mouvement (toujours à partir de l’instant de référence) 8.6(a) et par l’algorithme d’estimation spatio-temporelle de mouvement 8.6(b). (a) (b) F IG . 8.6. Distribution de l’erreur quadratique (en mm) calculé sur l’ensemble de la séquence Seq1 à partir d’estimations de mouvement séquentielles (a) et de l’estimation spatio-temporelle de mouvement (b). La figure 8.7 compare les trajectoires d’un point particulier de la séquence Seq2 (pris dans le segment inféro-septal du myocarde) obtenus par estimations séquentielles de mouvement et par l’algorithme d’estimation spatio-temporelle proposé à la trajectoire de référence. Nous constatons que la trajectoire estimée par l’algorithme d’estimation spatiotemporelle suit de près la référence avec une légère sous-estimation. La trajectoire issue de l’estimation séquentielle présente quant à elle des discontinuités franches. 8.2.1.2 Evaluation sur des données réelles Nous considérons maintenant des séquences réelles à partir desquelles, une évaluation quantitative est plus délicate. Nous comparons la trajectoire d’un point situé dans le myocarde lorsque le mouvement est estimé par succession de recalages (figure 8.8(a)) et avec la méthode proposée (figure 8.8(b)). On constate que la continuité de la trajectoire est bien préservée. CHAPITRE 8. RÉSULTATS 152 F IG . 8.7. Déplacement d’un point situé dans le myocarde pendant la phase systolique sur la séquence Seq2. Les trajectoires comparées sont la trajectoires de référence, la trajectoire estimée séquentiellement et la trajectoire issue de l’estimation spatio-temporelle de mouvement. (a) (b) F IG . 8.8. Trajectoire d’un point dans le myocarde estimée par succession d’estimations de mouvement (a) et par la méthode d’estimation spatio-temporelle de mouvement (b). 8.2. EVALUATION DE L’ESTIMATION DE MOUVEMENT SPATIO-TEMPORELLE153 F IG . 8.9. A gauche, différents instants d’une séquence réelle pendant la phase systolique. Dans l’ordre, les instants 1, 3, 6 et 9 d’une séquence comportant 22 instants et dont l’instant 9 correspond à la télé-systole. A droite, déformation d’une grille régulière pour les instants correspondants obtenue à partir de la transformation spatio-temporelle estimée. 154 CHAPITRE 8. RÉSULTATS F IG . 8.10. Champ de déplacement (par rapport à l’instant de référence) pour les deux premiers instants représentés sur la figure 8.9. A droite est représenté la valeur du jacobien de la transformation associée (légendes disponibles sur la figure 8.11). 8.2. EVALUATION DE L’ESTIMATION DE MOUVEMENT SPATIO-TEMPORELLE155 F IG . 8.11. Champ de déplacement, à gauche, et jacobien de la transformation ,à droite, pour les deux derniers instants de la figure 8.9. 156 CHAPITRE 8. RÉSULTATS 8.2.2 Discussion Concernant la figure 8.8, la trajectoire a été discrétisée afin d’associer une position particulière pour chacun des instants de la séquence. Cependant les résultats que nous obtenons assurent une parfaite continuité. La modélisation que nous avons choisie nous permet de calculer pour tout point de l’espace x et à n’importe quel instant t diverses informations quantitatives. Positions, vitesses et déformations, entre autres, sont donc accessibles et temporellement cohérentes. Les figures 8.9, 8.10 et 8.11, illustrent cette intéressante propriété. Les tenseurs de déformation dans le myocarde peuvent être estimés sur l’ensemble du cycle en vue de détecter des anomalies de mouvement du cœur. Sur la figure 8.11, nous remarquons que l’algorithme est particulièrement sensible et instable dans les régions homogènes en dehors du cœur. D’un point de vue applicatif, ce phénomène n’est pas pénalisant pour l’étude de la déformation cardiaque. En revanche, il s’agit là d’une caractéristique des algorithmes de recalage qui ne savent pas comment se comporter dans ces régions homogènes. L’ambiguïté réside dans le fait que l’homogénéité en termes d’intensité ne traduit pas l’immobilité. Chapitre 9 Comparaison d’algorithmes sur des séquences d’images thoraciques TDM Sommaire 9.1 9.2 9.3 9.4 9.5 9.6 9.7 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . Le mouvement en radiothérapie . . . . . . . . . . . . . . Matériel . . . . . . . . . . . . . . . . . . . . . . . . . . . . Procédure d’évaluation . . . . . . . . . . . . . . . . . . . 9.4.1 Sélection des amers . . . . . . . . . . . . . . . . . . 9.4.2 Evaluation quantitative de la précision des méthodes 9.4.3 Analyse des trajectoires . . . . . . . . . . . . . . . 9.4.4 Méthodes d’estimation de mouvement comparées . . Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.5.1 Résultats relatifs au critère T RE . . . . . . . . . . . 9.5.2 Résultats relatifs au ST E . . . . . . . . . . . . . . Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . 9.6.1 Précision des méthodes . . . . . . . . . . . . . . . . 9.6.2 Etude des trajectoires . . . . . . . . . . . . . . . . . Conclusion partielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 158 159 160 160 161 163 165 167 167 170 170 173 174 176 9.1 Introduction C e chapitre est issu d’un article actuellement en révision pour le journal IEEE Transactions on Medical Imaging sous le titre : A comparison framework for breathing motion estimation methods from 4D imaging. Cette étude a été menée dans le cadre d’une collaboration entre deux laboratoires : Creatis et le Liris1 , en partenariat avec le Centre Léon Bérard2 . Le but de l’étude concerne la mise en place d’une stratégie et de critères pour évaluer et comparer la précision de différentes méthodes face au problème 1 2 http ://liris.cnrs.fr/ http ://oncora1.lyon.fnclcc.fr/ 157 158 CHAPITRE 9. COMPARAISON D’ALGORITHMES de l’estimation de mouvement de structures thoraciques et du suivi de tumeur sur des séquences d’images TDM 4D du thorax au cours de la respiration. Dans le cadre de ma thèse, l’intérêt de cette étude est donc double. Elle permet bien entendu de mettre en évidence l’apport de la prise en compte du mouvement pendant les traitements radio-thérapeutiques, mais elle permet également de confronter la méthode de recalage d’images que nous avons proposée au chapitre 4 avec d’autres algorithmes destinés à suivre des structures d’intérêt pendant la respiration. Dans ce but, deux autres approches, également en phase d’évaluation, ont été envisagées. L’une d’entre elles appartient également à la catégorie des méthodes de recalage d’images tandis que la seconde repose sur la déformation d’un modèle biomécanique. Comme nous l’avons vu au chapitre 1, l’estimation de mouvement pour le suivi de tumeurs devient l’un des enjeux majeurs en radiothérapie des poumons en respiration libre. On pourrait ainsi contrôler l’intensité de la dose délivrée et l’orientation des faisceaux irradiants en fonction d’une information de mouvement pour réduire au maximum la destruction de cellules saines. On peut alors se demander si, dans le cas de la respiration, la prise en compte de plusieurs instants dans une séquence d’images permet de réduire l’erreur faite sur la position de points précisément identifiés ou si les instants extrêmes suffisent à décrire leur mouvement. En d’autres termes, les déplacements peuvent-ils être considérés comme linéaires sur l’ensemble du cycle ou y a t-il un intérêt à considérer des trajectoires plus complexes ? Pour pouvoir répondre à ces questions, nous avons demandé à des experts de sélectionner des points remarquables selon le principe décrit en 7.3.2. Un ensemble de 500 points a été sélectionné sur trois séquences 4D TDM dont les caractéristiques sont données dans le paragraphe 2.4.5. Pour chaque séquence, le pointage de ces amers a été réalisé par trois experts différents sur 4 images réparties sur la phase d’expiration. L’ensemble de ces sélections constitue alors une pseudo-référence en vue de répondre à ces questions. 9.2 Le mouvement en radiothérapie Actuellement en routine clinique, le volume que l’on destine à l’irradiation (volume cible prévisionnel) résulte d’une succession d’ajout de marges par rapport au contour initialement tracé par les cliniciens autour de la tumeur. L’une d’entre elles concerne la prévision de déplacement de la zone tumorale pendant la thérapie et peut parfois être importante. Zhang et al ont proposé d’introduire le mouvement de la cible dans le but d’optimiser le traitement en utilisant des champs de déplacement précalculés sur différents instants de séquences TDM 4D [Zhang et al., 2004]. En demandant au patient de respirer de manière régulière à l’aide d’un signal affiché, les auteurs cherchent à réduire l’irradiation de cellules saines. Rietzel et al. [Rietzel et al., 2005a] ont proposé d’utiliser des volumes contourés sur chaque image d’une séquence préalablement acquise pour déterminer les trajectoires et les excursions autour des trajectoires des tumeurs. En utilisant des techniques de recalages non-linéaires, ils tentent de quantifier l’impact du mouvement respiratoire sur les doses délivrées. Généralement, pour simuler l’irradiation d’une cible en mouvement, le clinicien 9.3. MATÉRIEL 159 estime l’accumulation des distributions de doses au cours de la thérapie. On note DDeliv (x, t) la dose délivrée à l’instant t en un point x de l’espace. Considérons maintenant un état de référence t = 0 (correspondant, par exemple, à la fin de l’expiration du patient) et un point anatomique particulier que l’on notera xana dans sont état de référence et dont la trajectoire peut être décrite par la relation xana (t) = ϕ(xana , t). La dose délivrée à ce point anatomique à l’instant t est DDeliv (xana (t), t). Sur la durée totale du traitement, la dose délivrée en chaque point anatomique s’exprime alors par : DDelivtotal (xana ) = Z tf in DDeliv (xana (t), t) dt (9.1) t=0 Nous voyons donc que, pour un volume donné, la dose calculée est proportionnelle au temps d’irradiation. La dimension temporelle du mouvement doit donc être prise en considération. Brock et al. [Brock et al., 2003] ont proposé d’utiliser un modèle géométrique volumique des poumons dont la déformation non-rigide est assurée par une modélisation par éléments finis. Le modèle, composé de 6000 tétraèdres, est établi grâce au contourage d’experts en fin d’expiration. Une carte de déformation est créée pour attirer ce modèle en fin d’inspiration. La calcul de dose intègre alors la déformation non-rigide des corps à irradier. Des positions intermédiaires sont utilisées pour pondérer en temps les doses à appliquer. Plus récemment, Keall et al. [Keall et al., 2005] ont étendu ce concept à l’utilisation de collimateurs dynamiques dont le principe général est d’adapter la forme des faisceaux irradiants au cours du temps. La forme des contours est définie sur une séquence d’images par recalage non rigide entre une image de référence en fin d’inspiration et les autres images de la séquence. Pour résumer, dans toutes les études récentes concernant la radiothérapie des poumons, il apparaît que le suivi du mouvement respiratoire devient fondamental et mérite d’être validé en vue d’être appliqué dans les années à venir en routine clinique. Ce suivi fait directement appel à la notion de temps qui doit être prise en compte lors de l’évaluation. Les critères et les outils d’évaluation introduits en 7.3.2 s’inscrivent dans ce contexte et sont décrits plus en détail ici. Avant de débuter l’évaluation et la comparaison de notre méthode, nous verrons comment nous introduisons une information temporelle basée, dans ce cas précis, sur un signal respiratoire. 9.3 Matériel Les caractéristiques des 3 séquences d’images de test utilisées sont décrites au chapitre 2.4.5. Nous noterons les séquences S1 S2 et S3 . Les patients qui caractérisent ces acquisitions sont tous atteints de cancers bronchiques non à petites cellules (voir 1.3.3). Pour chacun de ces patients, les tumeurs sont situées dans la partie basse du poumon droit et les volumes de ces tumeurs sont de 160, 165 et 37 cm3 , respectivement. Les déplacements maximum observés près du diaphragme sont de 23 mm, 25 mm et 17 mm pour les séquences S1 , S2 et S3 , respectivement. Dans cette étude, nous nous focalisons sur la phase d’expiration du cycle respiratoire en prenant en compte 4 images tridimensionnelles. Deux d’entre elles correspondent aux CHAPITRE 9. COMPARAISON D’ALGORITHMES 160 instants de fin d’inspiration (I0 ) et de fin d’expiration (I3 ). Les deux autres images correspondent à des instants intermédiaires choisis parmi 4. Nous les noterons I1 et I2 . Les autres images n’ont pas été retenues car elles présentaient trop d’artefacts qui risquaient de perturber les résultats. Ces artefacts apparaissent généralement sur certaines coupes près du diaphragme lorsque le patient respire trop rapidement ou lors d’un manque de précision pendant l’acquisition du signal respiratoire (voir Fig. 9.1(a)). D’autres types d’artefacts, moins fréquents, peuvent être dus aux mouvements du patient lors de l’acquisition (voir Fig. 9.1(b)). Il est important de noter, et c’est un point clé de cette étude, qu’une image de la séquence pour différents patients peut correspondre à des phases physiologiques différentes. En d’autres termes, la résolution temporelle n’est pas régulière et l’intervalle de temps entre deux images consécutives peut varier d’un patient à l’autre. Cette différence provient du fait que chaque patient à sa propre façon de respirer. Cette irrégularité de la résolution temporelle intervient également sur une même séquence où le temps passé entre deux images est fonction de la courbe de respiration associée. C’est l’une des caractéristiques des séquences 4D TDM inhérente à l’algorithme de tri des projections. Nous devons tenir compte de cet aspect lors de l’évaluation des algorithmes. Les volumes pulmonaires indiqués dans le Tableau 9.1 ont été estimés à partir d’algorithme de segmentation automatique dont les différentes étapes sont décrites dans [Sarrut et al., 2005]. TAB . 9.1. Volumes pulmonaires (en cm3 ) pour les trois séquences de tests. Le pourcentage exprimé entre parenthèses correspond à la variation de volume par rapport au volume de référence sur l’image I0 . XX XXX Séquence XX XX X Image XX I0 I1 I2 I3 9.4 S1 S2 S3 5181 (100%) 5004 (50%) 4692 (44%) 4315 (0%) 3214 (100%) 2981 (49%) 2880 (27%) 2755 (0%) 3121 (100%) 2897 (47%) 2797 (24%) 2696 (0%) Procédure d’évaluation Cette section, concerne la mise en place des outils destinés à l’évaluation et à la comparaison de méthodes d’estimation de mouvement du thorax respirant à partir d’un nombre limité de phases. Nous y décrivons notamment comment nous prenons en compte un modèle de respiration pour introduire le temps dans le critère que nous proposons équation (7.7). Nous décrivons aussi succinctement les deux autres méthodes avec lesquelles nous comparons nos résultats. 9.4.1 Sélection des amers Nous avons demandé à trois experts de suivre le protocole mis en place en section 7.3.2 pour la détermination d’un bronze standard. L’expert chargé d’extraire et d’étique- 9.4. PROCÉDURE D’ÉVALUATION (a) 161 (b) F IG . 9.1. Exemple d’artefacts dans les images 4D TDM. (a) Plusieurs coupes étaient manquantes à cet instant précis de la reconstruction. (b) Structures floues à cause de mouvements du patient pendant l’acquisition. ter les points sur l’image de référence avait pour consigne de choisir des points facilement identifiables : carène (séparation entre la bronche principale gauche et la bronche principale droite), nodules calcifiés, jonction culminale lingulaire, subdivisions d’artères pulmonaires, embranchements de faisceaux, etc. (voir Fig. 7.1). De plus, les amers devaient être répartis le plus uniformément possible à l’intérieur des poumons de manière à ne pas biaiser les résultats obtenus. Enfin, le nombre minimum d’amers devait être de 20. Il en résulte une sélection de 27 points sur S1 , de 41 sur S2 et de 56 sur S3 . Les Eq. (7.3) et (7.4) ont été utilisées pour définir notre référence. 9.4.2 Evaluation quantitative de la précision des méthodes La précision des méthodes sera appréciée quantitativement grâce au critère T RE (7.5) qui nous renseigne sur la pertinence des estimations en comparant les points déplacés avec les pseudo-références des experts. Les dispersions des erreurs seront représentées grâce à l’utilisation de boites à moustaches [Tukey, 1977](box and whiskers plots en anglais) qui permettent de représenter schématiquement la distribution d’une variable. Une telle représentation permet de mettre en évidence les valeurs médianes et moyennes d’un échantillon, son étendue et éventuellement certains points aberrants. De plus, des diagrammes de Bland-Altman [Bland and Altman, 1986] seront utilisés comme complément pour comparer les résultats obtenus par les différentes méthodes. Le principe du diagramme de Bland-Altman est de représenter le degré de ressemblance entre deux méthodes. L’axe des abscisses correspond à la moyenne des résultats obtenus pour chacune des deux méthodes à comparer. En ordonnées sont représentées les différences entre les deux méthodes. Une telle représentation constitue donc un outil très intéressant pour identifier visuellement des situations pour lesquelles les résultats entre deux méthodes sont discordants. Enfin, des t-tests de Student pour séries appariées seront réalisés pour vérifier si deux 162 CHAPITRE 9. COMPARAISON D’ALGORITHMES (a) (b) (c) F IG . 9.2. Volumes pulmonaires estimés pour les différentes images des séquences S1 (a), S2 (b) et S3 (c). La position relative de ces images est déterminée à partir de la modélisation du signal respiratoire décrit dans la section 9.4.3.1. On remarque que les instants intermédiaires ne correspondent pas à la même phase physiologique pour les trois séquences. 9.4. PROCÉDURE D’ÉVALUATION 163 méthodes se comportent de manière équivalente. Le choix d’utiliser des séries appariées se justifie par le fait que la mesure de l’équivalence de deux estimateurs différents n’a de sens que si les points sont considérés indépendamment. 9.4.3 Analyse des trajectoires Le critère T RE ne nous renseigne que pour des instants ponctuels de la phase expiratoire. Pour prendre en compte le profil des mouvements, nous avons introduit le critère ST E (7.8) permettant d’analyser l’ensemble des trajectoires des différents marqueurs. Ce critère nous permet d’évaluer l’apport des méthodes d’estimation de mouvement sur les incertitudes de position de cellules tumorales en radiothérapie. Nous allons voir comment intégrer un signal respiratoire à ce critère particulier. 9.4.3.1 Modélisation du cycle respiratoire Plusieurs modèles globaux de la respiration ont été proposés dans la littérature. Nous avons choisi d’utiliser celui proposé par Lujan et al. [Lujan et al., 1999] (Eq. (9.2)) pour déterminer la courbe dynamique de respiration. Cette description est réalisée grâce à une fonction périodique mais asymétrique qui reflète bien la différence de comportement en fin d’inspiration et en fin d’expiration. Généralement une phase plus longue est observée en fin de respiration. Dans l’Eq. (9.2), Vexp est le volume en fin d’expiration et b correspond au volume courant (voir Fig. 1.6). Ainsi, Vexp + b représente le volume en fin d’inspiration. τ représente la période du cycle respiratoire et n est un paramètre permettant de modifier la forme générale de la courbe représentée sur la Fig. 9.3. Plus ce paramètre est élevé plus la courbe s’aplatit. θ est un terme de phase. π f (t) = Vexp + b cos2n ( t − θ). (9.2) τ George et al. [George et al., 2005] ont étudié ce modèle à partir de 331 courbes obtenues grâce à un spiromètre sur 4 patients différents atteints de cancers du poumon. Une valeur de n = 2 reflète bien la corrélation entre les signaux réels et le modèle obtenu. Dans la suite, nous utilisons n = 2, ϕ = 0 et τ = 2. L’amplitude du mouvement est dépendante du patient. Ne disposant pas du signal respiratoire acquis pendant les phases de reconstruction des séquences d’images, les paramètres du modèle sont déterminés grâce aux valeurs disponibles dans le tableau 9.1. 9.4.3.2 Erreur spatio-temporelle Le calcul pratique du critère STE (7.7) est réalisé par discrétisation de l’intégrale en une série de cent échantillons sur l’intervalle [ta , tb ]. Dans la suite, nous prendrons ta = 0 et tb = 1 où 0 correspond à l’instant de fin d’inspiration et 1 correspond à l’instant de fin d’expiration. La discrétisation est réalisée de telle manière que l’écart de temps entre deux échantillons soit identique. On peut ainsi dire que l’échantillonnage est temporellement régulier. Si l’on représente la trajectoire d’un amer avec les échantillons, on observera un rapprochement des échantillons en fin d’expiration et d’inspiration. Grâce 164 CHAPITRE 9. COMPARAISON D’ALGORITHMES F IG . 9.3. Modélisation du cycle respiratoire proposé par [Lujan et al., 1999]. aux courbes de la Figure 9.2 et aux valeurs du Tableau 9.1, nous pouvons déterminer la position des images intermédiaires sur la phase d’expiration par ti = f −1 (Vi ). Trois intervalles de respiration dont les tailles sont déterminées à partir du positionnement des instants intermédiaires sur l’ensemble de la séquence (voir Figure 9.2) sont obtenus pour échantillonner la trajectoire. Si la ST E prend la valeur x, cela signifie que, en moyenne, sur la phase expiratoire, le fait d’utiliser une trajectoire estimée Γkest pour un amer k au lieu de la trajectoire de référence Γkref conduit à une différence moyenne de x mm. 9.4.3.3 Trajectoires directes et indirectes Afin de clarifier les différentes notions que nous allons utiliser par la suite, nous introduisons les acronymes suivants dont la signification est illustrée en Figure 9.4. – La TDR correspond à la Trajectoire Directe de Référence. Il s’agit de la trajectoire rectiligne que l’on obtient lorsque l’on relie directement les points issus des pointages des experts en début et en fin d’expiration. – La TDE correspond à la Trajectoire Directe Estimée. Il s’agit de la trajectoire rectiligne que l’on obtient lorsque l’on relie directement la position d’un amer pointé sur l’image en début d’expiration et la position estimée de ce point par une méthode quelconque en fin d’expiration. – La TIR correspond à la Trajectoire Indirecte de Référence. Il s’agit de la trajectoire non-rectiligne obtenue en reliant les points issus des pointages experts sur les quatre 9.4. PROCÉDURE D’ÉVALUATION 165 images de la séquence. – La TIE correspond à la Trajectoire Indirecte Estimée. Il s’agit de la trajectoire nonrectiligne obtenue en reliant les points issus des estimations successives obtenues sur toutes les images de la séquence par une méthode quelconque. TIR TIE TDR TDE F IG . 9.4. Illustration des acronymes utilisés pour différencier les trajectoires considérées par la suite. L’introduction d’une mesure d’erreur de type ST E a pour objectif d’évaluer l’impact de la prise en compte du mouvement dans le suivi de tumeurs par rapport à la situation actuelle où le mouvement n’est pas ou mal (marges d’erreur) pris en compte. On peut ainsi comparer la ST E pour la TIR d’un marqueur particulier et la ST E dans le cas où l’on considère la marqueur immobile c’est à dire la cas où le mouvement est complètement ignoré. Une autre situation est celle où l’on considère l’hypothèse de la linéarité des trajectoires entre les instants extrêmes. Dans ce cas, il nous faut comparer le mesure de ST E pour la TIR et la TDR/TDE. Ces différentes situations seront étudiées en section 9.5 à l’aide de diagrammes de Bland-Altman et de tests statistiques. 9.4.4 Méthodes d’estimation de mouvement comparées Dans cette section, nous décrivons brièvement les méthodes que nous comparons en faisant référence aux articles récents correspondants. Nous considérons en définitive quatre différentes méthodes d’estimation de mouvement. Nous noterons m1 la méthode de recalage paramétrique décrite au chapitre 4. La méthode m2 , inspirée de l’algorithme des démons, est également une méthode de recalage mais de type non-paramétrique. Enfin, m3 est une méthode basée sur la déformation d’un modèle biomécanique. Finalement, les résultats sont également comparés au cas extrême où aucun mouvement n’est estimé (ϕ = Id). Cette pseudo-méthode sera notée m0 . 9.4.4.1 Notre méthode : m1 Pour cette étude, nous prenons les paramètres suivants : – taille des pyramides de transformations : NT rans = 5. – taille de la pyramide d’images : NImg = 4. – degré des B-Splines pour la base de fonction FFD :3. – opérateur pour la fonction de coût : D1 . – pondération de la régularisation : α = 0.2. – pas de réduction d’espace d’analyse. CHAPITRE 9. COMPARAISON D’ALGORITHMES 166 9.4.4.2 Flux optique optimisé : m2 Cette méthode a été développée par V. Boldea dans le cadre sa thèse [Boldea, 2006]. Elle est basée sur l’approche proposée dans [Thirion, 1998]. Elle est décrite en détail dans [Sarrut et al., 2006]. Elle procède en deux étapes : 1. Pré-traitement des données pour segmenter les différentes structures. 2. Estimation dense de mouvement en chaque pixel. L’estimation finale de mouvement non-rigide est assurée par une optimisation de type descente de gradient du critère SSD (version non-paramétrique de l’équation (4.34)) et une régularisation gaussienne [Thirion, 1998]. Une approximation numérique de la dérivée ∇L(x, u) du critère est donnée dans [Pennec et al., 1999] : ∇L(x, u) = I1 (x) − I2 (x + u(x)) ∇I1 (x) ||∇I1 (x)||2 + α2 (I1 (x) − I2 (x + u(x)))2 (9.3) A chaque itération, le déplacement de chaque composante est limité par α (qui représente le vecteur maximum de déplacement). Le processus itératif est donné par l’équation : ui+1 (x) = Gσ (ui (x) + ∇L(x, ui )) (9.4) où ui représente le champ de déplacement à l’itération i et Gσ (.) est un noyau gaussien de variance σ > 0. Le filtrage gaussien est réalisé selon [Deriche, 1993]. 9.4.4.3 Méthode par modèle déformable biomécanique : m3 Cette méthode est développée par P.F. Villard dans le cadre de sa thèse. Une description est développée dans [Villard et al., 2005]. Le but de cette méthode est de simuler de manière réaliste le comportement des poumons par une approche de type élément finis. Les lois mécaniques utilisées reposent sur des hypothèses anatomiques et physiologiques. Cette méthode peut être décomposée en deux étapes principales : 1. La construction d’un modèle mécanique dépendant de la séquence de tests. 2. La déformation de ce modèle à partir de caractéristiques issues de l’image. La construction du modèle spécifique au patient repose sur la construction d’une surface maillée [Lorensen and Cline, 1987] puis d’un volume maillé [Villard et al., 2004] à partir d’un masque binaire obtenu sur l’image de référence de la séquence à traiter. Une fois ce maillage créé, il s’agit de lui appliquer un champ de forces superficielles (calculé sur l’ensemble des images de la séquence) de manière à ce qu’il s’adapte aux interfaces poumons/thorax des images suivantes sous certaines contraintes. La Fig. 9.5 illustre ce procédé. La déformation du modèle conduit à l’estimation d’une déformation entre deux images. Elle repose sur le formalisme des éléments finis. La résolution du problème est assurée par l’algorithme de Newton-Raphson. 9.5. RÉSULTATS 167 F IG . 9.5. Illustration des conditions de bord imposées par le mouvement du diaphragme et de la cage thoracique. Figure issue de [Villard et al., 2005]. 9.5 Résultats Dans cette section, nous décrivons les résultats obtenus pour les critères T RE (7.5) et ST E (7.7) sur les trois séquences S1 , S2 et S3 avec chacune des trois méthodes proposées. Des diagrammes de Bland-Altman, des représentations en boites à moustaches et des analyses par t-tests de Student sont utilisés pour interpréter ces résultats qui seront discutés dans la section 9.6. Pour les méthodes m1 et m2 , chaque champ de déformation obtenu entre deux instants est utilisé comme point de départ pour l’estimation du champ suivant, permettant ainsi d’initialiser l’algorithme avec des paramètres plus proches de la solution. Les tests concernant notre méthode sont réalisés sur une machine parallèle (SGI SMP NUMA 12 processeurs). Chaque processeur est cadencé à 1.5 GHz. Le tout fonctionne sous un système UNIX. Le temps de calcul ne dépend que de la taille de l’image et le niveau de transformation n’a pas d’influence sur les performances. En utilisant 10 processeurs, les temps de calculs ont varié entre 10 minutes pour S1 dont la taille des images est de 386×256×86 et 14 minutes pour S2 dont la taille des images est de 511 × 316 × 115. Les résultats de la méthode m2 ont été obtenus sur un PC cadencé à 2.8 GHz. Le recalage demande environ 10 minutes. Là aussi, ce temps dépend de la résolution de l’image. Enfin, la méthode m3 a été testée sur un PC à 3.2 GHz Les temps de calculs sont d’environ 2 heures pour un maillage composé de 7000 sommets et de 20000 cellules. Nous avons rencontré quelques difficultés à appliquer la méthode m3 sur la séquence S3 car la tumeur est en contact direct avec le diaphragme. La segmentation des poumons devient alors très délicate et conduit à des résultats non exploitables. 9.5.1 Résultats relatifs au critère T RE La Fig. 9.6 représente la distribution des erreurs T RE par la représentation de boites à moustaches pour chacune des trois séquences (une ligne par séquence). Les trois colonnes correspondent aux transformations ϕ1 , ϕ2 et ϕ3 , respectivement. Chaque diagramme montre les statistiques associées à chacune des quatre méthodes. Le Tableau 9.2 synthétise les valeurs de T RE pour toutes les méthodes. Une analyse CHAPITRE 9. COMPARAISON D’ALGORITHMES 168 (a) S1 / I1 (b) S1 / I2 (c) S1 / I3 (d) S2 / I1 (e) S2 / I2 (f) S2 / I3 (g) S3 / I1 (h) S3 / I2 (i) S3 / I3 F IG . 9.6. Boites à moustaches des T RE (en mm) obtenus pour les différentes méthodes. La première ligne correspond aux résultats obtenus sur la séquence S1 , la seconde pour la séquence S2 et la troisième pour la séquence S3 . La première colonne représente les résultats en estimant le mouvement entre I0 et I1 , la seconde colonne entre I0 et I2 et la troisième colonne entre I0 et I3 . Chaque boite représente les résultats obtenus pour les quatre méthodes. La méthode m0 représente l’erreur lorsque qu’aucune déformation n’est appliquée (ϕ = Id). m1 est la méthode décrite au chapitre 4, m2 est la méthode inspirée de l’algorithme des démons et m3 est la méthode biomécanique. 9.5. RÉSULTATS 169 TAB . 9.2. T RE pour chaque méthode et chaque transformation. Les valeurs sont exprimées en millimètre. Pour chaque cas, la première valeur traduit l’erreur moyenne. Les deux valeurs entre parenthèses correspondent au premier et au troisième quartile, respectivement. Méthode m0 m1 m2 m3 Méthode m0 m1 m2 m3 Méthode m0 m1 m2 m3 ϕ1 5.1 (1.8 / 7.4) 2.7 (1.1 / 4.0) 3.0 (1.2 / 3.5) 5.2 (3.2 / 6.3) ϕ1 3.9 (2.5 / 4.5) 2.2 (1.0 / 3.0) 1.8 (1.1 / 2.2) 5.2 (3.8 / 6.2) ϕ1 2.5 (1.7 / 2.9) 1.7 (1.0 / 2.4) 2.2 (1.4 / 2.8) – S1 ϕ2 8.4 (4.3 / 10.8) 1.8 (1.1 / 2.2) 2.0 (1.0 / 2.4) 6.7 (5.5 / 8.2) S2 ϕ2 5.8 (3.1 / 7.7) 2.5 (1.2 / 3.4) 1.8 (1.0 / 1.9) 5.5 (4.2 / 6.9) S3 ϕ2 3.3 (2.2 / 3.8) 1.4 (0.9 / 1.7) 1.2 (0.6 / 1.7) – ϕ3 11.4 (7.6 / 15.1) 1.7 (1.0 / 2.3) 1.7 (0.9 / 2.5) 7.8 (5.6 / 9.6) ϕ3 6.8 (3.5 / 9.2) 1.8 (0.5 / 2.2) 1.6 (1.8 / 2.0) 6.4 (4.6 / 7.6) ϕ3 6.4 (4.8 / 7.7) 1.4 (0.9 / 1.8) 1.3 (0.9 / 1.5) – de Bland-Altman a été réalisée pour chaque paire de méthodes afin de les comparer entre elles. Seules deux figures représentatives sont données (Fig. 9.7) sachant que les autres suivent la même tendance. La Fig. 9.7(a) compare la méthode m3 à la méthode de référence que constitue le suivi manuel des marqueurs. Sur cette figure, seul le déplacement dans l’axe cranio-caudal (axe tête-pieds) pour la transformation ϕ3 , sur la séquence S1 est considéré. La Fig. 9.7(b) représente la même information pour méthode m1 comparée à la référence manuelle. Dans ce cas précis, plus l’abscisse associée aux points représentés est grande, plus le déplacement estimé est grand. Parallèlement, une valeur importante de l’ordonnée signifie que la différence entre les deux méthodes est importante. Pour chaque diagramme, 95% de la différence entre deux méthodes se situe entre les deux limites repérées par une ligne en trait fort. Plus précisément cette limite correspond à un intervalle de d − 1.96s et d + 1.96s, où d est la valeur moyenne de cette différence et s son écart type. Le Tableau 9.3 donne les résultats des t-tests de Student entre chaque paire de méthodes. Ces résultats permettent de mettre en évidence des différences statistiques significatives entre les distributions de valeurs de T RE obtenues pour les deux méthodes comparées. La p-valeur est une probabilité qui mesure le degré de confiance que l’on peut accorder à l’hypothèse nulle H0 . Cette p-valeur est comparée à la valeur α qui constitue le niveau limite de l’acceptation d’hypothèse. Dans notre cas, α est fixé à 0.05. L’ hypothèse H0 que nous utilisons est la suivante : "les deux méthodes sont équivalentes au sens du critère T RE". Plus la p-valeur est faible, plus les chances de se tromper en rejetant l’hypothèse H0 sont faibles. La différence entre les deux méthodes peut alors être considérée comme significative. En revanche, lorsque la p-valeur est supérieure à α les méthodes CHAPITRE 9. COMPARAISON D’ALGORITHMES 170 sont considérées comme statistiquement proches, le rapprochement étant d’autant plus net que la p-valeur est élevée. a) Comparaison des déplacements cranio-caudaux entre la pseudo-référence issue des pointages des experts contre les estimations obtenues grâce à m3 . b) Comparaison des déplacements cranio-caudaux entre la pseudo-référence issue des pointages des experts contre les estimations obtenues grâce à m1 . F IG . 9.7. Exemple de représentations de Bland-Altman permettant de comparer les méthodes entre elles. Résultats obtenus sur la séquence S1 et la transformation ϕ3 . 9.5.2 Résultats relatifs au ST E La Figure 9.8 représente la longueur des TIR (sélection manuelle) en fonction de la distance à l’apex des poumons sur la séquence S1 . Cette figure illustre le fait que les déplacements les plus importants se situent près du diaphragme et que, dans ce cas précis, l’amplitude du mouvement à estimer est variable selon la position dans le thorax (de 3 mm environ près de l’apex à 25 mm près du diaphragme). Le Tableau 9.4 donne les statistiques liées au critère ST E entre les TIR et les TIE obtenues pour chaque méthode. Il permet de mettre en évidence les écarts commis par chaque méthode dans l’estimation temporelle de mouvement par rapport à la référence des experts. Les deux tableaux suivants (9.4 et 9.5) évaluent les différences entre les trajectoires directes et indirectes afin de tester la validité de l’hypothèse de linéarité et l’intérêt de prendre en compte des instants intermédiaires. Les t-tests de Student donnés dans le Tableau 9.6 comparent les TDE et les TIE pour chacune des méthodes. 9.6 Discussion Le cadre d’évaluation proposé dans ce chapitre nous permet d’apporter des éléments de comparaison de différentes méthodes d’estimation de mouvement à partir de données 4D. Le nombre limité de séquences étudiées ne nous permet cependant pas de prétendre donner des conclusions définitives mais des tendances. 9.6. DISCUSSION 171 TAB . 9.3. T-tests de Student appliqués à chaque paire de méthodes. Ici, nous avons considéré tous les résultats en même temps (toutes les séquences, tous les instants, et tous les marqueurs). Si les p-valeurs sont supérieures à 0.1, cela signifie que la différence n’est pas statistiquement significative et le symbole attribué dans la dernière case est ’=’. Si p < 0.1, la différence est non négligeable (symboles ’+’ ou ’++’) et si p < 0.0001, alors la différence devient très significative (symbole ’+ + +’). S1 S2 S3 Méthodes comparées p-valeur La différence est-elle significative ? m0 vs m1 <0.0001 +++ m0 vs m2 <0.0001 +++ m0 vs m3 0.00001 ++ m1 vs m2 0.42 = m1 vs m3 <0.0001 +++ m2 vs m3 <0.0001 +++ Méthodes comparées p-valeur La différence est-elle significative ? m0 vs m1 <0.0001 +++ m0 vs m2 <0.0001 +++ m0 vs m3 0.5067 = m1 vs m2 0.007 + m1 vs m3 <0.0001 +++ m2 vs m3 <0.0001 +++ Méthodes comparées p-valeur La différence est-elle significative ? m0 vs m1 <0.0001 +++ m0 vs m2 <0.0001 +++ m1 vs m2 0.34 = F IG . 9.8. Distribution de la longueur des trajectoires indirectes obtenues par sélection des experts en fonction de la distance des marqueurs par rapport à l’apex sur la séquence S1 . CHAPITRE 9. COMPARAISON D’ALGORITHMES 172 TAB . 9.4. Valeurs de la métrique ST E (moyenne en mm, ± écart type), pour les trois séquences entre les TIR et les TIE pour chaque méthode. Les valeurs maximum de la ST E sont données sur les trois dernières colonnes. Méthodes m0 m1 m2 m3 S1 6.8 ± 3.6 2.2 ± 1.2 2.3 ± 1.5 5.6 ± 1.9 ST E S2 4.2 ± 2.7 1.7 ± 0.9 1.3 ± 0.9 4.3 ± 1.4 S3 3.2 ± 1.7 1.17 ± 0.4 1.17 ± 0.5 – Valeur max. de la ST E S1 S2 S3 14.6 11.6 9.37 5.1 4.4 2.61 6.5 5.7 3.35 10.4 8.7 – TAB . 9.5. Pour les trois séquences, ST E (moyenne en mm, ± écart type) entre les TIR et les TDR d’une part (ligne 1) et les TDE d’autre part. Tous les marqueurs sont pris en compte pour fournir ces valeurs par séquence. Méthodes comparées TIR vs. TDR TIR vs. TDE (m1 ) TIR vs. TDE (m2 ) TIR vs. TDE (m3 ) S1 2.9 ± 1.7 3.3 ± 1.8 3.4 ± 2.0 5.6 ± 2.4 S2 1.2 ± 0.7 1.7 ± 1.1 1.7 ± 1.2 3.9 ± 1.8 S3 0.6 ± 0.2 1.0 ± 0.5 1.0 ± 0.4 – TAB . 9.6. Tests statistiques réalisés pour comparer les TDE et les TIE pour chacune des méthodes. Tous les marqueurs sont pris en compte pour fournir ces valeurs par séquences. S1 S2 S3 Méthodes comparées p-valeur La différence est-elle significative ? TDE (m1 ) vs TIE (m1 ) <0.0001 +++ TDE (m2 ) vs TIE (m2 ) <0.0001 +++ TDE (m3 ) vs TIE (m3 ) 0.63 = Méthodes comparées p-valeur La différence est-elle significative ? TDE (m1 ) vs TIE (m1 ) 0.05 + TDE (m2 ) vs TIE (m2 ) <0.0001 +++ TDE (m3 ) vs TIE (m3 ) 0.0039 ++ Méthodes comparées p-valeur La différence est-elle significative ? TDE (m1 ) vs TIE (m1 ) 0.0005 +++ TDE (m2 ) vs TIE (m2 ) <0.0001 +++ 9.6. DISCUSSION 173 9.6.1 Précision des méthodes La précision des trois méthodes comparées (m1 , m2 et m3 ) est d’abord évaluée grâce au critère T RE (section 9.6.1) L’erreur globale issue du critère T RE (pour l’ensemble des marqueurs et l’ensemble des images des séquences) est à mettre en relation avec la taille des voxels des images testées. En ce qui concerne notre méthode (m1 ) et celle basée sur l’algorithme des démons (m2 ), la moyenne des erreurs (Tableau 9.2) est de 2.1 mm et 2.0 mm, respectivement. Ces résultats sont en accord avec la taille des pixels (0.9 × 0.9 × 2.5 mm) et l’incertitude liée à la sélection des experts (1.2 mm). L’analyse des diagrammes de Bland-Altman (Figure 9.7), indique que les déplacements estimés sont généralement plus faible que la référence désignée par les experts. En effet, la différence entre les deux méthodes est toujours légèrement inférieure à 0 (le pointage des experts étant considéré comme méthode de référence). Une explication de ce phénomène peut être que les régularisations intégrées dans chacune de ces méthodes limitent les déformations trop importantes et conduisent donc à une légère sous-estimation de l’amplitude des déplacements. En ce qui concerne la méthode basée sur le modèle biomécanique (m3 ), plusieurs facteurs peuvent expliquer les résultats obtenus. 1. Les images testées ne contiennent pas toujours l’intégralité des structures pulmonaires ce qui pénalise l’extraction du masque binaire permettant la construction du maillage volumique initial. Celui-ci est alors complété et extrapolé de manière arbitraire. 2. Pour limiter le temps de calcul, seul un maillage grossier a été pris en compte (taille approximative des éléments du maillage volumique : S1 = 24 × 12 × 12mm3 et S2 = 10 × 10 × 10mm3 ). 3. Les amers ont été définis dans des zones présentant de forts gradients (repères facilement interprétables par les experts) ce qui signifie qu’ils correspondent à des régions présentant des propriétés physiques très hétérogènes. Ceci pénalise d’autant plus le comportement du modèle biomécanique basé justement sur des propriétés d’homogénéité des milieux étudiés. Malgré tout, nous observons sur la Fig. 9.6 que l’erreur moyenne est en deçà de la résolution du maillage. Les diagrammes de Bland-Altman (Fig. 9.7) nous permettent de détecter des marqueurs spécifiques pour lesquels les pointages fournis par les experts n’étaient pas en accord. Ces points peuvent être considérés comme aberrants. Après discussion avec les experts, ils ont été supprimés de la liste des points à comparer. On constate une légère différence entre les résultats obtenus par m1 et m2 pour les séquences de test S1 et S2 (voir Tab. 9.2). Une explication à cette remarque peut être donnée en considérant le modèle de transformation que nous utilisons. La méthode m2 permet d’obtenir un champ de déplacement où un vecteur de mouvement est attribué en chaque voxel de l’image. C’est une caractéristique importante des méthodes non-paramétriques. La précision ne dépend donc pas de la région d’intérêt considérée. En revanche, pour notre méthode, le champ de mouvement est exprimé par 174 CHAPITRE 9. COMPARAISON D’ALGORITHMES un modèle continu pour lequel l’influence de chaque paramètre dépend de la région d’intérêt et de la taille de la grille utilisée. Sur S1 la taille des images est de 386 × 256. La taille finale de la grille de déformation utilisée a été fixée à 19 par dimension. Ceci correspond approximativement à un point de contrôle tous les 10 voxels. La différence morphologique entre les patients correspondant aux séquences S1 et S2 entraîne la prise en compte d’une ROI légèrement plus grande sur les images de la séquence S2 (taille : 511 × 316 pixels). L’espace entre chaque point de contrôle devient alors plus important (14 voxels). Ceci peut expliquer ces légères différences de précisions. Au regard du Tableau 9.2, les méthodes m1 et m2 peuvent être considérées comme fournissant des résultats similaires. Cette remarque est confirmée par les tests de Student résumés dans le Tableau 9.3 (surtout pour S1 et S3 ). L’ensemble des résultats concernant la méthode m3 conduit à approfondir les notions de condition de contact pour les modèles à Eléments Finis. Nous observons que les conditions de contact ne sont pas proprement établies. En particulier, les conditions de non pénétration ne sont pas respectées pour certains nœuds du maillage. Ceci explique pourquoi, dans certains cas, la différence peut paraître importante. La précision (ou l’imprécision) du contact est de l’ordre de 5 mm, nous comprenons pourquoi la différence est quasiment constante pour l’ensemble des instants, et pourquoi la méthode m0 semble donner parfois de meilleurs résultats. Le développement d’un modèle biomécanique réaliste est très complexe dans le sens où il faut prendre en compte les multiples phénomènes dynamiques qui interagissent et trouver les bons modèles. Ceci est d’autant plus vrai pour le système respiratoire. 9.6.2 Etude des trajectoires 9.6.2.1 La métrique ST E pour l’évaluation des méthodes D’une manière générale l’évaluation spatio-temporelle des méthodes est réalisée en comparant les TIR et les TIE. D’après le Tableau 9.4, les trajectoires étudiées montrent que la distance moyenne entre les TIR et les TIE est d’environ 2 mm avec les méthodes m1 et m2 et d’environ 5 mm avec la méthode m3 , conséquence direct de l’accumulation des erreurs d’estimation sur l’ensemble des images d’une séquence. En pratique, il est rare de constater que de fortes erreurs mises en évidence par le T RE puissent conduire à de faibles valeurs de ST E. La différence entre les méthodes m1 et m2 peut être considérée comme statistiquement négligeable. Sur la séquence S1 , avec les méthodes m1 et m2 , le critère ST E (Tab. 9.4) est légèrement plus élevé que la moyenne des trois valeurs de T RE sur cette même séquence (moyennes de 2.0 et 2.2 mm, voir Tableau. 9.2 sur l’ensemble des instants comparés à une moyenne de 2.2 et 2.3 mm, voir Tab. 9.2). Les méthodes m1 et m2 conduisent à des résultats comparables, la valeur maximale du ST E est un peu plus faible pour la méthode m1 . Il ne s’agit pas, cependant, de tirer des conclusions trop générales car seulement trois cas ont été considérés dans cette étude. En revanche, il est intéressant de noter que la prise en compte du temps pour l’évaluation de l’estimation de mouvement sur l’ensemble d’un séquence peut modifier l’erreur globale associée à une trajectoire : certains résultats semblent être similaires pour S1 et S2 au regard du critère T RE alors que le critère ST E 9.6. DISCUSSION 175 permet de mettre en évidence quelques différences (voir ci-dessous). 9.6.2.2 La métrique ST E pour l’évaluation de l’apport du mouvement en radiothérapie Le tableau 9.4 illustre, au travers de trois séquences, l’importance de la prise en compte du mouvement. Les erreurs identifiées avec ST E entre les TIR et TIE sont considérablement réduites avec les méthodes m1 et m2 par rapport à la situation où le mouvement n’est pas du tout pris en compte (ST E de l’ordre de 2 mm pour m1 et m2 dans S1 contre presque 7 mm pour m0 , les valeurs maximales atteignant jusqu’à 14 mm !). Les méthodes m1 et m2 compensent correctement le mouvement avec des valeurs de ST E de l’ordre de 2 mm pour les 3 séquences. Une seconde question concerne l’intérêt de prendre en compte des instants intermédiaires pour l’estimation de mouvement. Pour cela, nous disposons des statistiques du critère ST E entre les TIR et TDR d’une part et les TIR et TDE d’autre part (tableau 9.5). Ici, l’écart observé dépend des séquences. Supérieur ou égal à 3 mm pour S1 , il est proche de 1.5 mm pour S2 et inférieur ou égal au mm pour S3 . Donc, il apparaît que selon les séquences, et les patients, la prise en compte d’instants intermédiaires peut ou non avoir un impact. Comme il est difficile d’évaluer par avance la dynamique respiratoire d’un patient, on ne peut que dire, qu’idéalement, il est préférable de disposer d’instants intermédiaires en vue d’une estimation de mouvement la plus précise possible. Nous remarquons également que les méthodes se comportent différemment face à ce problème. Bien que les méthodes m1 et m2 conduisent à des ST E similaires, le Tableau 9.6 montre que la différence entre les TDE et les TIE est significative avec la méthode m2 alors que, pour la méthode m1 , cette différence n’est significative que pour la séquence S1 et S3 . Il semble donc que les trajectoires estimées avec la méthode m1 soient plus linéaires que celles estimées avec la méthode m2 . Tous les critères statistiques ont été calculés globalement sur l’ensemble de l’image. Cependant le mouvement est loin d’être homogène sur l’ensemble du cycle. En particulier, les trajectoires sont nettement plus longues et plus linéaires dans les régions proches du diaphragme que près de l’apex (Fig. 9.8). Pour les études futures, l’utilisation de tels critères peut conduire à des analyses précises et quantitatives du comportement in vivo des poumons au cours de la respiration et notamment la mise en place de modèles de mouvement adaptés aux différentes régions du thorax (partie haute/basse des poumons, régions tumorales). 9.6.2.3 Comparaison de la T RE et de la ST E La mesure T RE est une méthode intuitive d’évaluation du suivi de mouvement. Cependant, elle ne tient compte que partiellement de la position des amers au cours de la séquence. Ceci malgré le fait que les structures anatomiques en mouvement suivent des lois physiologiques bien précises. La mesure ST E est un critère qui intègre le temps dans cette évaluation afin de conclure de manière plus précise sur les performances d’algorithmes de suivi de mouvement. L’évaluation devient ainsi plus cohérente avec la 176 CHAPITRE 9. COMPARAISON D’ALGORITHMES notion de trajectoire ou de chemin emprunté. Les mesures T RE et ST E apportent des informations complémentaires. Des méthodes qui semblent être identiques avec la métrique T RE (voir Tab. 9.3, séquence S2 , ligne 4), peuvent montrer certaines différences lorsque nous comparons la trajectoire complète des amers (voir Tableau 9.6, séquence S2 , ligne 1 et 2). Si nous considérons les deux métriques conjointement, nous pouvons conclure que les trajectoires issues de l’estimation avec m1 sont plus linéaires que celles estimées avec m2 . Ce contexte d’évaluation pourraient être utilisés pour étudier l’hystérésis observable pendant le cycle respiratoire (les trajectoires empruntées lors de l’inspiration sont différentes de celles empruntées pendant l’expiration), cependant pour mener à bien cette étude il faut sélectionner la position des points sur l’ensemble de la séquence respiratoire. 9.7 Conclusion partielle Dans ce chapitre, nous avons proposé une stratégie pour l’évaluation de la précision d’estimateurs de mouvement de structures thoraciques à partir de séquences 4D TDM. Cette étude est intéressante au moins à deux niveaux : 1. Elle nous a permis de confronter, dans le cadre d’une collaboration entre trois laboratoires Lyonnais, les performances de notre algorithme face à d’autres méthodes développées récemment. 2. Elle nous a permis de confirmer l’importance du mouvement respiratoire et de quantifier l’apport de la prise en compte de plusieurs images pour l’estimation des mouvements thoraciques. La procédure d’évaluation est basée sur l’intervention d’experts qui, dans notre cas ont accepté de repérer plus de 500 points repartis sur 4 phases de 3 séquences. Le critère d’erreur spatio-temporelle de trajectoire (ST E) permet de prendre en compte l’aspect temporel des déplacements en exploitant un modèle de la respiration. Il permet de faire ressortir certaines propriétés des estimateurs (linéarité des trajectoires estimées) et de souligner des différences entre deux estimateurs là où la simple considération du T RE conduit à des conclusions identiques. Cependant, il ne faut pas perdre de vue que ces deux informations sont complémentaires pour interpréter la précision des méthodes évaluées. Le critère spatio-temporel ST E proposé permet d’évaluer la trajectoire de points anatomiques au cours du cycle respiratoire. Cette information est particulièrement intéressante dans le cadre de la radiothérapie où des modèles 4D doivent être individualisés à partir de données 4D CT et utilisés pour l’estimation de dépôts de dose durant les irradiations thérapeutiques d’organes en mouvement. Le cadre d’évaluation proposé a été mis en œuvre pour la comparaison de méthodes différentes d’estimation de mouvement. Les résultats de l’évaluation montrent que notre méthode et la méthode basée sur l’algorithme des démons conduisent à des résultats similaires en terme de précision d’estimation. La précision obtenue est inférieure à la résolution spatiale des images. En ce qui concerne l’approche basée sur une déformation biomécanique par éléments finis, l’erreur 9.7. CONCLUSION PARTIELLE 177 estimée est cohérente avec la résolution des maillages utilisés et ne peut être comparée directement avec la taille des voxels. Cependant, nous sommes convaincus que ces approches (iconiques et basées sur un modèle biomécanique) sont complémentaires et pourront être couplées par la suite. Dans ce chapitre, les résultats obtenus sont issus de trois séquences 4D sur la moitié d’un cycle respiratoire. Cette étude doit être approfondie en incluant d’autres séquences et en prenant en compte l’ensemble du cycle respiratoire. Enfin, des contraintes physiques sur les déformations et une régularisation temporelle peuvent être prises en compte pour augmenter les performances des algorithmes proposés. Remerciements Nous remercions Greg Sharp, Steve Jiang et Noah Choi du Massachusetts General Hospital à Boston pour nous avoir fourni, par l’intermédiaire du Centre Léon Bérard (D. Sarrut), les données TDM 4D à partir desquelles nous avons réalisé nos expérimentations. Nous remercions également Line Claude et toutes les autres personnes qui ont passé beaucoup de temps à sélectionner les marqueurs dans les images. 178 CHAPITRE 9. COMPARAISON D’ALGORITHMES 179 Conclusion et Perspectives Bilan des contributions Ce travail de thèse a été pour moi l’occasion d’aborder un certain nombre de problèmes liés à la mise en correspondance d’images médicales cardiaques et thoraciques. Le recalage d’images a été exploité dans notre contexte comme un moyen d’estimer des transformations locales non linéaires afin de caractériser l’évolution d’organes comme le cœur et le thorax durant leur cycle physiologique. Tout au long de ce travail, nous nous sommes efforcés d’intégrer les hypothèses et contraintes introduites par les deux contextes applicatifs tout en proposant un cadre méthodologique général pour l’estimation spatio-temporelle du mouvement et le suivi de structures déformables dans des séquences d’images. Concernant la méthode de recalage entre deux images, nous nous sommes basé sur un modèle de déformation paramétrique de formes libres exprimée dans une base de fonctions B-Splines. Il nous permet de prendre en compte le caractère semi-local des transformations impliquées dans les phénomènes étudiés. La volonté d’introduire des contraintes spatio-temporelles de déformations, nous a incité à privilégier une approche paramétrique. L’approche de recalage repose sur la prise en compte d’une double pyramide. La première permet de gérer la hiérarchie de la décomposition du modèle de transformation alors que la seconde est une représentation multi-résolution des images à recaler. L’ensemble est ordonnancé selon le choix de l’utilisateur. Une de nos contributions dans la méthode de recalage sans a priori concerne l’exploitation d’un filtre détecteur de ruptures. La sortie de ce filtre traduit la stationnarité locale de l’intensité des pixels. Trois différents critères sont proposés pour la mise en correspondance des images. Le premier est uniquement basé sur l’intensité des voxels, le second est un critère chargé de mettre en correspondance les zones stationnaires d’intensité et s’appuie sur le filtre détecteur de ruptures. Le dernier critère est un critère vectoriel combinant ces deux informations. Le filtre a également été exploité pour réduire notablement les temps de calcul. Nous avons en effet proposé de réduire l’espace d’analyse en fonction des informations fournies par le filtre sachant qu’il nous renseigne sur la localisation des régions de l’image qui ont potentiellement une influence sur l’évolution des paramètres de la transformation. Enfin, notre algorithme a été parallélisé pour palier l’un des inconvénients des méthodes paramétriques de recalage : des temps de calculs élevés en 3D. La suite de nos contributions concernent plus spécifiquement l’estimation du mouvement 181 182 CHAPITRE 9. COMPARAISON D’ALGORITHMES et de l’évolution des structures cardiaques en IRM. Dans le cadre d’une collaboration avec le VTT, Tampere et la laboratoire BME à Helsinki, Finlande, nous avons contribué à la construction d’un modèle statistique de forme dynamique. L’intérêt de cette contribution est lié au nombre d’examens utilisés pour la construction du modèle (15) et la prise en compte à la fois des données en petit axe et en grand axe. Ce modèle reflète la variabilité de la forme des structures cardiaques sur un cycle dans la base d’images des 15 cas normaux. Il a été utilisé dans le cadre de notre application cardiaque pour contraindre la méthode de recalage afin de compenser deux effets indésirables. Le premier de ces effets est lié à la dérive observable lorsqu’une succession de recalages 3D est réalisée. Le second concerne l’anisotropie de résolution intrinsèque aux techniques d’acquisitions en cine-IRM cardiaque. L’information a priori fournit par le modèle permet de limiter ces effets lorsque l’ensemble de la séquence est analysée. Cela permet d’obtenir, en plus de l’information de mouvement, un suivi des différentes structures du cœur sur l’ensemble de la séquence par transport d’atlas. L’approche par cascade de recalage ne permet cependant pas de garantir une continuité et une cohérence des estimations sur l’ensemble de la séquence et suivant l’axe temporel. C’est là, l’intérêt de notre dernière contribution. Nous proposons en effet dans le dernier chapitre méthodologique de combiner l’algorithme de recalage et un filtre de Kalman permettant de prédire et de filtrer les paramètres d’un modèle dynamique à partir des résultats obtenus sur l’ensemble de la séquence. Pour cela, nous avons introduit un modèle de mouvement spatio-temporel basé sur l’extension à l’axe temporel du modèle de déformation de forme libre. L’idée de base consiste à considérer non plus des points de contrôle mais des fonctions de contrôle pour analyser le mouvement sur l’ensemble d’une séquence. Ce modèle garantit la continuité et la périodicité des mouvements estimés. L’ensemble des paramètres est prédit et filtré dans le cadre méthodologique du filtre de Kalman afin que l’estimation spatio-temporelle finale repose sur la contribution de tous les instants de la séquence. Afin de limiter le nombre de paramètres aux endroits qui ne le justifient pas, nous proposons d’adapter localement la complexité des trajectoires en fonction de l’intensité de la déformation. Cette proposition est en cours de d’implantation. Pour finir, un apport également important dans le cadre de ce travail est la mise en place d’un contexte d’évaluation permettant d’évaluer l’apport du recalage et de comparer différentes techniques de recalage sur l’ensemble d’une séquence dans un contexte de prise en compte du mouvement respiratoire dans le traitement de tumeurs pulmonaires par radiothérapie. Perspectives méthodologiques Compensation de l’anisotropie de résolution Dans le cadre spécifique de l’estimation du mouvement cardiaque, les données fournies par les imageurs par RM souffrent toujours d’une forte anisotropie de la résolution spatiale. L’empilement des coupes acquises et surtout la génération de volumes isotropes par interpolation ne résolvent que partiellement les problèmes dus à un espacement entre coupes généralement beaucoup plus élevé que la résolution dans le plan de coupe. Il s’agit donc d’un problème qu’il faut considérer afin d’améliorer les traitements 9.7. CONCLUSION PARTIELLE 183 réalisés sur ce type d’image, que ce soit pour l’estimation de mouvement ou pour la segmentation. Une solution envisagée consiste à prendre en compte conjointement les données en petit axe et les données en grand axe comme c’est le cas dans [Lötjönen et al., 2004] dans le cadre de la segmentation des différentes structures du cœur. Cependant cette perspective soulève la question de la masse de donnée sans cesse croissante à prendre en compte pour améliorer les techniques actuelles et qui constitue une limite pour les ordinateurs courants. Nous reviendrons sur ce point. L’imagerie TDM souffre moins de ce problème d’anisotropie et l’estimation de mouvement obtenue entre deux images 3D est cohérente suivant les trois dimensions. Combinaison de deux processus physiologiques/ prise en compte des discontinuités Tout au long de cette thèse nous avons orienté nos choix et nos développements méthodologiques de manière à considérer soit le mouvement cardiaque soit le mouvement respiratoire. Une orientation possible concerne l’estimation conjointe des mouvements engendrés par ces deux systèmes. Certains auteurs ont proposé des modèles comportementaux pour tenir compte du glissement dû à la présence du liquide pleural observable aux interfaces cœur/poumons et poumons/cage thoracique [Kaye et al., 1997]. Cette étude peut être intéressante pour mieux comprendre in vivo le comportement et le type de mouvements observables à ces interfaces. Actuellement, les techniques d’acquisition ne permettent pas encore d’obtenir des images permettant une telle étude, cependant des modèles géométriques dynamiques incluant à la fois la respiration et le cycle cardiaque sont à l’étude en vue de ce type de simulation. Prise en compte de la causalité pour le suivi de forme Au cours de nos travaux, nous n’avons pas discuté de l’adaptation de la contrainte de déformation C (équation (5.14)) issue du modèle dynamique de cœur en fonction des résultats obtenus aux instants précédents. Considérons en effet le résultat d’une déformation à l’instant j. Le modèle permet d’identifier les N sujets les plus proches du résultat obtenu. Une solution pour tenir compte de cette information consiste à ne prendre en compte que ces N individus au lieu de l’ensemble des sujets pour construire la variation de forme à l’instant suivant. Cela revient à considérer une probabilité conditionnelle p(X i (t) = xi (t)|t − 1) au lieu de p(X i (t) = xi (t)) dans l’équation (5.10). Enrichissement par d’autres modalités d’imagerie cardiaque L’instantiation du modèle dynamique du cœur est basé sur l’analyse exclusive de séquences d’images en cine-IRM. La segmentation de l’ensemble des images de chaque séquence ne permet pas d’assurer que les trajectoires établies suivent parfaitement le mouvement réel des différentes structures. Nous sommes confronté au problème d’ouverture bien connu des méthodes d’estimation de mouvement. La composante normale à la surface des structures peut être correctement estimée, en revanche l’estimation de la composante tangentielle, particulièrement importante dans l’étude du mouvement 184 CHAPITRE 9. COMPARAISON D’ALGORITHMES cardiaque (mouvement de torsion), n’est pas garantie. Ce modèle gagnerait énormément à être enrichi d’informations issues d’images par RM de marquage tissulaire. Réduction du temps de calcul par méthodes adaptatives Le recalage déformable d’images volumiques implique la mobilisation d’un grand nombre de paramètres. L’espace mémoire nécessaire n’est pas critique dans ce cas mais il peut le devenir dans le cas du modèle spatio-temporel. Un effort spécifique doit être réalisé pour réduire encore les temps de calcul et diminuer le nombre de paramètres sans pour autant pénaliser la qualité du recalage. La grille de déformation que nous utilisons est parfaitement uniforme sur l’ensemble du domaine. Pour certaines régions où la dynamique est importante, il est possible d’améliorer la précision en raffinant localement la grille de déformation [Hellier et al., 2001]. Cette adaptation est facilement transposable à notre algorithme et constitue une alternative encore plus efficace au modèle multi-échelle considéré dans nos travaux. Cela nous amène à faire une distinction plus nette entre l’adaptation spatiale du modèle de déformation et l’adaptation temporelle de la complexité locale des trajectoires. Pour l’instant, l’adaptation des trajectoires ne peut se faire que sur un ensemble de points uniformément distribués de la grille de déformation. Cette perspective nous permet d’envisager conjointement l’adaptation spatiale et temporelle du modèle. Le gain obtenu en terme de paramètres peut alors devenir très significatif. Il s’agit d’une étape indispensable pour que nous puissions utiliser le modèle spatio-temporel en 3D+temps ce qui demeure pour l’instant difficilement envisageable sur des ordinateurs standards où l’espace mémoire est limité. Amélioration de l’estimation de mouvement spatio-temporelle Des améliorations sont envisageables à ce niveau lorsque l’on considère plus en détail le filtrage de Kalman des paramètres du modèle spatio-temporel. Des techniques de lissage sur l’ensemble de la séquence peuvent être préférées aux techniques de prédiction/filtrage. En particulier, la technique de lissage à point fixe (fixed-point smoothing en anglais) est bien adaptée à notre modèle d’état considéré comme stationnaire. Parallèlement à cela, on peut envisager de parcourir la séquence à l’endroit (forward) et à l’envers (backward) et de confronter les résultats afin d’améliorer la pertinence de la transformation estimée [Meyer et al., 1996]. Le cadre général des équations d’états que nous avons proposé n’est pas entièrement exploité. Notamment, la relation spatiale entre les points de contrôle n’a pas été considérée dans le filtrage de l’état. Certaines relations pourront être introduites par la suite grâce à la souplesse apportée par l’utilisation de matrices blocs. Combinaison du modèle géométrique du cœur et du filtrage spatio-temporel de Kalman L’un de mes plus grands regrets dans le cadre de mes travaux de thèse est de n’avoir pas eu le temps d’approfondir la combinaison entre l’algorithme d’estimation spatio-temporelle de mouvement et le modèle dynamique que nous avons crée dans le 9.7. CONCLUSION PARTIELLE 185 cadre de notre collaboration avec la Finlande. Nous sommes convaincus qu’en combinant ces deux modèles nous pouvons obtenir une méthode très intéressante pour à la fois obtenir une estimation de mouvement et une segmentation temporellement cohérentes sur l’ensemble de la séquence. Une possibilité pour combiner ces deux approches peut consister à décomposer les trajectoires des pseudo-marqueurs (voir section 5.3.1) de la même manière que pour les points de contrôle. Il s’agirait alors de ne plus considérer les trajectoires des points de contrôle de la grille de déformation dans le vecteur d’état, mais celles des pseudo-marqueurs pour lesquels nous possédons des informations statistiques très intéressantes. Pour chacun de ces points particuliers, nous disposons en effet d’une trajectoire moyenne décomposable sur une base de fonctions harmoniques et d’une variation non-gaussienne autour de cette trajectoire qui pourra servir à modéliser le bruit d’état de manière non-stationnaire. En stockant ces trajectoires dans le vecteur d’état, cela nous ramène au cadre général des techniques de filtrage optimal et plus particulièrement des techniques de filtrage polynomial. Perspectives applicatives Validation de la méthode d’estimation de mouvement spatio-temporel cardiaque Tout d’abord, une évaluation plus consistante de la méthode spatio-temporelle mise en place pour l’application cardiaque doit être mise en oeuvre. Nous envisageons d’éprouver notre technique pour la détection de cas pathologiques par une étude des tenseurs de déformations engendrés par les mouvements estimés. La continuité du modèle assure une grande cohérence temporelle des estimations et les tenseurs de déformations résultants sont alors pleinement exploitables pour détecter les zones présentant des anomalies de mouvement. Nous n’avons pas encore eu la possibilité de tester la méthode d’estimation de mouvement spatio-temporel avec des données IRM marquées. Il s’agit bien entendu d’une perspective très intéressante envisagée à court terme. Reconstruction d’images compensée par l’information de mouvement en imagerie thoracique Une fois la méthode adaptée pour une estimation 3D+temps du mouvement, il sera possible de considérer les trajectoires et le suivi de tumeurs dans des images TDM. Il deviendra alors intéressant d’étudier l’hystérésis des trajectoires et d’évaluer l’impact du mouvement des tumeurs dans des simulations de dépôt de dose sur l’ensemble du cycle respiratoire. Les trajectoires obtenues à partir de quelques instants de la séquence pourraient aussi être exploitées pour améliorer la reconstruction d’images en TDM dynamique. 186 CHAPITRE 9. COMPARAISON D’ALGORITHMES Annexes 187 Annexe A La Tomodensitométrie à rayons X L a Tomodensitométrie (TDM), dénommée Computerized Tomography (CT) en anglais, est une technique d’imagerie qui utilise la physique des rayons X. Littéralement le terme tomographie signifie reconstruction de coupes. La TDM se démarque de la radiographie conventionnelle par l’acquisition d’un grand nombre de projections autour d’un même objet. L’ensemble de ces projections servent ensuite à la reconstruction d’objets tridimensionnels afin de mettre en évidence des tumeurs, des infections ou des hémorragies. Elle permet également de localiser avec précision un organe par rapport à un autre et de guider des ponctions d’organes profonds (biopsies) évitant ainsi des interventions chirurgicales. Il s’agit d’une imagerie essentiellement anatomique. A.1 Principe Physique La tomographie à rayons X repose sur le parcours de rayons X émis par une source à travers l’objet étudié. Les rayons X ont été découverts par Wilhelm Röntgen en 1895, ce qui lui value le premier prix Nobel de physique. La radiographie utilise le fait que tout faisceau de rayons X traversant un objet subit une atténuation. Cette atténuation est directement reliée aux propriétés physiques du matériau traversé et notamment le coefficient d’atténuation linéique µ. L’absorption des rayons X par la matière est décrite par la loi de Beer-Lambert : Iout = I0 e−Lµ pour un milieu homogène R − µ(x)dx Iout = I0 e pour un milieu hétérogène (A.1) (A.2) où I0 représente l’intensité du faisceau entrant, Iout , l’intensité du faisceau sortant et L, la longueur de l’objet suivant la direction considérée. Cette relation établit que chaque élément contribue à l’atténuation du faisceau. L’effet de l’atténuation est directement reliée à la longueur parcourue dans ce milieu (Fig. A.1). Pour réaliser une radiographie, on utilise une source émettrice de rayons X et une plaque photosensible située de l’autre côté de l’objet que l’on désire étudier. 189 ANNEXE A. LA TOMODENSITOMÉTRIE À RAYONS X 190 I0 µ1 µ2 µ0 µ1 µ3 Iout F IG . A.1. Passage d’un rayon X dans un milieu hétérogène A.2 Formation des Images Nous décrivons sommairement les principales étapes de la reconstruction tomographique afin de mettre en évidence les difficultés liées à l’imagerie d’objets mobiles (section 2.4). Dans ce qui suit, nous supposons que la géométrie d’acquisition est de type parallèle, ce qui constitue un cas idéal qui n’est pas celui de la réalité. La manipulation de géométries réalistes (géométrie en éventail ou géométrie conique) nécessite l’utilisation de transformations géométriques particulières qui ne seront pas développées ici. La TDM repose sur un ensemble de projections recueillies grâce à un capteur numérique et acquises lors de la rotation de l’ensemble source-capteur autour du patient. Le capteur est composé d’un ensemble de petits détecteurs (actuellement de 800 à 4800) alignés dans un anneau placé autour du patient (voir Fig. 2.7). Ces détecteurs captent les rayons atténués et déterminent donc la densité des structures traversées. L’ensemble de l’information est stockée puis traitée. La distribution tridimensionnelle de la fonction d’atténuation de l’objet à reconstruire est déterminée numériquement en tant que solution d’un problème inverse. Le fondement théorique de la reconstruction d’images en TDM a été établi, bien avant son apparition, par Radon en 1917 dont un théorème montre la possibilité de reconstruire un objet volumique à partir de la totalité de ses projections. En 2D, la transformée de Radon a pour expression : Z Rf (θ, p) = f (M )dM (A.3) M∈D(θ,p) La valeur de Rf (θ, p) représente l’intégrale de la fonction d’atténuation de l’objet f sur la droite de projection D(θ, p) (Fig. A.2). M est le vecteur représentant les coordonnées géométriques de chaque élément de matière. Pour un angle de rotation donné θ, la fonction Rf (θ, p) = Rfθ (p) représente la contribution en chaque abscisse p des rayons atténués. En pratique, il n’est pas possible d’obtenir toutes les projections nécessaires à la reconstruction exacte de l’objet. Les acquisitions sont obtenues pour un ensemble fini de positions, sur l’intervalle [0, π], de l’arc portant la source X et les détecteurs. Des opérations de filtrage des données et diverses stratégies sont mises en œuvre pour parvenir à produire une image numérique correspondant à une coupe de l’objet étudié. Il existe une bibliographie extrêmement riche concernant les méthodes de reconstruc- A.2. FORMATION DES IMAGES 191 y f(M) θ D(θ ,p) x p Récepteur F IG . A.2. Objet f (M ) plongé dans le scanner et sa projection suivant l’angle θ tions en tomographie. La plupart des méthodes sont adaptées à la reconstruction d’objets statiques puisqu’elles reposent sur l’hypothèse très forte que la particule M d’atténuation linéique µ occupe la même position géométrique durant l’ensemble des acquisitions. Mais que se passe t-il lorsque l’objet à imager est animé d’un mouvement comme dans le cas du thorax respirant ou du cœur battant ? Si l’objet évolue, les données obtenues sur un demi-tour ou un tour deviennent inconsistantes, comme s’il s’agissait d’objets différents. On constate ainsi l’apparition d’artefacts de mouvement qui se caractérisent par des flous localisés sur les régions animées, comme le montre la Fig. 2.2. Sur cette illustration, l’ensemble des projections a été obtenu durant le blocage volontaire de la respiration, ce qui explique que l’interface entre les poumons et les autres structures apparaît de manière précise. En revanche, le mouvement cardiaque n’a pas été pris en compte. L’ensemble des projections ont été obtenues pour des états différents du cœur entraînant un flou sur l’image reconstruite. Ce phénomène est mis en évidence par la zone entourée de rouge dans la figure A.2. Ce type d’artefact peut dissimuler des éléments importants de l’image et conduire à de mauvaises interprétations. La problématique de prise en compte du mouvement durant l’acquisition ne se limite pas au domaine cardiaque mais on la rencontre pour l’imagerie de toute structure anatomique mobile ou évoluant au cours du temps. C’est la cas notamment pour le suivi des structures pulmonaires au cour de la respiration dans le cadre d’une intervention chirurgicale ou d’un traitement par rayonnements ionisants. 192 ANNEXE A. LA TOMODENSITOMÉTRIE À RAYONS X Annexe B L’Imagerie par Résonance Magnétique L ’Imagerie par Résonance Magnétique (IRM) est une technique d’imagerie tomographique capable de produire des images de l’intérieur d’un objet en exploitant les propriétés magnétiques de la matière. Ces images peuvent mettre en évidence des caractéristiques anatomiques, physiques et chimiques de l’objet étudié. Cette partie est consacrée à la description des principes physiques à la base de l’IRM et à la formation des images. La connaissance de ces principes fondamentaux permet de comprendre les notions abordées à la section 2.3 et en particulier les techniques de synchronisation pour l’imagerie d’organes en mouvement. Pour plus de détails, nous invitons le lecteur à consulter par exemple [Liang and Lauterbur, 2000] ou l’adresse internet suivante : http ://www.cis.rit.edu/htbooks/mri/ B.1 Fondements Physiques La compréhension de l’IRM passe dans un premier temps par la compréhension des principes de la Résonance Magnétique Nucléaire (RMN). Le principe de la RMN, étudiée pour la première fois en 1946 par Purcell et Bloch, établit le comportement de noyaux des atomes de la matière sous l’effet d’un champ magnétique. Considérons l’atome d’hydrogène, abondamment présent dans le corps humain sous forme de molécules d’eau. Son noyau est composé d’un proton de charge +e, de masse m et caractérisé par une propriété quantique intrinsèque appelée Spin pouvant adopter deux états d’énergie possible (±1/2). Le spin est généralement associé à un mouvement de rotation de moment angulaire J (Figure B.1(a)) et de moment magnétique µ tel que : µ = γJ où γ est le rapport gyromagnétique du proton. Placés dans un champ magnétique statique B0 , les noyaux atomiques s’orientent selon l’axe de ce champ et précessent1 autour de celui-ci (voir Figure B.1(b)). La fréquence angulaire de Larmor, ω0 = γ kB0 k 1 (B.1) La précession est le changement graduel d’orientation de l’axe de rotation d’un objet quand un couple lui est appliqué 193 ANNEXE B. L’IMAGERIE PAR RÉSONANCE MAGNÉTIQUE 194 caractérise ce mouvement de précession et la fréquence de résonance excitatrice des différents protons plongés dans le champ B0 . J z B0 µ y x (a) (b) F IG . B.1. a) Mouvement de rotation d’un nucléon autour du moment angulaire J appelé spin. b) Mouvement de précession d’un noyau atomique autour de l’axe du champ B0 . Parmi tous les protons soumis à B0 , certains s’alignent selon ce champ de manière parallèle (Sud-Nord) et d’autre de manière anti-parallèle (Nord-Sud). Ces deux états correspondent à des niveaux discrets d’énergie différents Ep et Ea . Le protons se répartissent sur ces deux niveaux selon une distribution de Boltzmann : Np Ea − Ep ) = exp( Na kT (B.2) où Np et Na sont respectivement le nombre de protons dans l’état d’énergie Ep et Ea , k la constante de Boltzmann et T la température absolue. Les protons sont plus nombreux dans la configuration parallèle. L’aimantation macroscopique M , résultant de ~ , a même direction et sens que la sommation de toutes les aimantations élémentaires µ B0 . Si l’axe z correspond à la direction du champ B0 , alors nous avons Mz = kM k et Mxy = 0 où Mz et Mxy sont la composante longitudinale et tangentielle, respectivement. La valeur nulle de Mxy s’explique par le déphasage uniformément distribué des moments de précession, annulant ainsi la composante tangentielle à B0 . En routine clinique, l’intensité de ce champ statique est généralement de 1.5T et peut aller jusqu’à plus de 10T sur des systèmes expérimentaux. Considérons maintenant que ce champ statique B 0 est temporellement perturbé par ~ 1 (t) qui lui est orthogonale. Ce champ, généré une seconde source de champ magnétique B par une impulsion radiofréquence (RF) dans la direction longitudinale, est modulé à la fréquence ω0 de Larmor et son intensité est d’environ 50 mT. Cette perturbation modifie l’aimantation globale obligeant le vecteur M à quitter son état d’équilibre et à basculer d’un angle plus ou moins important (flip angle) selon la durée de l’impulsion (voir Figure B.2(a)). Ainsi Mz est modifié et la composante Mxy devient non nulle. Tout l’intérêt de la RMN réside dans l’observation du phénomène de relaxation (Figure B.2(b)). Ce phénomène intervient lors de l’interruption de l’impulsion RF entraînant le retour à l’état B.2. FORMATION DES IMAGES PAR RM 195 d’équilibre des noyaux. Le phénomène de relaxation est décrit par les équations de Bloch [Torrey, 1956] : Mxy (t) = Mxy (0+ )e−t/T 2 Mz (t) = Mze (1 − e−t/T 1 ) + Mz (0+)e−t/T 1 (B.3) (B.4) où Mxy (0+ ) et Mz (0+) sont respectivement la valeur de la composante tangentielle et transverse de M juste après l’impulsion RF. Mze correspond à la valeur de Mz à l’équilibre. T 1 et T 2 sont les deux constantes qui caractérisent la durée de retour à l’équilibre de Mz et Mxy respectivement et qui sont caractéristiques du tissu observé. L’équation (B.3) correspond au premier phénomène de relaxation dû au déphasage des spins entre eux annulant exponentiellement la composante tangentielle. L’équation (B.4) traduit la volonté générale des protons à s’aligner à nouveau dans la direction du champ B0 . Ces signaux, dont les énergies sont proportionnelles à la densité de spin, sont captés par des bobines réceptrices. Ils se présentent sous forme de signaux sinusoïdaux amortis et sont appelés signaux RMN (ou Free Induction Decay - FID - en anglais). Il est important de noter que l’enveloppe du signal FID est imposée par la décroissance exponentielle de la composante tangentielle Mxy (équation (B.3)) dont la composante de temps T 2 est plus courte que celle de la composante longitudinale. La transformée de Fourier de ces signaux sont des raies centrées sur la fréquence de résonance des protons. Les constantes de temps T 1 et T 2 ont une grande importance car elles déterminent l’intensité et le contraste des images. Elles dépendent de la composition et de la structure des tissus imagés. T 1 est toujours supérieur à T 2 avec un rapport de 10 environ. z B0 M Mz B1 y M Mxy x (a) (b) F IG . B.2. a) Perturbation de l’aimantation M par le champ créé par une impulsion RF. L’angle de bascule est fonction de la durée de cette impulsion. b) Retour à l’état d’équilibre des spins pendant la période de relaxation. L’évolution de l’aimantation est gouvernée par les équations (B.3) et (B.4). B.2 Formation des Images par RM A partir des principes physiques de noyaux dont on perturbe l’aimantation, il est possible de reconstruire des images. Pour cela, il est nécessaire de pouvoir différencier les réponses provenant des différentes parties de l’objet imagé. On distingue la sélection de coupe et l’encodage de deux directions pour la reconstruction d’une image. 196 ANNEXE B. L’IMAGERIE PAR RÉSONANCE MAGNÉTIQUE B.2.1 Encodage spatial Dans cette partie, nous décrivons comment chaque signal est spatialement différentié et localisé pour permettre la reconstruction d’une image. Cette discrimination spatiale est assurée par une excitation sélective puis par un encodage spatial. L’excitation sélective est obtenue par l’application d’un gradient spatial orienté dans la direction orthogonale à la coupe que l’on désire acquérir. Si, par exemple, on désire obtenir une coupe suivant l’axe z, le champ statique B s sera tel que : B s (z) = B 0 + gz z iz (B.5) où iz est un vecteur orthonormé directeur et gz une constante. L’application d’un tel champ statique impose une différentiation suivant l’axe z des fréquences de résonance de Larmor (B.1) des noyaux d’hydrogènes. Grâce au phénomène de résonance, la sélection d’une fréquence de modulation adéquate du signal RF permet de n’exciter que les protons correspondant au plan de coupe souhaité. Le temps qui s’écoule entre deux excitations s’appelle le temps de répétition (T R). L’encodage spatial est réalisé pendant le retour à l’équilibre des protons excités. Cette période est appelée période de précession libre. L’encodage spatial sert à discriminer les protons suivant les deux axes restants (x et y dans notre cas). On distingue le codage de phase et le codage de fréquence réalisés par application successive de deux gradients de champ magnétique. En appliquant un gradient de champ suivant l’axe x, la fréquence de précession des protons : ω(x) = ωs + γgx x, (B.6) est différenciée suivant leur position sur l’axe x. Ceci permet de distinguer chaque ligne du plan de coupe. Une fois ce déphasage réalisé, un second gradient de champ, appliqué suivant l’axe y, modifie la vitesse de précession des protons proportionnellement à leur ordonnée y. En pratique, le premier gradient est appliqué avant la lecture du signal. Le second champ est appliqué pendant la lecture. Le déphasage permet de localiser les protons suivant l’axe x et les différentes vitesses de précession permettent de localiser les protons suivant l’axe y. B.2.2 Les séquences d’écho On constate dans la pratique certaines hétérogénéités du champ B 0 . Si infimes soient elles, elles ont tendance à déphaser de manière indésirable le retour des protons à leur état d’origine. La diminution de la composante Mxy mesurée correspond au moyennage des protons plongés dans ces hétérogénéités magnétiques. Les contributions élémentaires déphasées tendent à accélérer l’annulation de la composante T 2 et donc du signal FID. On parle alors d’une seconde composante T2∗ plus faible que T2 . L’écho de spin est une solution utilisée pour corriger ce phénomène. En voici le principe : une première impulsion RF orientée suivant x fait basculer les aimantations élémentaires d’un angle de 90◦ de manière à ce qu’elles se retrouvent orientées selon l’axe y. Les hétérogénéités du champ B 0 ont pour conséquence que certaines particules précessent plus rapidement. Une seconde impulsion à 180◦ suivant l’axe des y inverse cet effet de déphasage et les protons les plus rapides rattrapent les plus lents, impliquant un rehaussement du signal observé dont l’intensité est à nouveau pondérée en T2 . Une illustration de cette description est B.2. FORMATION DES IMAGES PAR RM 197 donnée Figure B.3. Un enchaînement d’impulsions à 180◦ permet la formation d’un train d’échos de façon à prolonger le signal observé. Ce type de correction est largement utilisé en pratique et prend un intérêt particulier pour l’imagerie rapide et donc l’acquisition de séquence d’images. 180° 180° 180° 90° TE TE / 2 e −t / T2 * e −t / T2 F IG . B.3. Formation d’un train d’échos de spin avec, en haut, une séquence d’impulsions à 180◦ et en bas le signal d’écho résultant. Le second type d’écho que nous décrivons a aussi un rôle important dans la formation d’images ciné-IRM puisqu’il permet d’obtenir un grand nombre de signaux entre deux T R. L’écho de gradient est généré par une succession de gradients de champ qui déphasent et rephasent les signaux de manière contrôlée permettant ainsi la création de nombreux échos. Il faut noter toutefois que l’écho de gradient n’utilise pas d’impulsion d’inversion de spin et ne permet donc pas de corriger les hétérogénéités du champ magnétique statique : les images obtenues sont dites en T2∗ . Considérons la séquence de gradient de la Figure B.4. Après l’application d’une impulsion RF faisant pivoter les aimantations élémentaires d’un angle α (généralement les échos de gradient sont associées à de faibles valeurs d’angle de bascule pour accélérer les acquisitions), un gradient négatif (utilisé pour l’encodage spatial) déphase les spins proportionnellement à x selon la formule : Z τ −Gx x dt si 0 ≤ t ≤ τ γ (B.7) φ(x, t) = 0 −γ G x τ si t > τ x où τ est la durée d’application du gradient de champ. Gx est le scalaire qui traduit l’intensité de ce gradient et γ représente le rapport gyromagnétique du proton. Dans cet exemple, le déphasage entre les spins est donc proportionnel à leur position suivant l’axe x. La cohérence de phase devient alors de plus en plus faible suivant cet axe. Ceci combiné à l’hétérogénéité du champ B0 , le signal est caractérisé par une constante T2∗∗ . La décroissance du FID est alors très rapide. L’application d’un champ inverse rephase progressivement la magnétisation des différentes particules provoquant une augmentation du signal. L’application d’une succession de champ inverses, permet de réaliser plusieurs encodages ANNEXE B. L’IMAGERIE PAR RÉSONANCE MAGNÉTIQUE 198 spatiaux à partir d’une impulsion excitatrice initiale. Le nombre d’échos est limité par T2∗ et par la vitesse de bascule des gradients. Les imageurs par RM modernes permettent la formation de plus de 64 échos et ainsi la formation d’une image avec une seule impulsion RF. α Gx * e −t / T2 F IG . B.4. Formation d’un train d’échos en permutant les gradients de champ. Ces notions sont à la base des séquences ultra-rapides en IRM dont nous donnons une description au chapitre 2. Dans ce chapitre, nous nous intéressons à la façon de synchroniser les acquisitions sur le comportement des structures déformables étudiées. Annexe C Filtrage de Kalman L es principaux développements permettant d’obtenir les équations de Kalman présentées dans la section 6.3.2 sont donnés dans cette annexe. Cette annexe est inspirée d’un document disponible à l’adresse : http ://www.clubeea.org/ C.1 Notations Soit un système linéaire stochastique dont l’évolution dynamique est modélisée à l’aide des équations d’état : xj ′ = Aj · xj + Bj ′ · uj ′ + vj ′ (C.1) zj ′ = Cj ′ · xj ′ + wj ′ avec les contraintes suivantes : • E[vj ] = 0 • E[vj · vj ′ T ] = Qj δjj ′ avec Qj définie positive et δjj ′ symbole de Kroknecker • E[wj ] = 0 • E[wj · wj ′ T ] = Rj δjj ′ avec Rj définie positive • E[vj · wj ′ T ] = 0 • E[x0 · vj ′ T ] = 0 • E[x0 · wj ′ T ] = 0 • E[x̂0 · x̂T0 ] = P0 Le but du filtre de Kalman est d’estimer x̂j′ /j de xj′ /j à l’instant j ′ lorsque les mesures disponibles s’étendent de l’instant 0 jusqu’à l’instant j. Cette estimation est optimale au sens de la minimisation de la variance d’erreur entre la variable réelle et son estimation : 2 E[xj ′ − x̂j ′ /j / {z0 , z1 , . . . , zj }] 6 E[k(xj ′ − x)k2 / {z0 , z1 , . . . , zj }] (C.2) avec kxk2 = xT · x On distingue trois cas différents selon la position de j ′ par rapport à j : • j ′ < j : lissage • j ′ = j : filtrage 199 ANNEXE C. FILTRAGE DE KALMAN 200 • j ′ > j : prédiction Dans la suite nous détaillons les équations dans le cas de la prédiction, mais elles sont facilement dérivables pour les autres cas. C.2 Prédicteur à l’horizon 1 Dans le cas où j ′ = j + 1 le prédicteur de Kalman est dit à l’horizon 1. Dans cette description nous considérons le cas simplifié où uj = 0. La prédiction de x̂j+1/j est donnée par l’espérance mathématique : x̂j+1/j = E[xj+1 / {z0 , z1 , . . . , zj }] = Aj · E[xj / {z0 , z1 , . . . , zj }] + E[vj / {z0 , z1 , . . . , zj }] = Aj · x̂j/j (C.3) car le bruit d’état est orthogonal aux mesures. L’erreur de prédiction à l’instant j + 1 vaut alors : x̃j+1/j = = = = xj+1 − x̂j+1/j Aj xj + vj − Aj · x̂j/j Aj · (xj − x̂j/j ) + vj Aj · x̃j/j + vj (C.4) Le prédiction de la matrice de covariance vaut : Pj+1/j = E[x̃j+1/j · x̃Tj+1/j ] = Aj · E[x̃j/j · x̃Tj/j ] · Aj T + E[vj · vj T ] = Aj · Pj/j · Aj T + Qj (C.5) De la même manière, en se référant à (C.1) on peut prédire la mesure : ẑj+1/j = E[zj+1 / {z0 , z1 , . . . , zj }] = Cj+1 · x̂j+1/j . (C.6) L’innovation représente la différence entre la mesure observée et sa prédiction. C’est donc à ce niveau que se fait l’apport d’information : z̃j+1/j = zj+1 − ẑj+1/j = Cj+1 · (xj+1 − x̂j+1/j ) + wj+1 = Cj+1 · x̃j+1/j + wj+1 (C.7) La covariance de la matrice de prédiction vaut alors : Σj+1/j = E[z̃j+1/j · z̃Tj+1/j ] = Cj+1 · Pj+1/j · Cj+1 T + Rj+1 (C.8) C.2. PRÉDICTEUR À L’HORIZON 1 201 Finalement, l’estimation de l’état à l’instant j s’écrit sous la forme : x̂j/j = E[xj / {z0 , z1 , . . . , zj−1 , zj }] = E[xj / {z0 , z1 , . . . , zj−1 }] + E[xj+1 / {z̃j }] = x̂j/j−1 + Kj · z̃j/j−1 (C.9) Dans (C.9) le dernier terme apparait comme la somme de la prédiction de l’état et de l’innovation pondérée par le gain de Kalman. Cette notation est particulièrement importante puisque l’on voit apparaître le gain de Kalman Kj . Ce gain varie au cours de l’estimation en fonction de la confiance relative apportée à l’innovation et à l’état prédit. Cette confiance dépend bien évidemment des bruits associés à chacun de ces deux vecteurs. Pour une convergence rapide, il faut dans un premier temps que la valeur de Kj soit grande de manière à privilégier l’apport d’information dû à l’innovation. Puis au fil des estimations, l’erreur sur l’état représentée par Pj/j s’amenuise ce qui signifie que la confiance accordée à x̂j/j−1 est de plus en plus importante. Kj diminue alors en conséquence. Selon (C.9), l’erreur d’estimation vaut : x̃j/j = xj − x̂j/j = (xj − x̂j/j−1 ) − Kj · (zj − z̃j/j−1 ) = (I − Kj · Cj ) · (xj − x̂j/j−1 ) − Kj · wj (C.10) Le principe du filtre de Kalman repose sur la minisation de l’erreur quadratique : Pj/j = E[x̃j/j · x̃Tj/j ] = (I − Kj · Cj ) · Pj/j−1 · (I − Kj · Cj )T − Kj · Rj · Kj T (C.11) Le minimum de cette forme quadratique est obtenue par minimisation de T race(Pj/j ) ce qui donne : Kj T = Pj/j−1 · Cj T · Σ−1 j/j−1 = Pj/j−1 · Cj · (Cj · Pj/j−1 · Cj T + Rj )−1 (C.12) et Pj/j = (I − Kj · Cj ) · Pj/j−1 (C.13) 202 ANNEXE C. FILTRAGE DE KALMAN Bibliographie 203 Bibliographie personelle Articles de revues [Sarrut et al., 2006a] Sarrut, D., Delhay, B., Villard, P.F., Boldea B., Beuve, M. and Clarysse, P., Spatio-temporal comparison technique for deformable registration in a breathing thorax model, IEEE Transaction on Mediacal Imaging, soumis.1 Communications avec actes [Delhay et al., 2006] Delhay, B., Clarysse, P., Pera, C. and Magnin, I.E., A spatiotemporal deformation model for dense motion estimation in periodic cardiac image sequences, in : From Statistical Atlases to Personalized Models : Understanding Complex Diseases in Populations and Individuals, Satellite Workshop MICCAI 2006, Copenhagen, Denmark, 2006, in press. [Delhay et al., 2005b] Delhay, B., Lötjönen, J., Clarysse, P., Katila, T. and Magnin, I.E., A dynamic 3D cardiac surface model from MR images, in : Computers In Cardiology 2005’s Proceedings, IEEE, Lyon, France, 2006, pp. 423-426. [Delhay et al., 2005a] Delhay, B., Clarysse, P., Lötjönen, J., Katila, T. and Magnin, I.E., Evaluation of two free form deformation based motion estimators in cardiac and chest imaging, in Functionnal Imaging and Modeling of the Heart 2005’ Proceedings, Barcelona, Spain, 2005, pp. 467-476. [Delhay et al., 2004] Delhay, B., Clarysse, P., Bonnet, P., Grangeat, P. and Magnin, I.E., Combined 3D object motion estimation in medical sequences, in ICIP 2004’s Proceedings, IEEE, Singapore, 2004, pp. 1461-1464. 1 coécrit à 50% avec D. Sarrut 205 Bibliographie [Alvarez et al., 2000] Alvarez, L., Weickert, J., Sanchez, J., Reliable estimation of dense optical flow fields with large displacements, International Journal of Computer Vision, volume 39, no. 1, (2000), pp. 41–56. [Amini and Duncan, 1992] Amini, A., Duncan, J. S., Bending and stretching models for LV wall motion analysis from curves and surfaces, Image Vision Comput., volume 10, no. 6, (1992), pp. 418–430, ISSN 0262-8856. [Arulampalam et al., 2002] Arulampalam, S., Maskell, S., Gordon, N., et al., A tutorial on particle filters for on-line non-linear/non-gaussian bayesian tracking, IEEE Transactions on Signal Processing, volume 50, no. 2, (2002), pp. 174–188. [Ashburner and Friston, 1999] Ashburner, J., Friston, K., Nonlinear spatial normalization using basis functions, Human Brain Mapping, volume 7, no. 4, (1999), pp. 254–266. [Axel and Dougherty, 1989] Axel, L., Dougherty, L., MR imaging of motion with spatial modulation of magnetization, Radiology, volume 171, no. 3, (1989), pp. 841–845. [Bajcsy and Broit, 1982] Bajcsy, R., Broit, C., Matching of deformed images, in : Sixth Int. Conf. on Pattern Recognition, 1982, (pp. 351–353). [Bajcsy and Kovacik, 1989] Bajcsy, R., Kovacik, S., Multiresolution elastic matching, CVGIP, volume 46, (1989), pp. 1–21, these PJ. [Bardinet et al., 1998] Bardinet, E., Cohen, L. D., Ayache, N., A parametric deformable model to fit unstructured 3D data, Computer vison and Image Understanding, volume 71, no. 1, (1998), pp. 39–54. [Benoit-Cattin et al., 2005] Benoit-Cattin, H., Collewet, G., Belaroussi, B., et al., The SIMRI project : a versatile and interactive MRI simulator, Journal of Magnetic Resonance, volume 173, no. 1, (2005), pp. 97–115. [Besl and McKay, 1992] Besl, P. J., McKay, N. D., A method for registration of 3-D shapes, IEEE Trans. Pattern Anal. Mach. Intell., volume 14, no. 2, (1992), pp. 239– 256, ISSN 0162-8828. [Bland and Altman, 1986] Bland, J., Altman, D., Statistical methods for assessing agreement between two methods of clinical measurement, Lancet, volume 1, (1986), pp. 307–310. [Boldea, 2006] Boldea, V., Intégration de la respiration en radiothérapie : apport du recalage déformable d’images, Ph.D. thesis, Université Lumière Lyon 2, 2006. 207 208 BIBLIOGRAPHIE [Boldea et al., 2005] Boldea, V., Sarrut, D., Carrie, C., Comparison of 3D dense deformable registration methods for breath-hold reproducibility study in radiotherapy, in : SPIE Medical Imaging : Visualization, Image-Guided Procedures, and Display, volume 5747, 2005, (pp. 222–230). [Boldea et al., 2003] Boldea, V., Sarrut, D., Clippe, S., Lung deformation estimation with non-rigid registration for radiotherapy treatment., in : MICCAI 03, Montreal, Canada, 2003, (pp. 770–777). [Bonnet et al., 2003] Bonnet, S., Koenig, A., Roux, S., et al., Dynamic X-ray computed tomography., Proceedings of the IEEE, volume 91, no. 10, (2003), pp. 1574–1587. [Bookstein, 1989] Bookstein, F., Principal warps : thin plate splines and decomposition of deformation, IEEE Transactions on Pattern Analysis and Machine Intelligence, volume 11, (1989), pp. 567–585. [Boukerroui et al., 1999] Boukerroui, D., Basset, O., Baskurt, A., et al., Segmentation of echocardiographic data multiresolution 2D and 3D algorithm based on grey level statistics, in : MICCAI ’99 : Proceedings of the Second International Conference on Medical Image Computing and Computer-Assisted Intervention, Springer-Verlag, London, UK, ISBN 3-540-66503-X, 1999, (pp. 516–523). [Brock et al., 2003] Brock, K. K., McShan, D. L., Haken, R. K. T., et al., Inclusion of organ deformation in dose calculations, Medical Physics, volume 30, no. 3, (2003), pp. 290–295. [Broit, 1981] Broit, C., Optimal registration of deformed images, Ph.D. thesis, University of Pennsylvania, 1981. [Brown, 1992] Brown, L. G., A survey of image registration techniques, ACM Computing Surveys, volume 24, no. 4, (1992), pp. 325–376. [Cachier and Ayache, 2004] Cachier, P., Ayache, N., Isotropic energies, filters and splines for vector field regularization, J. Math. Imaging Vis., volume 20, no. 3, (2004), pp. 251–265, ISSN 0924-9907. [Cachier et al., October 2001] Cachier, P., Mangin, J.-F., Pennec, X., et al., Multipatient registration of brain MRI using intensity and geometric features, in : MICCAI’01, Utrecht, The Netherlands, October 2001, (pp. 734 – 742). [Camara, 2003] Camara, O., Recalage non linéaire d’images TDM et TEP dans les régions thoraciques et abdominales : etude méthodologique et application en routine clinique, Ph.D. thesis, Departement Traitement du Signal et des Images, Télécom Paris, ENST., 2003. [Camara et al., 2003] Camara, O., Delso, G., Bloch, I., Free form deformations guided by gradient vector flow : a surface registration method in thoracic and abdominal PET-CT applications., in : WBIR, Philadelphia, PA, USA, 2003, (pp. 224–233). [Canny, 1986] Canny, J., A computational approach to edge detection, IEEE Trans. Pattern Anal. Mach. Intell., volume 8, no. 6, (1986), pp. 679–698, ISSN 0162-8828. [Caspi and Irani, 2002] Caspi, Y., Irani, M., Spatio-temporal alignment of sequences, IEEE Transactions on Pattern Analysis and Machine Intelligence, volume 24, no. 11, (2002), pp. 1409–1424, ISSN 0162-8828. BIBLIOGRAPHIE 209 [Christensen et al., 1996] Christensen, G., Rabbitt, R., Miller, M., Deformable templates using large deformation kinematics, Image Processing, volume 5, (1996), pp. 1435–1447. [Christensen, 1999] Christensen, G. E., Consistent linear-elastic transformations for image matching, in : Proceedings of the 16th International Conference on Information Processing in Medical Imaging, Springer-Verlag, London, UK, ISBN 3540-66167-0, 1999, (pp. 224–237). [Chui and Rangarajan, 2003] Chui, H., Rangarajan, A., A new point matchning algorithm for non-rigid registration, Computer Vision and Image Understanding, volume 89, (2003), pp. 114–141. [Clarysse et al., 2000] Clarysse, P., Basset, C., Khouas, L., et al., 2D spatial and temporal displacement field fitting from cardiac MR tagging, Medical Image Analysis, volume 3, (2000), pp. 253–268. [Comaniciu et al., 2004] Comaniciu, D., Zhou, X. S., Krishnan, S., Robust real-time myocardial border tracking for echocardiography : an information fusion approach., IEEE Trans. Med. Imaging, volume 23, no. 7, (2004), pp. 849–860. [Coquillart, 1990] Coquillart, S., Extended free-form deformation : a sculpturing tool for 3D geometric modeling, in : SIGGRAPH ’90 : Proceedings of the 17th annual conference on Computer graphics and interactive techniques, ACM Press, New York, NY, USA, 1990, (pp. 187–196). [Crum et al., 2004] Crum, W., Hartkens, T., Hill, D., Non-rigid image registration : theory and practice, Br J Radiol., volume 77, no. 2, (2004), pp. 140–153. [Crum et al., 2003] Crum, W. R., Griffin, L. D., Hill, D. L., et al., Zen and the art of medical image registration : correspondence, homology, and quality., Neuroimage, volume 20, no. 3, (2003), pp. 1425–1437. [Declerck et al., 1998] Declerck, J., Feldmar, J., Ayache, N., Definition of a fourdimensional continuous planispheric transformation for the tracking and the analysis of left-ventricle motion, Medical Image Anlalysis, volume 2, no. 2, (1998), pp. 197–213. [Declerck et al., 1996] Declerck, J., Feldmar, J., Goris, M. L., et al., Automatic registration and alignment on a template of cardiac stress & rest SPECT images, Technical Report RR-2770, INRIA, 1996. [Delhay et al., 2004] Delhay, B., Clarysse, P., Bonnet, P., et al., Combined 3D object motion estimation in medical sequences, in : International Conference on Image Processing, Singapore, 2004, (pp. 1461–1464). [Deriche, 1990] Deriche, R., Fast Algorithms for Low-Level Vision, IEEE Trans. Pattern Anal. Mach. Intell., volume 12, no. 1, (1990), pp. 78–87, ISSN 0162-8828. [Deriche, 1993] Deriche, R., Recursively implementing the gaussian and its derivatives, Technical Report 1893, INRIA, 1993, http ://www.inria.fr/rrrt/rr-1893.html. [Deriche et al., 1996] Deriche, R., Kornprobst, P., Aubert, G., Optical-flow estimation while preserving its discontinuities : a variational approach, in : ACCV ’95 : Invited Session Papers from the Second Asian Conference on Computer Vision, SpringerVerlag, London, UK, ISBN 3-540-60793-5, 1996, (pp. 71–80). 210 BIBLIOGRAPHIE [Duchon, 1976] Duchon, J., Interpolation des fonctions de deux variables suivant le principe de la flexion des plaques minces, Revue d’automation, informatique et recherche operationelle, volume 10, no. 12, (1976), pp. 5–12. [Earls et al., 2002] Earls, J., Ho, V., Foo, T., et al., Cardiac MRI : recent progress and continued challenges., Journal of magnetic resonance imaging, volume 16, no. 2, (2002), pp. 111–127. [Endo et al., 2003] Endo, M., Tsunoo, T., Kandatsu, S., et al., Four-dimensional computed tomography 4D CTŰconcepts and preliminary development, Radiation Medicine, volume 21, (2003), pp. 17–22. [Ferrant et al., 2001] Ferrant, M., Nabavi, A., Macq, B., et al., Registration of 3D intraoperative MR Images of the brain using a finite-element biomechanical model, IEEE Transactions on Medical Imaging, volume 20, no. 12, (2001), pp. 1384–1397. [Fitzpatrick and West, 2001] Fitzpatrick, J., West, J., The distribution of target registration error in rigid-body point-based registration, IEEE Transactions on Medical Imaging, volume 20, no. 9, (2001), pp. 917–927. [Fitzpatrick et al., 1998] Fitzpatrick, J. M., Hill, D. L., Shyr, Y., et al., Visual assessment of the accuracy of retrospective registration of MR and CT images of the brain., IEEE Trans Med Imaging, volume 17, no. 4, (1998), pp. 571–585. [Flórez Valencia, 2006] Flórez Valencia, L., Modèle d’état de cylindre généralisé et la quantification de sténoses artérielles en imagerie 3D, Phd thesis, INSA de Lyon, 2006. [Frangi et al., 2002] Frangi, A., Rueckert, D., Schnabel, J., et al., Automatic construction of multiple-object three-dimensional statistical shape models : application to cardiac modeling, IEEE Trans on Medical Imaging, volume 21, no. 9, (2002), pp. 1151–66. [Fumihiko et al., 2005] Fumihiko, I., Kanrou, O., Kenichi, H., A data distributed parallel algorithm for nonrigid image registration, Parallel Comput., volume 31, no. 1, (2005), pp. 19–43, ISSN 0167-8191. [Gee et al., 1995] Gee, J., Barillot, L., Haynor, C., et al., Bayesian approach to the brain image matching problem, in : SPIE, Medical Imaging 1995 : Image Processing, Murray H. Loew, volume 2434, 1995, (pp. 145–156). [Gee et al., 1997] Gee, J. C., Haynor, D. R., Briquer, L. L., et al., Advances in elastic matching theory and its implementation, in : CVRMed-MRCAS ’97 : Proceedings of the First Joint Conference on Computer Vision, Virtual Reality and Robotics in Medicine and Medial Robotics and Computer-Assisted Surgery, Springer-Verlag, London, UK, ISBN 3-540-62734-0, 1997, (pp. 63–72). [Geman and McClure, 1987] Geman, S., McClure, D., Statistical methods for tomographic image reconstruction, in : Bulletin of the International Statistical Institute, 1987, (pp. LII–4 :5). [George et al., 2005] George, R., Vedam, S., Chung, T., et al., The application of the sinusoidal model to lung cancer patient respiratory motion, Medical physics, volume 32, no. 9, (2005), pp. 2850–2861. BIBLIOGRAPHIE 211 [Ghosal and Vanek, 1996] Ghosal, S., Vanek, P., A fast scalable algorithm for discontinuous optical flow estimation, IEEE Transactions on Pattern Analysis and Machine Intelligence, volume 18, no. 2, (1996), pp. 181–194, ISSN 0162-8828. [Goitein, 2004] Goitein, M., Organ and tumor motion : an overview, Seminars in Radiation Oncology, volume 14, no. 1, (2004), pp. 2–9. [Gorce et al., 1997] Gorce, J., Friboulet, D., Magnin, I., Estimation of three-dimensional cardiac velocity fields : assessment of a differential method and application to 3D CT data, Medical Image Analysis, volume 1, no. 3, (1997), pp. 245–261. [Götte et al., 2001] Götte, M., A., V. R., A., T., et al., Quantification of regional contractile function after infraction : strain analysis superior to wall thickening in discrimination infarct from remote myocardium, Journal of american college of radiology, volume 37, no. 3, (2001), pp. 808–817. [Grava, 2003] Grava, C., Compensation de mouvement par réseaux neuronaux cellulaires. Application en imagerie médicale, Ph.D. thesis, Université Claude-Bernard LYON I, 2003. [Grevera and Udupa, 1996] Grevera, G., Udupa, J., Shape-based interpolation of multidimensional grey-level images, IEEE Transaction on Medical Imaging, volume 15, no. 6, (1996), pp. 881–892. [Guimond et al., 2001] Guimond, A., Roche, A., Ayache, N., et al., Multimodal brain warping using the demons algorithm and adaptative intensity corrections, IEEE Transaction on Medical Imaging, volume 20, no. 1, (2001), pp. 58–69. [Hadamard, 1923] Hadamard, J., Lectures on Cauchy’s problem in linear partial differential equations, Yale Univ Press, New Haven, 1923. [Haddad et al., 2005a] Haddad, R., Clarysse, P., Orkisz, M., et al., A realistic anthropomorphic dynamic heart phantom, in : Computers in Cardiology, Lyon, France, 2005a, (pp. 801–804). [Haddad et al., 2005b] Haddad, R., Clarysse, P., Orkisz, M., et al., A realistic anthropomorphic numerical model of the beating heart, in : In Functional Imaging and Modeling of the Heart, FIMH’05, Barcelona, Spain, 2005b, (pp. 384–393). [Hajnal et al., 2001] Hajnal, J. V., Hill, D. L. G., Hawkes, D. J., Medical Image Registration, CRC Press, Boca Raton, 2001. [Han, 1999] Han, M., Analyse exploratoire de la déformation spatio-temporelle du myocarde à partir de l’imagerie par résonnance magnétique de marquage tissulaire, Ph.D. thesis, Institut National des Sciences appliquées de Lyon, 1999. [Hartiala and Knuuti, 1995] Hartiala, J., Knuuti, J., Imaging of the heart by MRI and PET., Annals of medicine, volume 14, (1995), pp. 35–45. [Hellier and Barillot, 2000] Hellier, P., Barillot, C., Coupling dense and landmark-based approaches for non rigid registration, Technical report, Sophia Antipolis, INRIA, 2000. [Hellier et al., 2003] Hellier, P., Barillot, C., Corouge, I., et al., Retrospective cvaluation of intersubject brain registration, IEEE Transactions on Medical Imaging, volume 22, no. 9, (2003), pp. 1120–1130. 212 BIBLIOGRAPHIE [Hellier et al., 2001] Hellier, P., Barillot, C., Memin, E., et al., Hierarchical estimation of a dense deformation field for 3-D robust registration, IEEE Transactions on Medical Imaging, volume 20, no. 5, (2001), pp. 388–4402. [Hinkley, 1971] Hinkley, D. V., Inference about the change-point from cumulative sum tests, Biometrika, volume 58, no. 3, (1971), pp. 509–523. [Horn and Schunck, 1981] Horn, B. K. P., Schunck, B. G., Determining optical flow, Artificial Intelligence, volume 17, (1981), pp. 185–203. [Houdas, 1990] Houdas, Y., Physiologie cardio-vasculaire, Paris :Vigeot, 1990. [Jacob et al., 1998] Jacob, G., Noble, J. A., Blake, A., Robust contour tracking in echocardiographic sequences, iccv, volume 00, (1998), p. 408. [Jannin et al., 2002] Jannin, P., Fitzpatrick, J., Hawkes, D., et al., Validation of medical image processing in image-guided therapy, IEEE Transaction on Medical Imaging, volume 21, (2002), pp. 1445–1449. [Johnson and Christensen, 2002] Johnson, H., Christensen, G., Consistent landmark and intensity-based image registration, IEEE Transactions on Medical Imaging, volume 21, (2002), pp. 450–461. [Kalender, 2006] Kalender, W. A., X-ray computed tomography, Physics in Medicine and Biology, volume 51, (2006), pp. 29–43. [Kalman, 1960] Kalman, A new approach to linear filtering and prediction problems, Transactions of the ASME–Journal of Basic Engineering, volume 82, no. Series D, (1960), pp. 35–45. [Kaye et al., 1997] Kaye, J., Metaxas, D. N., Jr., F. P. P., A 3D virtual environment for modeling mechanical cardiopulmonary interactions, in : CVRMed, Grenoble, France, 1997, (pp. 389–398). [Keall et al., 2005] Keall, P., Joshi, S., Vedam, S., et al., Four-dimensional radiotherapy planning for DMLC-based respiratory motion tracking, Medical physics, volume 32, no. 4, (2005), pp. 942–951. [Keeling and Ring, 2005] Keeling, S. L., Ring, W., Medical image registration and interpolation by optical flow with maximal rigidity, J. Math. Imaging Vis., volume 23, no. 1, (2005), pp. 47–65, ISSN 0924-9907. [Kim and Fessler, 2004] Kim, J., Fessler, J. A., Intensity-based image registration using robust correlation coefficients., IEEE Trans Med Imaging, volume 23, no. 11, (2004), pp. 1430–1444, ISSN 0278-0062. [Kirkpatrick et al., 1983] Kirkpatrick, S., Gelatt, C. D., Vecchi, M. P., Optimization by simulated annealing, Science, Number 4598, 13 May 1983, volume 220, 4598, (1983), pp. 671–680. [Klein, 2000] Klein, G., Four-dimensional processing of deformable cardiac PET data, in : MMBIA ’00 : Proceedings of the IEEE Workshop on Mathematical Methods in Biomedical Image Analysis, IEEE Computer Society, Washington, DC, USA, ISBN 0-7695-0737-9, 2000, (p. 127). [Koikkalainen and Lötjönen, 2004] Koikkalainen, J., Lötjönen, J., Image segmentation with the combination of the PCA- and ICA-based modes of shape variation, in : ISBI, Arlington, USA, 2004, (pp. 149–152). BIBLIOGRAPHIE 213 [Kybic, 2001] Kybic, J., Elastic image registration using parametric deformation models, Ph.D. thesis, Ecole Polytechnique Fédérale de Lausanne, 2001. [Kybic and Unser, 2003] Kybic, J., Unser, M., Fast parametric elastic image registration, IEEE Transactions on Image Processing, volume 12, no. 11, (2003), pp. 1427– 1442, ISSN 1057-7149. [Leal1 et al., 2006] Leal1, J., Luengo-Fernandez, R., Gray, A., et al., Economic burden of cardiovascular diseases in theenlarged european union., European Heart Journal, volume 27, (2006), pp. 1610–1619. [Ledesma-Carbayo et al., 2005] Ledesma-Carbayo, M., Kybic, J., Desco, M., et al., Spatio-temporal nonrigid registration for ultrasound cardiac motion estimation, IEEE Transactions on Medical Imaging, volume 24, no. 9, (2005), pp. 1113–1126. [Lei and Sewchand, 1992] Lei, T., Sewchand, W., Statistical approach to X-ray CT imaging and its applications in image analysis—I : a new stochastic model-based image segmentation technique for X-ray CT image, IEEE Transactions on Medical Imaging, volume 11, (1992), pp. 53–61. [Liang and Lauterbur, 2000] Liang, Z.-P., Lauterbur, P. C., Principles of magnetic resonance imaging : a signal processing perspective., Bellingham, WA : SPIE Optical Engineering Press ; Piscataway, NJ : IEEE Press ; 416 p., 2000. [Linder, 2003] Linder, C., An arbitrary lagrangian-eulerian finite element formulation for dynamics and finite strain plasticity models, Ph.D. thesis, University Stuttgart, 2003. [Liu et al., 1992] Liu, W., Magnin, I., Gimenez, G., A statistic based approach for segmentation, in : 14th Int. Conf. IEEE Eng. in Medicine and Biology, volume 5, Paris, 1992, (pp. 1924–1925). [Liu et al., 1995a] Liu, W., Magnin, I., Gimenez, G., Un nouvel opérateur pour la détection de ruptures dans des signaux bruités, Traitement du Signal, volume 12, no. 3, (1995a), pp. 225–236. [Liu et al., 1995b] Liu, W., Orkisz, M., Magnin, I., et al., Spatial Discontinuity Detection and Temporal Smoothing for Heart-Wall Motion Estimation from TM-mode Echocardiographic Images, in : Computers in Cardiology, Vienne (Austria), 1995b, (pp. 561–564). [Lorensen and Cline, 1987] Lorensen, W., Cline, H., Marching cubes : a high resolution 3D surface reconstruction algorithm, Computer Graphics, volume 21, (1987), pp. 163–169. [Lorenzo-Valdés et al., 2003] Lorenzo-Valdés, M., Sanchez-Ortiz, G. I., Mohiaddin, R., et al., Segmentation of 4D cardiac MR images using a probabilistic atlas and the EM algorithm., in : MICCAI, Montréal, Canada, 2003, (pp. 440–450). [Lötjönen et al., 2004] Lötjönen, J., Kivistö, S., Koikkalainen, J., et al., Statistical shape model of atria, ventricles and epicardium from short- and long-axis MR images, Medical Image Analysis, volume 8, no. 3, (2004), pp. 371–386. [Lötjönen et al., 1998] Lötjönen, J., Magnin, I., Reissman, P., et al., Segmentation of magnetic resonance images using 3D deformable model, in : Proceedings of First International Conference on Medical Image Computing and Computer-Assisted Intervention, MICCAI 1998, Springer Verlag, Berlin, 1998, (pp. 1211–1221). 214 BIBLIOGRAPHIE [Lötjönen and Mäkelä, 2001] Lötjönen, J., Mäkelä, T., Elastic matching using a deformation sphere, in : MICCAI, Utrecht, The Netherlands, 2001, (p. 541). [Lötjönen et al., 2004] Lötjönen, J., Pollari, M., Kivistö, S., et al., Correction of movement artifacts from 4-D cardiac short- and long-axis MR data, in : Medical Image Computing and Computer-Assisted Intervention, MICCAI 2004, Springer Berlin, London, UK, ISBN 978-3-540-22977-3, 2004, (pp. 405–412). [Lötjönen et al., 2005] Lötjönen, J., Pollari, M., Kivistö, S., et al., Correction of motion artifacts from cardiac cine Magnetic Resonance Images, Academic Radiology, volume 12, no. 10, (2005), pp. 1273–1284. [Low et al., 2003] Low, D., Nystrom, M., Kalinin, E., et al., A method for the reconstruction of four-dimensional synchronized CT scans acquired during free breathing., Medical Physics., volume 30, no. 6, (2003), pp. 1254–1263. [Lujan et al., 1999] Lujan, A., EW, L., Balter, J., et al., A method for incorporating organ motion due to breathing into 3D dose calculations, Medical physics, volume 26, no. 5, (1999), pp. 715–20. [Maes et al., 1997] Maes, F., Collignon, A., Vandermeulen, D., et al., Multimodality image registration by maximization of mutual information, IEEE Transactions on Medical Imaging, volume 16, no. 2, (1997), pp. 187–198. [Mageras and Yorke, 2004] Mageras, G., Yorke, E., Deep inspiration breath hold and respiratory gating strategies for reducing organ motion in radiation treatment, Seminars in Radiation Oncology, volume 14, no. 1, (2004), pp. 65–75. [Mäkelä et al., 2002] Mäkelä, T., Clarysse, P., Sipila, O., et al., A review of cardiac image registration methods, IEEE Transactions On Medical Imaging, volume 21, (2002), pp. 1011–21. [Mäkelä et al., 2003] Mäkelä, T., Pham, Q., Clarysse, P., et al., A 3D model-based registration approach for the PET, MR and MCG cardiac data fusion, Medical Image Analysis, volume 7, no. 3, (2003), pp. 377–389. [Mallat, 1998] Mallat, S., A wavelet tour of signal processing, 2nd edition, Academic Press, San Diego, 1998, 577 pp. [Marquardt, 1963] Marquardt, D., An algorithm for least-squares estimation of nonlinear parameters., Journal of the Society for Industrial and Applied Mathematics, volume 11, no. 2, (1963), pp. 431–441. [Matheny and Goldgof, 1995] Matheny, A., Goldgof, D. B., The use of three- and fourdimensional surface harmonics for rigid and nonrigid shape recovery and representation, IEEE Transactions on Pattern Analysis and Machine Intelligence, volume 17, no. 10, (1995), pp. 967–981, ISSN 0162-8828. [Maurer and Fitzpatrick, 1993] Maurer, C., Fitzpatrick, J., A review of medical image registration, in : Interactive Image Guided Neurosurgery, of Neurological Surgeons, A. A., ed., Parkridge, IL, 1993, (pp. 17–44). [McInerney and Terzopoulos, 1995] McInerney, T., Terzopoulos, D., A dynamic finite element surface model for segmentation and tracking in multidimensional medical images with application to cardiac 4d image analysis, in : Computarized Medical Imaging and Graphics, volume 19, 1995, (pp. 69–83). BIBLIOGRAPHIE 215 [Meyer et al., 1996] Meyer, F. G., Constable, R. T., Sinusas, A. J., et al., Tracking myocardial deformation using phase contrast MR velocity fields : a stochastic approach, IEEE Transactions on Medical Imaging, volume 15, no. 4, (1996), pp. 453–465. [Miller et al., 1993] Miller, M. I., Christensen, G. E., Amit, Y., et al., Mathematical textbook of deformable neuroanatomies, Proceedings of the National Academy of Science, volume 90, (1993), pp. 11944–11948. [Miller et al., 1999] Miller, M. I., Joshi, S. C., Christensen, G. E., Large deformation fluid diffeomorphisms for landmark and image matching, in : Brain Warping, (pp. 115–132), A. Toga, Ed. San Diego, CA : Academic, 1999. [Modersitzki, 2004] Modersitzki, J., Numerical methods for image registration, Oxford University Press, New York, 2004. [Montagnat and Delingette, 2005] Montagnat, J., Delingette, H., 4D deformable models with temporal constraints : application to 4D cardiac image segmentation, Medical Image Analysis, volume 9, no. 4, (2005), pp. 87–100. [Murcia, 1996] Murcia, J. D., Reconstruction d’images cardiaques en tomographie d’émision monophotonique à l’aide de modèles spatio-temporels., Ph.D. thesis, Institut National Polytechnique de Grenoble, 1996. [Murray, 1986] Murray, J. F., The normal lung, second edition, W.B.Saunders, Philadelphia, 1986, 377 pp. [Musse et al., 2001] Musse, O., Heitz, H., Armspach, J. P., Topology preserving deformable image matching using constrained hierarchical parametric models, IEEE Transactions on Medical Imaging, volume 10, (2001), pp. 1081–1093. [Nagel, 1987] Nagel, H.-H., On the estimation of optical flow : relations between different approaches and some new results, Artif. Intell., volume 33, no. 3, (1987), pp. 298–324, ISSN 0004-3702. [Napadow et al., 2001] Napadow, V. J., Mai, V., Bankier, A., et al., Determination of regional pulmonary parenchymal strain during normal respiration using spin inversion tagged magnetization MRI, Journal of magnetic resonance imaging, volume 13, (2001), pp. 467–474. [Nicolau et al., 2003] Nicolau, S., Pennec, X., Soler, L., et al., Evaluation of a new 3D/2D registration criterion for liver radio-frequencies guided by augmented reality, in : IS4TM, Juan-les-Pins, France, 2003, (pp. 274–287). [Noblet, 2006] Noblet, V., Recalage non rigide d’images cérébrales 3D avec contrainte de conservation de la topologie, Ph.D. thesis, Université Louis Pasteur- Strasbourg, 2006. [Noblet et al., 2005] Noblet, V., Heinrich, C., Heitz, F., et al., 3D deformable image registration : a topology preservation scheme based on hierarchical defroamtnio models and interval analysis optimization, IEEE Transactions on image processing, volume 21, no. 5, (2005), pp. 553–565. [Noblet et al., 2006] Noblet, V., Heinrich, C., Heitz, F., et al., Retrospective evaluation of a topology preserving non-rigid registration method, Medical Image Analysis, volume 10, no. 3, (2006), pp. 366–384. 216 BIBLIOGRAPHIE [Odobez and Bouthemy, 1995] Odobez, J.-M., Bouthemy, P., Estimation robuste multiéchelle de modèles paramétrés de mouvement sur des scènes complexes, Traitement du Signal, volume 12, no. 2, (1995), pp. 113–128. [Orkisz and Clarysse, 1996] Orkisz, M., Clarysse, P., Estimation du flot optique en présence de discontinuités : une revue, Traitement du Signal, volume 13, no. 5, (1996), pp. 489–513. [Oumsis et al., 2003] Oumsis, M., Pham, Q.-C., Sdigui, A. D., et al., Modeling and tracking of the cardiac left ventricular motion by a state space harmonic model in MRI sequence., in : FIMH, Lyon, France, 2003, (pp. 184–193). [Pan et al., 2004] Pan, T., Lee, T., Rietzel, E., et al., 4D-CT imaging of a volume influenced by respiratory motion on multi-slice CT, Medical Physics, volume 31, (2004), pp. 333–340. [Parzen, 1962] Parzen, E., On the estimation of a probability density function and mode, Annals of Mathematical Statistics, volume 33, (1962), pp. 1065–1076. [Pauna, 2004] Pauna, N., Evaluation des méthodes de mise en correspondance en imagerie multimodale IRM/TEP thoracique et cardiaque., Ph.D. thesis, Université Claude-Bernard LYON I, 2004. [Pennec, 1996] Pennec, X., L’incertitude dans les problèmes de reconnaissance et de recalage – applications en imagerie médicale et biologie moléculaire, Thèse de sciences (phd thesis), Ecole Polytechnique, Palaiseau (France), 1996. [Pennec et al., 1999] Pennec, X., Cachier, P., Ayache, N., Understanding the demon’s algorithm : 3D non rigid registration by gradient descent, in : miccai99, Taylor, C., Colschester, A., eds., volume 1679, lncs, Cambridge, UK, 1999, (pp. 597–605). [Pennec et al., 1998] Pennec, X., Guttmann, C. R. G., Thirion, J.-P., Feature-based registration of medical images : estimation and validation of the pose accuracy, in : MICCAI ’98 : Proceedings of the First International Conference on Medical Image Computing and Computer-Assisted Intervention, Springer-Verlag, London, UK, ISBN 3-540-65136-5, 1998, (pp. 1107–1114). [Penney et al., 1998] Penney, G., Weese, J., Little, J., et al., A comparison of similarity measures for use in 2-D-3-D medical image registration, IEEE Transactions on Medical Imaging, volume 17, no. 4, (1998), pp. 586–595. [Perperidis et al., 2004] Perperidis, D., Lorenzo-Valdes, M., Chandrashekara, R., et al., Building a 4D atlas of the cardiac anatomy and motion using MR imaging, in : Biomedical Imaging : Macro to Nano, 2004. IEEE International Symposium on, volume 1, IEEE Computer Society, 2004, (pp. 412–415). [Perperidis et al., 2005] Perperidis, D., Mohiaddin, R., Rueckert, D., Spatio-temporal free-form registration of cardiac MR image sequences, Medical Image Analysis, volume 9, (2005), p. 5. [Perperidis et al., 2003] Perperidis, D., Rao, A., Valdes, M. L., et al., Spatio-temporal alignement of 4D cardianc images, in : FIMH, Lyon, France, 2003, (pp. 205–214). [Petitjean, 2003] Petitjean, C., Recalage non rigide d’images par approches variationnelles statistiques : application à l’analyse et à la modélisation de la fonction myocardique en IRM, Ph.D. thesis, Université René Descrates- Paris V, 2003. BIBLIOGRAPHIE 217 [Pettigrew et al., 1999] Pettigrew, R., Oshinski, J., Chatzimavroudis, G., et al., MRI techniques for cardiovascular imaging., Journal of magnetic resonance imaging, volume 10, no. 5, (1999), pp. 590–601. [Pham et al., 2001] Pham, Q., Vincent, F., Clarysse, P., et al., A FEM-based deformable model for the 3D segmentation and tracking of the heart in cardiac MRI, in : ISPA 2001, Pula, Croatia, 2001, (pp. 250–254). [Planat, 1999] Planat, A. C., Estimation de mouvement par maillage actif multiéchelle avec prise en compte des discontinuités : Application à l’imagerie cardiaque en Résonance Magnétique., Ph.D. thesis, INSA de Lyon, 1999. [Press et al., 1992] Press, W., Teukolsky, S., Vetterling, W., et al., Numerical Recipes in C : the art of scientific computing, 2 edition, Cambridge University Press, Cambridge, 1992. [Promayon, 1997] Promayon, E., Modélisation et simulation de la respiration, Ph.D. thesis, Université Joseph Fourier, 1997. [Reilhac et al., 2005] Reilhac, A., Batan, G., Michel, C., et al., PET-SORTEO : validation and development of database of simulated PET volumes, IEEE Transactions on Nuclear Science, volume 52, no. 1, (2005), pp. 1321– 1328. [Rey et al., 2002] Rey, D., Subsol, G., Delingette, H., et al., Automatic detection and segmentation ofevolving processes in 3D medical images : application to multiple sclerosis, Medical Image Analysis, volume 6, no. 2, (2002), pp. 163–179. [Reynard et al., 1995] Reynard, D., Blake, A., Azzawi, A., et al., Computer tracking of tagged 1H MR Images for motion analysis, in : CVRMed ’95 : Proceedings of the First International Conference on Computer Vision, Virtual Reality and Robotics in Medicine, Springer-Verlag, London, UK, ISBN 3-540-59120-6, 1995, (pp. 272– 276). [Rhor et al., 2001] Rhor, K., Stiehl, H. S., Sprengel, R., et al., Landmark-based elastic registration using approximating thin-plate splines, IEEE Transactions on Medical Imaging, volume 20, no. 6, (2001), pp. 526–534. [Rietzel et al., 2005a] Rietzel, E., Chen, G., Choi, N., et al., Four-dimensional imagebased treatment planning : target volume segmentation and dose calculation in the presence of respiratory motion, International Journal of Radiation Oncology Biology Physics, volume 61, no. 5, (2005a), pp. 1535–50. [Rietzel et al., 2005b] Rietzel, E., Pan, T., Chen, G., Four-dimensional computed tomography : image formation and clinical protocol., Medical Physics, volume 32, (2005b), pp. 874–889. [Rit et al., 2005] Rit, S., Sarrut, D., Ginestet, C., Respiratory signal extraction for 4D CT imaging of the thorax from cone-beam CT projections., in : Medical Image Computing and Computer-Assisted Intervention Ű MICCAI 2005, Springer Berlin, 2005, (pp. 556–563). [Ritchie et al., 1992] Ritchie, C., Godwin, J., Crawford, C., et al., Minimum scan speeds for suppression of motion artifacts in CT., Radiology, volume 185, (1992), pp. 37– 42. 218 BIBLIOGRAPHIE [Roche et al., 1999] Roche, A., Malandain, G., Ayache, N., Unifying maximum likelihood approaches in medical image registration, Technical report, Sophia Antipolis, INRIA, 1999. [Roche et al., 1998] Roche, A., Malandain, G., Ayache, N., et al., Multimodal image registration by maximization of the correlation ratio, Technical Report RR-3378, INRIA, 1998. [Rohlfing and Maurer, 2003] Rohlfing, T., Maurer, C., Non-rigid image registration in shared-memory multiprocessor environments with application to brains, IEEE Transactions on Information Technology in Biomedicine, volume 7, (2003), pp. 16–25. [Rohlfing et al., 2003] Rohlfing, T., Maurer, C. R., Bluemke, D. A., et al., Volumepreserving nonrigid registration of MR breast images using free-form deformation with an incompressibility constraint, IEEE Transactions on Medical Imaging, volume 22, (2003), pp. 730–741. [Rohr, 2001] Rohr, K., Landmark-Based Image Analysis : Using Geometric and Intensity Models, Kluwer Academic Publishers, Norwell, MA, USA, 2001, ISBN 0792367510. [Rousseeuw and Leroy, 1987] Rousseeuw, P. J., Leroy, A. M., Robust regression and outlier detection, John Wiley & Sons, Inc., New York, NY, USA, 1987, ISBN 0-47185233-3. [Roux, 2004] Roux, S., Modèles dynamiques en tomographie- application à l’imagerie cardiaque, Ph.D. thesis, Université Joseph Fourier Grenoble, 2004. [Rueckert et al., 1999] Rueckert, D., Sonoda, L., Hayes, C., et al., Nonrigid registration using free form deformation : application to breast MR images, IEEE Transactions on Medical Imaging, volume 11, (1999), pp. 712–721. [Sanchez-Ortiz et al., 2000] Sanchez-Ortiz, G. I., Declerck, J., Mulet-Parada, M., et al., Automating 3D echocardiographic image analysis, in : MICCAI ’00 : Proceedings of the Third International Conference on Medical Image Computing and ComputerAssisted Intervention, Springer-Verlag, London, UK, ISBN 3-540-41189-5, 2000, (pp. 687–696). [Sarrut, 2006] Sarrut, D., Deformable registration for image-guided radiation therapy, Zeitschrift fuer Medizinische Physik, volume 16, no. 4, (2006), pp. 285–297. [Sarrut et al., 2005] Sarrut, D., Boldea, V., Ayadi, M., et al., Non-rigid registration method to assess reproducibility of breath-holding with ABC in lung cancer, International Journal of Radiation Oncology Biology Physics, volume 61, no. 2, (2005), pp. 594–607. [Sarrut et al., 2006] Sarrut, D., Boldea, V., Miguet, S., et al., Simulation of 4D CT images from deformable registration between inhale and exhale breath-hold CT scans, Medical Physics, volume 33, no. 3, (2006), pp. 605–617. [Sederberg and Parry, 1986] Sederberg, T. W., Parry, S. R., Free-form deformation of solid geometric models, in : SIGGRAPH ’86 : Proceedings of the 13th annual conference on Computer graphics and interactive techniques, ACM Press, New York, NY, USA, ISBN 0-89791-196-2, 1986, (pp. 151–160). BIBLIOGRAPHIE 219 [Shen and Castan, 1992] Shen, J., Castan, S., An Optimal Linear Operator for Step Edge Detection, GMIP, volume 54, no. 1, (1992), pp. 112–133. [Shepp et al., 1979] Shepp, L. A., Hilal, S. K., Schulz, R. A., Tuning fork artifact in computerized tomography, Computer Graphics and Image Processing, volume 10, no. 3, (1979), pp. 246–255. [Shimizu et al., 2000] Shimizu, S., Shirato, H., Kagei, K., et al., Impact of respiratory movement on the computed tomographic images of small lung tumors in threedimensional radiotherapy, International Journal of Radiation Oncology Biology Physics, volume 46, no. 5, (2000), pp. 1127–1133. [Shirato et al., 2003] Shirato, H., Harada, T., Harabayashi, T., et al., Feasibility of insertion/implantation of 2.0-mm-diameter gold internal fiducial markers for precise setup and real-time tumor tracking in radiotherapy, International Journal of Radiation Oncology Biology Physics, volume 56, no. 1, (2003), pp. 240–247. [Sprengel et al., 1996] Sprengel, R., Rohr, K., Stiehl, H., Thin-plate spline approximation for image registration, in : Proceedings of the 18th Annual International Conference of the IEEE, volume 3, 1996, (pp. 1190–1191). [Stiller and Konrad, 1999] Stiller, C., Konrad, J., Estimating motion in image sequences, a tutorial on modeling and computation of 2D motion, IEEE Signal Process. Mag., volume 16, (1999), pp. 70–91. [Thirion, 1998] Thirion, J., Image matching as a diffusion process : an analogy with Maxwell’s demons, Medical Image Analysis, volume 2, no. 3, (1998), pp. 243–260. [Torrey, 1956] Torrey, H. C., Bloch equations with diffusion terms, Phys. Rev., volume 104, no. 3, (1956), pp. 563–565. [Tukey, 1977] Tukey, J. W., Box-and-whisker plots, in : Exploratory Data Analysis, Addison-Wesley, Reading, Mass., 1977, (pp. 39–43). [Vedam et al., 2003] Vedam, S., Keall, P., Kini, V., et al., Acquiring a four-dimensional computed tomography dataset using an external respiratory signal, Physics in Medicine and Biology, volume 48, no. 1, (2003), pp. 45–62. [Viergever and Maintz, 1998] Viergever, M., Maintz, J., A survey of medical image registration, Medical Image Analysis, volume 2, (1998), pp. 1–36. [Villard et al., 2005] Villard, P., Beuve, M., Shariat, B., et al., Simulation of lung behaviour with finite elements : influence of bio-mechanical parameters, in : MEDIVIS ’05 : Proceedings of the Third International Conference on Medical Information Visualisation–BioMedical Visualisation, IEEE Computer Society, Washington, DC, USA, 2005, (pp. 9–14). [Villard et al., 2004] Villard, P.-F., Beuve, M., Shariat, B., et al., Lung mesh generation to simulate breathing motion with a finite element method, in : IEEE Conference on Information Visualization, volume 00, IEEE Computer Society, London, UK, 2004, (pp. 194–199). [Viola, 1995] Viola, P., Alignment by maximization of mutual information, Ph.D. thesis, Massachusetts Institute of Technology (MIT), 1995. [Weickert and Schnörr, 2001] Weickert, J., Schnörr, C., Variational optic flow computation with spatio-temporal smoothness constraint, Journal of Mathematical Imaging and Vision, volume 14, (2001), pp. 245–255. 220 BIBLIOGRAPHIE [Welch and Bishop, 2004] Welch, G., Bishop, G., An introduction to the kalman filter, Technical Report TR 95-041, University of North Carolina at Chapel Hill, 2004. [Wendland, 2004] Wendland, H., Scattered data approximation, Cambridge University Press, Cambridge, UK, 2004. [Wierzbicki et al., 2004] Wierzbicki, M., Drangova, M., Guiraudon, G., et al., Validation of dynamic heart models obtained using non-linear registration for virtual reality training, planning, and guidance of minimally invasive cardiac surgeries, Medical Image Analysis, volume 8, no. 3, (2004), pp. 387–401. [Woods et al., 1998] Woods, R. P., Grafton, S. T., Watson, J. D. G., et al., Automated image registration. II. intersubject validation of linear and nonlinear models., Journal of Computer Assisted Tomography, volume 22, no. 1, (1998), pp. 153–165. [Wright, 1997] Wright, G. A., Magnetic resonance imaging, IEEE Transactions on Singal Processing, volume 14, no. 1, (1997), pp. 56–66. [Young et al., 1995] Young, A., Kraitchman, D., Dougherty, L., et al., Tracking and finite element analysis of stripe deformation in magnetic resonance tagging, IEEE Transactions on Medical Imaging, volume 14, no. 3, (1995), pp. 413–421. [Zerhouni et al., 1988] Zerhouni, E., Parish, D., Rogers, W., et al., Human heart : tagging with MR imaging - a method for non invasive assessment of myocardial motion, Radiology, volume 169, no. 1, (1988), pp. 59–63. [Zhang et al., 2004] Zhang, T., Jeraj, R., Keller, H., et al., Treatment plan optimization incorporating respiratory motion, Medical physics, volume 31, no. 6, (2004), pp. 1576–86. F OLIO A DMINISTRATIF T HÈSE SOUTENUE DEVANT L’I NSTITUT N ATIONAL DES S CIENCES A PPLIQUÉES DE LYON N OM : DELHAY P RÉNOM : Bertrand DATE DE SOUTENANCE : 13 Décembre 2006 T ITRE : Estimation spatio-temporelle de mouvement et suivi de structures déformables. Application à l’imagerie dynamique du cœur et du thorax N ATURE : Doctorat N UMÉRO D ’ ORDRE : 2006-ISAL-00119 F ORMATION DOCTORALE : Sciences de l’Information, des Dispositifs et des Systèmes F ILIÈRE : Instrumentation, Système, Signal & Image C OTE B.I.U. LYON : T 50/210/19 / C LASSE : R ÉSUMÉ : Cette étude a pour cadre l’extraction de paramètres quantitatifs caractérisant la dynamique d’organes (thorax & cœur) en mouvement à partir de séquences d’images tridimensionnelles acquises en imagerie médicale. Notre approche s’appuie sur des techniques de recalage non-linéaires paramétriques et des transformations dites déformations de formes libres. Une représentation multi-résolution et multi-échelle de recalage non-linéaire 3D dans une base de fonctions B-splines est d’abord proposée. Nous constatons les limites de l’approche 3D pour l’estimation et le suivi de mouvement dans une séquence d’images et la nécessité d’introduire des contraintes temporelles. Nous avons contribué à la construction d’un modèle dynamique probabiliste des 4 cavités cardiaques. Le modèle géométrique des structures est constitué d’un ensemble de pseudo-marqueurs qui décrit l’évolution des surfaces cardiaques. Un échantillonnage des trajectoires de ces pseudo-marqueurs adapté à la séquence d’images à traiter permet d’obtenir, pour chacun des instants, un modèle statistique composé d’une forme moyenne et de variations estimées par une méthode de fenêtrage de Parzen. Un modèle d’état paramétrique et continu des transformations spatio-temporelles est ensuite introduit. Un algorithme basé sur le filtrage de Kalman estime les paramètres de ce modèle sous la contrainte de périodicité du mouvement. L’avantage principal de cette méthode est de prendre en compte de manière globale l’ensemble des images de la séquence. Le cadre théorique proposé permet également l’adaptation locale de la complexité du modèle au mouvement à estimer. Afin de diminuer les temps de calcul, une version parallèle et diverses stratégies ont été mises en oeuvre, en particulier sur une architecture multi-processeurs. Enfin, une évaluation de l’influence des paramètres est proposée sur des cas synthétiques et réels en imagerie cardiaque. La mise en place d’un cadre d’évaluation permet d’effectuer des comparaisons avec d’autres méthodes dans un contexte de prise en compte du mouvement dans la préparation de traitements en radiothérapie des poumons. M OTS - CLÉS : Analyse d’images, Estimation spatio-temporelle de mouvement, Recalage non linéaire d’images, imagerie 4D, Contrainte temporelle, Filtrage de Kalman, Multirésolution, Modèle statistique de forme 4D, Imagerie thoracique et cardiaque. L ABORATOIRE DE R ECHERCHES : Centre de Recherche et d’Applications en Traitement de l’Image et du Signal (CREATIS), UMR CNRS 5515, U630 Inserm C O -D IRECTEURS DE T HÈSE : Patrick Clarysse, Isabelle Magnin P RÉSIDENT DU J URY : C OMPOSITION DU J URY : Grégoire Malandain, Isabelle Bloch, Jérôme Pousin, Jyrki Lötjönen, Patrick Clarysse et Isabelle Magnin