M - Les Thèses de l`INSA de Lyon

Transcription

M - Les Thèses de l`INSA de Lyon
Numéro d’ordre : 2006-ISAL-00119
Année 2006
THÈSE
présentée devant
L’Institut National des Sciences Appliquées de Lyon
pour obtenir
LE GRADE DE DOCTEUR
ÉCOLE DOCTORALE : ÉLECTRONIQUE, ÉLECTROTECHNIQUE, AUTOMATIQUE
FORMATION DOCTORALE : IMAGES ET SYSTÈMES
par
Bertrand DELHAY
Ingénieur de l’INSA de Lyon
Estimation spatio-temporelle de mouvement et suivi de structures déformables.
Application à l’imagerie dynamique du cœur et du thorax
Soutenance prévue le 13 décembre 2006
Composition du Jury :
M. Grégoire MALANDAIN
Mme. Isabelle BLOCH
M. Jérôme POUSIN
M. Jyrki LÖTJÖNEN
M. Patrick CLARYSSE
Mme. Isabelle MAGNIN
DR INRIA
Professeur
Professeur d’université
PhD, Researcher VTT
CR CNRS
DR Inserm
Rapporteur externe
Rapporteur externe
Co-directeur de thèse
Co-directeur de thèse
i
i
SIGLE
ECOLE DOCTORALE
CHIMIE DE LYON
M. Denis SINOU
E2MC
ECONOMIE, ESPACE ET
MODELISATION DES COMPORTEMENTS
M. Alain BONNAFOUS
E.E.A.
ELECTRONIQUE, ELECTROTECHNIQUE,
AUTOMATIQUE
M. Daniel BARBIER
E2M2
EVOLUTION, ECOSYSTEME,
MICROBIOLOGIE, MODELISATION
http ://biomserv.univ-lyon1.fr/E2M2
M. Jean-Pierre FLANDROIS
EDIIS
INFORMATIQUE ET INFORMATION POUR
LA SOCIETE
http ://www.insa-lyon.fr/ediis
M. Lionel BRUNIE
EDISS
INTERDISCIPLINAIRE SCIENCES-SANTE
http ://www.ibcp.fr/ediss
M. Alain Jean COZZONE
MATERIAUX DE LYON
M. Jacques JOSEPH
Math IF
MATHEMATIQUES ET INFORMATIQUE
FONDAMENTALE
http ://www.ens-lyon.fr/MathIS
M. Franck WAGNER
MEGA
MECANIQUE, ENERGETIQUE, GENIE
CIVIL, ACOUSTIQUE
http ://www.lmfa.eclyon.fr/autres/MEGA/index.html
M. François SIDOROFF
NOM ET
COORDONNEES DU RESPONSABLE
M. Denis SINOU
Université Claude Bernard Lyon 1
Lab Synthèse Asymétrique
UMR UCB/CNRS 5622
Bât 308
2ème étage
43 bd du 11 novembre 1918
69622 VILLEURBANNE Cedex
Tél : 04.72.44.81.83 Fax : 04.78.89.89.14
[email protected]
M. Alain BONNAFOUS
Université Lyon 2
14 avenue Berthelot
MRASH M. Alain BONNAFOUS
Laboratoire d’Economie des Transports
69363 LYON Cedex 07
Tél : 04.78.69.72.76
[email protected]
M. Daniel BARBIER
INSA DE LYON
Laboratoire Physique de la Matière
Bâtiment Blaise Pascal
69621 VILLEURBANNE Cedex
Tél : 04.72.43.64.43 Fax : 04.72.43.60.82
[email protected]
M. Jean-Pierre FLANDROIS
UMR 5558 Biométrie et Biologie Evolutive
Equipe Dynamique des Populations Bactériennes
Faculté de Médecine Lyon-Sud
Laboratoire de Bactériologie BP
1269600 OULLINS
Tél : 04.78.86.31.50 Fax : 04.72.43.13.88
[email protected]
M. Lionel BRUNIE
INSA DE LYON
EDIIS
Bâtiment Blaise Pascal
69621 VILLEURBANNE Cedex
Tél : 04.72.43.60.55 Fax : 04.72.43.60.71
[email protected]
M. Alain Jean COZZONE
IBCP (UCBL1)
7 passage du Vercors
69367 LYON Cedex 07
Tél : 04.72.72.26.75 Fax : 04.72.72.26.01
[email protected]
M. Jacques JOSEPH
Ecole Centrale de Lyon
Bât F7 Lab. Sciences et Techniques des Matériaux et des Surfaces
36 Avenue Guy de Collongue BP 163
69131 ECULLY Cedex
Tél : 04.72.18.62.51 Fax : 04.72.18.60.90
[email protected]
M. Franck WAGNER
Université Claude Bernard Lyon1
Institut Girard Desargues
UMR 5028 MATHEMATIQUES
Bâtiment Doyen Jean Braconnier
Bureau 101 Bis, 1er étage
69622 VILLEURBANNE Cedex
Tél : 04.72.43.27.86 Fax : 04.72.43.16.87
M. François SIDOROFF
Ecole Centrale de Lyon
Lab. Tribologie et Dynamique des Systèmes
Bât G8, 36 avenue Guy de Collongue, BP 163
69131 ECULLY Cedex
Tél : 04.72.18.62.14 Fax : 04.72.18.65.37
[email protected]
ii
Résumé
Cette étude a pour cadre l’extraction de paramètres quantitatifs caractérisant la dynamique
d’organes (thorax & cœur) en mouvement à partir de séquences d’images tridimensionnelles acquises en imagerie médicale. Notre approche s’appuie sur des techniques de recalage non-linéaires paramétriques et des transformations dites déformations de formes
libres. Une représentation multi-résolution et multi-échelle de recalage non-linéaire 3D
dans une base de fonctions B-splines est d’abord proposée. Nous constatons les limites de
l’approche 3D pour l’estimation et le suivi de mouvement dans une séquence d’images et
la nécessité d’introduire des contraintes temporelles. Nous avons contribué à la construction d’un modèle dynamique probabiliste des 4 cavités cardiaques. Le modèle géométrique des structures est constitué d’un ensemble de pseudo-marqueurs qui décrit l’évolution des surfaces cardiaques. Un échantillonnage des trajectoires de ces pseudo-marqueurs
adapté à la séquence d’images à traiter permet d’obtenir, pour chacun des instants, un modèle statistique composé d’une forme moyenne et de variations estimées par une méthode
de fenêtrage de Parzen.
Un modèle d’état paramétrique et continu des transformations spatio-temporelles est ensuite introduit. Un algorithme basé sur le filtrage de Kalman estime les paramètres de ce
modèle sous la contrainte de périodicité du mouvement. L’avantage principal de cette méthode est de prendre en compte de manière globale l’ensemble des images de la séquence.
Le cadre théorique proposé permet également l’adaptation locale de la complexité du modèle au mouvement à estimer. Afin de diminuer les temps de calcul, une version parallèle
et diverses stratégies ont été mises en oeuvre, en particulier sur une architecture multiprocesseurs. Enfin, une évaluation de l’influence des paramètres est proposée sur des cas
synthétiques et réels en imagerie cardiaque. La mise en place d’un cadre d’évaluation permet d’effectuer des comparaisons avec d’autres méthodes dans un contexte de prise en
compte du mouvement dans la préparation de traitements en radiothérapie des poumons.
Mots-clés : Analyse d’images, Estimation spatio-temporelle de mouvement, Recalage
non linéaire d’images, imagerie 4D, Contrainte temporelle, Filtrage de Kalman, Multirésolution, Modèle statistique de forme 4D, Imagerie thoracique et cardiaque.
Abstract
This motivation of this study is the extraction of quantitative parameters characterizing the dynamics of moving organs (thorax structures & heart) from three-dimensional
medical image sequences. Our approach is based on non-linear parametric registration
technique. The deformation model, known as free form deformation transformation, is based on a hierachical multi-scale parametric representation using B-Spline basis functions.
We quickly noticed the limits of this 3D approach for motion estimation and tracking in
sequences and the need for introducing temporal constraints. First of all, we contributed
to the construction of a probabilistic dynamic model of the 4 cardiac chambers. The geometrical model of the structures consists of a set of pseudo-markers which describe the
evolution of cardiac surfaces. A sampling of the trajectories of these pseudo-markers is
adapted to the image sequence of images. This results in a statistical model made up of an
iii
average shape and variations estimated by Parzen windowing at each time points.
A parametric and continuous state model of the spatio-temporal transformations is introduced. An algorithm based on the Kalman filter estimates the parameters of this model
under the constraint of motion periodicity. The principal advantage of this method is to
take into account all the images in the sequence. This proposed framework allows the
contextual adaptation of the complexity of the motion model. In order to decrease computing times, a parallel version and various strategies were implemented, in particular on a
multiprocessors architecture. Lastly, an evaluation of the parameters influence is proposed
on synthetic and real cases in the context of cardiac imaging. An evaluation framework
has been also settled to carry out comparison with other motion estimation methods in the
context of motion compensated radiotherapy of lung tumors.
Keywords : Medical Imaging, Spatio-temporal motion estimation, Non linear image
registration, 4D Imaging, Temporal constraint, Kalman Filtering, Multiresolution, 4D statistical model of the shape.
iv
Table des matières
Introduction Générale
3
I Contexte médical et méthodologique
5
1 Contexte médical
1.1 Introduction . . . . . . . . . . . . . . . . .
1.2 Anatomie et Physiologie cardiaque . . . . .
1.2.1 Description de l’anatomie cardiaque
1.2.2 Physiologie cardiaque . . . . . . .
1.2.3 Les mouvements cardiaques . . . .
1.2.4 Défauts de l’activité cardiaque . . .
1.3 Le système respiratoire . . . . . . . . . . .
1.3.1 Physiologie respiratoire . . . . . .
1.3.2 Fonction ventilatoire . . . . . . . .
1.3.3 Pathologies pulmonaires . . . . . .
1.3.4 Radiothérapie . . . . . . . . . . . .
1.4 Conclusion . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2 Imagerie médicale d’organes en mouvement
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . .
2.2 Modalités d’imagerie d’organes en mouvement . . .
2.3 Exploration de l’activité cardiaque en IRM . . . . . .
2.3.1 Formation des images par RM . . . . . . . .
2.3.2 Les séquences de base en imagerie cardiaque
2.3.3 Les séquences IRM rapides et ultra rapides .
2.3.4 Images par RM utilisées dans cette thèse . .
2.3.5 IRM de marquage tissulaire . . . . . . . . .
2.4 La Tomodensitométrie à Rayons X . . . . . . . . . .
2.4.1 Caractérisation des images TDM . . . . . . .
2.4.2 Dispositifs d’acquisition . . . . . . . . . . .
2.4.3 TDM dynamique . . . . . . . . . . . . . . .
2.4.4 TDM 4D . . . . . . . . . . . . . . . . . . .
2.4.5 Images TDM utilisées dans cette thèse . . . .
v
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
9
9
10
12
13
14
14
16
18
18
20
.
.
.
.
.
.
.
.
.
.
.
.
.
.
21
21
22
26
26
28
28
30
31
33
33
33
35
36
36
TABLE DES MATIÈRES
vi
2.5
3
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Etat de l’art
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Estimation de mouvement . . . . . . . . . . . . . . . . . . . . . . .
3.2.1 Les méthodes différentielles . . . . . . . . . . . . . . . . . .
3.2.2 Mise en correspondance de blocs (MCB) . . . . . . . . . . .
3.2.3 Les méthodes statistiques . . . . . . . . . . . . . . . . . . . .
3.3 Recalage d’images médicales . . . . . . . . . . . . . . . . . . . . . .
3.3.1 Principe du recalage d’images . . . . . . . . . . . . . . . . .
3.3.2 Les primitives . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.2.1 Approches par primitives géométriques . . . . . . .
3.3.2.2 Approches par primitives iconiques . . . . . . . . .
3.3.2.3 Approches hybrides . . . . . . . . . . . . . . . . .
3.3.3 Modèles de transformation . . . . . . . . . . . . . . . . . . .
3.3.3.1 Approches paramétriques . . . . . . . . . . . . . .
3.3.3.2 Approches non-paramétriques . . . . . . . . . . . .
3.3.4 Optimisation . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4 Suivi d’objets et de mouvement dans une séquence . . . . . . . . . .
3.4.1 Alignement de séquences . . . . . . . . . . . . . . . . . . . .
3.4.2 Estimation spatio-temporelle de mouvement . . . . . . . . . .
3.4.3 Suivi de structures déformables dans des séquences d’images .
3.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
38
41
41
42
43
43
44
44
45
45
45
46
47
47
47
49
50
51
51
51
53
54
II Contributions Méthodologiques
55
4
57
57
58
58
59
60
60
62
63
64
64
65
65
65
65
67
69
72
72
Estimation de mouvement par recalage
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Recalage de deux images . . . . . . . . . . . . . . . . . . . . . . .
4.2.1 Motivations . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.2 Problématique . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Modèle de transformation . . . . . . . . . . . . . . . . . . . . . . .
4.3.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.2 Modèle non-linéaire de transformation . . . . . . . . . . . .
4.3.3 Fonctions splines . . . . . . . . . . . . . . . . . . . . . . .
4.3.4 Calcul pratique de la transformation FFD B-Spline . . . . .
4.3.4.1 Calcul des coordonnées locales . . . . . . . . . .
4.3.4.2 Influence des fonctions d’interpolation . . . . . .
4.3.4.3 Calcul de la déformation . . . . . . . . . . . . .
4.3.5 Approche bi-pyramidale de l’estimation de la transformation
4.3.5.1 La pyramide d’images . . . . . . . . . . . . . . .
4.3.5.2 La pyramide de transformations . . . . . . . . . .
4.3.6 Propriétés de la transformation . . . . . . . . . . . . . . . .
4.3.7 Régularisation . . . . . . . . . . . . . . . . . . . . . . . .
4.3.7.1 Énergie de membrane élastique . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
TABLE DES MATIÈRES
4.4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
73
73
76
76
76
80
81
81
83
83
84
89
5 Including prior shape in segmentation tracking
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Motivations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3 Geometric modeling of the cardiac cavities . . . . . . . . . . . . . .
5.3.1 3-D shape model construction [Lötjönen et al., 2004] . . . . .
5.3.2 Dynamic models construction . . . . . . . . . . . . . . . . .
5.3.2.1 4D dataset segmentation . . . . . . . . . . . . . . .
5.3.2.2 Normalization and resampling of the temporal axis .
5.3.2.3 Dynamic models relevance . . . . . . . . . . . . .
5.4 Time-dependent statistical modeling of the shape variability . . . . .
5.5 Integrating the SDM into the segmentation tracking process . . . . . .
5.5.1 Time-dependent prior shape . . . . . . . . . . . . . . . . . .
5.5.2 First frame initialization . . . . . . . . . . . . . . . . . . . .
5.5.3 SDM adapted cost function . . . . . . . . . . . . . . . . . . .
5.6 Proposal summary . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
91
91
93
93
95
98
98
99
99
100
103
103
105
105
107
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
109
109
110
110
111
111
113
113
114
115
116
117
119
119
122
122
122
4.5
4.6
Critères de mise en correspondance . . . . . . . . . . . . . . . .
4.4.1 terme d’appariement . . . . . . . . . . . . . . . . . . . .
4.4.2 Choix des opérateurs . . . . . . . . . . . . . . . . . . . .
4.4.2.1 Opérateur D1 . . . . . . . . . . . . . . . . . .
4.4.2.2 Opérateur D2 . . . . . . . . . . . . . . . . . .
4.4.2.3 Opérateur D3 . . . . . . . . . . . . . . . . . .
Optimisation et implantation . . . . . . . . . . . . . . . . . . . .
4.5.1 La stratégie d’optimisation . . . . . . . . . . . . . . . . .
4.5.2 Accélération des calculs . . . . . . . . . . . . . . . . . .
4.5.2.1 Réduction de l’espace d’analyse . . . . . . . .
4.5.2.2 Implantation sur architecture multi-processeurs
Discussion et résumé de la contribution . . . . . . . . . . . . . .
vii
.
.
.
.
.
.
.
.
.
.
.
.
6 Estimation spatio-temporelle de mouvement
6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Définitions préalables . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2.1 Notion de Trajectoire . . . . . . . . . . . . . . . . . . . . . .
6.2.2 Description Lagrangienne du mouvement . . . . . . . . . . .
6.2.3 Description Eulérienne du mouvement . . . . . . . . . . . . .
6.2.4 Périodicité . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3 Techniques d’estimation et de filtrage de signaux stochastiques . . . .
6.3.1 Processus markovien et modèle d’état . . . . . . . . . . . . .
6.3.2 Estimateur d’état de Kalman . . . . . . . . . . . . . . . . . .
6.4 Application à l’estimation de mouvement dans une séquence d’images
6.4.1 Modèle spatio-temporel de mouvement . . . . . . . . . . . .
6.4.2 Vecteur d’état . . . . . . . . . . . . . . . . . . . . . . . . . .
6.4.3 Prédiction et Filtrage . . . . . . . . . . . . . . . . . . . . . .
6.4.4 Critère d’arrêt . . . . . . . . . . . . . . . . . . . . . . . . . .
6.4.5 Contrainte de passage à l’origine . . . . . . . . . . . . . . . .
6.4.6 Approche Multiéchelle . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
TABLE DES MATIÈRES
viii
6.5
6.4.7 Trajectoires de complexité adaptative
6.4.8 Remarques complémentaires . . . . .
6.4.9 Prétraitement des données . . . . . .
Conclusion . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
123
124
124
127
III Evaluation
129
7
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
131
131
132
132
133
133
133
134
134
134
135
135
136
137
138
139
.
.
.
.
.
.
.
.
143
143
146
146
149
151
151
151
156
.
.
.
.
.
.
.
.
.
.
.
157
157
158
159
160
160
161
163
163
163
164
165
8
9
Méthodologie d’évaluation
7.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Brève revue des méthodes d’évaluation . . . . . . . . . . . . . . . . .
7.2.1 Références synthétiques . . . . . . . . . . . . . . . . . . . . .
7.2.2 Détermination d’un bronze standard . . . . . . . . . . . . . . .
7.2.2.1 Références obtenue par analyse d’experts . . . . . . .
7.2.2.2 Références obtenues algorithmiquement . . . . . . .
7.2.3 Qualité de la transformation . . . . . . . . . . . . . . . . . . .
7.2.3.1 Inspection visuelle . . . . . . . . . . . . . . . . . . .
7.2.3.2 Propriétés de la déformation . . . . . . . . . . . . . .
7.2.3.3 Transport d’atlas . . . . . . . . . . . . . . . . . . . .
7.3 Méthodes d’évaluation utilisées dans cet ouvrage . . . . . . . . . . . .
7.3.1 Evaluation du mouvement . . . . . . . . . . . . . . . . . . . .
7.3.2 Evaluation dans une séquence d’images . . . . . . . . . . . . .
7.3.3 Evaluation du suivi de mouvement par recalage spatio-temporel
7.3.3.1 Séquences de synthèse . . . . . . . . . . . . . . . . .
Résultats
8.1 Evaluation du compromis précision / temps de calcul . . . .
8.1.1 Résultats . . . . . . . . . . . . . . . . . . . . . . .
8.1.2 Discussion . . . . . . . . . . . . . . . . . . . . . .
8.2 Evaluation de l’estimation de mouvement spatio-temporelle .
8.2.1 Résultats . . . . . . . . . . . . . . . . . . . . . . .
8.2.1.1 Evaluation sur des données synthétiques .
8.2.1.2 Evaluation sur des données réelles . . . .
8.2.2 Discussion . . . . . . . . . . . . . . . . . . . . . .
Comparaison d’algorithmes
9.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . .
9.2 Le mouvement en radiothérapie . . . . . . . . . . . . . . .
9.3 Matériel . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.4 Procédure d’évaluation . . . . . . . . . . . . . . . . . . . .
9.4.1 Sélection des amers . . . . . . . . . . . . . . . . . .
9.4.2 Evaluation quantitative de la précision des méthodes
9.4.3 Analyse des trajectoires . . . . . . . . . . . . . . .
9.4.3.1 Modélisation du cycle respiratoire . . . .
9.4.3.2 Erreur spatio-temporelle . . . . . . . . . .
9.4.3.3 Trajectoires directes et indirectes . . . . .
9.4.4 Méthodes d’estimation de mouvement comparées . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
TABLE DES MATIÈRES
9.5
9.6
9.7
ix
9.4.4.1 Notre méthode : m1 . . . . . . . . . . . . . . . . . . .
9.4.4.2 Flux optique optimisé : m2 . . . . . . . . . . . . . . .
9.4.4.3 Méthode par modèle déformable biomécanique : m3 . .
Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.5.1 Résultats relatifs au critère T RE . . . . . . . . . . . . . . . . . .
9.5.2 Résultats relatifs au ST E . . . . . . . . . . . . . . . . . . . . .
Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.6.1 Précision des méthodes . . . . . . . . . . . . . . . . . . . . . . .
9.6.2 Etude des trajectoires . . . . . . . . . . . . . . . . . . . . . . . .
9.6.2.1 La métrique ST E pour l’évaluation des méthodes . . .
9.6.2.2 La métrique ST E pour l’évaluation de l’apport du mouvement en radiothérapie . . . . . . . . . . . . . . . . .
9.6.2.3 Comparaison de la T RE et de la ST E . . . . . . . . .
Conclusion partielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
165
166
166
167
167
170
170
173
174
174
175
175
176
Conclusion et Perspectives
181
Bilan des contributions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
Perspectives méthodologiques . . . . . . . . . . . . . . . . . . . . . . . . . . 182
Perspectives applicatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
Annexes
189
A La Tomodensitométrie à rayons X
189
A.1 Principe Physique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
A.2 Formation des Images . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
B L’Imagerie par Résonance Magnétique
B.1 Fondements Physiques . . . . . . .
B.2 Formation des Images par RM . . .
B.2.1 Encodage spatial . . . . . .
B.2.2 Les séquences d’écho . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
193
193
195
196
196
C Filtrage de Kalman
199
C.1 Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
C.2 Prédicteur à l’horizon 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
Bibliographie
205
Bibliographie personelle
205
Bibliographie
220
TABLE DES MATIÈRES
x
Notations
D’une manière générale, les vecteurs et les matrices seront notés en gras, les lettres
minuscules désignent des vecteurs et les lettres majuscules designent des matrices.
Termes généraux :
Rd
ϕ
M
x
t
j
u
u(x, t)
v
ΓM
∇
∇x
espace de dimension d
transformation géométrique
Point matériel
Point géométrique de l’espace
Variable continue du temps
Variable discrète du temps
Déplacement
Déplacement du point x à l’instant t
vitesse
Trajectoire du point matériel M
Gradient
Gradient suivant la direction x
Termes relatifs au recalage d’images :
Ic
Is
Pk
ξk
βr
A
R
C
PImg
PT rans
Image cible
Image source
Point de contrôle k
Déplacement du point de contrôle Pk
B-Spline de degré r
Terme d’appariement
Terme de régularisation
Terme de constrainte
Pyramide d’images
Pyramide de transformations
Termes relatifs au modèle dynamique cardiaque :
L(i)
S(p)
D(p)
xi,p
K()
Pseudo marqueur i
Modèle géométrique du cœur pour le sujet p
Modèle géométrique dynamique du cœur pour le sujet p
Coordonnées du pseudo marqueur i pour le sujet p
Noyau de convolution
TABLE DES MATIÈRES
Termes relatifs au filtrage de Kalman :
x
z
A
C
v
w
Sξk
Uk
Vecteur d’état
Mesure
Matrice de transition d’état
Matrice de mesure
Bruit d’état
Bruit de mesure
Série de Fourier du point de contrôle Pk
Vecteur de paramètres de la trajectoire du point Pk
1
2
TABLE DES MATIÈRES
Introduction Générale
Ce mémoire présente des contributions méthodologiques pour l’estimation du mouvement et le suivi de structures déformables dans des séquences d’images. Ces travaux sont
motivés par deux contextes applicatifs médicaux. Le premier concerne l’estimation de la
dynamique du cœur en IRM pour l’aide à la détection d’anomalies dans des pathologies
cardiaques comme l’ischémie myocardique. La seconde concerne la prise en compte du
mouvement respiratoire dans la préparation de séances de radiothérapie de tumeurs pulmonaires. Le fil conducteur de mes travaux concerne la prise en compte du temps dans
les traitements proposés afin d’apporter une cohérence sur l’ensemble des estimations de
mouvement dans une séquence temporelle. La description de mes travaux fait l’objet de
la seconde partie de ce mémoire. Ce travail de thèse s’inscrit dans le cadre d’une collaboration entre le laboratoire Creatis, le VTT1 à Tampere et le laboratoire BME2 à Helsinki,
Finlande. Un séjour doctoral de 6 mois à Helsinki (du 01/10/04 au 31/03/05), financé
en partie par la bourse régionale Eurodoc (Région Rhônes Alpes) et par l’ambassade de
France à Helsinki m’a permis de découvrir d’autres méthodes de travail. Nous avons dans
ce cadre envisagé l’apport d’une information a priori de forme grâce à la construction d’un
modèle dynamique statistique de structures cardiaques. Pour cette raison, l’ensemble de
ce document sera rédigé en français, excepté le chapitre 5, qui concerne la construction et
l’utilisation d’un tel modèle et qui sera rédigé en anglais. Ce mémoire est structuré de la
manière suivante :
• La première partie s’attache à présenter les fondements médicaux de ce travail de
recherche. La chapitre 1 propose un exposé des contextes applicatifs, et des notions
d’anatomie et de physiologie qui seront présentes tout au long de mes travaux. Il en
ressort un certain nombre d’hypothèses dont nous devrons tenir compte par la suite
(étude de la déformation d’organes mous, périodicité des phénomènes étudiés). Le
chapitre 2 décrit les dispositifs d’acquisition permettant de fournir des séquences
d’images qui traduisent le comportement physiologique d’organes en mouvement.
Le chapitre 3 propose une synthèse des méthodes capables d’estimer le mouvement
entre deux ou plusieurs images. Nous insisterons plus particulièrement sur les méthodes d’estimation de mouvement sur une séquence entière d’images.
• La seconde partie est dédiée aux contributions méthodologiques. Le chapitre 4
1
2
http ://www.vtt.fi/
http ://biomed.tkk.fi/image/index.html
3
4
TABLE DES MATIÈRES
concerne la mise en place d’une méthode d’estimation de mouvement entre deux
images 2D ou 3D quelconques d’une séquence. Le modèle de transformation paramétrique et non-linéaire repose sur une approche multi-échelle. Il s’agit d’une
représentation de déformations de forme libre exprimée dans une base de fonctions
B-Splines. Nous introduisons un filtre dont la sortie traduit le caractère stationnaire
local de l’intensité des pixels. Ce filtre est utilisé dans le but de fournir un terme
d’appariement vectoriel robuste et de réduire notablement les temps de calcul. Le
chapitre 5 concerne la construction d’un modèle statistique de forme dynamique
utilisé dans le cadre de l’application cardiaque pour contraindre la méthode de recalage et pour assurer le suivi des structures du cœur dans une séquence d’images.
Dans le chapitre 6, nous proposons de considérer l’algorithme de recalage décrit
dans le chapitre 4 comme la mesure d’un filtre de Kalman. Pour cela, nous introduisons un modèle de mouvement spatio-temporel. Ce modèle est l’extension à l’axe
temporel du modèle de transformation d’images. Ce modèle garantit la continuité
et la périodicité des mouvements estimés. L’estimation des paramètres repose sur la
contribution de tous les instants de la séquence. Finalement, nous introduisons une
stratégie d’adaptation locale des modèles de trajectoires en fonction de l’amplitude
de la déformation.
• La dernière partie est consacrée à l’évaluation des méthodes proposées. Nous discutons tout d’abord l’impact des paramètres les plus importants des méthodes d’estimation de mouvement entre deux images. Afin d’évaluer la précision de la méthode
pour l’ensemble d’une séquence, un contexte d’évaluation est proposé (chapitre 8)
plus spécifiquement pour évaluer l’apport du recalage et comparer différentes techniques de recalage sur l’ensemble d’une séquence dans un contexte de prise en
compte du mouvement dans la radiothérapie des poumons. Enfin, nous présentons
les premières évaluations de la méthode d’estimation spatio-temporelle de mouvement introduite au chapitre 6.
Une conclusion synthétisera les contributions et les résultats obtenus et proposera des
perspectives à mes travaux.
Première partie
Contexte médical et méthodologique
5
Chapitre
1
Contexte médical
Sommaire
1.1
1.2
1.3
1.4
Introduction . . . . . . . . . . . . . . . .
Anatomie et Physiologie cardiaque . . . .
1.2.1 Description de l’anatomie cardiaque
1.2.2 Physiologie cardiaque . . . . . . .
1.2.3 Les mouvements cardiaques . . . .
1.2.4 Défauts de l’activité cardiaque . . .
Le système respiratoire . . . . . . . . . .
1.3.1 Physiologie respiratoire . . . . . .
1.3.2 Fonction ventilatoire . . . . . . . .
1.3.3 Pathologies pulmonaires . . . . . .
1.3.4 Radiothérapie . . . . . . . . . . . .
Conclusion . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
9
9
10
12
13
14
14
16
18
18
20
1.1 Introduction
C
e chapitre est consacré au contexte général de mes travaux de recherche. Notre problématique porte sur deux points :
1. l’étude individualisée de la cinétique cardiaque pour l’aide au diagnostique et la
détection d’anomalies et de pathologies telles que l’ischémie myocardique.
2. le suivi de cibles tumorales en mouvement dans des structures thoraciques, en particulier les poumons, pour la mise en place de traitements adaptés comme la radiothérapie.
Afin d’en comprendre les enjeux, nous commençons la partie dédiée à la description
des contextes applicatifs de mes travaux avec des rapports publiés récemment (2003-2005)
sur le site de l’Organisation Mondiale de la Santé 1 (OMS). Ces rapports concernent les
1
http ://www.who.int/en
7
CHAPITRE 1. CONTEXTE MÉDICAL
8
défis actuels de la santé dans le monde et l’importance, sans cesse croissante, des maladies
non transmissibles telles que les maladies cardio-vasculaires ou le cancer. Il y a encore
de cela 25 ans, le traitement et la prévention des maladies cardio-vasculaires (MCV) ne
faisaient pas parti des priorités sanitaires à l’échelle mondiale. Les MCV étaient considérées comme des maladies des pays industrialisés liées au mode de vie totalement différent de celui de pays en voie de développement. Actuellement la réalité est tout autre.
Si elles constituent toujours la première cause de mortalité dans les pays industrialisés
(la seconde cause étant les tumeurs malignes), contrairement aux idées reçues, les MCV
ont fait leur apparition dans presque tous les pays pauvres venant s’ajouter aux maladies transmissibles qui continuent de sévir. En 2002, sur 32 millions de décès recensés
liés aux maladies non transmissibles, plus de la moitié (16.7 millions) sont d’origines
cardio-vasculaires. Dorénavant, ces décès sont deux fois plus nombreux dans les pays en
développement que dans les pays développés.
Un second rapport2 décrit de manière quantitative l’influence des MCV à l’échelle
mondiale :
• Avec 16.7 millions de morts en 2002, les MCV représentent 29.2% de la mortalité
globale recensée.
• 80% des MCV sont intervenues dans les pays développés.
• D’ici à 2010, les MCV pourraient être la cause principale de mortalité dans les pays
en voie de développement.
• Les maladies cardiaques n’ont pas de frontières géographiques ou socioéconomiques.
Sur les 16.7 millions de morts dues aux MCV, 7.2 millions sont liées à l’ischémie myocardique.
Une étude économique issue d’articles publiés dans l’European Heart Journal [Leal1
et al., 2006], établit le constat du coût engendré par le traitement et la prise en charge
des maladies cardio-vasculaires au sein de l’Union Européenne (UE). D’après les auteurs,
les dépenses des maladies cardio-vasculaires pourraient culminer à 181 milliards d’euros
pour 2005 dans l’UE. Ce chiffre comprend les soins de santé, les pertes de productivité et
les soins informels.
Concernant l’impact du cancer sur la morbidité mondiale, un article paru en 20053
nous fournit les informations suivantes :
"Le cancer occupe une place de plus en plus importante dans la charge de morbidité mondiale. Quelque 24.6 millions de personnes vivent actuellement avec un cancer ; on estime
qu’elles seront 30 millions en 2020. D’ici à 2020, le cancer pourrait faire plus de 10 millions de victimes par an. Si cette tendance perdure, on estime que le nombre annuel de
nouveaux cas passera de 10.9 millions en 2002 à 16 millions en 2020. Quelque 60 % de
ces cas surviendront dans les pays les moins avancés du monde. Près de 7 millions de personnes succombent actuellement chaque année au cancer. Dans les pays industrialisés, le
cancer se situe au deuxième rang des causes de mortalité après les maladies cardiovasculaires et, selon les données épidémiologiques, cette tendance est en voie d’émerger dans
les pays les moins avancés. C’est le cas en particulier des pays "en transition", comme en
2
3
http ://www.who.int/dietphysicalactivity/publications/facts/cvd/en/
http ://www.who.int/features/qa/15/fr/index.html
1.2. ANATOMIE ET PHYSIOLOGIE CARDIAQUE
9
Amérique du sud et en Asie. Aujourd’hui déjà, plus de la moitié de tous les cas de cancer
surviennent dans les pays en développement. Le cancer des poumons fait plus de victimes
que tout autre cancer."
Après l’exposé de ces faits, la suite de ce chapitre donne des éléments d’anatomie et de
physiologie cardiaque et pulmonaire. Pour chacun de ces deux organes, nous insistons
sur le comportement physiologique lié plus particulièrement à leur dynamique et sur les
mouvements observables avec les techniques d’imagerie actuelles.
1.2 Anatomie et Physiologie cardiaque
Cette section est consacrée à l’étude du cœur, moteur de la circulation sanguine. Une
description de l’anatomie et de la physiologie cardiaque est d’abord proposée. Puis nous
exposerons brièvement les pathologies liées à la diminution de la fonction contractile du
myocarde.
1.2.1 Description de l’anatomie cardiaque
Le cœur est un muscle creux chargé de la circulation du sang grâce à des contractions
périodiques. Son rôle est de pomper le sang automatiquement afin de le redistribuer dans
les organes du corps humain. Situé dans le médiastin, entre les poumons et au dessus du
diaphragme, il pèse de 250 à 350 grammes chez l’adulte et mesure environ 13 cm de long
sur 8 cm de large. Le cœur est composé de quatre cavités (Fig. 1.1). On distingue les
oreillettes gauche (OG) et droite (OD) en haut, à paroi mince, et les ventricules gauche
(VG) et droit (VD), en bas, à paroi épaisse.
Ces cavités sont délimitées par une nappe musculaire (la paroi interauriculaire sépare
les deux oreillettes et le septum interventriculaire, plus épais, sépare les deux ventricules)
Le cœur est principalement composé d’un tissu musculaire strié, le myocarde, qui ne ressemble à aucun autre tissu musculaire du corps. Les cavités et les valves sont tapissées par
l’endocarde qui constitue la couche interne du cœur. La surface externe du cœur est recouverte par une membrane à deux feuillets. Le premier d’entre eux, l’épicarde, est collé au
muscle cardiaque. Le second, le péricarde, est un "sac" qui contient le cœur et le départ de
l’aorte et de l’artère pulmonaire. Ces deux tissus sont séparés par une couche de liquide
d’environ 10 à 15 ml dont le rôle est de lubrifier les contacts durant le cycle cardiaque.
Ces feuillets péricardiques facilitent les mouvements de la masse cardiaque au cours de
son cycle.
L’OG et le VG constituent la partie gauche du cœur qui recueille le sang oxygéné sortant des poumons par les veines pulmonaires pour le propulser dans l’aorte et ses divisions.
La partie gauche et notamment le ventricule assure donc la distribution du sang (environ
25 litres par minute) dans l’ensemble du corps humain à travers un réseau vasculaire d’environ 100 km ! On comprend donc l’intérêt que suscite l’étude de cette cavité. L’OD et
le VD constituent la partie droite du cœur qui assure la circulation du sang chargé en dioxyde de carbone recueilli par les veines caves. Le sang carboné aboutit dans l’oreillette
droite puis est transmis au ventricule droit. Il est ensuite éjecté dans l’artère pulmonaire
vers les poumons. La circulation du sang au sein du cœur est assurée par la présence d’un
CHAPITRE 1. CONTEXTE MÉDICAL
10
ensemble de valvules unidirectionnelles. Le sang circule ainsi toujours dans la même direction grâce à ces quatre valves cardiaques, appelées respectivement tricuspide, pulmonaire, mitrale, et aortique. Ces valves sont des structures fibreuses très souples, implantées
sur des anneaux qui constituent les orifices qu’elles viennent obstruer. Elles sont amarrées
aux parois ventriculaires par des cordages nommés piliers du cœur. En position fermée,
elles sont hermétiques et empêchent le passage du sang. Elles s’ouvrent toutes dans un
sens bien défini, empêchant ainsi tout reflux. Voici leur description respective :
• la valve tricuspide s’ouvre dans le sens de l’oreillette droite vers le ventricule droit.
• la valve pulmonaire s’ouvre dans le sens du ventricule droit vers l’artère pulmonaire.
• la valve mitrale s’ouvre dans le sens de l’oreillette gauche vers le ventricule gauche.
• la valve aortique s’ouvre dans le sens du ventricule gauche vers l’aorte.
F IG . 1.1. Description anatomique du cœur
(source : www.medecine-et-sante.com/anatomie/coeur.html).
1.2.2 Physiologie cardiaque
Le fonctionnement du muscle cardiaque est complexe et présente de nombreuses facettes. Nous résumons ici les principales phases de la pompe cardiaque qui règlent la
circulation du sang dans l’organisme, sa fonction primordiale. Pour un exposé approfondi
de la physiologie cardiaque, nous invitons le lecteur à se référer à des ouvrages plus spécialisés [Houdas, 1990]. Un cycle cardiaque se déroule en deux étapes. Dans un premier
temps, la diastole correspond au remplissage des ventricules. Les valves auriculoventriculaires (mitrale et tricuspide) sont alors ouvertes et les valves sigmoïdes (aortique et
pulmonaire) sont fermées. Le durée d’une diastole est d’environ 600 ms. Dans un second temps, la systole correspond à la contraction des ventricules. Les valves sigmoïdes
1.2. ANATOMIE ET PHYSIOLOGIE CARDIAQUE
11
s’ouvrent pour permettre l’évacuation du sang accumulé durant la diastole vers les organes
du corps humain. Les valves auriculoventriculaires se ferment pour éviter tout reflux du
sang vers les oreillettes. La phase systolique se déroule en 300 ms environ. Les deux instants de télédiastole et de télésystole indiquent respectivement le relâchement maximum
et la contraction maximale du ventricule gauche. Le fonctionnement du muscle cardiaque
est périodique et totalement automatique dans le sens où il n’a besoin d’aucun stimulus
externe. L’amplitude des mouvements impliqués lors des cycles cardiaques est constante.
La Figure 1.2 illustre l’évolution de quelques paramètres physiologiques du cœur au cours
du cycle cardiaque, en particulier les courbes de pressions et de volumes des cavités en
regard de l’électrocardiogramme, signal électronique périodique représentant le cycle cardiaque.
F IG . 1.2. Quelques paramètres physiologique du cœur au cours du cycle cardiaque
La partie B de la Fig. 1.2 correspond à la variation des volumes ventriculaires au
cours du cycle. Le volume d’éjection systolique (VES ) représente le volume de sang éjecté
pendant chaque contraction. Chez l’homme, il varie entre environ 70ml au repos à 150ml
chez le sportif en plein effort. Il se calcule par une simple différence entre le volume de
sang dans le ventricule gauche en fin de diastole avant éjection, ou volume télédiastolique
(VT D ) et le volume de sang dans le ventricule gauche en fin de systole, après éjection du
sang ou volume télésystolique (VT S ). De ces mesures, on peut également définir le débit
cardiaque :
DC = VES ∗ Fc
où Fc représente la fréquence cardiaque. Une importance particulière est généralement
12
CHAPITRE 1. CONTEXTE MÉDICAL
portée à la fraction d’éjection (FE ) exprimée en pourcentage :
VT D − VT S
× 100%.
(1.1)
FE =
VT D
La fraction d’éjection du VG est normalement d’environ 65% ce qui signifie que 65% du
sang qui est contenu dans le ventricule gauche en télédiastole est éjecté. Un chiffre plus
bas indique un mauvais fonctionnement du myocarde. Il s’agit donc d’un critère global
permettant de mesurer le degré de l’insuffisance cardiaque. Ces indicateurs sont très utilisés en routine clinique mais ils ne sont basés que sur deux états extrêmes du muscle
cardiaque. L’étude des déformations cardiaques sur l’ensemble du cœur et du cycle cardiaque doit permettre une identification plus précise des régions pathologiques [Götte
et al., 2001].
L’ouverture et la fermeture de chacune des valves sont passives. Elles dépendent de
la différence de pression de chaque côté des membranes vasculaires (Fig. 1.2, A). Lors
de l’éjection, la différence de pression est assurée par la fonction mécanique du cœur,
elle-même pilotée par la propagation d’une onde électrique de dépolarisation dans les tissus nodaux. L’activité électrique devient dès lors un excellent indicateur de son état à un
instant précis. Quand l’onde électrique traverse le cœur, une infime partie de ce courant
se propage à la surface du corps. En installant des électrodes aux poignets, aux chevilles
et sur la peau du thorax, il est possible d’acquérir un signal électrique en temps réel. Cet
examen est appelé électrocardiogramme (ECG) (voir Fig. 1.2,C). La forme générale de
l’ECG présente un ensemble d’ondes caractéristiques indexées par des lettres et correspondant à des phases bien déterminées. Ainsi, l’onde de dépolarisation auriculaire porte
la dénomination P. La dépolarisation ventriculaire recouvre les ondes appelées Q, R et
S. Lorsqu’une onde a une amplitude égale ou supérieure à 5 mm, la lettre la désignant
est majuscule, sinon elle est minuscule. La déflexion négative débutant une dépolarisation
ventriculaire porte la lettre Q (ou q). Celle ne débutant pas une dépolarisation ventriculaire
porte la lettre S (ou s). L’onde positive porte la lettre R (ou r). L’ ECG est fondamental en
cardiologie. Il permet en effet au médecin de poser, par l’analyse de ce signal, des diagnostics précis (troubles du rythme, infarctus, péricardite, etc.), sans entraîner la moindre
contrainte ou traumatisme pour le malade. L’électrocardiogramme est, en effet, un examen indolore non invasif et sans aucune contre-indication. Une autre raison, plus adaptée
à notre contexte, consiste à se servir de ce signal pour renseigner en temps réel les algorithmes de reconstruction d’images de la configuration du cœur. Il permettra ainsi de
déclencher des acquisitions ou de trier des informations à des moments précis du cycle
cardiaque.
La fermeture des valves est responsable des bruits caractéristiques que l’on associe au
cœur. Le premier bruit, appelé B1, correspond à la fermeture des valves mitrales et tricuspides et le second bruit, B2, correspond à la fermeture des valves aortiques et pulmonaires
(Fig. 1.2, D).
1.2.3 Les mouvements cardiaques
Le mouvement du cœur est extrêmement complexe du fait de l’hétérogénéité des tissus
qui le composent. D’une manière simplifiée, on peut considérer qu’il y a 3 couches. Une
1.2. ANATOMIE ET PHYSIOLOGIE CARDIAQUE
13
couche centrale prépondérante où les fibres sont orientées de manière circonférentielle et
deux couches périphériques où les fibres sont inclinées d’environ ±60◦ , respectivement
(Fig. 1.3). Cette configuration permet notamment la torsion du cœur pour une meilleure
efficacité de l’éjection du sang.
Ventricule
Gauche
Endocarde
111111
000000
000000
111111
000000
111111
000000
111111
000000
111111
000000
111111
000000
111111
000000
111111
000000
111111
11111
00000
00000
11111
00000
11111
00000
11111
0000
1111
0000
1111
00000
0000 11111
1111
0000
1111
00000
11111
0000
1111
0000
1111
00000
0000 11111
1111
0000
1111
00000 Epicarde
0000 11111
1111
0000 11111
1111
00000
0000
1111
0000
1111
00000
11111
0000
1111
0000 11111
1111
00000
0000
1111
0000
1111
0000
1111
F IG . 1.3. Orientation des fibres musculaires du ventricule gauche, schéma inspiré de [Petitjean,
2003]
On ne dispose pas de modèle précis des mouvements cardiaques. Cependant il est
possible de donner une description globale et qualitative des principaux mouvements du
cœur [Han, 1999]. Ainsi la systole cardiaque est caractérisée par :
• Une contraction radiale et l’épaississement de la paroi de VG
• Une torsion autour du grand axe formé par l’apex et la base
• Une déformation et diminution du grand axe
1.2.4 Défauts de l’activité cardiaque
Evaluation de la fonction contractile
Il existe un grand nombre de pathologies cardiaques. Celles qui nous intéressent particulièrement sont celles liées au défaut de la fonction contractile myocardique, directement
reliée à l’état fonctionnel de la pompe cardiaque. Une altération de cette fonction contractile est caractérisée par la variation de paramètres physiologiques et d’un ensemble de
signaux.
Le fraction d’éjection (1.1) et la fraction de raccourcissement définie par :
FR =
DT D − D T S
DT D
où DT D et DT S sont les diamètres de la cavité ventriculaire gauche en télédiastole et télésystole, respectivement. Ce paramètre physiologique permet une description quantitative
globale de la fonction contractile du cœur.
CHAPITRE 1. CONTEXTE MÉDICAL
14
Ischémie myocardique
Lorsque les artères coronaires, chargées de vasculariser le myocarde se bouchent, le
myocarde ne reçoit plus de sang et manque d’oxygène ; c’est l’ischémie myocardique.
L’ischémie myocardique peut intéresser une région du cœur ou l’ensemble du muscle cardiaque. D’un point de vue dynamique, l’ischémie myocardique représente un déséquilibre
entre les apports et la demande en oxygène du myocarde.
L’infarctus du myocarde est la nécrose d’une zone plus ou moins étendue du muscle
cardiaque. Les cellules musculaires cardiaques de ce territoire ne parviennent plus à se
contracter par manque d’apport en oxygène et meurent en quelques heures. La gravité
de l’infarctus tient surtout à son étendue : plus l’artère obstruée irrigue une zone importante, plus l’infarctus est grave. Si l’atteinte est très étendue, le fonctionnement de toute
la pompe cardiaque est altéré et les contractions deviennent anormales. On distingue deux
catégories d’ischémies :
l’ischémie réversible pour laquelle, dans les secondes qui suivent le début de l’ischémie, une diminution très brutale de l’activité contractile se produit : l’épaississement / raccourcissement du myocarde est remplacé par un amincissement / dilatation passif. Pendant les premières minutes d’ischémie, les dommages cellulaires
restent réversibles : si la perfusion coronaire est rétablie, il n’y aura pas de nécrose.
Les cellules qui ont été sous-perfusées retrouvent un fonctionnement normal dans
les heures qui suivent cette reperfusion.
l’ischémie irréversible apparaît si le manque en oxygène est plus prolongé (durée supérieure à 30 minutes en moyenne chez l’homme). Les myocytes cardiaques sont
irréversiblement endommagés. Le sous-endocarde est le plus sensible à l’ischémie.
Si l’occlusion de l’artère coronaire persiste pendant trois heures, la nécrose se développe du sous-endocarde vers le sous-épicarde.
L’analyse spatio-temporelle de la déformation du muscle cardiaque, permet la détection
d’anomalies cardiaques et favorise la mise en évidence et la localisation de pathologies
ischémiques. Les méthodes d’estimation de forme et de mouvement que nous proposons
dans ce mémoire sont développées dans ce but.
1.3
Le système respiratoire
1.3.1 Physiologie respiratoire
La respiration est un phénomène complexe qui implique un grand nombre d’organes
et de tissus présents dans la cage thoracique. L’action commune de ces différents protagonistes est nécessaire au bon déroulement de la respiration et la défaillance de l’un
d’entre eux entraîne des insuffisances respiratoires plus ou moins prononcées. La notion
de respiration regroupe en fait deux processus physiologiques bien distincts que sont la
ventilation, responsable des mouvements observables, et l’échange gazeux, intervenant au
niveau de la paroi des poumons. Dans ce qui suit nous nous intéresserons uniquement à la
ventilation, même si parfois, par abus de langage, nous emploierons le terme respiration
1.3. LE SYSTÈME RESPIRATOIRE
15
pour désigner ce processus. La ventilation dépend de l’activité des muscles respiratoires
(diaphragme, muscles intercostaux, muscles de la paroi de l’abdomen) qui modifie la géométrie et le volume du thorax. C’est par l’intermédiaire de ces variations que les échanges
gazeux s’effectuent.
F IG . 1.4. Coupe schématique des poumons
Voici une description des principaux acteurs de la ventilation :
Le diaphragme est un muscle très important dans la mécanique respiratoire. Il se situe
juste en dessous des poumons (Figure 1.4). Les différentes fibres de ce muscle sont
dirigées vers le haut et viennent se plaquer sur la surface interne de la partie inférieure de la cage thoracique. Sa forme générale est un cylindre coiffé d’un dôme.
Lorsqu’il se contracte, il s’aplatit, créant ainsi un vide dans la cavité thoracique en
exerçant une pression dans la cavité abdominale. C’est lui le moteur de la respiration.
Contrairement à ce que l’on pourrait penser, le poumon est un organe passif de la respiration, même si c’est à lui que l’on doit la totalité des échanges gazeux. Il est
doté d’une élasticité considérable et s’adapte à la paroi de la cavité thoracique. Son
mouvement dépend donc de l’action musculaire au niveau du tronc. Les poumons
sont comparables à deux sacs spongieux mobiles fixés au niveau du hile pulmonaire
(point d’arrivée de la bronche souche, de l’artère pulmonaire et d’autres vaisseaux).
Le poumon droit est constitué de trois lobes : lobe supérieur, lobe moyen, lobe inférieur, alors que le poumon gauche n’en possède que deux : lobe supérieur et lobe
inférieur, laissant ainsi un espace plus important pour le cœur.
La cage thoracique est composée de 10 paires de côtes reliées au sternum par des cartilages et de deux paires de côtes flottantes. Les muscles qui interviennent de façon
significative pendant la respiration sont les scalènes et les sternomastoïdiens. Les
scalènes élèvent la cage thoracique lors de l’inspiration et sont très utiles au repos.
16
CHAPITRE 1. CONTEXTE MÉDICAL
1.3.2 Fonction ventilatoire
D’un point de vue fonctionnel, les échanges gazeux sont liés à l’action d’un piston et
d’un cylindre [Promayon, 1997] stabilisés à chaque instant par des forces élastiques. La
mesure de l’élasticité est une mesure statique puisqu’elle ne dépend pas de la vitesse. Le
poumon et le thorax sont deux entités élastiques couplées par l’intermédiaire de la poche
pleurale. Le liquide pleural est un liquide visqueux où règne une pression légèrement négative favorisant ainsi le contact glissant, sans frottement entre les poumons et le thorax.
Ce glissement se retrouve également à l’interface médiastin/poumon permettant ainsi un
désynchronisme entre les mouvements cardiaques et les mouvements ventilatoires. Il n’y
a, à priori, aucune coordination entre ces deux mouvements même si généralement on
admet qu’il se passe environ 4 cycles cardiaques pour un cycle respiratoire. Le fait qu’il
n’y ait pas de coordination ne veut pas dire qu’il n’y ait pas de relation entre ces deux
mouvements. Pour commencer, d’un point de vue physiologique, l’augmentation du cycle
cardiaque entraîne un besoin accru en oxygène ce qui se traduit également par une augmentation de la fréquence ventilatoire. Enfin, la déformation du cœur introduit localement
une déformation des poumons au niveau de leurs interfaces avec l’enveloppe cardiaque.
La déformation locale des poumons est donc tributaire du mouvement cardiaque.
A l’état de repos, sans aucune action musculaire, ces corps élastiques (poumons, thorax) sont repérés par un état de référence (la capacité résiduelle fonctionnelle -CRF- ou
functional residual capacity en anglais sur la Fig. 1.6).
F IG . 1.5. Représentation schématique des organes thoraciques durant l’expiration (à gauche) et
l’inspiration (à droite) et radiographies respectives associées
Dans ces conditions, l’inspiration (Fig. 1.5, à droite) est nécessairement un processus
actif, conséquence de l’action combinée des muscles respiratoires :
1. Contraction des muscles respiratoires
2. Déplacement vertical du diaphragme vers le bas et déplacement de la cage thoracique vers l’avant et vers le haut (action des muscles intercostaux)
3. Le volume de la cage thoracique augmente et la pression pleurale décroît légèrement
4. Les poumons sont attirés vers la paroi de la cage thoracique
5. La pression de l’air dans les poumons diminue ce qui entraîne un flux d’air dirigé
de l’extérieur vers les poumons
L’expiration (Fig. 1.5, à gauche), en revanche, est un processus passif résultant du
relâchement des muscles respiratoires et du retour à l’équilibre des corps élastiques (force
rétractile du poumon importante et force expansible du thorax faible) :
1.3. LE SYSTÈME RESPIRATOIRE
17
1. Relâchement des muscles respiratoires
2. Les organes abdominaux remontent
3. Le volume de la cage thoracique diminue
4. La pression de l’air dans les poumons augmente
5. Flux d’air dirigé vers l’extérieur de la cage thoracique
Il est important d’apporter une appréciation quantitative des mouvements engendrés
par la ventilation :
• Le déplacement principal se situe dans l’axe cranio-caudal (axe vertical).
• Le déplacement au niveau du diaphragme est de 2 à 4 cm.
• On compte 12-14 cycles par minutes et environ 4 cycles cardiaques par respiration
• L’inspiration et l’expiration ne sont pas exactement des phénomènes inverse l’un
de l’autre. En terme de mouvement, cette asymétrie des deux phases engendre un
cycle d’hystérésis.
F IG . 1.6. Volumes pulmonaires échangés lors de différents types de respiration
Détaillons maintenant les autres descripteurs illustrés sur la Fig. 1.6. Le volume courant (tidal volume) est le volume mobilisé par une inspiration et une expiration normale
(0.5L). Le volume de réserve inspiratoire (resp. expiratoire) (3L , resp. 1.5L) est le volume
mobilisable après inspiration (resp. expiration) normale pour une inspiration forcée (resp.
expiration). Enfin le volume résiduel (1.5L) est le volume restant après expiration forcée.
Ces échanges d’air sont mesurés par des spiromètres. Tout comme l’ECG pour l’appréciation de la fonction cardiaque, les données fournies par les spiromètres sont d’une grande
utilité pour la reconstruction de séquences d’images de thorax respirant. Pour plus de renseignements concernant la physiologie respiratoire, le lecteur pourra se référer à [Murray,
1986].
CHAPITRE 1. CONTEXTE MÉDICAL
18
(a)
(b)
F IG . 1.7. Illustration d’une tumeur pulmonaire sur une coupe transversale (a) et sagittale (b)
d’une image en fin d’expiration extraites d’une séquence d’images tomodensitométriques
4D
1.3.3 Pathologies pulmonaires
Les pathologies broncho-pulmonaires sont fréquentes et potentiellement gravissimes
chez la personne âgée. Leur diagnostic est souvent difficile, de par la rareté des symptômes, entraînant un retard du diagnostic et donc du traitement. Parmi les principales pathologies pulmonaires recensées on trouve : les tumeurs, les pneumopathies, la bronchite
chronique, l’asthme et la tuberculose. Le cancer des bronches est responsable de plus de
25 000 nouveaux cas chaque année en France. Il est plus fréquent chez l’homme que chez
la femme. Les chiffres impressionnants rappelés en début de chapitre rappellent qu’il est
essentiel de développer des moyens de prévention et de traitement adaptés. On distingue
les cancers primitifs, qui apparaissent d’abord dans les poumons puis gagnent éventuellement d’autres parties du corps, des cancers secondaires, qui suivent le cheminement
inverse. L’évolution de ces cancers peut être divisée en quatre étapes :
• Le premier stade est un cancer très localisé, qui n’a pas envahi les ganglions lymphatiques.
• Au second stade, le cancer s’est étendu aux ganglions lymphatiques de voisinage.
• Pour le troisième stade, le cancer s’est étendu à des organes voisins de sa localisation initiale (paroi thoracique, diaphragme).
• Le quatrième stade représente une extension du cancer à un organe de localisation
éloignée (métastase).
Enfin, ll existe deux grands types de cancer du poumon : 1) les cancers dits à petites
cellules et 2) ceux dits non à petites cellules.
Les données que nous traiterons seront obtenues sur des patients souffrant de cancers
bronchiques non à petites cellules. Ce type de pathologie représente 80% des cancers
broncho-pulmonaires. Il se caractérise par son évolutivité très lente.
1.3.4 Radiothérapie
Actuellement, la radiothérapie est l’une des principales techniques thérapeutiques du
cancer avec la chirurgie et la chimiothérapie. Environ deux tiers des malades cancéreux
sont traités par radiothérapie. L’objectif de la radiothérapie est de détruire par rayonnement ionisant des cellules tumorales. La Fig. 1.7 montre une tumeur pulmonaire en to-
1.3. LE SYSTÈME RESPIRATOIRE
19
modensitométrie. Le traitement consiste à exposer la tumeur à des radiations ionisantes.
Lorsque la zone à irradier est statique, elle peut être déterminée précisément et le plan de
traitement mis en place s’appuie sur une bonne localisation des cellules cibles. Par contre
lorsque la tumeur se situe dans une région en mouvement, comme la cage thoracique, la
mise en place du plan de traitement devient difficile. Actuellement, en routine clinique,
il y a peu de prise en compte réelle du mouvement durant la thérapie. Il peut en résulter
une irradiation importante de cellules saines avoisinant la région tumorale. Plusieurs solutions sont actuellement à l’étude. Selon Boldea [Boldea, 2006], on peut les regrouper en
diverses catégories :
• Ajout de marge de sécurité lors de la thérapie. A l’heure actuelle, les plans de
traitements s’appuient sur une acquisition tomodensitométrique (TDM) 3D réalisée
avant irradiation des tumeurs. Si le scanneur est lent, cette acquisition n’est qu’un
moyennage à un instant donné de ce qui se passe durant l’ensemble du cycle respiratoire. Si le scanneur est rapide l’acquisition n’est pas floue mais elle ne représente
qu’un instant particulier. Dans les deux cas, ce n’est pas le reflet des déplacements
et déformations intervenants durant la respiration. Il en résulte une incertitude liée à
la position des cellules cancéreuses durant le protocole et la définition d’un volume
cible prévisionnel statique qui servira durant l’ensemble du traitement. D’une manière idéale, les plans de traitements ne devraient pas être établis à partir d’image
3D mais à partir d’images 4D et devraient être synchronisés pendant l’irradiation.
• Le blocage respiratoire. Il s’agit de bloquer la respiration à des positions prédéfinies et d’irradier la zone tumorale rendue statique ou quasiment statique. Le blocage peut être volontaire et c’est le patient qui décide de passer en apnée à certains
moments de la respiration, généralement fin d’inspiration car à cet instant, le tissu
pulmonaire est moins dense ce qui entraîne une diminution de l’irradiation des cellules saines. Le patient est secondé par un spiromètre qui le renseigne en temps réel
sur son cycle respiratoire. Le blocage de la respiration peut également se faire par
intervention d’un dispositif extérieur. Le dispositif Active Breath Control (ABC)
utilisé au Centre Léon Bérard à Lyon en est un exemple. Cet appareil se sert également de l’information délivrée par un spiromètre pour bloquer la respiration durant
8 à 20 secondes lorsque le patient lui en donne le signal. Cet appareil peut s’avérer
gênant pour certains patients et son utilisation passe par une phase d’entraînement
préalable afin d’éviter toute angoisse ou réaction non contrôlée.
• D’autres approches visent à synchroniser l’activation du faisceau irradiant avec le
signal respiratoire [Mageras and Yorke, 2004] pendant une durée prédéterminée du
cycle respiratoire. La synchronisation est réalisée grâce à un signal externe obtenu
à partir de marqueurs sur le thorax du patient ou grâce à l’information délivrée par
un spiromètre. Ce type de traitement est beaucoup plus confortable pour les patients
qui peuvent respirer librement mais de façon régulière.
• Le suivi en temps-réel est l’un des enjeux actuels du traitement radiothérapeutique
de tumeurs mobiles. Il nécessite la prise en compte du processus respiratoire durant
la thérapie [Boldea, 2006] [Shimizu et al., 2000] [Shirato et al., 2003] afin d’éviter
aux patients hospitalisés des contraintes supplémentaires telles que le blocage de
la respiration. La prise en compte du mouvement doit conduire à la réduction des
incertitudes concernant la position de la cible cancéreuse et donc diminuer l’irradiation des régions saines du poumon [Goitein, 2004] tout en augmentant la dose
CHAPITRE 1. CONTEXTE MÉDICAL
20
délivrée à la tumeur pour un temps de traitement identique. Pour cela, le dispositif
doit être renseigné en temps réel de la position des cellules cancéreuses, des poumons et des autres structures thoraciques afin d’asservir la direction des faisceaux
irradiants pendant le traitement.
La prise en compte des mouvements respiratoires pendant les traitements radiothérapeutiques des cancers du poumon est devenue un challenge [Goitein, 2004]. La réduction
des incertitudes quant à la position des cellules pathologiques devrait permettre de réduire
l’irradiation de cellules saines et d’augmenter localement la dose émise sur les cellules
cancéreuses. Des approches sont actuellement en cours d’investigation mais toutes ces
méthodes manquent cruellement d’une information de mouvement respiratoire spécifique
à chaque patient. L’utilisation des algorithmes de recalage d’images dans le domaine de la
radiothérapie est relativement récente et en constante progression [Sarrut, 2006]. Le but
final est de proposer des solutions pour le contrôle et la planification des doses délivrées
en temps réel. Le suivi en temps réel, qui constitue une procédure idéale, a donc besoin
d’une information spatio-temporelle du mouvement et doit être adaptée à chaque patient.
Les méthodes d’estimation de mouvement et de forme que nous proposerons s’inscrivent
donc également dans ce contexte particulier.
1.4
Conclusion
Nous résumons ici les principales hypothèses concernant les organes et les pathologies qui constituent le contexte médical de ce mémoire. L’ensemble des organes qui
constituent le corps humain sont des structures élastiques qui se déforment suivant certaines propriétés en contraintes. Ceci nous donne un a priori sur la façon d’appréhender
le mouvement complexe de ces structures dont la caractéristique principale est qu’il est
non-rigide. De plus, les phénomènes dynamiques étudiés sont des phénomènes pseudopériodiques que nous assimilerons à des phénomènes périodiques. En effet, la périodicité
n’est pas stricte dans le sens où l’on peut observer des variations de fréquence d’un cycle
à l’autre que ce soit dans le cas de la respiration que dans le cas du battement cardiaque.
Cependant il n’existe pas de discontinuité prononcée et la variation de la durée du cycle
se fait généralement de manière progressive. L’hypothèse de périodicité est justifiée dans
le sens où, comme nous le verrons par la suite, les techniques de reconstruction de séquences d’images 3D synchronisent les acquisitions sur des repères physiologiques explicites (ECG pour le cœur et courbe ventilatoire ou position remarquable du diaphragme
pour le thorax respirant). La séquence ainsi obtenue ne couvre qu’un cycle ou une partie
du cycle étudié. Enfin, les avancées matérielles constatées ces dernières années permettent
aujourd’hui une imagerie dynamique 3D. Le prochain chapitre est consacré à ces techniques d’imagerie d’organes en mouvement en insistant plus particulièrement sur la prise
en compte du temps dans la formation des images.
Chapitre
2
Imagerie médicale d’organes en
mouvement
Sommaire
2.1
2.2
2.3
2.4
2.5
Introduction . . . . . . . . . . . . . . . . . . . . .
Modalités d’imagerie d’organes en mouvement . .
Exploration de l’activité cardiaque en IRM . . . .
2.3.1 Formation des images par RM . . . . . . . .
2.3.2 Les séquences de base en imagerie cardiaque
2.3.3 Les séquences IRM rapides et ultra rapides .
2.3.4 Images par RM utilisées dans cette thèse . .
2.3.5 IRM de marquage tissulaire . . . . . . . . .
La Tomodensitométrie à Rayons X . . . . . . . . .
2.4.1 Caractérisation des images TDM . . . . . . .
2.4.2 Dispositifs d’acquisition . . . . . . . . . . .
2.4.3 TDM dynamique . . . . . . . . . . . . . . .
2.4.4 TDM 4D . . . . . . . . . . . . . . . . . . .
2.4.5 Images TDM utilisées dans cette thèse . . . .
Conclusion . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
21
22
26
26
28
28
30
31
33
33
33
35
36
36
38
2.1 Introduction
C
e chapitre est consacré à la description des techniques d’imageries tomographiques
dont les images sont utilisées lors de mes travaux à savoir l’Imagerie par Résonance
Magnétique (IRM) et la TomoDensitoMétrie (TDM). De nombreux ouvrages et articles
décrivent ces techniques et leur principe dans le détail. Nous insisterons plus particulièrement dans cette section sur les adaptations et les méthodes mises en œuvre pour l’analyse
d’organes en mouvement. Les fondements physiques ne varient pas par rapport aux techniques plus classiques destinées à l’acquisition d’organes statiques. En revanche, la formation des images est, elle, adaptée aux mouvements que l’on désire mettre en évidence.
21
22
CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT
Ce chapitre est organisé de la manière suivante : d’abord, nous faisons un tour d’horizon
des enjeux et des techniques d’exploration d’organes en mouvement. Puis les deux sections suivantes sont consacrées plus particulièrement à l’IRM et à la TDM en insistant
plus particulièrement sur la formation des images ainsi que leurs caractéristiques. Le lecteur trouvera en annexes A et B un résumé des principes physiques associés à ces deux
types d’imagerie.
2.2
Modalités d’imagerie d’organes en mouvement
Avant d’aborder la prise en compte du temps pour l’étude des organes en mouvement,
il convient de resituer brièvement les techniques d’exploration les plus utilisées en clinique.
Généralement, on distingue les techniques d’imagerie dites anatomiques qui visent à
apporter une information géométrique détaillée des structures et des tissus et les techniques d’imagerie dites fonctionnelles qui permettent d’obtenir des informations relatives
au fonctionnement des organes.
Pour accéder à la morphologie cardiaque ou thoracique, on fait généralement appel à
l’IRM, à la TDM ou à l’imagerie ultrasonore (US). Chacune de ces modalités possèdent
leurs propres caractéristiques. Ainsi, l’IRM est préconisée pour l’examen des tissus mous,
alors que la TDM (ou Computed Tomography - CT - en anglais) est particulièrement bien
adaptée à l’étude des structures osseuses. Cette dernière permet de mettre en évidence
des infections ou des hémorragies et de guider des ponctions d’organes profonds. L’un
des avantages de l’IRM par rapport à la TDM est son caractère non-invasif. L’examen par
IRM génère des images de qualité, mais, étant moins diffusé, il peut être plus difficilement
accessible pour le patient et coûte plus cher. L’imagerie US trouve tout son intérêt pour
l’analyse d’organes en mouvement. Sa simplicité d’utilisation, son faible coût en font une
technique de choix pour les premiers examens d’imagerie, en cardiologie notamment.
L’information fonctionnelle liée au métabolisme peut être explorée en utilisant la Tomographie à Emission de Positons (TEP) [Hartiala and Knuuti, 1995] alors que l’information
liée à la perfusion est explorée en Tomographie à Emission MonoPhotonique (TEMP), en
IRM, en imagerie US ou en TEP.
La complexité des phénomènes est telle qu’elle ne peut être explorée par une seule
modalité d’acquisition. Dans un contexte clinique, ces techniques s’avèrent être complémentaires pour le clinicien qui doit détecter les zones pathologiques et affiner le traitement. Dans un contexte de recherche, toutes ces modalités sont intéressantes pour comprendre, in vivo, le comportement d’organes sains et pathologiques. La Figure 2.1 illustre
des images issues de quelques unes de ces modalités.
L’intégration du temps dans le principe d’acquisition de ces images prend une place
particulière compte tenu des contextes médicaux de ma thèse. Aujourd’hui, les progrès
matériels et logiciels sont tels que chaque grande famille de modalités peut prétendre obtenir des séquences d’images dynamiques restituant des phénomènes qui évoluent au cours
du temps. Le but d’une série d’images acquises dans le temps est de permettre l’étude d’un
processus physiologique dynamique ou l’étude dynamique d’organes déformables. Ainsi,
2.2. MODALITÉS D’IMAGERIE D’ORGANES EN MOUVEMENT
(a)
(c)
(e)
23
(b)
(d)
(f)
F IG . 2.1. Illustration des différentes modalités d’acquisitions utilisées en clinique au travers de
leurs images : (a)-Coupe sagittale du thorax en IRM (pondération T1) (b)-Coupe sagittale
du thorax en IRM (pondération T2) (c)-Image TEP de VG cardiaque (d)-Image ultrasonore
apicale 4 cavités du cœur (e)-Coupe transversale tomodensitométrique du thorax (f)-Image
SPECT du cœur en orientation petit axe.
CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT
24
pour l’exploration d’organes en mouvement, nous distinguons quatre grandes familles de
modalités.
L’IRM et plus particulièrement le ciné IRM et l’IRM de marquage tissulaire [Zerhouni
et al., 1988,Axel and Dougherty, 1989] sont particulièrement bien adaptées à l’étude
de la fonction contractile du cœur. Elles permettent d’estimer le comportement dynamique du cœur.
La TDM constitue également un moyen d’explorer des organes mobiles. On distingue
la TDM dynamique qui intègre directement des informations de mouvement lors
de la reconstruction [Roux, 2004, Bonnet et al., 2003] et la TDM 4D qui trie les
différentes acquisitions à partir de repères externes [Vedam et al., 2003].
L’imagerie US n’est pas une modalité tomographique au sens des deux précédentes
mais elle mérite d’être mentionnée puisqu’elle permet d’explorer des organes en
temps réel. Notons l’existence de systèmes échocardiographiques 3D pour l’étude
du cœur1 . Ce type d’imagerie ne sera pas pris en compte dans la suite de ce document.
L’imagerie nucléaire constituée de la TEMP et de la TEP, synchronisée sur des signaux
physiologiques comme l’ECG, peut générer des séries d’images. Ces modalités ne
seront pas davantage décrites.
Dans la suite, nous nous focaliserons sur les techniques tomographiques dont le principe général consiste à obtenir la distribution spatiale d’une quantité physique par mesure
indirecte. La construction des images requiert de nombreuses mesures et peut demander
du temps. Le temps de reconstruction est un facteur important et peut être limitant pour
des acquisitions dynamiques d’où la nécessité de développer des techniques spécifiques.
Cette reconstruction géométrique (ie. la formation de l’image) nécessite une acquisition
complète de l’objet et souffre donc de limitations temporelles. Les deux modalités à partir
desquelles l’ensemble de mes expérimentations seront effectuées sont l’IRM où la détection du signal à reconstituer se fait de manière électronique et la TDM où la mécanique
(rotation de l’ensemble source-détecteur) entre également en jeu. L’un des enjeux actuels
de ces techniques tomographiques repose sur la prise en compte du temps car l’utilisation
de techniques d’acquisition et de reconstruction standards conduisent généralement à des
images présentant des artefacts de mouvement [Shepp et al., 1979, Ritchie et al., 1992].
D’une manière générale, la résolution temporelle dépend des processus physiologiques
que l’on souhaite mettre en évidence et de l’agent de contraste éventuellement utilisé
[Bonnet et al., 2003]. Par exemple, d’après les descriptions données au chapitre 1, un
cycle respiratoire complet s’effectue en 5 s et le cycle cardiaque varie de 0.9 à 0.5 s selon
que l’on soit au repos ou à l’effort. Un autre mouvement intervient également mais n’entre
pas dans le cadre de ce mémoire : il s’agit de la déglutition qui s’effectue en environ 1 s.
Si la résolution temporelle dépend des processus physiologiques à imager, elle dépend
également des contraintes technologiques qui peuvent s’avérer être un facteur limitant et
ce, plus particulièrement pour la TDM également tributaire du temps de rotation de l’arc.
La reconstruction d’images dynamiques est fortement conditionnée par le fait que l’on
désire (ou non) reconstruire les images en ligne. En effet, la reconstruction d’images en
ligne, lors d’interventions chirurgicales par exemple, nécessite de considérer les acquisi1
http ://www.medical.philips.com/main/products/ultrasound/cardiology/sonos7500/index.html
2.2. MODALITÉS D’IMAGERIE D’ORGANES EN MOUVEMENT
25
tions de manière causale (seules les acquisitions obtenues antérieurement à l’instant de reconstruction peuvent être prises en compte) et la reconstruction d’images à la volée se fait
souvent au détriment de la qualité des images (résolution moindre, prise en compte partielle de l’information). Ces limitations sont moins présentes lorsque la séquence d’images
peut être reconstruite a posteriori, où le temps de reconstruction est moins contraignant
et où l’on dispose de toutes les données acquises pour construire la séquence d’images en
chaque instant.
Deux moyens peuvent être employés pour limiter les artefacts de mouvement : 1) pour
réduire les mouvements respiratoires, on peut demander au patient de suspendre sa respiration durant les acquisitions. Ce blocage n’est jamais vraiment parfait et il arrive que les
patients ne soient pas en mesure d’effectuer ce blocage ; 2) dans le cas de la tomodensitométrie, on peut augmenter la vitesse de l’arc tout en sachant qu’il existe une limite d’ordre
matériel à cette augmentation [Ritchie et al., 1992]. Actuellement en TDM dynamique, la
rotation de l’arc peut atteindre une vitesse de 0.33 à 0.5 seconde.
D’une manière générale, si l’objet évolue pendant l’acquisition, les données deviennent
inconsistantes, comme s’il s’agissait d’objets différents (comme lorsqu’on prend une
photo et que le sujet bouge). On constate ainsi l’apparition d’artefacts de mouvements
qui se caractérisent par des flous localisés sur les régions animées comme le montre la Figure 2.2. Sur cette illustration, l’ensemble des projections a été obtenu durant le blocage
volontaire de la respiration ce qui explique que l’interface entre les poumons et les autres
structures soit clairement définie. En revanche, le mouvement cardiaque n’a pas été pris
en compte. Les projections ont été obtenues pour des états différents du cœur entraînant
un flou sur l’image reconstruite. Ce phénomène est mis en évidence par la zone cerclée
de rouge sur cette illustration.
Ce type d’artefact peut dissimuler des éléments importants de l’image et conduire à de
mauvaises interprétations. Cette nécessité de prendre en compte le mouvement durant
l’acquisition ne se limite pas au domaine cardiaque, c’est une problématique générale qui
s’applique à l’acquisition de tout objet en mouvement.
F IG . 2.2. Coupe transversale d’une acquisition tomographique 3D obtenue par blocage de la respiration. La zone entourée de rouge correspond à la mise en évidence d’un flou localisé sur
le cœur dont le mouvement, plus rapide, ne peut être restitué par la reconstruction
Des solutions algorithmiques ont été proposées en médecine nucléaire où les temps
d’acquisition sont généralement assez longs (de quelques minutes pour l’imagerie TEP
26
CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT
à 20 minutes pour l’imagerie TEMP) pour lesquelles le blocage de la respiration est inenvisageable. Ces solutions visent à compenser a posteriori le mouvement respiratoire à
partir des données elles-même ou à partir d’appareils de systèmes externes. Dans le cas de
mouvements périodiques comme la respiration ou le battement cardiaque, il est possible
de trier les acquisitions à partir d’une référence physiologique (débit respiratoire avec un
spiromètre, ECG pour le cœur) afin de répartir les acquisitions en sous intervalles temporels. Ces méthodes tendent également à réduire le bruit dans les images par moyennage
des données [Murcia, 1996]. Les principes d’acquisition détaillés en 2.3.3 et 2.4.4 appartiennent à cette catégorie. D’autres méthodes de reconstruction, également à l’étude, sont
basées sur une compensation du mouvement estimé a priori [Roux, 2004, Bonnet et al.,
2003]. Plus de détails seront donnés sur cette méthode au paragraphe 2.4.3.
Dans les parties suivantes, nous nous intéressons plus particulièrement à la prise en
compte des mouvements cardiaques dans les séquences d’images par RM et la prise en
compte des mouvements respiratoires dans la reconstruction d’images TDM.
2.3
Exploration de l’activité cardiaque en IRM
La définition et l’explication des différents paramètres caractérisant une image par
RM sont disponibles dans l’Annexe B, en l’occurrence les constantes de temps T1 et T2 ,
les temps d’échos et de répétition T E et T R et la formation du signal Radio-Fréquence
(RF).
2.3.1 Formation des images par RM
L’intensité des pixels des images par RM dépend de paramètres intrinsèques des tissus imagés que sont la densité de spin, les constantes de temps T1 et T2 et également de
paramètres extrinsèques liés à l’appareil de mesure et à la séquence choisie pour l’acquisition (séquence d’impulsions RF, T E et T R...). En choisissant les valeurs de T E et
de T R, on peut mettre en évidence diverses propriétés du milieu observé. Le temps T R
détermine l’influence du paramètre T1 . En effet, si le temps entre deux impulsion RF est
long, la composante Mz devient quasiment nulle, mais l’application de séquences d’échos
permettra d’en détecter la composante tangentielle. La valeur T E détermine la pondération du contraste en T2 . Quatre paramètres principaux sont indispensables à la description
d’une séquence :
– l’angle de basculement du signal d’excitation RF
– le type d’écho utilisé
– le temps d’écho T E
– le temps de répétition T R
Il existe un très grand nombre de séquences, chacune étant adaptée à l’organe et à la pathologie étudiée. Il revient donc au clinicien de paramétrer correctement les séquences.
2.3. EXPLORATION DE L’ACTIVITÉ CARDIAQUE EN IRM
27
F IG . 2.3. Imageur par RM (source : clinique sauvegarde de Lyon la duchère, www.cliniquesauvegarde.fr/images/IRM.jpg).
La qualité des images par RM, peut être caractérisée par le rapport signal sur bruit
(RSB), donnée par l’équation [Wright, 1997] :
√
B0 Ta
(2.1)
RSB ∝
Rimg
On tire de cette équation deux principaux enseignements. Le premier concerne l’intensité
du champ statique dans lequel est plongé le patient. Plus ce champ est intense, meilleure
est la qualité de l’image. Le problème pour l’instant est que l’on ne connaît pas vraiment
l’influence d’un tel champ sur le corps humain et les intensités les plus couramment utilisées se situent entre 0.5 et 1.5 T. Des expérimentations sont actuellement réalisées sur
des petits animaux avec des dispositifs de plus haut champ magnétique (de 7 à 9 T). La
seconde remarque importante concerne le compromis très souvent observable dans le domaine de l’imagerie entre le temps d’acquisition Ta et la résolution Rimg de l’image. Le
bruit dans les images provient à la fois d’une force électro-motrice générée par le corps
lui-même [Wright, 1997] et du mouvement Brownien d’électrons libres à l’intérieur des
composants électriques [Liang and Lauterbur, 2000]. En pratique, un modèle gaussien
de moyenne nulle est généralement utilisé pour décrire le bruit dans l’image. Sa variance
dépend de l’impédance de la bobine réceptrice.
Grâce aux possibilités d’imagerie rapide qu’offrent les appareils à haut champ magnétique, le développement des examens d’IRM cardiaque est possible et l’étude de la contraction cardiaque est accessible par des examens de type cine-IRM. Son caractère non-invasif
(contrairement à la radiologie traditionnelle ou à la tomodensitométrie) en fait une technique de choix de plus en plus utilisée pour l’exploration in vivo du cœur. Elle permet
d’accéder assez facilement à des informations comme des volumes ou la fraction d’éjection (1.1) et la masse myocardique, ce qui est plus difficile en imagerie ultrasonore.
28
CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT
2.3.2 Les séquences de base en imagerie cardiaque
La description des séquences décrites dans ce paragraphe n’est pas exhaustive. Pour
plus de détails le lecteur pourra se référer à [Pettigrew et al., 1999, Earls et al., 2002] ou
sur le site suivant : http ://www.mr-tip.com.
Il existe deux séquences de base qui sont généralement utilisées de manière complémentaire :
les séquences en Echo de Spin (ES). Lorsqu’elles sont appliquée au cœur, ces séquences
sont synchronisées sur l’électrocardiogramme. Le signal RM apparaît environ 20 à
30 ms après l’impulsion RF. Le temps T E est alors typiquement choisi entre 50
et 90 ms (soit de 1/16 à 1/8 du cycle cardiaque) sachant que plus cette constante
de temps est longue, plus l’image est pondérée en T 2, ceci au prix d’une réduction
du RSB. Les images obtenues par ce type de séquence sont dites de sang noir (ou
dark blood en anglais) car le délai entre l’impulsion RF et la lecture du signal RM
est trop important pour que les hématies excitées (dont le mouvement dépend du
flux sanguin) par la première impulsion se retrouvent au même endroit lors de la
formation de l’image.
les séquences en Echo de Gradient (EG). On se réfère généralement à cette seconde
approche par une variété d’acronismes qui dépendent du constructeur de l’imageur
(FFE : Fast Field Echo chez Philips, GRE chez General Electric et Siemens). Ce
type de séquence n’utilise qu’une seule impulsion RF (voir Annexe B) et un signal
cohérent est obtenu par application successive de gradients de champ. Le signal
RM apparaît alors beaucoup plus rapidement (1-10ms). Les dispositifs d’acquisition
permettent désormais des commutations de gradient de champ très rapides ce qui
permet d’obtenir des temps d’écho très faibles (8 à 10 ms). Le sang apparaît blanc
sur ce type de séquences. Lorsque l’acquisition est synchronisée sur l’ECG, les
échos peuvent être obtenus toutes les 20 à 40 ms sur tout le cycle cardiaque. On est
alors capable d’imager de nombreuses phases du cycle cardiaque permettant une
visualisation en mode ciné.
2.3.3 Les séquences IRM rapides et ultra rapides
Les deux techniques de base décrites en 2.3.2 ont donné naissance à des techniques
plus rapides. Le gain en vitesse d’acquisition a été rendu possible grâce aux progrès matériels (bobines de gradient, électronique, informatique permettant le traitement de volumes
de données toujours plus importants). Mais ces accélérations sont également basées sur
un remplissage et un échantillonnage adaptés de l’espace des K. Cet espace est l’espace
de Fourier qui contient toutes les informations nécessaires à la formation de l’image (par
transformation de Fourier inverse). Chaque signal RM capté contribue au remplissage de
cet espace. Une prise en compte partielle de cet espace ou/et un remplissage adapté permet
d’accélérer nettement les acquisitions. Ces progrès matériels et algorithmiques combinés
à l’application des hypergradients (gradient d’intensité élevée de 20-30mT/m à temps de
commutation courts, 0.2 - 0.4 msec) constituent le point de départ des nouvelles séquences
et de l’imagerie par RM ultra-rapide.
Ainsi la séquence turbo ES ou Fast Spin Echo est une version nettement accélérée de
2.3. EXPLORATION DE L’ACTIVITÉ CARDIAQUE EN IRM
29
F IG . 2.4. Illustration schématique du principe d’acquisition pour des séquences rapides en écho
de gradient. Pour chaque phase, plusieurs segments de l’espace des K sont obtenus par une
génération rapide d’échos de gradient. En acquérant 8 segments à la fois, 1/16 de l’image
est obtenue à chaque battement cardiaque. Ainsi, 16 battements de cœur suffisent à acquérir
l’ensemble de la série d’images. (issu de [Pettigrew et al., 1999].)
la séquence ES mais au prix d’un contraste affaibli pour les tissus mous. Le principe de
ce type de séquence est non plus de considérer un écho mais un train d’écho par une succession d’impulsions à 180◦ . Chaque écho, encodé en phase permet de remplir une ligne
différente dans l’espace des K en se focalisant sur les lignes centrales correspondant aux
basses fréquences. Chaque écho est séparé temporellement de 10 ms. Grâce à ce type de
séquence, il est possible d’acquérir une image de taille 256 × 256 en un temps de 0.1 à 1
seconde.
De la même façon, les séquences rapides en écho de gradient permettent d’accélérer nettement les temps d’acquisition. Pour ce faire, le gradient d’écho est répété toutes les 20 à
30 ms pour imager une ou plusieurs coupes sur l’ensemble d’un cycle cardiaque. Si l’on
considère que l’intervalle entre les ondes R de l’ECG est d’environ 800ms, on est capable
d’obtenir pour une coupe une séquence d’images constituée de 40 images. Si la taille de
l’image est de 128 × 128, l’acquisition s’effectue sur 128 battements cardiaques. Si l’on
fait le choix d’acquérir 2 coupes à la fois, il est possible d’obtenir 20 images par cycle
cardiaque. En général, chaque image doit être acquise deux fois pour permettre d’augmenter le RSB (soit 256 battements cardiaques et un temps d’acquisition d’environ 3 à 4
minutes). Ce temps d’acquisition peut encore être réduit si le nombre de bobines réceptrices augmente.
A l’heure actuelle, les accélérations logicielles et matérielles permettent des acquisitions en ciné-IRM avec une résolution temporelle de l’ordre de 10 à 20 ms. Les séquences
d’images pour une coupe donnée sont réalisées en un unique blocage de la respiration.
On comprend alors tout l’intérêt de telles acquisitions et la qualité des séquences obtenues où les artefacts de respiration sont considérablement réduits (en tout cas pour une
coupe particulière). Ces acquisitions ont été rendues possibles pour deux raisons : 1) les
temps d’écho de gradient sont devenus extrêmement faibles (environ 1 ms) et surtout 2)
30
CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT
le remplissage de l’espace des K ne se fait plus sur une mais plusieurs lignes à la fois par
battement cardiaque et pour chaque phase du cycle (voir Fig 2.4). En acquérant 8 lignes
par battement cardiaque, le temps est significativement diminué. Il y a donc un compromis
à trouver entre la résolution spatiale de l’image et la résolution temporelle de la séquence
obtenue. La méthode actuellement la plus rapide est celle de l’écho planar (EPI) avec un
balayage en dent de scie de l’espace de Fourier. L’acquisition d’une image 256 × 256
se fait en moins d’une seconde mais le RSB est assez faible et on constate souvent des
artefacts de décalage chimique (Chemical Shift en anglais).
Ces dernières années, l’arsenal des séquences IRM s’est considérablement étoffé.
Celles-ci permettent désormais des études morphofonctionnelles complètes. Cependant,
si les acquisitions sont de plus en plus rapides, le volume d’informations généré s’est également considérablement accru. Cela pose un problème de traitement et d’interprétation
auquel il convient de répondre avec pertinence.
2.3.4 Images par RM utilisées dans cette thèse
Les images par RM cardiaques sur lesquelles ont porté mes travaux ont été acquises
dans le cadre de notre collaboration avec la Helsinki University of Technology (HUT) et le
VTT Technical Research Centre of Finland. La base de données de séquences IRM dont
nous disposons a été acquise au Helsinki Medical Imaging Center (Helsinki University
Central Hospital, HUCH). Cette base de données est constituée d’examens de 15 sujets.
Ceux ci ont été choisis parmi une population adulte et saine. Pour chacun de ces sujets,
nous disposons de coupes en petit axe et en grand axe. La visualisation de quelques images
pendant la phase systolique de l’un de ces sujets est donnée en Figure 2.5. Les images ont
été obtenues sur un dispositif Siemens Vision et Siemens Sonata à 1.5 T (Siemens, Erlangen, Germany). Les séquences utilisées sont de types écho de gradient ultra-rapides avec
apnée (Ultrafast GRE). Elles se caractérisent par de courts temps T R et T E. L’acquisition
d’une image complète se fait en moins d’une seconde.
Voici les paramètres qui décrivent ces images :
– épaisseur de coupes en petit axe : 6 − 7 mm
– distance inter-coupe en petit axe : 7 − 8 mm
– épaisseur de coupes en grand axe : 6 − 7 mm
– distance inter-coupe en grand axe : 3 − 4 mm
– TR : 30 − 40 ms
– TE : 4.8 ms
– angle de basculement : 20◦
– taille de l’image : 256 × 256 pixels
– champ de vue : 250 − 300 mm
– résolution spatiale en petit axe : 1.0 × 1.0 mm
– résolution spatiale en grand axe : 1.4 × 1.4 mm
– nombre de coupes petit axe : 4 − 5
– nombre de coupes grand axe : 4 − 7
– résolution temporelle : 30 − 40 ms
La variation de paramètres entre deux sujets différents s’explique par les différences
2.3. EXPLORATION DE L’ACTIVITÉ CARDIAQUE EN IRM
31
de forme du cœur observées au sein de la population choisie.
t = 0ms
t = 90ms
t = 150ms
t = 240ms
F IG . 2.5. Acquisitions cine-IRM obtenues par blocage de la respiration et par synchronisation sur
l’ECG (HUCH, Finland). En haut, coupes en petit axe et en bas, coupes quatre cavités. Les
paramètres des séquences sont disponibles dans la section 2.3.4.
Il est important de noter que les séquences obtenues ne sont cohérentes spatialement
qu’au niveau des coupes. En effet, une information volumique peut être obtenue en empilant l’ensemble des coupes obtenues en mode ciné. L’acquisition ciné de chaque coupe
correspond cependant à un blocage respiratoire différent. Malgré les efforts réalisés pour
reproduire fidèlement ce blocage pour l’acquisition de toutes les coupes et pour éviter le
mouvement du patient entre deux acquisitions, il n’est pas rare de constater des artefacts
de mouvement inter-coupes dus à la respiration qui se traduisent par un décalage géométrique entre ces différents niveaux de coupe. Ce type d’artefact peut être corrigé grâce à la
méthode proposée par Lötjönen [Lötjönen et al., 2004], qui propose de s’appuyer à la fois
sur les acquisitions en petit axe et en grand axe pour recaler rigidement les coupes entre
elles grâce à une mesure de similarité de type information mutuelle.
La Figure 2.6 illustre ce type d’artefact. En haut sont représentées une coupe en petit
axe et une coupe en grand axe. Le ligne du milieu visualise l’artefact proprement dit, observable par l’empilement des coupes en petit axe et en grand axe. La ligne du bas illustre
l’effet de la correction de l’artefact et le réalignement des différentes coupes. Toutes les
séquences issues de la base de données dont nous disposons ont été corrigées par cette
méthode puis interpolées selon l’algorithme d’interpolation dit ’Shape-based’ [Grevera
and Udupa, 1996] au sein du Laboratory of Biomedical Engineering en Finlande. L’interpolation nous permet, à partir des coupes acquises, d’obtenir une information volumique.
2.3.5 IRM de marquage tissulaire
L’IRM de marquage tissulaire (ou Tagged MRI en anglais) n’entre pas dans le contexte
de ce mémoire. Cependant, cette technique d’imagerie [Zerhouni et al., 1988, Axel and
32
CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT
F IG . 2.6. Illustration des artefacts de mouvement inter-coupes. A gauche sont représentées les
coupes en petit axe et à droite, les coupes en grand axe. Les figures du milieu (c)(d) montrent
les artefacts observables par empilement des coupes petit axe et grand axe. Les figures du
bas (e)(f) illustrent la correction des artefacts et le réalignement des différents niveaux de
coupes (illustration issue de [Lötjönen et al., 2004]).
2.4. LA TOMODENSITOMÉTRIE À RAYONS X
33
Dougherty, 1989] est particulièrement intéressante pour étudier la déformation du myocarde. Le principe du marquage tissulaire consiste à appliquer une impulsion RF sélective
accompagnée d’un champ de gradient à des endroits prédéfinis du tissu. On simule ainsi
un quadrillage régulier (motif de marquage) sur l’instant de référence d’une structure en
mouvement avant une acquisition cine-IRM standard. Le marquage simulé se déforme en
même temps que le muscle cardiaque permettant ainsi d’accéder aux différentes composantes de sa déformation. La superposition d’une grille virtuelle constitue une importante
source d’information qui se fait de plus de manière non invasive. Cette modalité, initialement dédiée à l’étude du mouvement cardiaque, a récemment été envisagée pour l’étude
des déformations pulmonaires [Napadow et al., 2001].
2.4 La Tomodensitométrie à Rayons X
Les principes physiques permettant la compréhension de la formation d’une image ou
d’un volume TDM sont brièvement rappelés dans l’Annexe A. D’une façon générale, la
TDM est un système d’imagerie qui exploite les différences d’atténuation des rayons X
au sein des différents constituants de l’organisme. Il s’agit, comme en radiologie conventionnelle, d’un système d’imagerie par transmission, pour lequel le patient est placé entre
une source de rayons X et un détecteur. L’appareil est constitué d’un tube à rayons X
qui tourne et émet autour du patient. Un ensemble de détecteurs, dont le mouvement est
solidaire de la source à rayons X, permet de recueillir des images de projection qui sont
communiquées à un ordinateur. Celui-ci reconstruit une image représentant une coupe ou
un ensemble de coupes de la structure étudiée.
2.4.1 Caractérisation des images TDM
L’utilisation de détecteurs performants permet d’enregistrer des différences d’atténuation très fines entre les différentes structures. Les informations recueillies sont placées
dans une matrice qui constitue la "carte topographique" de la coupe en question. Une
échelle utilisant des Unités Hounsfield (UH), en l’honneur de l’inventeur de la tomodensitométrie Sir Godfrey Newbold Hounsfield, permet de quantifier l’atténuation de chaque
pixel entre -1000 (air) et + 1000 (os compact). Par définition, l’eau pure a une atténuation
de 0 UH. Une classification de éléments est exprimée en fonction des UH dans le tableau
2.1.
L’intensité des pixels est donc directement reliée à la densité électronique des matériaux imagés. Pour terminer, une description détaillée des propriétés statistiques intervenant dans le processus de formation d’images TDM est donnée dans [Lei and Sewchand,
1992]. D’après l’auteur, la distribution de probabilité des projections suit une loi de Poisson. Le bruit dans l’image résultante peut être asymptotiquement décrit par une distribution Gaussienne.
2.4.2 Dispositifs d’acquisition
Lors d’une récente étude [Kalender, 2006], Kalender propose un historique et une
classification des différentes générations de scanneurs à rayon X depuis leur introduction
34
CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT
Matériau
air
poumons
gras
eau
sang
muscles
os
métal
Niveau de gris (Unité Hounsfield)
-1000
-500, -200
-200, -50
0
25
25, 40
200, 1000
> 1000
TAB . 2.1. Echelle de Hounsfield
F IG . 2.7. Tomodensitomètre à rayon X (source : http ://www.usoncology.com)
en clinique dans les années 1970. Les imageurs peuvent être distingués suivant certains
critères :
– Vitesse de rotation du portique
– Résolution spatiale dans le plan d’acquisition
– Épaisseur de coupe
– Nombre de barrettes du récepteur
– Géométrie d’acquisition (Faisceaux divergents ou parallèles, en éventail ou coniques)
La technologie des tomodensitomètres a énormément évolué pour obtenir des images de
qualité et de résolution toujours plus intéressantes. Actuellement, la période de rotation
des portiques est de l’ordre de 0.5 sec, voire 0.33 sec. La résolution spatiale est typiquement d’environ 0.5 mm et la distance inter-coupe peut-être inférieure au millimètre.
Le nombre de barrettes du récepteur est intimement lié au nombre de coupes obtenues
à chaque rotation. Elle peut atteindre 64 voire 256 pour certains prototypes. Les performances actuelles des scanners rendent désormais possible l’acquisition d’organes en
mouvement comme nous allons le voir avec la TDM dynamique et la TDM 4D.
2.4. LA TOMODENSITOMÉTRIE À RAYONS X
35
2.4.3 TDM dynamique
L’idée principale de la tomodensitomètrie dynamique est de prendre en considération
une information de mouvement pendant la reconstruction des images [Bonnet et al., 2003]
et de tenir compte de l’évolution dynamique de l’objet que l’on veut acquérir. La finalité
de ce type d’imagerie est de reconstruire une séquence d’images représentant l’objet au
cours de son évolution sous certaines critères :
– la résolution temporelle
– la résolution spatiale
– le rapport signal sur bruit
– la dose délivrée au patient
Les principales applications concernées par la TDM dynamique sont les interventions
chirurgicales guidées par l’image, les études fonctionnelles (agent de contraste) et l’imagerie cardiaque. L’introduction technologiques de portiques multi-détecteurs à vitesse de
rotation rapide a permis les récents développements liés à l’imagerie d’organes en mouvement.
Un état de l’art complet de la tomographie dynamique est proposé dans [Roux, 2004]
avec une description des techniques récentes d’acquisition. Dans [Bonnet et al., 2003],
l’auteur propose d’utiliser de longues périodes d’acquisitions avec compensation dynamique des organes en mouvement. Des acquisitions obtenues à basse résolution sur plusieurs demi-tours sont utilisées pour reconstruire une séquence à haute résolution spatiale
tout en diminuant la dose délivrée au patient. Pour cela, la notion de trajectoire d’un objet
en déformation est considérée. ϕtref ,t représente la transformation d’un objet entre son
état de référence tref (considéré comme l’instant de reconstruction) et un instant quelconque t (voir la section 6.2 pour plus de détails concernant les notions de trajectoires).
Le principe général de la TDM dynamique repose sur l’intégration du temps dans l’équation (A.3) pour exprimer la transformée de Radon dynamique :
Z
Rf (θ, p, t) =
f (M , t)dM
(2.2)
M∈D(θ,p)
où f représente l’objet à imager. Cette équation traduit le fait que la fonction d’atténuation
varie au cours du temps. La difficulté majeure réside dans le fait que les projections sont
obtenues à des instants différents. Le pas temporel entre chaque acquisition et l’angle
de projection θ sont directement reliés à la vitesse de rotation du portique du scanneur.
Toujours dans [Bonnet et al., 2003], l’état de l’objet à l’instant t est approché au premier
ordre par la relation :
D
E ∂f
f (ϕtref ,t (M ), t) ≈ f (M , tref ) + ϕ̇tref ,t (M ), grad f +
(M , tref ) (t − tref )
∂t
(2.3)
L’information de mouvement nécessaire pour la reconstruction apparaît avec le terme
ϕ̇tref ,t (M ) qui traduit la vitesse instantanée de la particule M à l’instant t. La trajectoire est supposée être linéaire par morceau. Le mouvement peut alors être estimé à partir
d’images en basse résolution obtenues tous les demi-tours et réintroduites dans les algorithmes de reconstruction afin d’obtenir des séquences d’images en haute résolution, avec
une réduction des artefacts de mouvement pour une meilleure qualité d’image. Une reconstruction en temps réel a été proposée dans le cas où les déplacements linéaires sont
CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT
36
connus a priori. Lorsque cette information de mouvement n’est pas disponible (ce qui est
le cas en pratique), il faut utiliser des algorithmes d’estimation de mouvement et la reconstruction en temps réel semble à l’heure actuelle plus délicate. Cependant, ce type méthode
est potentiellement adapté à la reconstruction de séquences cardiaques et thoraciques tout
en limitant l’exposition aux rayons X des patients.
2.4.4 TDM 4D
Le principe des acquisitions TDM 4D est différent même si la finalité reste la même :
dans [Endo et al., 2003], Endo et al décrivent la TDM 4D comme un protocole d’acquisition permettant d’acquérir des séquences d’images d’objets animés avec une qualité d’image comparable à la TDM 3D classique. Dans [Vedam et al., 2003, Pan et al.,
2004, Rietzel et al., 2005b], cette définition générale est plus particulièrement adaptée au
problème particulier de la reconstruction de séquences de thorax respirant. Contrairement
à ses analogues tridimensionnels nécessitant un blocage de la respiration à des instants
prédéfinis, la TDM 4D fournit une réponse intéressante à l’acquisition de séquences de
qualité malgré un mouvement respiratoire laissé libre (voir section 1.3.4). Le reconstruction nécessite alors des informations supplémentaires comme une courbe respiratoire délivrée par un spiromètre [Low et al., 2003] ou un dispositif vidéo permettant de suivre en
temps réel des capteurs placés sur la surface du thorax afin de trier les données correspondant à une même phase respiratoire. Un exemple de tri est illustré sur la Figure 2.8.
Sur cet exemple, le cycle respiratoire est subdivisé en quatre phases principales permettant ainsi la construction d’une séquence de 4 images. D’autres études actuellement en
cours tentent de trier les acquisitions sans aucun signal externe. Le tri se fait grâce à l’extraction de repères anatomiques dans les projections elles-mêmes (par exemple le haut du
diaphragme) [Rit et al., 2005].
On distingue généralement les acquisitions en mode hélicoïdal, où la table sur laquelle
est allongé le patient se déplace continûment et les acquisitions en mode axial ciné, où la
table ne se déplace que lorsque le portique ne tourne pas. Dans ce cas, sa position reste la
même pendant quelques tours.
2.4.5 Images TDM utilisées dans cette thèse
La base de données TDM 4D que nous utiliserons dans ce mémoire a été obtenue au
département d’oncologie du Massachussetts General Hospital, Boston, grâce à un tomodensitomètre General Electric LightSpeed QX/i. Nous avons eu accès à ces images dans
le cadre d’une collaboration scientifique entre le Centre Léon Bérard2 à Lyon et le Massachussetts General Hospital. Une description précise du protocole d’acquisition est donnée
dans [Pan et al., 2004, Rietzel et al., 2005b, Boldea, 2006].
Pour ces acquisitions, le signal externe est apporté par une caméra CCD qui capture la
position de réflecteurs positionnés sur le thorax du patient (appareillage de type RPMReal Time Position Management) et la courbe de respiration est déduite de la position des
différents capteurs au cours du temps . Le scanneur fonctionne en mode axial ciné dans
la direction cranio-caudale et un ensemble de 1000 à 1500 projections est acquis pour reconstruire l’ensemble de la séquence. In exemple d’une coupe frontale d’un des différents
2
http ://oncora1.lyon.fnclcc.fr/
2.4. LA TOMODENSITOMÉTRIE À RAYONS X
37
F IG . 2.8. Processus de sélection des données en TDM 4D [Rit et al., 2005]. L’acquisition est
réalisée alors que le patient respire librement. Le signal respiratoire est acquis en même
temps que les données afin de pouvoir les trier. Chaque reconstruction 3D correspond à une
phase du cycle respiratoire, l’ensemble conduisant à une séquence couvrant l’ensemble du
cycle respiratoire. L’ensemble des données 3D constitue l’image 4D.
volumes acquis durant la phase d’expiration est visible en Figure 2.9.
Notre base de donnée est composée de 3 séquences, chacune comportant dix instants.
Ces dix instants sont répartis de manière non uniforme sur l’ensemble du cycle respiratoire. Deux volumes TDM 3D correspondent aux phases extrêmes de la respiration (fin
d’expiration et fin d’inspiration), 4 volumes sont répartis sur la phase d’inspiration et 4
volumes sont répartis sur la phase d’expiration. Les caractéristiques des séquences sont
les suivantes :
– dimension des images : 512 × 512
– nombre de coupes : 80 à 130 (selon l’espace couvert par les poumons)
– résolution dans le plan : 0.977 × 0.977mm2
– épaisseur de coupe : 2.5 mm
– résolution temporelle : variable en fonction du signal ventilatoire obtenu.
Il faut noter toutefois que ce protocole d’acquisition est toujours à l’étude et qu’il arrive parfois de constater l’apparition d’artefacts caractéristiques comme celui représenté
sur la Figure 2.10. Ce type de défaut est dû à la fois à l’irrégularité du cycle et au nombre
38
CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT
parfois trop faible de reconstructions disponibles pour une coupe donnée. Les phases intermédiaires sont donc particulièrement sensibles à ce genre d’artefact. Des expériences
sont actuellement menés pour sélectionner différemment les projections.
F IG . 2.9. Coupes frontales du thorax à 6 instants reconstruits durant la phase d’expiration selon
le protocole défini en 2.4.5.
F IG . 2.10. Artefact de reconstruction caractéristique de la TDM 4D. Cette image correspond à
une reconstruction 3D en fin d’expiration.
2.5
Conclusion
Dans ce chapitre, nous avons décrit les principales modalités permettant l’exploration
des organes en mouvement. Nous avons insisté sur deux techniques tomographiques (cinéIRM et TDM 4D) dont les principes d’acquisition très différents permettent d’obtenir des
séquences d’images. C’est sur des séquences d’images issues de ces deux modalités que
portent les développements méthodologiques décrit dans ce mémoire, en lien, bien sûr,
2.5. CONCLUSION
39
avec les deux contextes applicatifs présentés au chapitre 1.
Ainsi, mes recherches portent sur des techniques d’estimation de mouvement dans des
séquences d’images monomodales. Il faut préciser que l’on considère que ces séquences
comportent au minimum 2 images, mais typiquement plus. Le fait que les processus physiologiques puissent être différents et que deux modalités d’acquisition sont considérées
orientera mes choix lors des développements méthodologiques. Enfin, en vue d’une utilisation effective dans les deux cadres applicatifs présentés, les temps de calculs des algorithmes proposés constitueront également une contrainte à prendre en considération.
Lors du précédent chapitre nous avions exposé l’intérêt de la prise en compte du mouvement dans les traitements radiothérapeutiques et de l’estimation spatio-temporelle du
mouvement et de la forme d’organes en évolution. Ce chapitre complète notre problématique et montre que les champs de mouvement que nous obtiendront pourraient également être utilisés à des fins de reconstruction de séquences d’images.Pour l’évaluation
des méthodes que je propose dans ce mémoire de thèse, les données IRM et TDM seront exploitées pour évaluer l’influence des paramètres d’un algorithme d’estimation de
mouvement entre deux images que j’ai développé (chapitre 8, section 8.1). Les données
TDM serviront à la comparaison de trois méthodes dans le contexte de la radiothérapie
(chapitre 9). La méthode d’estimation spatio-temporelle de mouvement (nombre d’images
de la séquence > 2) que nous proposons dans ce mémoire sera évaluée dans le cadre de
l’application cardiaque uniquement en modalité IRM (chapitre 8, sections 8.2). Nous envisageons cependant, dans un avenir proche, de tester cette méthode sur les données TDM
thoraciques dont nous disposons.
Le chapitre suivant propose un état de l’art des méthodes d’estimation et de suivi de mouvement dans des séquences d’images.
40
CHAPITRE 2. IMAGERIE MÉDICALE D’ORGANES EN MOUVEMENT
Chapitre
3
Etat de l’art
Sommaire
3.1
3.2
3.3
3.4
3.5
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Estimation de mouvement . . . . . . . . . . . . . . . . . . . . . . .
3.2.1 Les méthodes différentielles . . . . . . . . . . . . . . . . . .
3.2.2 Mise en correspondance de blocs (MCB) . . . . . . . . . . .
3.2.3 Les méthodes statistiques . . . . . . . . . . . . . . . . . . . .
Recalage d’images médicales . . . . . . . . . . . . . . . . . . . . .
3.3.1 Principe du recalage d’images . . . . . . . . . . . . . . . . .
3.3.2 Les primitives . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.3 Modèles de transformation . . . . . . . . . . . . . . . . . . .
3.3.4 Optimisation . . . . . . . . . . . . . . . . . . . . . . . . . .
Suivi d’objets et de mouvement dans une séquence . . . . . . . . .
3.4.1 Alignement de séquences . . . . . . . . . . . . . . . . . . . .
3.4.2 Estimation spatio-temporelle de mouvement . . . . . . . . . .
3.4.3 Suivi de structures déformables dans des séquences d’images .
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
41
42
43
43
44
44
45
45
47
50
51
51
51
53
54
3.1 Introduction
L
’estimation de mouvement dans des séquences temporelles d’images est un des problèmes fondamentaux en traitement et analyse d’images. Il s’agit d’un problème inverse mal posé, pour lequel de très nombreux développements ont été proposés. Cependant, devant les difficultés théoriques et pratiques, cela reste un problème ouvert. Parmi
les domaines d’applications concernés, nous pouvons mentionner à titre d’exemple :
– la compression de vidéos pour la télévision numérique.
– la robotique et l’interprétation de scènes animées.
– la météorologie avec le suivi de masses nuageuses sur des images satellitaires.
– la médecine avec l’estimation de mouvement d’organes mobiles notamment des
structures cardiaques et thoraciques.
41
CHAPITRE 3. ETAT DE L’ART
42
Les applications de traitement d’images satellitaires sont les plus proches de notre application car elles doivent également tenir compte du caractère non-rigide du mouvement
à détecter. Ce chapitre présente une synthèse bibliographique de méthodes d’estimation
et suivi de mouvement. La suite de ce chapitre est organisée de la manière suivante :
dans la section 3.2 nous décrivons le principe des méthodes d’estimation de mouvement
entre deux images. Une attention particulière sera ensuite portée sur la notion de recalage d’images (section 3.3), ce type de méthode constituant le cœur méthodologique de
ce mémoire. La fin de cette section sera consacrée à la prise en compte du temps dans les
algorithmes de recalage. Enfin, dans le but d’aborder la notion de suivi d’objet dans des
séquences d’images, nous décrirons, dans la section 3.4.3, quelques méthodes proposées
récemment qui ont attiré notre attention.
3.2
Estimation de mouvement
Dans cette partie, nous ne décrirons pas de manière détaillée l’ensemble des méthodes,
dites classiques, d’estimation de mouvement. En effet, de nombreux rapports et articles
existent sur le sujet. Nous invitons le lecteur à se référer à [Stiller and Konrad, 1999] ou
à [Grava, 2003], par exemple.
D’un manière générale, les méthodes d’estimation de mouvement sont basées sur l’hypothèse de conservation de l’intensité lumineuse des objets en déplacement au cours du
temps. Si on note I(x, t) la fonction d’intensité (niveau de gris) d’un point de coordonnées x dans une image à l’instant t, la contrainte de conservation peut être traduite par
l’équation de la DFD (Displaced Frame Difference)
DF D(x, t, t + dt) = I(x + dx, t + dt) − I(x, t) = 0
(3.1)
où dx représente le déplacement vectoriel du point x. Si on considère deux images
d’une séquence aux instants t et t + ∆t, l’équation (3.1) devient :
DF D(x, t, t + ∆t) = I(x + u(x), t + ∆t) − I(x, t) = 0
(3.2)
où u(x) correspond au déplacement du point x entre les deux images. Si v(x) est la
vitesse instantanée du point x, nous avons la relation :
v(x) =
u(x)
∆t
(3.3)
Le problème de l’estimation de mouvement consiste à estimer un champ u (ou v)
à partir de la donnée d’un ensemble fini d’images que l’on peut considérer comme des
clichés instantanés réalisés à des instants précis au cours du mouvement. On distingue
généralement les méthodes non-paramétriques et les méthodes faisant intervenir des modèles paramétriques de mouvement. La suite de cette section concerne la description des
principales classes de méthodes non-paramétriques. Les méthodes paramétriques seront
expliquées en détail dans la section 3.3.3.1 lorsque la notion de recalage sera abordée.
3.2. ESTIMATION DE MOUVEMENT
43
3.2.1 Les méthodes différentielles
Ces méthodes, très populaires, visent à estimer le flux optique entre deux images à
partir de l’estimation de gradients spatio-temporels de l’intensité en chacun des pixels de
l’image. Le flux optique est défini comme la distribution de mouvement ou de vitesse
apparent dans une image. Son estimation dans une séquence d’images est un sujet de
recherche intense dans le domaine du traitement d’images, en particulier depuis l’article
fondateur de Horn & Schunck [Horn and Schunck, 1981].
Un développement de Taylor du premier ordre de l’équation (3.2), permet d’obtenir
l’équation de contrainte de mouvement :
It + ∇I · v = 0
(3.4)
où v représente la vitesse, ∇I le gradient spatial de l’intensité et It la dérivée temporelle de l’intensité I. La simplicité de l’approche dissimule un inconvénient majeur. Nous
sommes confrontés au problème d’ouverture qui ne donne que la composante normale du
champ de déplacement. En deux dimensions, cette seule équation à deux inconnues ne
permet pas de définir de manière unique les deux composantes du déplacement.
De nombreux auteurs se sont intéressés à ce problème. Horn et Schunck [Horn and
Schunck, 1981] ont proposé d’ajouter une contrainte globale de lissage du champ de mouvement. Ils font l’hypothèse que les points voisins sont animés d’une vitesse similaire et
que le flux varie continûment. Cela revient à minimiser l’équation intégrale suivante :
Z
(It + ∇I · u)2 + α k∇uk2 dx
(3.5)
x∈Ω
Dans la partie de gauche, nous retrouvons l’équation du flux optique tandis que le
terme de droite est la contrainte de lissage. D’autres auteurs ont proposé des lissages anisotropes sous l’hypothèse de correspondance entre les frontières photométriques et les
frontières de mouvement [Nagel, 1987, Ghosal and Vanek, 1996] dans le but de prendre
en compte les discontinuités des champs de mouvement. D’autres développements intéressants ont été réalisés afin d’introduire la notion de discontinuité de mouvement dans
un cadre variationnel [Deriche et al., 1996]. En 3D, il faut une équation supplémentaire.
Gorce et al ont proposé d’ajouter une contrainte de divergence nulle [Gorce et al., 1997].
Il faut enfin souligner que les méthodes différentielles sont intéressantes pour la mesure
de petits déplacements. Pour la prise en compte de déplacements importants, une analyse
multi-résolution est généralement préconisée.
3.2.2 Mise en correspondance de blocs (MCB)
Ces méthodes sont couramment employées dans les algorithmes de compression des
normes H261 ou MPEG. Le principe de base des méthodes MCB est de découper une
image de référence en blocs de pixels. Pour chacun de ces blocs, on essaie de trouver celui
qui lui ressemble le plus dans l’image suivante de la séquence. L’hypothèse sous jacente
est que le mouvement est localement translationnel. Les caractéristiques associées à cette
catégorie de méthodes sont les tailles des blocs et de la fenêtre de recherche, le critère de
similarité et la stratégie de recherche du bloc correspondant [Stiller and Konrad, 1999].
Ces méthodes permettent de traiter de grands déplacements mais elles ont, au mieux, une
CHAPITRE 3. ETAT DE L’ART
44
précision équivalente au pixel contrairement aux méthodes différentielles. Dans le cadre
de mon travail de DEA, nous avons mis au point une méthode basée sur les méthodes
MCB qui prend en compte la notion d’objet [Delhay et al., 2004].
3.2.3 Les méthodes statistiques
Parmi les méthodes statistiques, les méthodes Markoviennes ou Bayesiennes sont les
plus répandues. Elles reposent sur la formulation probabiliste du champ U . L’estimation
finale u est considérée comme étant une réalisation particulière d’un champ aléatoire
U . Une formulation très répandue du problème d’estimation de mouvement repose sur
l’estimateur de maximum a posteriori (MAP) [Gee et al., 1995, Odobez and Bouthemy,
1995, Stiller and Konrad, 1999] :
û = arg max p(u, It+1 , It )
u
(3.6)
Cette distribution a posteriori est exprimée en utilisant la règle de Bayes :
p (U = u|It+1 , It ) =
p(It+1 |U = u) · p(U = u)
p(It+1 , It )
(3.7)
Le terme p(It+1 |U = u) représente la vraisemblance d’obtenir It+1 connaissant le
champ de déplacement u. Il s’agit donc d’un terme d’attache aux données grâce auquel
il est possible d’introduire des a priori sur l’acquisition de l’image It+1 (prise en compte
d’un modèle de bruit dans l’image notamment). Le terme p(U = u) permet d’introduire
un a priori sur le champ de déplacement. Comme dans le cas de méthodes variationnelles,
il est possible d’introduire dans ce cadre des discontinuités du champ de mouvement
via les processus de ligne explicites ou implicites1 [Orkisz and Clarysse, 1996, Planat,
1999, Stiller and Konrad, 1999]
3.3
Recalage d’images médicales
Le recalage d’images joue un rôle très important pour l’analyse et l’interprétation
d’images médicales. On distingue quatre objectifs majeurs du recalage :
• Recalage intra-patient multi-modalités. Il s’agit de fusionner des informations issues de modalités différentes afin de confronter des informations anatomiques (e.g.
TDM, IRM imagerie US) et/ou fonctionnelles (e.g. SPECT, TEP, IRM fonctionnelle). Les images considérées sont des acquisitions effectuées sur un même patient
et impliquent donc des méthodes de recalage dites rigides ou affines.
• Recalage inter-patient. Il permet de mettre en correspondance des informations
complémentaires disponibles au sein d’une population pour la construction d’atlas anatomiques ou fonctionnels. Il permet également la construction de modèles
anatomo-fonctionnels individualisés. Le recalage est dans ce cas généralement non
rigide
1
http ://www.creatis.insa-lyon.fr/˜clarysse/Cours/Discontinuity4.pdf
3.3. RECALAGE D’IMAGES MÉDICALES
45
• Recalage intra-patient mono-modalité. Ce type de recalage intervient pour évaluer
l’évolution d’une pathologie sur des images d’un même patient obtenues à des périodes différentes. Il permet également d’estimer in vivo des comportements physiologiques à des fins diagnostiques ou thérapeutiques.
• Recalage atlas-données. Il permet notamment l’étiquetage ou la segmentation automatique d’attributs par transport de cartes (atlas).
Notre travail exploite le principe de recalage d’images pour estimer une transformation spatio-temporelle à partir d’un ensemble d’images. En ce sens, il se rapproche de la
troisième catégorie et considère une même modalité d’imagerie et un même sujet.
3.3.1 Principe du recalage d’images
Le recalage d’images (ou mise en correspondance d’images) consiste à déterminer la
transformation (au sens mathématique) d’une image afin qu’elle ressemble le plus possible à une autre.
Cette principe général soulève un certain nombre de questions. Quelles sont les informations disponibles et utilisables pour aider la mise en correspondance ? Quel est le
critère qui peut nous renseigner sur la ressemblance entre deux images ? Par quelle type
de transformation allons nous établir cette mise en correspondance ? Comment rechercher
la meilleure correspondance ? Ces questions débouchent sur la définition des composants
des méthodes de recalage. La suite de cette description propose un rappel des principales
approches de recalage d’images classées selon 3 critères : le type de primitives/terme d’appariement, le modèle de transformation et les méthodes d’optimisation. Cette description
n’est sans doute pas exhaustive compte tenu du nombre considérable de publications où
le mot "recalage" compte parmi les mots clefs. Des états de l’art concernant le recalage
d’images en imagerie médicale sont disponibles dans [Maurer and Fitzpatrick, 1993,Viergever and Maintz, 1998, Crum et al., 2004] et, plus particulièrement pour l’imagerie du
cœur, dans [Mäkelä et al., 2002]. Des thèses soutenues récemment dans ce domaine [Kybic, 2001, Camara, 2003, Petitjean, 2003, Noblet, 2006] ainsi que certains livres [Hajnal
et al., 2001, Modersitzki, 2004] proposent également des synthèses détaillées des méthodes de recalage proposées en imagerie médicale. Comme nous proposons d’estimer
une transformation spatio-temporelle sur l’ensemble d’une séquence, nous nous focaliserons plus particulièrement sur les méthodes de suivi d’objet et de mouvement dans la
section 3.4.
3.3.2 Les primitives
Les primitives représentent l’information sur laquelle s’appuie l’estimation de la transformation entre les images. On distingue généralement les primitives géométriques et les
primitives iconiques.
3.3.2.1
Approches par primitives géométriques
Ces approches nécessitent l’extraction de sous ensembles de points homologues (primitives) dans les images à recaler. L’idée de base de cette méthode consiste à trouver une
CHAPITRE 3. ETAT DE L’ART
46
transformation qui met en correspondance une paire d’ensembles finis de primitives extraites dans chacune des images. [Maurer and Fitzpatrick, 1993]. L’extraction des primitives peut s’effectuer manuellement par intervention d’experts ou automatiquement grâce
à des outils de détection (voir par exemple [Rohr, 2001]).
Les primitives géométriques peuvent être des points, des courbes ou des surfaces.
Les méthodes généralement employées pour apparier deux ensembles de primitives sont
l’interpolation/l’approximation par des bases de fonctions radiales et les algorithmes de
type ICP (Iterative Closest Point).
Fonctions de base radiales Les fonctions de base radiales sont largement utilisées pour
l’approximation et l’interpolation de fonctions dans les domaines de la géologie, de la météorologie ou de l’imagerie médicale notamment. Pour plus de détails, nous invitons le lecteur à se référer à une description détaillée proposée dans [Wendland, 2004]. Le principe
de cette méthode est de trouver une transformation spatiale interpolante/approximante qui
permet de mettre en correspondance deux ensembles de points [Duchon, 1976, Bookstein,
1989, Sprengel et al., 1996]. Les fonctions radiales étant à support infini, elles ont une influence sur l’ensemble de l’image. D’autres fonctions à support compact ont été proposées
(voir [Wendland, 2004]).
L’algorithme du point le plus proche itéré (ICP - Iterative Closest Point - en anglais)
Cet algorithme introduit par [Besl and McKay, 1992] est destiné au recalage rigide de deux
ensembles de primitives géométriques. Pour chaque point de l’espace de départ, les points
les plus proches de l’espace d’arrivé sont recherchés. Une technique de moindres carrés
est utilisée pour estimer la transformation rigide à partir des correspondances de points.
Cette transformation est ensuite appliquée à l’ensemble des points de départ. Ces deux
étapes sont réitérées jusqu’à ce que la distance entre les deux ensembles soit considérée
comme suffisamment faible. Dans [Camara, 2003], les auteurs proposent de combiner les
transformations linéaires obtenues par ICP et des transformations non-linéaires pour initialiser la position des points d’une grille de déformation (de type Free Form Deformation
- voir section 3.3.3.1) afin d’obtenir un déplacement cohérent sur l’ensemble du volume.
Une généralisation au cas non-rigide est également proposé dans [Chui and Rangarajan,
2003] avec l’algorithme TPS-RPM (Thin Plate Spline Robust Point Matching).
3.3.2.2
Approches par primitives iconiques
Le principe de ces méthodes repose sur la prise en compte de l’information intensité
attachée en chaque pixel de l’image. Le choix du critère dépend de la nature des images
à recaler. Ainsi, un recalage monomodal ou multimodal va généralement conduire à des
critères tout à fait différents. Dans la littérature, quelques articles proposent une étude
comparative de différents critères [Roche et al., 1999, Penney et al., 1998].
Les critères couramment utilisés en recalage monomodal d’images reposent sur l’hypothèse de conservation de l’information photométrique. Parmi ces critères, on note entre
autres :
• Critère de similarité en valeur absolue basé sur une distance de norme L1 entre
l’image source déformée et l’image cible.
3.3. RECALAGE D’IMAGES MÉDICALES
47
• Critère de similarité quadratique (Sum of Squared Difference, SSD - en anglais) qui
est son analogue avec une norme L2 . Elle est robuste aux bruits gaussiens mais pas
aux points aberrants.
• Critères de similarité robuste [Rousseeuw and Leroy, 1987, Geman and McClure,
1987]. Les méthodes de recalage s’appuyant sur ce type de critères présentent a
priori une moindre sensibilité aux points aberrants [Kim and Fessler, 2004, Noblet,
2006]. La mesure de similarité quadratique est un cas particulier des estimateurs
robustes.
Dans le cas du recalage multimodal, l’hypothèse précédente n’est plus fondée. La relation entre les intensités n’est pas connue a priori. Les critères doivent alors prendre en
compte des relations plus complexes entre les distributions d’intensité des deux images.
Ainsi, dans le cas d’une relation linéaire ou affine, on considère le coefficient de corrélation [Brown, 1992]. Dans le cas d’une dépendance fonctionnelle, Roche et al [Roche
et al., 1998] ont introduit le rapport de corrélation. Enfin pour exprimer la dépendance
statistique, l’information mutuelle, normalisée ou non, a reçu beaucoup d’intérêt [Viola,
1995, Maes et al., 1997].
3.3.2.3
Approches hybrides
Certains auteurs ont proposé des approches hybrides où des primitives géométriques
et iconiques sont utilisées conjointement. Le terme d’appariement permettant de mettre en
correspondance les objets à recaler est alors composé d’une contribution liée aux informations iconiques et d’une contribution liées aux amers géométriques [Hellier and Barillot,
2000, Cachier et al., October 2001, Johnson and Christensen, 2002].
3.3.3 Modèles de transformation
Le choix de la transformation est orienté par la nature de la correspondance géométrique que l’on désire établir entre les images à recaler. Son choix est fondamental dans le
sens où il va définir l’espace de recherche pour l’algorithme de recalage. On distingue généralement les transformations paramétriques et les transformations non-paramétriques.
Si la transformation s’appuie sur un modèle paramétrique, ce modèle définit l’ensemble
des solutions acceptables et le nombre de degrés de liberté (DDL) accordé à la transformation. Ce modèle de déformation peut être global s’il s’applique à l’ensemble de l’image,
semi-local si la transformation résulte d’un ensemble de contributions appliquées à des
sous régions de l’image. Dans le cas non-paramétrique, la transformation est discrète et
locale car elle est définie explicitement en chaque pixel de l’image. On distingue aussi généralement les transformations rigides/affines et non-rigides qui peuvent se décliner dans
les différents cas du global au local. Une description détaillée des différentes transformations est donnée dans [Viergever and Maintz, 1998].
3.3.3.1
Approches paramétriques
Transformation globale Par définition, les modèles de transformation globale ont une
influence sur l’ensemble de l’espace. Les transformations rigides/affines appartiennent à
CHAPITRE 3. ETAT DE L’ART
48
cette catégorie. Elles s’écrivent sous la forme :
ϕ(x) = Ax + t , x ∈ Rd
(3.8)
Les transformations sont dites rigides lorsque seules les rotations et les translations sont
prises en compte. Les distances, les angles et le parallélisme sont alors conservés et nous
avons det A = 1. Si cette condition n’est pas respectée, la transformation est dite affine.
Elle permet alors, en plus des rotations et des translations, l’étirement et le cisaillement
des structures à recaler. Dans ce cas, seul le parallélisme est conservé. Ce type de transformation est très intéressant dans le cas de recalages intra-patient multi-modalités car seul le
positionnement doit être corrigé. Pour étudier une variation de morphologie, on préférera
des modèles autorisant un plus grand nombre de degrés de liberté.
Les méthodes polynomiales [Woods et al., 1998] constituent une extension des modèles linéaires. Des modèles quadratiques (second ordre) voire d’ordre supérieur peuvent être pris
en compte. L’influence des polynômes s’étend à l’ensemble de l’image rendant l’estimation de déplacements localisés difficile. De plus, des phénomènes d’oscillations rendent
cette approche en général peu satisfaisante. Cette transformation globale non-linéaire ne
conserve plus la géométrie. Elle est dite non-rigide.
Transformation semi-locale Les transformations semi-locales ou non-linéaires autorisent la variation de la géométrie des structures et donc de modifier leur forme globale.
Pour ces raisons on les appelle également transformations non-rigides ou déformables.
Elle sont donc particulièrement intéressantes pour étudier les variations de forme de
structures entre plusieurs patients ou pour étudier l’évolution d’une structure au cours
du temps. Dans ce cas, le nombre de DDL requis est beaucoup plus important. Parmi les
modèles non-linéaires, on peut citer :
• Les transformations sur bases de fonctions radiales que nous avons décrites dans
le cas du recalage par primitives géométriques. Elle constituent un moyen d’appréhender les déformations semi-locales de manière paramétrique.
• Les déformations dites de formes libres (ou Free Form Deformation - FFD - en
anglais) ont été introduites par Sederberg et Parry en 1986 [Sederberg and Parry,
1986]. Le principe de la déformation FFD consiste à plonger l’image (ou un objet
quelconque) que l’on désire déformer, dans une grille régulière composée d’un ensemble de K points de contrôle (PDC). Leur déplacement entraîne un déplacement
sur l’ensemble ou une partie du domaine de définition selon la base de fonctions
choisie. La déformation continue de l’espace se calcule par interpolation des déplacements ponctuels attribués aux PDC. L’avantage principal des FFD réside dans
leur aptitude à estimer des déformations très localisées. Ces travaux ont ensuite été
repris par Coquillart [Coquillart, 1990] et étendus à des géométries de grille plus
complexes de type cylindriques ou sphériques. L’idée a été reprise dans la communauté de l’imagerie médicale à la fin des années 90 pour la modélisation de
transformations dédiées à la segmentation d’images thoraciques [Lötjönen et al.,
1998], au recalage d’images du cerveau [Rueckert et al., 1999], à la déformation de
surfaces implicites de type super-quadriques pour la segmentation d’images TDM
3.3. RECALAGE D’IMAGES MÉDICALES
49
à rayons X cardiaques [Bardinet et al., 1998] ou pour le recalage de surfaces dans
des images TEP et TDM [Camara et al., 2003].
Régularisation Lorsque le nombre de paramètres est important, il devient difficile de
maîtriser le comportement du modèle de transformation. La régularisation de la transformation permet de pénaliser les variations brusques du champs de déplacement. Ainsi
dans [Horn and Schunck, 1981, Gee et al., 1997] une énergie de membrane est considérée
pour minimiser les dérivées premières du champ de déplacement estimé. Dans [Bookstein, 1989, Rueckert et al., 1999, Rohlfing et al., 2003, Ashburner and Friston, 1999] ce
sont les dérivées secondes qui sont considérées pour minimiser une énergie de flexion de
plaques minces. Dans [Miller et al., 1993] une énergie élastique linéaire est introduite.
Elle a été réutilisée ensuite dans de nombreux articles. Enfin dans [Cachier and Ayache,
2004], les auteurs proposent de considérer le terme général suivant pour unifier les formes
différentielles du premier ordre :
q(u) = a tr(∇uT ∇u) + b tr(∇u∇u) + c tr2 (∇u)
(3.9)
où a, b et c sont trois coefficients réels et u représente de déplacement.
3.3.3.2
Approches non-paramétriques
Dans le cas non-paramétrique, la transformation est définie explicitement en chaque
pixel de l’image par un vecteur de déplacement (ou de vitesse).
Flux optique La méthode de flux optique, largement utilisée en estimation de mouvement, établit un lien direct entre les méthodes de recalage et les méthodes d’estimation de
mouvement qui peuvent être considérées comme un cas particulier des méthodes de recalage au sens large. L’hypothèse d’invariance de l’intensité des méthodes de flux optique
est utilisé dans le cas du recalage monomodal.
Démons L’algorithme des démons [Thirion, 1998] est une méthode de mise en correspondance basé sur la notion de modèle de diffusion. Ce modèle de diffusion est utilisé
pour déformer l’image alors considérée comme une grille déformable. Cette méthode a
été récemment utilisée pour estimer le mouvement de structures thoraciques dans le cadre
de traitements radiothérapeutiques [Boldea et al., 2003] ou pour le recalage multimodalités du cerveau avec correction d’intensité [Guimond et al., 2001].
Modèles basés sur des lois physiques Le choix d’un modèle comportemental peut
s’avérer intéressant d’un point de vue méthodologique pour contrôler la déformation de
la façon désirée. Cependant, on peut toujours se poser la question de la validité physique
des modèles choisis par rapport aux phénomènes étudiés.
• Les modèles élastiques [Broit, 1981] [Bajcsy and Broit, 1982] considèrent le recalage comme un problème de déformation élastique. La déformation est contrôlée par les équations de Navier par le biais de deux paramètres, les coefficients de
Lamé. Ces méthodes conservent la topologie uniquement dans le domaine continu
CHAPITRE 3. ETAT DE L’ART
50
et ne sont applicables que pour les petits déplacements dans le cas de l’élasticité
linéaire [Bajcsy and Kovacik, 1989, Ferrant et al., 2001].
• Les modèles fluides [Christensen et al., 1996] [Christensen, 1999] [Miller et al.,
1999] permettent de gérer les grands déplacements. Ces modèles s’appuient sur la
formulation Eulérienne du déplacement. Les équations aux dérivées partielles sont
identiques à celles du modèle élastique à ceci près qu’elles agissent sur la vitesse
plutôt que le déplacement (Equations de Navier-Stokes). Ces méthodes sont très
coûteuses en temps de calcul.
3.3.4 Optimisation
La transformation de recalage résulte de la minimisation d’une fonction de coût qui
dépend des primitives sélectionnées. Selon le nombre de DDL et les images, la minimisation peut s’avérer rapidement un problème complexe. Des stratégies d’optimisation
doivent être mises en œuvre afin de garantir l’obtention d’une solution correcte dans un
temps raisonnable. La difficulté majeure de l’optimisation des problèmes de recalage nonrigide résident dans la non-convexité de la fonction de coût dans l’espace des paramètres et
donc dans la possibilité de converger vers des minima locaux. L’initialisation du processus
d’optimisation est ainsi très importante. Les approches multi-échelles et multi-résolutions
constituent une alternative à la non-convexité sans pour autant garantir l’optimalité de la
solution.
Les méthodes directes sont envisageables lorsque le nombre de paramètres à estimer
est faible. Le recalage rigide/affine à partir de deux ensembles de marqueurs ou le recalage non-rigide à partir de la mise en correspondance de primitives géométriques et des
transformations de type RBF peut se formuler par un problème de moindres carrés [Rhor
et al., 2001].
Les méthodes exhaustives reposent sur la discrétisation arbitraire ou adaptée de l’espace de recherche et sur un balayage empirique de l’espace de recherche discrétisé [Mäkelä et al., 2003]. Pour un nombre élevé de paramètres, ces méthodes sont extrêmement
coûteuses en temps de calcul.
Les méthodes numériques itératives sont envisagées lorsque la fonction de coût à minimiser est une fonction non-linéaire des paramètres à optimiser. Ces méthodes reposent
sur le calcul du gradient de la fonction de coût (descente de gradient (DG) ou descente
de gradient conjugué (DCG)) ou, pour les méthodes dites de Newton, sur le calcul du
gradient et de la matrice Hessienne. Ces dernières sont réputées être plus rapides mais
nécessitent une bonne initialisation. Les méthodes basées sur le gradient souffrent d’une
vitesse de convergence trop lente au voisinage du minimum. Les méthodes de LevenbergMarquardt [Marquardt, 1963] permettent de combiner les avantages des deux précédentes
sans pour autant garantir un minimum global. D’autres algorithmes de type Powell ou simplexe effectuent des recherches itératives en fonction des résultats obtenus précédemment
et ne nécessitent pas le calcul explicite du gradient de la fonction de coût. Ces méthodes
ne sont pas optimales [Press et al., 1992].
3.4. SUIVI D’OBJETS ET DE MOUVEMENT DANS UNE SÉQUENCE
51
Les méthodes stochastiques de type recuit simulé [Kirkpatrick et al., 1983] ou les algorithmes génétiques garantissent une solution optimale malgré la non-convexité de l’espace
de recherche. Cependant, les temps d’exécution sont souvent très élevés.
3.4 Suivi d’objets et de mouvement dans une séquence
Cette section est consacrée aux méthodes dont le but est d’appréhender le mouvement
sur l’ensemble d’une séquence. Nous distinguerons trois approches différentes. La première concerne les méthodes de recalage qui intègrent l’espace et le temps dans le but
d’aligner des séquences d’images entre elles. La seconde concerne plus particulièrement
l’étude du mouvement sur l’ensemble d’une séquence. Enfin, nous décrirons brièvement
les méthodes qui visent à suivre des structures déformables dans des séquences d’images.
Ces méthodes ont été plus spécifiquement développées dans le cadre de l’estimation du
mouvement et le recalage de séquence d’images cardiaques. Certaines d’entre elles ont
été utilisées également en imagerie thoracique.
3.4.1 Alignement de séquences
Des méthodes d’alignement de séquence ont fait leur apparition dans la communauté
de la vision par ordinateur. Dans [Caspi and Irani, 2002], le but est d’établir une correspondance spatio-temporelle entre deux séquences vidéos afin de compenser le mouvement ou la mauvaise calibration de caméras qui observent une scène de façon simultanée. Plus particulièrement, dans le cas de l’analyse de la fonction cardiaque, Perperidis et al proposent d’utiliser une grille 4D et des déformations de forme libre à base
de B-Splines [Perperidis et al., 2003, Perperidis et al., 2005]. Ces méthodes sont mal
adaptées à notre contexte applicatif, car leur but est de fournir une correspondance entre
deux séquences d’images. Elles sont particulièrement intéressantes pour la comparaison
de comportements physiologiques au sein d’une population ou pour la construction d’atlas
dynamiques mais elles ne donnent pas directement d’information sur le mouvement.
3.4.2 Estimation spatio-temporelle de mouvement
En imagerie cardiaque, l’IRM de marquage tissulaire a suscité de nombreux travaux
pour l’extraction d’informations quantitatives de mouvement. Historiquement, les premiers étaient basés sur l’estimation du mouvement du motif de marquage préalablement
extrait. Dans [Young et al., 1995, Reynard et al., 1995], le mouvement dense du cœur est
estimé en suivant les lignes de marquage extraites sur l’ensemble d’une séquence.
Clarysse et al estiment les paramètres d’un modèle spatio(2D)-temporel de mouvement
du motif de marquage dont on peut déduire facilement des paramètres caractéristiques
comme les déformations principales ou les déformations dans les directions radiales et circonférentielles. Des modèles de forme et de mouvement ont été proposé pour caractériser
la fonction cardiaque. Ainsi dans [Matheny and Goldgof, 1995], les auteurs utilisent une
décomposition harmonique de la surface pour modéliser la forme et le mouvement du ventricule gauche du cœur. Declerck et al ont proposé un modèle de transformation planisphérique pour assurer la continuité du mouvement spatio-temporel estimé. Cette estimation
CHAPITRE 3. ETAT DE L’ART
52
est issue de la prise en compte de primitives géométriques [Declerck et al., 1996,Declerck
et al., 1998]. Oumsis et al ont proposé un modèle d’état harmonique spatio-temporel dans
le but de détecter des zones d’anomalie de mouvement du cœur [Oumsis et al., 2003].
Gorce et al estiment le mouvement du cœur en 3D avec une méthode de flux optique avec des contraintes supplémentaires de conservation de la masse et de divergence
nulle [Gorce et al., 1997]. De la même façon, Amini et Duncan proposent d’estimer le
mouvement entre deux instants consécutifs d’une séquence et de régulariser les champs
obtenus en prenant en compte l’ensemble de la séquence [Amini and Duncan, 1992]. Dans
un contexte plus général, d’autres auteurs ont proposé de considérer une extension spatiotemporelle de la régularisation spatiale généralement utilisée en estimation de mouvement
par flux optique [Weickert and Schnörr, 2001]. Cette méthode garantit l’existence et l’unicité de la solution. Elle a été étendue pour l’étude des grand déplacements dans [Alvarez
et al., 2000]. Dans [Klein, 2000], un algorithme d’estimation de mouvement 4D est proposé. La prédiction est basée sur l’hypothèse de continuité de la vitesse entre deux instants
cardiaques successifs.
Keeling et Ring présentent une méthode de recalage dans laquelle l’idée est de rajouter
une dimension z aux images pour créer un domaine Q : Q = {(x1 , . . . , xN , z) = (x, z) :
0 < x1 , . . . , xN , z < 1} dans lequel il est possible de contrôler l’évolution de la transformation entre deux extrêmes [Keeling and Ring, 2005]. La méthode décrite dans [LedesmaCarbayo et al., 2005] est également une méthode de recalage spatio-temporelle. Elle est
destinée à l’étude et la quantification de l’élasticité du myocarde dans des séries d’images
ultrasonores 2D. C’est sans doute la méthode la plus avancée à l’heure actuelle en recalage spatio-temporel d’images. L’image est définie de manière continue par I(x, t) qui
représente l’intensité de l’image à l’instant t et à la position x. Le but est d’estimer un
champ dense de déplacement sur l’ensemble d’une série d’images ultrasonores 2D du
cœur. Le mouvement compensé est exprimé en fonction de l’instant de référence par une
transformation ϕ(x, t).
La transformation est exprimée par un modèle paramétrique défini par une base de Bsplines séparables en temps et en espace :
XX
ϕ(x, t) =
ξ j,l βj (x)βl (t)
(3.10)
l∈L j∈J
où l ∈ Z et j ∈ Z correspondent aux indices des paramètres temporels et spatiaux,
respectivement. L’estimation de ces paramètres est réalisée conjointement en prenant en
compte l’ensemble de la séquence par la minimisation d’une énergie de type SSD (norme
L2 ) étendue à l’ensemble de la séquence :
T −1
1X
E =
Et
T t=0
Z
Et =
(I(ϕ(x, t), t) − I(x, 0))2 dx
(3.11)
(3.12)
x∈Ω
où T est le nombre total d’images dans la séquence. L’optimisation de ce problème
est réalisée par une méthode de descente de gradient.
Cette approche est très intéressante car elle a la particularité d’individualiser clairement le
3.4. SUIVI D’OBJETS ET DE MOUVEMENT DANS UNE SÉQUENCE
53
temps et l’espace dans le modèle de déformation et dans sa façon d’appréhender le terme
d’appariement. L’ensemble des images de la séquence est utilisé simultanément pour fournir une estimation réellement spatio-temporelle. L’un des avantages dans notre contexte
par rapport à la méthode décrite dans le paragraphe précédent, est que l’estimation finale propose une information de mouvement de l’ensemble des points matériels et non
une mise en correspondance entre deux séquences. Des améliorations peuvent cependant
être envisagées. La périodicité des mouvements n’est pas prise en compte. Il en résulte
une discontinuité de la vitesse à l’instant de référence. De plus, le nombre de paramètres
décrivant l’évolution temporelle est uniforme sur l’ensemble de l’image. Pour des applications 2D+t, cela n’est pas très pénalisant mais pour des approches 3D+t le nombre de
paramètres peut vite définir un facteur limitant. La méthode de recalage spatio-temporelle
que nous proposons dans le chapitre 6 s’appuiera sur ces constations.
3.4.3 Suivi de structures déformables dans des séquences d’images
Les méthodes de suivi de structures dans des séquences d’images ne permettent pas de
fournir une information dense de mouvement. Cependant, les modèles spatio-temporels
mis en place et leur façon d’appréhender l’ensemble des images d’une séquence les
rendent particulièrement intéressantes dans notre contexte. Ainsi Jacob et al estiment les
déplacements entre deux instants successifs d’une séquence ultrasonore. Les estimations
sont initialisées grâce à un algorithme de prédiction [Jacob et al., 1998]. D’autres auteurs
ont proposé la segmentation de structures déformables dans une séquence d’images par
modèle markovien [Boukerroui et al., 1999], par logique floue [Sanchez-Ortiz et al., 2000]
ou par des méthodes par éléments finis [McInerney and Terzopoulos, 1995, Pham et al.,
2001, Mäkelä et al., 2003]
Dans le cadre de sa thèse, Murcia propose une méthode de reconstruction d’images TEP
à partir de l’estimation de mouvement spatio-temporelle obtenue à partir d’images bruitées [Murcia, 1996]. La reconstruction s’inscrit dans le cadre théorique du filtrage de
Kalman. L’algorithme récursif repose sur des opérations de type filtrage-rétroprojection.
L’ensemble des phases est reconstruit simultanément. La reconstruction de la séquence est
effectuée par minimisation d’une fonctionnelle quadratique établie dans le cadre d’une régularisation spatio-temporelle.
La technique proposée dans [Comaniciu et al., 2004] est adaptée à l’étude de séquences
d’images ultrasonores. Un estimateur de Kalman y est proposé comme un moyen du fusionner différentes sources d’informations.
Dans [Montagnat and Delingette, 2005], Montagnat propose une méthode de segmentation de structures déformables dans des images 3D et 4D médicales. Elle se base sur une
formulation discrète des surfaces par des maillages dits simplexes permettant notamment
un contrôle intéressant de la courbure des surfaces reconstruites. L’évolution et la déformation de ces surfaces sont régularisées en espace et en temps grâce à des contraintes
faibles où chaque sommet est attiré vers le milieu du segment défini par ses deux voisins
temporels ainsi que des contraintes fortes où l’ensemble des trajectoires est régularisé. La
méthode a été appliquée au ventricule gauche du cœur sur plusieurs modalités d’images.
CHAPITRE 3. ETAT DE L’ART
54
3.5
Conclusion
Dans ce chapitre, nous avons proposé une synthèse des méthodes d’estimation de
mouvement et des principales méthodes de recalage d’images. Nous avons présenté les
principes et concepts de base sans trop entrer dans le détail, compte tenu des nombreux
documents et ouvrages existant sur le sujet que se soit sur l’estimation de mouvement
et le recalage d’images. Nous avons ensuite fait état de travaux plus récents qui tendent
à prendre en compte non plus seulement deux images mais plusieurs images d’une séquence. Nous avons vu que dans le cadre du recalage, on peut distinguer les approches
paramétriques et non paramétriques. Les approches paramétriques présentent l’avantage
de fournir une représentation du champ de mouvement sous la forme d’un modèle à partir duquel il est aisé d’extraire des paramètres quantitatifs caractéristiques du mouvement.
c’est un atout important dans nos deux contextes applicatifs. On constate aussi qu’il existe
un compromis entre la complexité du modèle (i.e. son nombre de paramètres) et la localité de l’estimation. Plus on cherche à estimer un mouvement ponctuel, plus le nombre de
paramètres requis augmente pour avoisiner celui des méthodes non paramétriques. Il en
résulte que pour assurer la résolution du problème paramétrique en temps raisonnable, on
cherche le plus possible à adapter le modèle et le nombre de paramètres au cas étudié.
Deuxième partie
Contributions Méthodologiques
55
Chapitre
4
Estimation de mouvement entre deux
images par recalage
Sommaire
4.1
4.2
4.3
4.4
4.5
4.6
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Recalage de deux images . . . . . . . . . . . . . . . . . . . . . .
4.2.1 Motivations . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.2 Problématique . . . . . . . . . . . . . . . . . . . . . . . .
Modèle de transformation . . . . . . . . . . . . . . . . . . . . . .
4.3.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.2 Modèle non-linéaire de transformation . . . . . . . . . . . .
4.3.3 Fonctions splines . . . . . . . . . . . . . . . . . . . . . . .
4.3.4 Calcul pratique de la transformation FFD B-Spline . . . . .
4.3.5 Approche bi-pyramidale de l’estimation de la transformation
4.3.6 Propriétés de la transformation . . . . . . . . . . . . . . . .
4.3.7 Régularisation . . . . . . . . . . . . . . . . . . . . . . . .
Critères de mise en correspondance . . . . . . . . . . . . . . . .
4.4.1 terme d’appariement . . . . . . . . . . . . . . . . . . . . .
4.4.2 Choix des opérateurs . . . . . . . . . . . . . . . . . . . . .
Optimisation et implantation . . . . . . . . . . . . . . . . . . . .
4.5.1 La stratégie d’optimisation . . . . . . . . . . . . . . . . . .
4.5.2 Accélération des calculs . . . . . . . . . . . . . . . . . . .
Discussion et résumé de la contribution . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
57
58
58
59
60
60
62
63
64
65
69
72
73
73
76
81
81
83
89
4.1 Introduction
L
e but de ce chapitre est de décrire en détail la méthode de recalage d’images qui sera
utilisée comme base dans ce mémoire. Elle est utilisée dans notre contexte comme
estimateur de mouvement. La méthode décrite dans ce chapitre ne concerne que le déplacement entre deux images. La prise en compte d’a priori de forme sera abordée au chapitre
57
58
CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE
5 et le chapitre 6 sera consacré à la prise en compte de séquences entières d’images pour
une estimation spatio-temporelle des déformations. La transformation pour la mise en
correspondance de deux images appartient à la catégorie des déformations non-linéaires.
Elle est représentée de manière paramétrique dans une base de fonctions B-splines et hiérarchisée à travers une approche multi-échelle. Cette manière d’appréhender le modèle
de déformation, a déjà été utilisée dans d’autres contextes, notamment par Musse et Noblet [Musse et al., 2001, Noblet et al., 2005] pour de la mise en correspondance d’images
du cerveau avec contrainte de préservation de topologie. Rohlfing [Rohlfing et al., 2003] a
envisagé ce type de transformation pour le recalage d’images du sein avec contrainte d’incompressibilité et Kybic [Kybic, 2001] l’utilise pour la mise en correspondance d’images
RM anatomiques et fonctionnelles. Nos contributions dans ce chapitre concernent la mise
en correspondance de primitives statistiques de l’image issues de l’information photométrique pour le recalage intra-modalités d’images par RM ou TDM. L’extraction des
caractéristiques statistiques de l’image est également mise à profit pour l’accélération des
calculs dans le contexte de la modélisation multi-échelle de la déformation. Enfin, cette
méthode, et plus particulièrement le terme d’appariement, a été parallélisée pour une exécution sur une architecture multi-processeurs ou de fermes de PC. L’organisation de ce
chapitre est la suivante : dans un premier temps, nous décrivons le modèle de transformation utilisé et ses propriétés. Nous insisterons ensuite sur le terme de mise en correspondance basé sur l’information iconique de l’image et sur des propriétés statistiques de
stationnarité qui en découle. Enfin, nous exposerons l’optimisation de ce terme d’appariement et l’accélération des calculs.
4.2
Recalage de deux images
4.2.1 Motivations
Nous avons introduit dans le chapitre 3 les principaux composants des méthodes de recalage d’images. Nous en redonnons ici une brève description en insistant sur les orientations que nous avons choisies. Ces orientations sont motivées par les contraintes imposées
par nos deux domaines applicatifs.
Le choix de la transformation est orienté par la nature de la correspondance géométrique que l’on désire établir entre les images à recaler. Son choix est fondamental
dans le sens où il va définir l’espace des solutions pour l’algorithme de recalage.
Dans le cadre de nos applications médicales, nous nous intéressons à la déformation
conjointe d’organes mous. La déformation est loin d’être uniforme sur l’ensemble
de l’image et l’amplitude du déplacement varie selon les régions de l’image. On
prend également en considération une certaine inter-dépendance entre les mouvements des structures anatomiques voisines comme le cœur et les poumons. Pour
ces raisons, notre choix de modèle s’est orienté vers des modèles de transformation
semi-locale. De plus, la volonté d’introduire des contraintes spatio-temporelles de
déformations, nous a incité à considérer plutôt des approches paramétriques. Enfin,
si les phases considérées correspondent à des états physiologiques très différents
(ie. recalage d’une image en télé-diastole et d’une image en télé-systole pour l’imagerie cardiaque, ou le recalage d’une image en fin d’inspiration et d’une image
4.2. RECALAGE DE DEUX IMAGES
59
en fin d’expiration pour l’imagerie thoracique), il n’est pas rare de constater des
amplitudes de mouvements de l’ordre d’une vingtaine de pixels, ce qui nous situe
dans un cadre de grands déplacements. Les stratégies multi-échelles sont un moyen
d’appréhender de tels comportements.
Les primitives sont les éléments sur lesquels s’appuie le calcul de la transformation de
recalage. Dans notre cas, les données dont nous disposons ne nous offrent pas la
possibilité d’utiliser des repères externes et l’information photométrique est la seule
dont nous disposons. Dans ce chapitre, nous utilisons donc des primitives iconiques.
Notre méthode doit être applicable aussi bien à des données IRM que des données
CT et la seule information de l’intensité du pixel n’est pas suffisante. L’hypothèse
de conservation de cette intensité sur l’ensemble des images d’une séquence peut
en effet être discutée. Nous envisagerons un second critère basé sur la stationnarité
spatiale de l’intensité qui traduit le contraste entre les structures au sein d’une sousrégion.
Le critère d’appariement évalue la distance entre les primitives de chaque image. Il
constitue donc le cœur de l’algorithme de recalage puisque la minimisation ou la
maximisation de ce critère doit aboutir à l’estimation de la déformation recherchée. Dans la mesure où l’estimation de mouvement repose sur la conservation (ou
la quasi-conservation) de l’intensité photométrique au cours du déplacement, nous
choisissons d’utiliser une mesure qui traduit le rapprochement entre les primitives
iconiques. La norme L2 semble donc adaptée à notre problématique et nous utilisons une métrique simple qui est la moyenne des différences des intensités au carré
ou Intesity Mean Squared Difference (MSD) en anglais.
L’optimisation ou stratégie de recherche définit la méthode qui va permettre de converger progressivement vers l’estimation finale en explorant l’espace des solutions. Le
choix d’un modèle paramétrique semi-local de déplacement entraîne un nombre significatif de paramètres à estimer. Une recherche de type exhaustive est donc inenvisageable du fait de la taille considérable de l’espace de recherche. Les algorithmes
de recherche de type stochastique (recuit simulé, algorithmes génétiques) garantissent une solution optimale malgré la non-convexité de l’espace de recherche.
Cependant, les temps d’exécution sont souvent très élevés et risquent d’être considérablement longs pour les espaces que nous considérons. Même si la convexité de
l’espace de recherche est loin d’être garantie dans notre cas, les approches multiéchelles permettent d’augmenter graduellement la complexité de ces espaces. Les
basses échelles/résolutions du modèle de déformation et des images offrent une version "lissée" de la fonction de coût qui tend ainsi à la convexité. Les échelles plus
élevées exploiterons les résultats obtenus sur les versions plus lissées des espaces
inférieurs évitant ainsi certains minima locaux. La dérivée de notre fonction de coût
étant calculable de façon analytique, nous mettrons en œuvre une méthode d’optimisation numérique générique de type descente de gradient.
4.2.2 Problématique
La problématique générale du recalage d’images est illustrée sur la Figure 4.1. Considérons une image source Is définie sur un domaine Ωs et à valeur dans R et une image
60
CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE
cible Ic définie sur Ωc et également à valeur dans R. Les deux domaines Ωc et Ωs sont
tous deux des sous-espaces d’un même espace Rd . Le but du recalage est d’estimer une
transformation ϕ : Rd → Rd entre Ic et Is de telle manière que Is ◦ ϕ soit similaire à Ic
selon un critère prédéfini. La transformation est recherchée sur un espace T de transformations admissibles. Le critère d’appariement est une fonction d’énergie J qui dépend
à la fois des images à recaler et de la transformation de mise en correspondance (ie.
J (Is , Ic , ϕ)). La phase d’optimisation consiste à estimer une transformation ϕ ∈ T qui
minimise l’énergie J afin de garantir la meilleure mise en correspondance entre les deux
images. Le problème du recalage peut donc se résumer par l’équation (4.1) :
ϕ̂ = arg min J (Is , Ic , ϕ).
ϕ∈T
(4.1)
Selon le formalisme définit par Modersitzki et Fischer [Modersitzki, 2004], le terme
général de la fonctionnelle à minimiser (ou à maximiser selon les cas) peut s’écrire de
manière générale sous la forme :
J (Ic , Is , ϕ) = A(Ic , Is , ϕ) + αR(ϕ) + γC(ϕ).
(4.2)
A est le terme d’appariement qui évalue la distance entre les deux images Ic et Is . La
dérivée de ce terme par rapport aux paramètres de la transformation fournit un champ de
force dans l’espace des paramètres destiné à attirer les primitives de l’image source vers
leurs correspondantes dans l’image cible. R est un terme de lissage qui permet de régulariser l’espace des solutions et enfin C est un opérateur de contrainte. Dans ce qui suit,
nous détaillons plus particulièrement le premier terme. Nous reviendrons sur le terme de
lissage dans la suite et sur le terme de contrainte dans le chapitre 5.
4.3
Modèle de transformation
4.3.1 Définition
La transformation fait correspondre un point géométrique x de l’espace de départ Ω ⊂
R vers son image x′ dans l’espace d’arrivée Rd (Figure 4.2). Considérons l’application
ϕ de Ω ⊂ Rd vers ϕ(Ω) ⊂ Rd que nous cherchons à estimer :
d
ϕ = I + u,
(4.3)
où u représente le déplacement. Nous choisissons volontairement de ne pas imposer
la contrainte ϕ(Ω) = Ω. Cette contrainte impliquerait la préservation des bords ∂Ω de
l’image et donc ϕ = 0 pour x ∈ ∂Ω. En effet, les acquisitions dont nous disposons
ne couvrent pas la totalité des organes en mouvement et, pour quelques images de la
séquence, certains d’entre eux peuvent partiellement sortir du champ de vue défini pendant
l’acquisition.
La transformation ϕ est la composition de l’identité et d’un terme de déplacement u.
Nous cherchons donc à estimer le champ de déplacement u en tout point x ∈ Rd tel que :
(Is ◦ ϕ)(x) = Is (ϕ(x)) = Is (x + u(x)) soit ’similaire’ à Ic (x).
(4.4)
4.3. MODÈLE DE TRANSFORMATION
Pré−
traitements
61
Mesure d’appariement
Image Cible
ϕ
Pré−
traitements
Optimisation
Interpolation
Image Source
ϕ
F IG . 4.1. Schéma du principe général du recalage d’images. Le principe général consiste en l’estimation d’un champ de transformation de manière à ce que l’image source déformée soit la
plus proche possible de l’image cible au sens d’un certain critère d’appariement. Les principaux blocs que sont le critère d’appariement, la transformation ϕ, l’optimisation de cette
transformation et l’interpolation de l’image source sont à définir en fonction du contexte
applicatif.
62
CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE
Dans l’ensemble de ce rapport, le domaine de définition Ω est un sous espace de R3 .
Ainsi, de manière générale, la transformation ϕ est décomposée suivant ses trois composantes spatiales ϕx , ϕy , ϕz ; de même, le champ de déplacement u est formé des trois
composantes ux , uy , uz et ce pour chaque point x = [x, y, z]t de l’espace. Pour un modèle
de transformation paramétrique de vecteur de paramètres ξ ∈ Rp , l’équation (4.1) peut
être réécrite sous la forme :
ξ̂ = arg minp J (Is , Ic , ξ).
(4.5)
ξ∈R
4.3.2 Modèle non-linéaire de transformation
Le modèle de déformation que nous utilisons s’apparente à des déformations dites
de forme libre ou Free Form Deformation (FFD) en anglais. Il s’agit d’une modélisation
paramétrique non-rigide de la transformation. Ce modèle semi-local génère des déformations non-linéaires de l’espace dans le sens où les longueurs et la géométrie ne sont pas
conservées (une droite peut devenir courbe).
Le principe de la déformation FFD consiste à plonger l’image (ou un objet quelconque)
que l’on désire déformer, dans une grille régulière composée d’un ensemble de K points
de contrôle (PDC). Dans la suite, nous noterons Pk le PDC d’indice k.
Le déplacement ξ k = [ξx;k , ξy;k , ξz;k ]t de Pk entraîne un déplacement sur l’ensemble ou
une partie du domaine de définition selon la base de fonctions choisie. La déformation
continue de l’espace se calcule par interpolation des déplacements ponctuels attribués aux
PDC. Notons que dans le cas du recalage d’images, l’ensemble des déplacements des
PDC constitue l’ensemble des paramètres ξ qu’il s’agit d’estimer.
ϕ
Ω
ϕ(Ω)
F IG . 4.2. Description schématique de l’espace de départ et de l’espace d’arrivée mis en correspondance par la transformation ϕ
Selon les notations introduites dans [Kybic, 2001], dans un espace mono-dimensionnel,
le déplacement s’exprime par la combinaison linéaire d’un terme de déplacement et d’une
fonction d’interpolation dont la taille du support est à définir :
X
u(x) =
ξk β k (x),
(4.6)
k∈Kinf
4.3. MODÈLE DE TRANSFORMATION
63
où ξk représente le déplacement de Pk . Kinf ⊂ K représente le sous-ensemble des
PDC qui influence le déplacement du point x. On verra dans la section 4.3.3 que cet
ensemble dépend directement du choix de la fonction d’interpolation. Ceci sera reprécisé
dans la section 4.3.5.2. Considérons que l’expression (4.6) correspond à la décomposition
de u sur un espace vectoriel dont la base est formée par l’ensemble des fonctions β(x).
Dans le cas multidimentionel, on introduit généralement une hypothèse de séparabilité
des dimensions de l’espace pour exprimer une base engendrée par produit tensoriel des
espaces unidimensionnels correspondants (4.8).
X
u(x) =
ξ k β k (x)
(4.7)
k∈Kinf
modélise le champ de déplacement en trois dimensions. Dans l’équation (4.7), la base
β k (x) = βxk (x)βyk (y)βzk (z).
(4.8)
pondère le déplacement ξ k associé à Pk en fonction de l’influence que celui-ci exerce
sur le point x. Intuitivement, nous voyons que la densité des PDC va avoir une grande
influence sur le caractère local de la déformation estimée et donc sur l’espace paramétrique associé. La densité des PDC est directement corrélée à la résolution de la grille de
déformation. La modification de la densité de cette grille permet d’approcher des comportements de mouvement plus ou moins globaux et donc de proposer une hiérarchie dans
les déformations estimées.
Nous allons dans la suite décrire la fonction d’interpolation choisie, ses propriétés et
les raisons qui ont motivé notre choix.
4.3.3 Fonctions splines
Dans l’ensemble de mes travaux, la fonction d’interpolation β est de type B-Spline.
Une B-Spline de degré r est définie de manière récursive par :
βr =
β
∗ β0 ∀ r ∈ N
r−1
1 si x ∈ − 12 , 21
β0 =
0 sinon
(4.9)
(4.10)
où ∗ est l’opérateur de convolution. En vertu du théorème central limite, lorsqu’une
fonction (β0 dans notre cas) est r fois convoluée par elle-même, elle tend vers une fonction
gaussienne. L’opérateur de convolution peut être alors considéré comme un opérateur de
lissage et β4 est une fonction plus lisse que β3 elle même plus lisse que β2 .
Les fonctions de base jusqu’au degré 3 (r = 0, 1, 2, 3) sont représentées sur la Figure 4.3. Dans la suite, nous ne considérons que les fonctions de degré impair (i.e. 1
et 3) car leur support correspond à un nombre entier de cellules sur la grille de déformation. Le support d’une fonction B-Spline est donc compact et s’étend sur l’intervalle
(−r/2 − 1/2; r/2 + 1/2).
Cette modélisation décrit le champ de déplacement analytiquement. Cette propriété
est particulièrement intéressante dans notre cas et ce pour trois raisons. La première est
qu’elle permet, grâce aux propriétés inhérentes à la fonction d’interpolation, d’approcher
64
CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE
β0
β1
β2
β3
F IG . 4.3. Représentation des fonctions B-Splines pour les quatre premiers ordres (ordre = degré
+ 1)
les termes de vitesse et d’accélération de manière exacte alors que les méthodes variationnelles ont recours à des approximations par des convolutions. La seconde concerne plus
particulièrement la fonction B-Spline et la compacité de son support. Il est ainsi possible
d’estimer un déplacement localisé sur une partie de l’image sans influencer le déplacement
sur l’ensemble du domaine. Enfin, et ce sera détaillé dans le chapitre 6, cet ensemble de
paramètres est particulièrement bien adapté pour la représentation de la transformation
sous forme de modèle d’état permettant un filtrage des paramètres sur l’ensemble de la
séquence d’images.
4.3.4 Calcul pratique de la transformation FFD B-Spline
Pour le modèle de transformation décrit à la section précédente, le calcul pratique de
la déformation se décompose en trois étapes que nous décrivons dans les paragraphes
4.3.4.1, 4.3.4.2 et 4.3.4.3.
4.3.4.1
Calcul des coordonnées locales
Cette étape détermine les coordonnées locales xloc = [xloc , yloc , zloc ]T d’un point x
dans l’élément de la grille de déformation dans laquelle il se situe (Figure 4.4). Ces coordonnées sont dépendantes de la géométrie du motif de la grille de déformation, de son
origine et des pas de résolution tridimensionnelle δx, δy, δz. Le premier point de cet
élément est repéré par les coordonnées {i, j, k} :
xloc
i = ⌊x/δx⌋ ; j = ⌊y/δy⌋ ; k = ⌊z/δz⌋
= x/δx − i; yloc = y/δy − j; zloc = z/δz − k
⌊.⌋ représente l’opération d’arrondi par valeur inférieure.
(4.11)
(4.12)
4.3. MODÈLE DE TRANSFORMATION
65
δx
δy
(i,j+1,k)
(i,j,k+1)
x
zloc
δz
y loc
(i,j,k)
x loc
(i+1,j,k)
F IG . 4.4. Détermination des coordonnées locales d’un point x.
4.3.4.2
Influence des fonctions d’interpolation
Cette influence dépend du degré r de la fonction β et des coordonnées locales précédemment calculées. Cette étape détermine l’ensemble Kinf des PDC qui auront une
influence sur le déplacement de xloc ∈ [0; 1]. Pour clarifier l’explication, une illustration
est donnée en 1D dans le tableau 4.1 mais l’extension en 3D est immédiate.
4.3.4.3
Calcul de la déformation
La déformation est calculée à partir des équations (4.7) et (4.8) limitées au sous ensemble Kinf . Dans la suite, afin d’alléger les notations, nous ne mentionnerons plus les
indices relatifs au degré de la B-Spline, sauf lorsque cela est nécessaire.
4.3.5 Approche bi-pyramidale de l’estimation de la transformation
Le terme bi-pyramidal est utilisé pour désigner le fait qu’une série d’approximations
est réalisée à la fois sur les images à recaler et sur la transformation à estimer.
4.3.5.1
La pyramide d’images
La décomposition multi-résolution des images est très utilisée dans le domaine du traitement d’images, notamment en compression d’images. Dans notre cas, il y a au moins
deux intérêts à utiliser une telle approche. La première concerne le coût calculatoire. Les
données à traiter sont souvent très volumineuses ( ≈ 512 × 512 × 100 pour les données
CT). Le parcours de plusieurs MVoxels à chaque itération de l’optimisation est coûteux
en temps de calcul. Une prise en compte progressive des détails de l’image au cours du
recalage est donc fortement appréciable. Le second intérêt concerne la qualité du champ
estimé et notamment l’évincement de certains minima locaux.
En compression d’images, de nombreux travaux ont été réalisés afin de réduire le support de l’image tout en gardant le maximum d’information disponible dans les images
sous-résolues. Dans notre cas, la perte de détails n’a pas de conséquence majeure puisque
l’estimation finale repose sur les images initiales.
Les pyramides PImg associées à Ic et Is sont construites par filtrages et souséchantillonnages successifs. Un filtrage passe-bas (gaussien) supprime les détails dans
CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE
TAB . 4.1. Description des fonctions d’interpolation et des sous-ensemble des points influants pour les B-Splines de degrés 1 et de degré 3
r=3
i
β3 (u)
i
β1 (u)
i+1
β1 (u)
i+1
β3 (u)
Fonctions d’interpolation
β3 (u)
i−1
i
i+1
i+2
β3 (u)
i
Sous ensemble
points influents
des
Valeur des fonctions à
l’abscisse a
66
r=1
Degré de la B-Spline
Kinf = {i; i + 1}
β1i (a) = 1 − a
β1i+1 (a) = a
Kinf = {i − 1; i; i + 1; i + 2}
β3i−1 (a) = (−a3 + 3a2 − 3a + 1)/6
β3i (a) = (3a3 + 6a2 + 4)/6
β3i+1 (a) = (−3a3 + 3a2 + 3a + 1)/6
β3i+2 (a) = a3 /6
i+1
4.3. MODÈLE DE TRANSFORMATION
67
l’image et la décimation résultante réduit le support de l’image. La pile d’images est
connu sous le nom de pyramide gaussienne. Soient NImg le nombre de niveaux dans PImg
et I NImg −1 = I, l’image en pleine résolution. Les images correspondant aux différents
niveaux de PImg sont calculées récursivement selon :
I ni −1 = (I ni ∗ Gσ ) ↓2 ,
(4.13)
où Gσ est un noyau gaussien de variance σ qui satisfait les contraintes de séparabilité,
de normalisation et de symétrie. ↓2 représente l’opérateur de décimation par 2.
Pratiquement, le nombre NImg d’étages de la pyramide est calculé de telle manière que
les dimensions de I 0 soient encore suffisamment grandes pour pouvoir en extraire des
informations exploitables. Nous proposons de fixer cette taille minimum à la valeur de
16 pixels par dimension. Le fait que les dimensions de l’image soient différentes suivant
les directions ne perturbe pas cette contrainte puisque le filtrage est séparable et peut être
adapté suivant
direction.
0 chaque
1
NImg −1
PImg = I ; I ; . . . I
est calculée à la fois pour l’image source et pour l’image
cible suivant le même ordonnancement et l’algorithme commence par recaler les images
les plus grossières. Le résultat obtenu pour un niveau donné est ensuite utilisé comme
initialisation pour le niveau supérieur de la pyramide et ainsi de suite jusqu’à ce que l’on
arrive au niveau 0 de la pyramide, qui correspond à l’image en pleine résolution de départ.
4.3.5.2
La pyramide de transformations
Une représentation multi-échelle de la déformation est ici envisagée. Cette représentation va permettre un raffinement progressif de la transformation estimée et donc d’accéder
à une hiérarchisation des mouvements observés par construction d’une pyramide de transformation Ptrans .
Pour décrire cette approche multi-échelle, nous nous appuyons sur les travaux dans
[Musse et al., 2001] repris dans [Noblet et al., 2005]. Pour cela, reconsidérons l’espace T
des transformations admissibles, comme étant un espace de Hilbert1 des transformations
d’énergie finie de Rd dans Rd (d = 3 dans notre cas). La transformation finale estimée
ϕ̂ = I + û appartient à cette espace de Hilbert et nous considérons la décomposition de
u sur un ensemble de sous-espaces emboîtés T0 ⊂ T1 ⊂ . . . ⊂ Tl . . . ⊂ T permettant une
description multi-échelle de u suivant le formalisme de Mallat [Mallat, 1998]. Lorsque l
tend vers l’infini, l’espace emboîté tend vers l’espace de Hilbert et,
lim ul = u.
(4.14)
l→∞
Pour une échelle donnée l, nous avons :
 P
l
β k;l (x, y, z)
ξx;k

 k∈Kinf
 l

ux (x, y, z)
 P l k;l


ξy;k β (x, y, z)
ul (x, y, z) = uly (x, y, z) = 

k∈Kinf

l
uz (x, y, z)
 P l k;l

ξz;k β (x, y, z)
(4.15)
k∈Kinf
1
Un espace vectoriel muni d’un produit scalaire est un espace de Hilbert s’il est complet pour la norme
associée au produit scalaire.
68
CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE
u0
u1
111111111111111111
000000000000000000
000000000000000000
111111111111111111
000000000000000000
111111111111111111
11111111111111111111111
00000000000000000000000
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
u2
u3
PTrans
(a)
(b)
I4
I3
I2
I1
I0
u0
u1
(c)
u2
u3
F IG . 4.5. Schéma des deux pyramides utilisées pour le recalage et ordonnancement des transitions
entre les différents niveaux. En haut, une illustration de la pyramide d’images PImg (a) et
de la pyramide de transformation PT rans (a) sont données. Un ordonnancement est proposé
en (c). Ce schéma décrit la façon de naviguer à travers les différents niveaux des pyramides. Dans l’application que nous proposons, cet ordonnancement est définissable par
l’utilisateur qui est libre de choisir la manière dont il veut enchaîner les différents niveaux.
4.3. MODÈLE DE TRANSFORMATION
69
où le champ ul−1 est une approximation de ul . Dans la suite, lorsqu’il n’y aura pas
d’ambiguïté, les indices d’échelle neseront pas mentionnés
afin d’alléger les notations.
k;l
L’ensemble des produits tensoriels β (x, y, z) ; k ∈ K constitue la base de l’espace
Tl et tout champ de déplacement ul d’énergie finie à l’échelle l, peut être exprimé
comme une combinaison linéaire de cette base. Grâce à l’analyse multi-échelle du champ
de déplacement, il est possible de créer une série d’approximations du champ u. Par
analogie avec les algorithmes de compression d’images, il est ainsi possible de fournir
des informations hiérarchisées de mouvement qui peuvent être exploitées (voir section
2.4.3).
De la même façon que pour la pyramide d’images PImg , les résultats obtenus à
l’échelle l sont utilisés pour initialiser l’estimation à l’échelle l + 1. Cette initialisation
est fournie par projection des estimations obtenues sur l’espace Tl sur le nouvel espace
Tl+1 . L’initialisation des paramètres sur T0 correspond au vecteur nul 0. Le nombre
de paramètres augmente avec la complexité du champ suivant le schéma défini au
paragraphe 4.3.6. Cette approche à l’avantage d’éviter d’être piégé dans des minima
locaux lors de l’optimisation de la fonction de coût.
Pour la mise en pratique de la projection
un espace supérieur, considérons une
l sur
l
l
estimation du vecteur de paramètres ξ = ξ x , ξ y , ξ lz à l’échelle l. Cette estimation peut
être directement projetée à l’échelle l+1 grâce à la transition d’échelle obtenue par convolution d’un filtre H appelé miroir conjugué [Noblet et al., 2005] [Mallat, 1998]. Selon la
théorie de Mallat, la fonction B-Spline satisfait aux critères de fonctions d’échelles et le
principe de causalité (Tl ⊂ Tl+1 ) garantit que la projection se fait de manière exacte et
sans approximation.
 l+1
l
 ξ x = ↑2 ξ x ∗ H
(4.16)
ξ l+1 = ↑2 ξ ly ∗ H
 yl+1
l
ξ z = ↑2 ξ z ∗ H
↑2 est l’opérateur de sur-échantillonnage qui consiste à intercaler des zéros entre chaque
coefficient estimé au niveau l. Les coefficients du filtre miroir H correspondent aux coefficients de la décomposition linéaire de l’équation de raffinement propres aux fonctions
d’échelles qui traduit la notion de contraction et de décalage [Mallat, 1998] :
X
1
√ β(x/2) =
αi β(x − i)
2
i
Ainsi pour une spline de degré r, les nous avons :
1 1
1
H = √
pour r = 1,
1
2
2 2
1 1 1 3 1 1
H = √
pour r = 3.
2 8 2 4 2 8
4.3.6 Propriétés de la transformation
D’une façon générale, la transformation paramétrique est définie par :
(4.17)
CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE
70
ϕ:
Rd × Rp −→ Rd
(x, ξ) 7−→ ϕ (x, ξ) = x′
(4.18)
où p est le nombre de paramètres utilisés pour décrire la transformation. Dans notre
cas,
p = d(2l+1 + r)d .
(4.19)
Afin de sensibiliser le lecteur au nombre de DDL intrinsèque au modèle de déformation
choisi, le nombre de paramètres nécessaires pour modéliser la transformation est donné
dans le tableau 4.2 en fonction de la dimension de l’espace d, du facteur d’échelle l et du
degré de la spline r. Il varie exponentiellement avec la dimension de l’espace et le facteur
d’échelle.
TAB . 4.2. Nombre de paramètres nécessaires à la description de la transformation paramétrique
FFD multi-échelle en fonction de la dimension de l’espace d, du facteur d’échelle l et du
degré de la spline r.
r=1
r=3
l=0
l=1
l=2
l=3
l=4
l=0
l=1
l=2
l=3
l=4
d=2
d=3
d=4
18
50
163
578
2178
50
98
242
722
2450
81
375
2187
14739
107811
375
1029
3993
20577
128625
324
2500
26244
334084
4743684
2500
9604
58564
521284
6002500
Les propriétés de continuité et de dérivabilité comptent parmi les avantages des modèles de déformation paramétriques par rapport aux modèles non paramétriques. L’équation (4.18) établit que la transformation est fonction du point x et du vecteur de paramètres
ξ. On distingue alors deux types de matrice jacobienne. La première, J1 , est composée des
dérivées partielles des coordonnées du point transformé par rapport aux paramètres de la
transformation. Cette matrice peut être interprétée comme un indicateur, pour un point
dans Ωc , de la façon dont sera modifiée la fonction de transformation en réponse à un
petite variation de l’un des paramètres de la transformation :
4.3. MODÈLE DE TRANSFORMATION
71
!
∂uw (x, ξ)
∂w =
J1 (x, ξ) =
w = {x, y, z}
∂ξ w,k ϕ(x,ξ) w = {x, y, z}
∂ξ w,k
k = {0, · · · , p − 1}
k = {0, · · · , p − 1}


∂ux (x, ξ)
∂ux (x, ξ)
∂ux (x, ξ)
...
...
 ∂ξx;0
∂ξx;k
∂ξx;p−1 






 ∂uy (x, ξ)

∂u
(x,
ξ)
∂u
(x,
ξ)
y
y

...
...
=
∈ Rd×p
 ∂ξy;0

∂ξ
∂ξ
y;k
y;p−1 





 ∂uz (x, ξ)
∂uz (x, ξ)
∂uz (x, ξ) 
...
...
∂ξz;0
∂ξz;k
∂ξz;p−1
∂ux (x, ξ)
représente donc l’in∂ξx;k
fluence de ce paramètre sur le déplacement suivant l’axe x.
On constate que la somme de l’influence de l’ensemble des paramètres suivant chaque
ligne (ie. chaque direction de l’espace) vaut 1. Cette propriété, connue sous le nom de
partition de l’unité, est une propriété que la fonction d’échelle doit remplir. La vérification ci-dessous est donnée pour w = x mais reste valable pour les autres dimensions.
ξx;k représente le déplacement suivant l’axe x de Pk .
X ∂x X ∂x =
=
∂ξ
∂ξ
x;k ϕ(x,ξ)
x;k ϕ(x,ξ)
k∈K
k∈K
inf
X ∂ (ux (x, ξ))
∂ξx;k
k∈K
inf
X ∂ξx;k β k (x)
=
∂ξx;k
k∈Kinf
X
=
β k (x) = 1
(4.20)
k∈Kinf
La seconde matrice jacobienne J2 est celle couramment rencontrée en mécanique des
milieux continus. Elle est composée des dérivées partielles des coordonnées du point
transformé par rapport aux coordonnées du point avant transformation. La matrice J2 est
donc un tenseur du second ordre qui décrit localement la transformation autour du point
x. Son expression est donnée par :
!
∂v J2 (x, ξ) =
∂w ϕ(x,ξ) v = {x, y, z}
w = {x, y, z}

P
∂β k (x)



si
ξv;k
 1+
∂w
k∈Kinf
=
P

∂β k (x)

ξ
sinon

v;k

∂w
k∈Kinf
∈ Rd×d
v=w
(4.21)
CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE
72
Les dérivées des fonctions d’interpolation sont immédiates dans notre cas du fait de
leurs représentations polynomiales. Si le degré de la spline utilisée vaut r = 3 alors la
dérivée est continue. En revanche, pour le degré 1, la dérivée est continue par morceau.
4.3.7 Régularisation
Les modèles à faible nombre de paramètres ne nécessitent généralement pas de régularisation car celle-ci est imposée de manière implicite par le modèle. C’est le cas des
modèles de déformation rigide, affine ou même pour les faibles niveaux d’échelles de
l’approche que nous décrivons dans ce chapitre. Lorsque le nombre de DDL augmente,
le modèle est capable d’accéder à des déformations beaucoup plus fines et localisées.
Quand ce nombre devient très important (tableau 4.2), l’information portée par l’image
n’est plus suffisante pour estimer correctement l’ensemble des paramètres. Au sens de
Hadamard [Hadamard, 1923], le problème du recalage d’images devient alors mal posé2 .
On préconise généralement l’introduction d’un terme de régularisation afin de garantir
l’unicité de la solution. L’ajout d’un terme de régularisation dans la fonction de coût introduit une cohérence spatiale sur les déformations estimées, notamment dans les régions
homogènes où des déformations artificielles peuvent apparaître du fait du manque d’information dans cette zone de l’image.
4.3.7.1
Énergie de membrane élastique
Le choix du terme de régularisation est délicat et il existe un grand nombre de régularisations différentes dans la littérature. Il est difficile dans le cas du recalage d’images d’établir si une méthode de régularisation de champs de déformation est plus efficace qu’une
autre. Cette difficulté réside dans l’absence de vérité terrain pour le recalage d’images
réelles et donc la difficulté de conclure sur la qualité des méthodes face à la complexité
des comportements physiologiques étudiés. En effet, la connotation mécaniste des différentes régularisations proposées n’offrent qu’un aperçu de la réelle complexité des mouvements naturels. A l’heure actuelle, même si elles évoluent en ce sens, les techniques
d’imagerie n’offrent toujours pas la possibilité d’explorer les organes en mouvement à un
niveau suffisamment fin pour appréhender et comprendre les mouvements.
Dans notre cas, nous avons choisi de coupler le terme d’appariement à une régularisation
de type membrane élastique. Notre choix a été motivé par le faible coût calculatoire engendré par le calcul des dérivées premières de la déformation. En posant v = {x, y, z} et
w = {x, y, z}, cette expression peut se mettre sous la forme condensée :
R(ϕ) =
2
Z X
∂uv (x)
Ω v;w
∂w
dx.
(4.22)
L’expression de la dérivée de ce terme de régularisation par rapport aux paramètres de la
transformation est donnée par :
2
Un problème est dit mathématiquement bien posé s’il existe une solution, que cette solution est unique
et qu’elle dépend de manière continue des données. Si une de ces conditions n’est pas respectée, le problème
est dit mal posé.
4.4. CRITÈRES DE MISE EN CORRESPONDANCE
∂R(ϕ)
=2
∂ξ
avec
Z X
∂uv (x) ∂ 2 uv (x)
·
dx.
∂w
∂w∂ξ
Ω v;w
X
∂uv (x)
∂β k (x)
=
ξv;k
∂w
∂w
k∈K
inf
et
∂ 2 uv (x)
∂β k (x)
=
.
∂w∂ξv
∂w
73
(4.23)
(4.24)
4.4 Critères de mise en correspondance
4.4.1 terme d’appariement
Le choix du critère de mise en correspondance est important pour le recalage d’images
et la littérature abonde à ce sujet (voir chapitre 3). Son choix doit être motivé par la
prise en compte de la modalité des images à analyser et des primitives que l’on désire
mettre en correspondance. Le terme général de la fonctionnelle à minimiser est donnée
par l’équation (4.2) [Modersitzki, 2004].
Dans le cadre de la mise en correspondance d’images monomodales, l’utilisation de
primitives issues de l’intensité des pixels (primitives iconiques) est justifiée. L’hypothèse
sous-jacente consiste à considérer que les intensités d’un même point sont similaires
dans les deux images. On peut s’interroger sur la validité de cette hypothèse. En imagerie
tomographique à rayons X, le niveau de gris (en unité Hounsfield) est directement relié
à la notion de densité des structures imagées, le niveau de référence étant la densité
de l’eau. Sur la coupe transversale du thorax et le profil associé de la Figure 4.6, il est
possible de distinguer les tissus, les poumons et les structures osseuses. Dans [Sarrut
et al., 2006], les auteurs tiennent compte de la variation de densité des poumons plus ou
moins remplis d’air au cours de la respiration et proposent de corriger cette variation sur
les régions pulmonaires pour améliorer les performances d’un algorithme de recalage.
Dans le cas de l’imagerie par RM, cette hypothèse n’est pas non plus parfaitement
vérifiée et la notion de contraste est sans doute plus pertinente compte tenu du principe
d’acquisition des images.
Considérons le terme d’appariement suivant :
Z
A(IC , IS , ϕ) =
L(DIc (x) − DIs (ϕ(x))dx.
(4.25)
Ω
L’opérateur D : Rd −→ Rg permet d’extraire des primitives locales de l’image
(géométriques ou statistiques). Pour un point x du domaine Ω, celui-ci fournit un
ensemble de g primitives issues de l’image. L : Rl −→ R est une norme permettant
de quantifier l’écart entre les primitives. Il est à noter que ces opérateurs sont tous deux
non-linéaires. Dans l’approche classique, la norme L2 est utilisée et consiste à minimiser
la somme des différences au carré entre les intensités ou entre les caractéristiques
issues de l’image. Celle-ci est cependant peu robuste aux points aberrants. Dans [Noblet
et al., 2006], Noblet et al proposent d’utiliser d’autres normes issues des statistiques
robustes [Rousseeuw and Leroy, 1987] pour rendre le critère de similarité plus robuste
74
CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE
1500
Profil de la coupe CT
1000
500
0
-500
-1000
0
50
100
150
(a)
200
250
300
350
400
(b)
F IG . 4.6. Coupe transversale d’un volume 3D tomographique du thorax et un profil extrait.
220
Profil de la coupe IRM
200
180
160
140
120
100
80
60
40
20
0
0
(a)
20
40
60
80
100
120
140
(b)
F IG . 4.7. Coupe transversale d’un volume 3D IRM du cœur en petit axe et un profil extrait.
4.4. CRITÈRES DE MISE EN CORRESPONDANCE
75
vis à vis des points aberrants.
L’image source Is est délivrée sous forme discrète à l’issu de son acquisition. Elle doit
cependant pouvoir être décrite de manière continue pour fournir une information de niveau
de gris à des coordonnées ne correspondant pas à des valeurs entières de pixels. Une
version continue de l’image source Isc sur l’espace continu de son domaine d’acquisition
peut être exprimée par l’interpolation suivante :
X
β1 (x)Is
(4.26)
Isc (x) =
K
où β1 est une spline de degré 1. Dans nos travaux, l’interpolation tri-linéaire a été
choisie car elle est plus rapide à calculer.
En utilisant la norme L2 , le terme d’appariement devient :
Z
A(Ic , Is , ϕ) = (DIc (x) − DIsc (ϕ(x))2 dx
(4.27)
Ω
A(Ic , Is , ϕ) =
Z
Ω
(DIc (x) − DIsc (ϕ(x))T (DIc (x) − DIsc (ϕ(x))dx.
(4.28)
Si ϕ est exprimée de manière paramétrique, ξ étant le vecteur de paramètres à estimer
(dans notre cas, ce vecteur de paramètres est le déplacement des points de contrôle), on
peut écrire :
A(Ic , Is , ξ) =
Z
Ω
(DIc (x) − DIsc (ϕ(x, ξ))T (DIc (x) − DIsc (ϕ(x, ξ))dx.
(4.29)
La dérivée de A par rapport aux paramètres p de la transformation constitue la force
que ce critère engendre pour guider les recalages et donc l’influence de la variation des
paramètres sur l’opérateur A.
∂A(Ic , Is , ξ)
= −2
∂ξ
Z
Ω
∂DIsc (ϕ(x, p))
(DIc (x) − DIsc (ϕ(x, ξ))T dx
∂ξ
(4.30)
avec,
∂DIsc (ϕ(x, ξ))
∂ϕ(x, ξ)
=
× ∇DIsc (ϕ(x, ξ))
∂ξ
∂ξ
(4.31)
Le terme intégré dans l’équation (4.30) représente la force dans l’espace des paramètres. Sa direction est normale au gradient de l’opérateur D (gradient classique de
l’image si D ne renvoie que l’intensité du pixel). Cette direction est pondérée par la
différence observée entre les primitives correspondantes dans les deux images. Lorsque
les vecteurs de primitives sont parfaitement identiques, la contribution du point x sur
l’évolution des paramètres est nulle.
Le terme
ϕ(x,ξ)
∂ξ
correspond à la matrice jacobienne J1 .
CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE
76
4.4.2 Choix des opérateurs
Dans cette partie nous allons définir les deux opérateurs que nous utilisons dans notre
algorithme. Le premier opérateur D1 est l’opérateur "standard" qui ne renvoie que l’information de l’intensité du pixel pour un point donné. Le second opérateur D2 aura pour but
d’extraire des paramètres statistiques locaux de l’image pour une meilleure robustesse au
bruit. Cet opérateur sera également exploité dans la section 4.5.2.
4.4.2.1
Opérateur D1
On définit D1 de la manière suivante :
D1 I :
Rd −→ R
x 7−→ I(x)
(4.32)
(4.33)
C’est l’opérateur le plus simple que l’on puisse imaginer puisqu’il renvoie l’intensité de
l’image au point considéré. Dès lors, le terme d’appariement (4.29) et sa dérivée (4.30)
deviennent respectivement :
Z
A(Ic , Is , ξ) = (Ic (x) − Isc (ϕ(x, ξ))2 dx
(4.34)
Ω
et
∂A(Ic , Is , ξ)
= −2
∂ξ
avec,
Z
Ω
∂Isc (ϕ(x, ξ))
(Ic (x) − Isc (ϕ(x, ξ))T dx
∂ξ
∂ϕ(x, ξ)
∂Is (ϕ(x, ξ))
=
× ∇Is (ϕ(x, ξ))
{z
}
|
∂ξ
∂ξ
| {z } gradient de l’imageIs
(4.35)
(4.36)
J1
4.4.2.2
Opérateur D2
Nous avons envisagé un autre opérateur qui puisse extraire des informations de
contours afin de distinguer les différentes structures présentes dans les images. La plupart de ces opérateurs sont basés sur le gradient de l’image ∇I(x) ou de son amplitude
|∇I(x)|. Dans [Liu et al., 1995a], deux catégories de filtres sont identifiées afin d’extraire
les zones de rupture dans les images. Les premiers essaient de détecter les changements
de paramètres dans l’image [Hinkley, 1971]. Les seconds lissent l’image et appliquent
des opérateurs différentiels pour obtenir des valeurs de gradients [Canny, 1986, Deriche,
1990, Shen and Castan, 1992].
Notre choix s’est porté sur l’opérateur initialement proposé dans [Liu et al., 1992] que
nous noterons D2 . Dans son article [Liu et al., 1995a], l’auteur compare son opérateur
à un opérateur de référence [Deriche, 1990] et en déduit que, dans les cas théoriques
et simulés, les pics de détection sont plus nets et d’amplitude supérieure. Cet opérateur
s’appuie sur les propriétés de stationnarité locale du signal et donne de meilleurs résultats
sur les signaux bruités et non bruités. Lorsque le signal est stationnaire alors la réponse
4.4. CRITÈRES DE MISE EN CORRESPONDANCE
77
de l’opérateur est très proche de zéro. En revanche, l’amplitude de la réponse sera forte
en cas de rupture du signal.
Cet opérateur a été utilisé par Florez et al [Flórez Valencia, 2006] pour le rehaussement
de contours artériels dans des images angiographiques par RM et TDM. Nous avons testé
ce filtre sur nos images (Figures 4.6 et 4.7).
Description Considérons xe (t) : R → R comme étant un processus localement
stationnaire et ergodique. Le filtrage du signal se déroule en deux étapes comme le montre
la Figure 4.8.
h 2 (t)
( )2
xe(t)
h 1 (t)
^2
+ σ ( t) = xs (t)
^µ( t)
−
h 2 (t)
( )2
F IG . 4.8. Diagramme de l’algorithme de détection de ruptures proposé dans [Liu et al., 1992].
()2 est l’opérateur de mise au carré.
Le premier filtre (h1 (t)) est une estimation du moment statistique d’ordre θ du signal
d’entrée x(t). Dans la suite, nous utiliserons le moment d’ordre 1 (θ = 1) qui correspond
donc à un filtre moyenneur classique permettant de mettre en évidence les ruptures entre
des régions d’intensité moyenne différentes :
µ̂(t) = (h1 ∗ x)(t)
(4.37)
ou ∗ est un opérateur de convolution. La seconde partie du filtre est un estimateur de
la variance du signal µ̂(t) sur un horizon de temps fini :
σ̂µ̂2 (t) = h2 (t) ∗ [µ̂(t)]2 − [h2 (t) ∗ µ̂(t)]2
(4.38)
Ainsi pour une entrée stationnaire, le signal µ̂ est quasi-constant. L’estimation de sa
variance prend alors une valeur très proche de zéro. S’il y a un changement de moyenne,
on constate une transition dans le signal µ̂ et l’augmentation localisée σ̂µ̂2 traduit une mauvaise estimation du signal µ̂. Cette mauvaise estimation est due à la rupture de la stationnarité du signal. Liu propose de choisir les filtres suivants :
h1 (t) = h2 (t) =
t
1
rect( )
L
L
(4.39)
où L représente la taille de l’horizon.
Le comportement du filtre est illustré sur un signal 1D. Son principe est facilement généralisable à des dimensions supérieures comme les images ou les volumes car il consiste
en une succession de convolutions. Le paramètre unique de ce filtre est la taille de la
fenêtre L. Elle correspond au nombre d’échantillons qui seront pris en compte pour chacune des estimations. Les Figures 4.9 et 4.10 représentent les réponses du filtre de Liu sur
CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE
78
2000
2000
Niveau de gris de la coupe CT
RØponse du filtre de Liu sur le signal
Niveau de gris de la coupe CT
RØponse du filtre de Liu sur le signal
1500
1500
1000
1000
500
500
0
0
-500
-500
-1000
-1000
0
50
100
150
200
250
300
350
400
0
50
100
(a) L = 3
150
200
250
300
350
400
(b) L = 5
2000
2000
Niveau de gris de la coupe CT
RØponse du filtre de Liu sur le signal
Niveau de gris de la coupe CT
RØponse du filtre de Liu sur le signal
1500
1500
1000
1000
500
500
0
0
-500
-500
-1000
-1000
0
50
100
150
200
(c) L = 7
250
300
350
400
0
50
100
150
200
250
300
350
400
(d) L = 9
F IG . 4.9. Réponse du filtre de Liu sur un signal 1D issu d’un volume TDM (Fig. 4.6). Le filtre est
appliqué pour différentes tailles de fenêtres. La valeur du signal de sortie a été divisée par
100 pour permettre la superposition avec le signal d’entrée. Lorsque L est grande, l’espérance de la sortie du filtre est indépendante du bruit et les petites ruptures, assimilées
à du bruit, ne sont pas détectées mais les pics correspondant aux transitions plus lentes
augmentent. Inversement, les petites valeurs de L rendent la réponse au filtre plus sensible
aux hautes fréquences du signal et fournissent un fort signal de sortie pour les ruptures très
prononcées de xe (transition observable sur L échantillons). Lorsque L augmente, cette
amplitude est réduite car la moyenne est calculée sur un horizon plus grand. L’amplitude
maximum du signal de sortie est observée lorsque la taille de L correspond approximativement au nombre d’échantillons nécessaires à la transition.
4.4. CRITÈRES DE MISE EN CORRESPONDANCE
1000
79
1000
Niveau de gris de la coupe IRM
RØponse du filtre de Liu sur le signal
Niveau de gris de la coupe IRM
RØponse du filtre de Liu sur le signal
800
800
600
600
400
400
200
200
0
0
0
20
40
60
80
100
120
140
0
20
40
(a)
60
80
100
120
140
(b)
1000
1000
Niveau de gris de la coupe IRM
RØponse du filtre de Liu sur le signal
Niveau de gris de la coupe IRM
RØponse du filtre de Liu sur le signal
800
800
600
600
400
400
200
200
0
0
0
20
40
60
(c)
80
100
120
140
0
20
40
60
80
100
120
140
(d)
F IG . 4.10. Réponse du filtre de Liu pour un signal 1D issu d’une image par RM (Fig. 4.7). La
valeur du signal de sortie a été ici divisée par 4.
CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE
80
les profils visibles sur les Figures 4.6 et 4.7, respectivement. Voici quelques remarques
concernant la réponse du filtre :
• La signal de sortie xs pour un échelon idéal est de la forme d’une cloche dont la
hauteur et la largeur dépendent de la valeur de L. Dans le cas d’un échelon unité, la
largeur du pic vaut 2L
• La taille L de h1 et h2 établit un compromis entre la détection des ruptures et la
robustesse au bruit dans l’image. Dans son article [Liu et al., 1995b], Liu propose
une taille 7 × 7 pour des images échographiques car, pour ce type d’image, le filtre
fournit suffisamment d’information sur les changements statistiques.
• La hauteur du pic est proportionnelle à la valeur absolue du contraste supposé entre
deux structures. Ni le signe de la variation ni la valeur absolue des niveaux de gris
n’a d’influence sur la réponse.
Comportement sur les images L’expression analytique du signal de sortie pour
x2e
2
les filtres donnés dans (4.39) est xs = 12L
− 1) [Flórez Valencia, 2006]. Cette
2 (L
expression est également valable en 3D. L’interprétation du problème en 3D peut se faire
en considérant qu’un noyau de taille 3 × 3 × 3 placé sur une région de rupture entraîne
la même valeur de discontinuité si chaque moitié de la région d’intérêt est située de part
et d’autre de cette rupture. Cela correspondrait à un signal 1D avec une taille de noyau
de 33 . Les Figures 4.11(a) et 4.11(b) représentent respectivement le filtrage d’un volume
TDM du thorax et d’un volume IRM du cœur.
On définit D2 de la manière suivante :
D2 I :
Rd × R −→ R
x, L 7−→ B(x, L)
(4.40)
(4.41)
Le terme d’appariement et sa dérivée sont identiques à ceux définis pour D1 ((4.34) et
(4.35) respectivement) à ceci près qu’il faut remplacer I par B. L’opérateur D2 sera également utilisé afin de limiter le temps de calcul (section 4.5.2) et afin d’adapter l’optimisation du problème aux régions de l’image qui présentent le plus d’information (section
4.5).
4.4.2.3
Opérateur D3
Nous définissons l’opérateur D3 comme étant l’opérateur vectoriel issu de la composition de l’opérateur D1 et D2 :
Rd × R −→ R
x, L 7−→ [I(x) B(x, L)]T
D3 I :
(4.42)
(4.43)
Dès lors, le terme d’appariement (4.29) et sa dérivée (4.30) deviennent respectivement :
Z
A(Ic , Is , ξ) =
k(D3 Ic (x, L) − D3 Isc (ϕ(x, ξ), L)k2 dx
(4.44)
Ω
4.5. OPTIMISATION ET IMPLANTATION
81
et
∂A(Ic , Is , ξ)
= −2
∂ξ
Z
Ω
(D3 Ic (x) − D3 Isc (ϕ(x, ξ))T
∂D3 Isc (ϕ(x, ξ), L)
dx
∂ξ
(4.45)
avec,
∂ϕ(x, ξ)
∂Is (ϕ(x, ξ))
=
×
∇D I (ϕ(x, ξ))
| 3 s {z
}
∂ξ
∂ξ
| {z } gradient de l’image vectorielle D3 Is
(4.46)
J1
L’intérêt de cet opérateur est d’apparier de manière encore plus prononcée les
frontières des objets tout en s’affranchissant des bruits d’acquisitions des imageurs.
L’opérateur permet donc d’envisager un recalage moins dépendant de la modalité des
images traitées à la condition que le recalage soit, lui, monomodal.
4.5 Optimisation et implantation
Résoudre le problème du recalage d’images revient à minimiser (4.5) où J est la fonctionnelle, dépendant des paramètres de la transformation. Il s’agit d’un problème classique
d’optimisation non-linéaire en dimension finie. On trouve dans [Press et al., 1992], une
description assez complète des différentes méthodes d’optimisation.
Une étude des performances de différents optimiseurs (descente de gradient (GD), descente de gradient optimisée, gradient conjugué (GC), et Levenberg-Marquardt) est présentée dans [Kybic and Unser, 2003] dans ce contexte du recalage non-rigide d’images.
La méthode GC trouve son principal intérêt lorsque l’estimation de ∇ξJ est 10 à 100 fois
plus rapide que J . La méthode DG converge moins rapidement que la méthode DGO.
Finalement, la méthode ML devient très lente quand le nombre de paramètres augmente
à cause de l’inversion de la matrice hessienne.
4.5.1 La stratégie d’optimisation
Nous avons mis en œuvre, comme dans [Kybic and Unser, 2003], une méthode classique de descente de gradient. Considérons le vecteur de paramètre ξ it à l’itération it. A
l’itération suivante, nous avons :
ξ it+1 = ξ it + ∆ξ it ,
(4.47)
∆ξ it = −µit ∇ξit J ,
(4.48)
avec
où J est la fonctionnelle définie par (4.2).
Le pas initial µit est fixé à 1. Ce pas est divisé par 2 lorsque ∇ξit · ∇ξit−1 < 0. Lorsque
trois pas successifs n’inversent pas le signe du gradient alors µit est multiplié par deux.
82
CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE
(a)
(b)
F IG . 4.11. Exemple de filtrage proposé par l’opérateur D2 de Liu avec L = 3 sur a) un volume
TDM du thorax de dimension 400 × 300 × 90 et b) un volume RM de dimension 160 ×
160 × 80.
4.5. OPTIMISATION ET IMPLANTATION
83
4.5.2 Accélération des calculs
Les données à traiter sont de plus en plus volumineuses et, le recalage d’images est
un processus relativement lent. Cette lenteur est directement reliée à la taille des images
à traiter (plusieurs millions de voxels). A titre d’exemple, un recalage peut nécessiter
entre 200 et 500 itérations, où, à chaque itération, le terme d’appariement est calculé
ainsi que sa dérivée première et seconde selon le choix de l’optimiseur. Environ 95% du
temps consacré au recalage est imparti à ce calcul proprement dit. Malgré l’approche bipyramidale (section 4.3.5), le temps de calcul reste élevé. Nous proposons ici quelques
techniques pour réduire notablement le temps de calcul. Dans la section 4.5.2.1, nous
décrivons comment réduire l’espace d’analyse au prix d’un compromis entre la précision
du recalage et le temps de calcul. La section 4.5.2.2 décrit la parallélisation de l’algorithme
sans de perte de précision sur l’estimation finale de la déformation.
4.5.2.1
Réduction de l’espace d’analyse
La réduction de l’espace d’analyse consiste à ne pas parcourir la totalité de l’image
cible mais seulement une partie de cette image. En effet, lorsque l’algorithme se situe au
niveau 0 de la pyramide PImg , l’image à parcourir est alors en pleine résolution ce qui
signifie que le nombre de pixels à scruter est souvent de l’ordre de plusieurs millions à
chaque itération. Il n’est pas rare de constater des temps de calculs d’environ 1 à 2 minutes pour chaque itération (cette valeur variant bien sûr avec la dimension de l’image
et la configuration de la machine). On atteint ainsi des temps de calcul qui sont inenvisageables pour une utilisation en routine et qui nous pénalisent aussi pour nos propres
expérimentations en vue de l’étude de l’impact des paramètres de la méthode.
Focalisation sur les zones riches en information
Nous décrivons ici la manière de prendre en compte le pré-traitement par l’opérateur D2 (section 4.4.2.2) pour réduire l’espace d’analyse. Cette réduction est également
adaptée au niveau de la pyramide PImg . La réponse de cet opérateur nous renseigne sur
la non-stationnarité de l’intensité des voxels d’une image tridimensionnelle. En plus de
réduire le bruit dû aux conditions d’acquisition des images, il permet d’extraire les zones
de fort gradient de l’image et donc les zones qui sont susceptibles de porter l’information
utile pour guider le recalage. La mise à jour des paramètres dépend en effet directement
du gradient de l’intensité de l’image à recaler.
Un seuillage du signal de sortie de l’opérateur D2 permet donc de générer une image
binaire, qui met en évidence les zones de l’image que nous garderons pour estimer les
paramètres de la transformation. La valeur du seuil, exprimée en % de l’intensité max
du signal de sortie, est donc un paramètre sensible. L’espace d’analyse est réduit de
manière d’autant plus significative que le seuil sera élevé. La mise en correspondance
n’est plus assurée par l’ensemble de l’image mais par un sous ensemble de l’image de
référence. Intuitivement, on peut donc s’attendre à une accélération de l’algorithme mais
également à une perte de précision sur le champ estimé. L’étude du compromis entre le
gain calculatoire et la précision du recalage fera l’objet d’une étude dans la section 8.1
du chapitre 8. La Figure 4.12 illustre les masques binaires obtenus sur des images par
RM pour deux valeurs de seuil de l’image filtrée et le tableau 4.3 représente la réduction
CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE
84
de l’espace d’analyse (en % de voxels) de l’espace initial Ω. Sur ce tableau, les valeurs
inférieures et supérieures (en niveaux de gris), retenues pour le seuillage dans ce cas
précis sont également indiquées.
(a)
(b)
(c)
(d)
(e)
(f)
F IG . 4.12. Illustration des masques binaires utilisés pour réduire l’espace d’analyse. En haut,
une coupe en petit axe de l’image par RM. En bas, une coupe en grand axe. De gauche à
droite sont illustrés l’image, les résultats du seuillage de la réponse au filtre D2 avec un
seuillage à 5% de l’intensité maximale de la sortie de D2 (b et e) et un seuillage à 10% de
cette intensité maximale (c et f).
Adaptation à la stratégie multirésolution
L’adaptation de ce principe de seuillage à la multi-résolution peut s’avérer judicieux. La réduction de l’espace d’analyse est une solution appliquée pour accélérer
le calcul dans le cas où les données à traiter sont très volumineuses. Pour les bassesrésolutions de l’image, cette réduction n’est pas indispensable. Nous proposons d’adapter
ce seuillage au niveau de résolution de l’image considérée. Une fonction de pondération
peut être utilisée afin de réduire progressivement cet espace de recherche en privilégiant
des espaces de recherche peu réduits pour les faibles résolutions. Une solution proposée
est une pondération de type S(ni ) = a × n3i (voir Figure 4.13) où a est un coefficient qui
dépend du seuillage maximum que l’on désire appliquer en pleine résolution et du niveau
de cette pleine résolution. ni correspond au iieme niveau de la pyrapide d’images PImg de
ni
taille NImg Dans la suite, nous noterons IBin
, le masque binaire considéré pour le niveau
ni de la pyramide d’images PImg .
4.5.2.2
Implantation sur architecture multi-processeurs
Nous décrivons dans cette section, l’implantation de l’algorithme de recalage sur une
machine parallèle (SGI SMP NUMA 12 processeurs) qui nous a permis de réduire consi-
4.5. OPTIMISATION ET IMPLANTATION
85
TAB . 4.3. Evolution de l’espace de recherche en fonction du seuil appliqué. Sur la colonne de
gauche sont représentées les valeurs de seuil en pourcentage de l’intensité maximale (Imax )
de la réponse du filtre D2 . La colonne du milieu correspond aux bornes inférieure et supérieure (en valeur de niveau de gris) retenues pour le seuillage. La dernière colonne représente le pourcentage de l’espace d’analyse finalement considéré par rapport à l’espace
initial qui correspond à la discrétisation de Ω. La Figure sur la partie de droite est la
représentation de la réduction de l’espace en fonction du seuil appliqué sur une échelle
logarithmique.
%
Imax
50
20
10
5
3
1
0.5
0.1
0
Imin − Imax
Ωs (%)
1689-3375
675-3375
338-3375
169-3375
101-3375
34-3375
17-3375
3-3375
0-3375
0.1
2.4
7.1
12.9
18.0
29.8
38.8
67.1
100
0.012
0.01
Valeur du seuil
0.008
0.006
0.004
0.002
0
0
1
2
Niveau de resolution de l’image
3
4
F IG . 4.13. Exemple de fonction de pondération pour l’adaptation du seuillage pour la réduction de l’espace d’analyse dans une approche multi-résolution. La fonction est définie par
0.01
S(ni ) = a × n3i avec, dans ce cas, a = 3 .
4
86
CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE
Algorithme 1 Algorithme de recalage
B UT: Estimer les paramètres ξ de la transformation ϕ pour chaque niveau d’échelle l qui
assurent la mise en correspondance des images Is et Ic .
E NTRÉES : Is , Ic
PARAMÈTRES :
TImg : taille de la pyramide d’images
TT rans : taille de la pyramide de transformations
S : valeur du seuil pour la détermination des pixels à prendre en compte
α : terme de pondération entre le terme d’appariement et le terme de régularisation
NM ax : Nombre maximum d’itérations par niveau
D ÉBUT DE L’ ALGORITHME :
Calcul de la pyramide d’image PImg
Pour ni ∈ [0, · · · , TIm − 1] Faire
Calculer D2 Icni pour extraire les zones de fortes ruptures spatiales
ni
En déduire IBin
pour Is
Calculer le gradient de chaque image Isni
Fin Pour
TT ot ← TIm + TT rans − 1
ni ← 0 /* niveau courant dans la pyramide d’images */
nt ← 0 /* niveau courant dans la pyramide de transformations */
ng ← 0 /* niveau courant global */
µit ← 1
Tant Que ng < TT ot Faire
it ← 0
Répète
ni
Pour Tout les pixels de IBin
Faire
Calcul de la contribution sur J et sa dérivée
Fin Pour
Mise à jour de µit
t
= ξ nitt − µit ∆ξ nitt
ξ nit+1
it ← it + 1
Jusqu’à convergence des ξ nt ou si it = NM ax
Si Mettre à jour le niveau de transformation Alors
nt
Calcul des paramètres ξ nt +1 en fonction des ξ̂
nt ← nt + 1 ; ng ← ng + 1
Sinon
ni ← ni + 1 ; ng ← ng + 1
Fin Si
Fin Tant Que
0
1
TT rans−1
S ORTIES : ξ̂ , ξ̂ , · · · ξ̂
4.5. OPTIMISATION ET IMPLANTATION
87
dérablement le temps de calcul de l’algorithme dont nous détaillons le fonctionnement
dans l’algorithme 1.
Une analyse du temps d’exécution de l’algorithme confirme que la majeure partie du
temps de calcul est dédiée au calcul du terme d’appariement et de sa dérivée. Dans [Rohlfing and Maurer, 2003] (dont les travaux ont été repris dans [Fumihiko et al., 2005]),
l’auteur propose la parallélisation du calcul du critère d’information mutuelle entre deux
images dans le cadre d’un recalage 3D d’images avec déformations non-linéaires. Dans
notre implantation, nous adaptons cette parallélisation pour notre propre terme d’appariement et optimisons la répartition des données en fonction de la réduction de l’espace
d’analyse.
Sur une machine de type SMP NUMA, certaines séquences de l’algorithme au temps
de calcul important peuvent être parallélisées en utilisant le principe du multithreading 3 .
La particularité de ce type de calculateur est que tous les processeurs partagent la même
mémoire et peuvent donc travailler simultanément et indépendamment sur les mêmes données partagées. Les tâches parallèles peuvent alors accéder en lecture à des espaces mémoires identiques (par exemple le gradient de l’image) sans perturber les autres tâches.
Pour une itération donnée, l’algorithme doit calculer séquentiellement la mesure de
similarité et sa dérivée puis mettre à jour les paramètres de la transformation en fonction
des résultats obtenus. Le calcul de la mesure de similarité est effectué sur l’ensemble
ou sur une partie de l’image. Nous parallélisons cette étape en découpant les données à
parcourir en plusieurs sous partitions. Chaque thread ou processus léger (PL) est assigné
à une sous-partition et calcule son influence sur la mesure de similarité et sa dérivée.
L’ensemble de ces calculs peut être réalisé par chaque PL de manière indépendante. En
revanche, la confrontation de l’ensemble des résultats nécessite une synchronisation de
l’ensemble des PL afin d’avoir accès à toutes les contributions. La caractère sommatoire
de ces contributions (voir équations (4.29) et (4.30)) permet une implantation très efficace
et sans perte de précision du calcul global.
Une première version de la parallélisation effectuait une découpe naïve par tranches
du volume à traiter. Cette partition n’était pas réellement optimisée en fonction de l’image
à parcourir. Comme l’illustre la Figure 4.14, il en résulte une période de latence qui provient du fait que les PLs associés aux sous-régions moins volumineuses terminent plus
rapidement les calculs.
La version que nous utilisons à l’heure actuelle consiste à stocker, une fois la réduction
de l’espace d’analyse effectuée, l’ensemble des pixels à considérer sous forme de liste et
de scinder cette liste en parts égales pour les distribuer aux différentes PLs. Le temps de
synchronisation est ainsi beaucoup moins élevé. Dans [Rohlfing and Maurer, 2003], on
propose d’approximer le temps d’exécution total du recalage par une équation du type :
B
(4.49)
n
où n représente le nombre de PL utilisés. Cette approximation est vérifiée aussi dans notre
T (n) = A +
3
Les processus légers (en anglais, thread), sont similaires aux processus en cela qu’ils représentent tous
deux l’exécution d’un ensemble d’instructions du langage machine d’un processeur. Toutefois là où chaque
processus possède sa propre mémoire virtuelle, les processus légers appartenant au même processus père
partagent une même partie de sa mémoire virtuelle (http ://www.techno-science.net). Le multithreading
correspond à l’exécution en parallèle de plusieurs processus légers appartenant au même processus père et
partageant une même partie de sa mémoire virtuelle.
88
CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE
temps
Début de l’itération
Creation des différents PLs
Synchronisation− récupération
des résultats
F IG . 4.14. Illustration du temps de synchronisation nécessaire à la mise en commun de l’ensemble
des contributions issues des PL
cas (voir Figure 4.15) ce qui indique que les temps de synchronisation ne perturbent pas
les performances de la version parallèle de notre algorithme.
F IG . 4.15. Temps de calcul en secondes pour un recalage 3D d’une image de taille 160×160×80.
L’ensemble de l’image est considéré (pas de réduction de l’espace d’analyse). Le nombre
de niveaux d’images Nimg et de transformations Ntrans est 4 et 5 respectivement. Le
temps de calcul est inversement proportionnel au nombre de PL utilisés. Cela signifie qu’il
existe une limite au gain fourni par la parallélisation de l’algorithme. Ce gain dépend
directement de la proportion entre la partie parallélisée et la partie non parallélisée du
code.
Les performances de l’algorithme deviennent désormais très intéressantes (moins de
15 minutes sur une image de taille 160 × 160 × 80 et sans réduction de l’espace d’analyse,
voir chapitre 8) ce qui nous permet d’envisager son utilisation en situation clinique. La
principale limitation, cependant, est liée au prix très élevé des machines SMP NUMA.
Ceci nous amène à considérer son implantation sur d’autres stations de travail et sur des
grilles de calculs. Cela nécessite de trouver un compromis car, si le nombre de processeurs
disponibles devient beaucoup plus élevé, la mémoire n’est plus nécessairement commune
4.6. DISCUSSION ET RÉSUMÉ DE LA CONTRIBUTION
89
à l’ensemble des processeurs et les données doivent être échangées. Il faut alors prendre en
considération la communication et les échanges d’information entre les différents noeuds.
4.6 Discussion et résumé de la contribution
Dans ce chapitre, nous avons décrit la méthode de recalage d’images qui va nous
permettre d’estimer une transformation non rigide entre deux images d’une séquence.
La transformation est représentée de manière paramétrique dans une base de B-splines
et hiérarchisée à travers une approche bi-pyramidale images-transformations. La navigation dans cette hiérarchie est définie par l’utilisateur. Nos contributions dans ce chapitre
concernent la mise en correspondance de propriétés statistiques locales de l’image issues de l’information photométrique pour le recalage intra-modalités d’images par RM ou
TDM. Les trois opérateurs D1 , D2 et D3 proposés constituent différentes façons d’appréhender l’information iconique dans le cas où il n’existe pas de variation fonctionnelle entre
les intensités d’un même point sur l’ensemble de la séquence. L’opérateur D3 introduit un
critère vectoriel de mise en correspondance, où l’intensité et le descripteur statistique local de l’intensité dans une région sont considérés conjointement. Si l’opérateur D2 permet
l’extraction des caractéristiques statistiques de l’image, il est également mis à profit pour
l’accélération des calculs. La réduction de l’espace d’analyse diminue considérablement
les temps de calcul tout en conduisant à des résultats d’une précision quasiment identique.
Cette réduction est adaptée à la description multi-résolution des images de manière à limiter son effet sur les basses résolutions. Enfin, cette méthode, et plus particulièrement
le terme d’appariement, a été rendue parallèle pour une exécution sur une architecture
multi-processeurs ou de fermes de PC réduisant encore les temps de calcul sans perte de
précision cette fois ci. Le découpage des données à traiter est optimisé en fonction du
nombre de processeurs disponibles. Une évaluation de l’algorithme sera proposée dans la
section 8.1 du chapitre 8.
90
CHAPITRE 4. ESTIMATION DE MOUVEMENT PAR RECALAGE
Chapitre
5
Including prior shape in cardiac sequential
segmentation tracking
This chapter concerns the work done in collaboration between the Creatis Laboratory,
VTT1 in Tampere, Finland and the BME Laboratory2 in Helsinki, Finland where I spent
6 months from 01/10/04 to 31/03/05 thanks to an Eurodoc Grant (Rhônes Alpes Region).
This is the reason why this chapter is written in English.
Sommaire
5.1
5.2
5.3
5.4
5.5
5.6
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . .
Motivations . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Geometric modeling of the cardiac cavities . . . . . . . . . .
5.3.1 3-D shape model construction [Lötjönen et al., 2004] . .
5.3.2 Dynamic models construction . . . . . . . . . . . . . .
Time-dependent statistical modeling of the shape variability
Integrating the SDM into the segmentation tracking process
5.5.1 Time-dependent prior shape . . . . . . . . . . . . . . .
5.5.2 First frame initialization . . . . . . . . . . . . . . . . .
5.5.3 SDM adapted cost function . . . . . . . . . . . . . . . .
Proposal summary . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
91
93
93
95
98
100
103
103
105
105
107
5.1 Introduction
T
o segment and track the heart in an image sequence, it is possible to apply a sequence
of registrations with the method described in the previous chapter. However, such a
strategy may lead, as it will be seen, to unsatisfactory results : some parts of the heart shape
may derive considerably. To avoid this phenomenon, inclusion of additional information
is required. This can be envisaged through various means. One approach can be to impose
1
2
http ://www.vtt.fi/
http ://biomed.tkk.fi/image/index.html
91
92
CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING
an overall temporal constraint to the segmentation process [Montagnat and Delingette,
2005]. This constraint can be a continuity constraint on the overall motion of the heart’s
structures but if too general, such a constraint may give unrealistic behaviors as well.
To improve the temporal consistency, prior knowledge about cardiac dynamics can be
used. Some recently introduced models incorporate dynamic features of ventricles and
myocardium :
In [Wierzbicki et al., 2004], Wierzbicki et al use the first frame of a 4D MRI data to
build a dynamic model. Manual segmentations from several slices are used to build
a static geometrical model. Then, this static model is warped according to the transformations between consecutive frames provided by a non-linear image registration
algorithm. However the authors do not consider the large variability of subjects’
heart dynamics and only short axis scans have been used.
In [Perperidis et al., 2004], the authors describe the construction of 4D atlas of human
heart using tagged as well as untagged MR image sequences from 11 healthy volunteers. A spatio-temporal registration algorithm is used to produce a 4D probabilistic
model of the cardiac anatomy. In addition, the tagged MR image sequences are used
to derive motion fields between the end-diastolic and the end-systolic frames which
describe myocardial contraction patterns in each subject. These motion fields are
also mapped into a spatio-temporal reference coordinate system to produce a 4D
statistical model of cardiac function.
In this chapter, we propose a new Statistical 3D Dynamic Model (SDM) of the heart
by learning through a population of healthy individuals. This SDM is composed of a
set of semi-landmarks which statistically describe the spatio-temporal evolution of the
heart structure surfaces (ventricles and atria). For each semi-landmark, a mean trajectory
and the variability around it are derived. The SDM provides a reasonable constraint for
a temporally regularized segmentation and tracking algorithm. Our model is built from
both short- and long-axis cine MRI acquisitions of 15 healthy subjects to represent the
statistical distribution of identified semi-landmarks over space and time.
This chapter describes the following contributions :
• A new statistical dynamic model is built using both Short Axis (SA) and Long Axis
(LA) MR slices of 15 healthy volunteers.
• The temporal behavior of the shape is exploited to model a spatial distribution of
each semi-landmark over time.
• Prior shape model is introduced in the algorithm described in Chapter 4 to propose
a subject-dependent shape and motion estimation algorithm whose temporal
consistency is therefore increased.
In Section 5.3, we give the details of the SDM construction. In particular, we emphasize
the spatial (Section 5.3.1) and temporal consistency (Section 5.3.2) of each semi-landmark
through the database. Then a model is proposed for semi-landmark location at each
time point of the sequence (Section 5.4). Finally, we describe, in section 5.5, how to introduce these prior constraints into equation (4.2) to formulate a shape tracking algorithm.
5.2. MOTIVATIONS
93
5.2 Motivations
The previous chapter was dedicated to the estimation of a dense displacement field
between two consecutive images issued from a sequence. All the considered sequences
aim to describe a physiological process for which it is necessary to take into account the
temporal axis.
In the following, we denote (Itj )0≤j≤J an image sequence where Itj is the j th image
in a sequence and where J denotes the number of frames in the sequence.
Basically, there are two main approaches to consider the motion in image sequences. The
Lagrangian or material description is faced with the Eulerian or spatial one. These two
descriptions are described in details in the next chapter. However, a short description
and an illustration of the two points of view are given in Figure 5.1. The Lagrangian
point of view (lower part of the Figure 5.1) focuses on trajectory and displacement of
material points. All the displacements are expressed from a reference state. Since mesh
points of geometrical structures remain coincident with material points, in the Lagrangian
description, elements deform with the material and therefore can become severely
distorted. The Eulerian point of view describes what is happening at each geometrical
location (upper part of the Figure 5.1). The motion is generally described with velocity
or acceleration. In the Eulerian description, the motion estimation errors accumulate
and lead to noisy and unrealistic shapes. An illustration of this phenomenon is given in
Figure 5.2. In this example, a manual segmentation was realized on the first image of the
sequence It0 . The initial mesh was warped according to successive estimations within an
Eulerian framework. The segmentation results for j = 5 (Figure 5.2, left) and j = 15
(Figure 5.2, right) illustrate the error accumulation.
We would also like to limit another undesirable effect. Cardiac MR images have a very
good resolution in the slice planes (here 160 × 160). The inter-slice distance is however
lower. Due to the small number of slices in cine-MRI acquisitions, an image interpolation
(section 2.3.4) is applied to obtain a three-dimensional image. However, the resulting volume still suffers from an inter-slice anisotropy and a lack of information can be observed
in the direction orthogonal to the imaging plane (Figure 5.2). This disturbs the motion
estimation in this particular direction. Thus, image information, alone, is not sufficient to
properly handle the segmentation tracking through the 3D sequence. The 3D Statistical
Dynamic Model proposed hereafter attempts to
– regularize the motion in a cardiac sequence to compensate for the error accumulation
– constrain the shape of the different heart’s structures throughout the cardiac cycle.
5.3 Geometric modeling of the cardiac cavities through
the cardiac cycle
Cine-MR Image sequences of 15 healthy volunteers formed the reference dataset.
For each of them, both SA and LA images have been acquired according to the protocol
described in Section 2.3.4. All the images in the data set were preprocessed using in-slice
94
CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING
ϕt t
ϕt t
0 1
It0
ϕt t
0 1
ϕt t
1 2
2 3
It1
It2
ϕt t
5 6
It6
ϕt t
0 2
ϕt t
0 6
F IG . 5.1. Volumetric transformation estimations within an image sequence. In the Eulerian description (upper part), the motion is estimated between two consecutive frames (ϕtj ;tj+1 )
iteratively. In the Lagrangian description (lower part), the displacement is estimated between the reference image at t0 and any other image in the sequence through ϕt0 ;tj .
F IG . 5.2. Illustration of the error accumulation of errors with motion estimation between successive frames. A manual segmentation is realized on the first frame. The resulting mesh is
warped according to the successive estimations. The resulting segmentation for j=5 is given
on the left and for j=15 on the right.
5.3. GEOMETRIC MODELING OF THE CARDIAC CAVITIES
(a)
95
(b)
(c)
F IG . 5.3. Illustration of the ’stair effect’ (more details are given in the text). a) shows a 2D slice
of a 3D reconstructed volume in the orthogonal direction of the slice planes. The subfigures b) and c) represent the two arbitrary gray-level profiles in (a). To this aim, a manual
segmentation is realized on the first frame and the resulting mesh is warped according to
the estimated transformation.
motion compensation [Lötjönen et al., 2005]. 3D shape-based interpolation [Grevera and
Udupa, 1996] was used to provide SA and LA volume sequences with reduced motion
artifacts. For more details, see Section 2.3.4 or [Lötjönen et al., 2004].
The first following subsection concerns the construction of the statistical threedimensional shape model. This stage is fully described in [Lötjönen et al., 2004] but
the main steps of this construction will be briefly recalled in order to make the reader
familiar with the notations and to underline the spatial consistency of each semi-landmark
from one subject to the other. The second subsection describes the temporal extension of
this geometrical statistical model. Once again, we underline the consistency between each
subject : the trajectory of each semi-landmark is normalized for all the subjects to make
them comparable and to merge the information. As a result, we obtain a fully 4D statistical shape model that will be used in order to constrain the sequential motion estimations
(Section 5.5).
5.3.1 3-D shape model construction [Lötjönen et al., 2004]
Let us define the notation used in the sequel :
– Let p = 1, · · · , n (n ∈ N) be the subject number in the database (n = 15 in our
case).
– Let L(i) denotes the ith semi-landmark (SL) in the geometric model where 1 ≤
i ≤ m, with m ∈ N the number of SL in the model.
– xi,p denotes the coordinates of L(i) for the pth subject in the database.
96
CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING
– For a given subject p, a whole set of SL makes up a 3D shape model, S(p) defined
by :
S(p) = xi,p 1 ≤ i ≤ m
(5.1)
The Statistical 3-D cardiac surface model was generated for the end-diastolic (ED)
cardiac phase which corresponds to the first time frame of each image series. Let
(It0 (p))1 ≤ p ≤ n be the set of these ED Images. Ventricles, atria and epicardium from
each case were manually segmented from both SA and LA images by a medical expert
by deforming a 3-D surfacic mesh in these images using a dedicated software tool
(developed at the BME laboratory) allowing for interactive local non-rigid deformation.
For each subject, the manual segmentation was iteratively performed in SA image, and in
corresponding LA image until no deformation was needed. Accurate instructions were
given to the expert to perform the final segmentation. The guidelines are fully described
in [Lötjönen et al., 2004].
F IG . 5.4. Manual segmentation result for one subject shown on few slices. Intersection between
the 3D meshed model and the corresponding image is displayed in red. Top : SA slices and
Bottom : LA slices
From all the resulting meshes (see Figure 5.4 for an example), a set of corresponding
SL was determined for each subject p according to the method described in [Frangi
et al., 2002]. By corresponding, we mean that L(i) is assumed to correspond to the same
anatomical point for each subject p. In the following, we give the different steps to build
such a set of corresponding SL.
1. In order to match all the segmentations, an artificial volume Iart (p), with
1 ≤ p ≤ n, was generated for each segmented data by assigning a gray level
for each object in the model. One of the volumes Iart (pref ) was arbitrarily chosen
5.3. GEOMETRIC MODELING OF THE CARDIAC CAVITIES
97
to be a reference to which all other volumes were affinely aligned by maximizing a
normalized mutual information measure.
2. This reference was non-rigidly registered using the method described in [Lötjönen
and Mäkelä, 2001]. The output transformations ϕpref ;p map the reference volume
Iart (pref ) to each remaining Iart (p).
3. The set S(pref ) is considered as the reference set of SL which is propagated to the
remaining IED (p) according to the estimated ϕpref ;p
In order to reduce the bias introduced by the arbitrary choice of a reference subject,
a mean shape (see Figure 5.6) was computed from the semi-landmarks of all the subjects
according to :
n
n
1X
1 X i,p S̄ =
S(p) =
x 1≤i≤m.
(5.2)
n p=1
n p=1
F IG . 5.5. Surfaces of all the database subjects. One can notice the large shape variability between
subjects.
The previous procedure (steps 1 to 3) was repeated using the mean model as the reference. A new artificial reference volume Iart was computed from S̄ and the final sets
of corresponding SL, S(p) = (L(i))p1 ≤ i ≤ m , were computed by propagating S̄ to all the
database subjects according to the new estimated transformations. In our case, all the 3D
98
CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING
(a)
(b)
F IG . 5.6. Geometrical Mean Model with (left), and without pericardium (right)
shape models are composed of m = 2086 points. In order to highlight the four chambers
and epicardium shape variability within the database, the surface of all subjects are displayed in Figure 5.5. A statistical description of large shape variability and its application
in cardiac or brain image segmentation can be found in [Lötjönen et al., 2004, Koikkalainen and Lötjönen, 2004].
5.3.2 Dynamic models construction
The geometrical shape model has been used to dynamically describe the motion of the
heart structures. Starting from each subject-specific geometrical model S(p), a segmentation of the heart’s structures has been performed for each image in the sequence. The
segmentation was achieved in a semi-automatic way. To avoid any confusion, for each
subject we compute a specific dynamical model D(p). All the models are normalized and
the final statistical dynamic model (SDM) results by accounting for all the specific model
to compute statistical information. This section is dedicated to the different steps of the
construction of the dynamic model for one subject.
5.3.2.1
4D dataset segmentation
As in [Lorenzo-Valdés et al., 2003, Wierzbicki et al., 2004], for each subject p,
a non-rigid registration was applied to extract volumetric transformations ϕptj ;tj+1 ,
between two successive images (Itj and Itj+1 ) in a 4D data set according to the method
described in [Lötjönen and Mäkelä, 2001]. The estimated motion fields were prone
to error accumulations (see Figure 5.2) and the 3-D transformations were manually
corrected to accurately refine the segmentations. As a result, sequential segmentations
for 23-29 time points, depending on the subject, were achieved for each of the 15 subjects.
5.3. GEOMETRIC MODELING OF THE CARDIAC CAVITIES
5.3.2.2
99
Normalization and resampling of the temporal axis
In order to ensure the dynamic consistency between all the subjects, let consider the
i SL L(i) for the pth subject. The notation introduced in section 5.3.1 is extended with
respect to the temporal axis :
th
xi,p (t), 1 ≤ i ≤ m, 1 ≤ p ≤ n, {i, p} ∈ N × N, t ∈ R
(5.3)
denotes the coordinates of L(i) at time t. n = 15 is the number of subjects in the
database and m = 2086 is the number SL in one mesh.
The signal,
(xi,p (tj ))j∈N
(5.4)
corresponds to the successive locations of L(i) for the pth subject provided by the semi
automatic segmentations (Figure (5.7) : raw line). This discrete 3D trajectory is expressed
at uniform temporally spaced time points. Each discrete trajectory was interpolated with
cubic B-Splines in order to get continuous and smooth paths (Fig.(5.7) : dotted line) :

 i,p  P
β3 (t)xi,p (tj )
x (t)
j
P
y i,p (t) =  j β3 (t)y i,p (tj )
(5.5)
P
i,p
i,p
z (t)
j β3 (t)z (tj )
Moreover, the number of phases and the systolic time points differs from one subject
to the other. Therefore, in order to construct the dynamic cardiac surface model, we must
take into account the inter-subject cardiac cycle variability. This is the reason why all the
trajectories must be normalized and resampled to obtain unified and temporally consistent
semi-landmarks paths.
A normalization is first performed according to the number of time points in the sequence
in such a way that the cardiac cycle is ranged between 0 and 1.
Then, all the normalized trajectories were resampled to set the detected end systolic time
point to 1/3 the cardiac cycle (Fig.(5.7). dashed line).
For each subject p, a dynamic geometrical model is now available and will be denoted
D(p, t). This model is fully described by :
(5.6)
D(p, t) = xi,p (t) 1 ≤ i ≤ m with t ∈ [0 , 1]
An important boundary condition is given for t = 0 by imposing the correspondence
between the dynamical model at time 0 and the static shape model :
D(p, 0) = xi,p (0) 1 ≤ i ≤ m = S(p).
(5.7)
5.3.2.3
Dynamic models relevance
The result of the normalization stage is illustrated in Figure 5.8 where the volume
curve of the left ventricle of each subject is given. We can observe the strong coherency
of all these curves. In particular, all the systole time points are in correspondence. The
resampling stage is essential for the quality of the prior information provided by the final
SDM. Indeed, this model aims to describe the shape variability of the heart structures at
100
CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING
F IG . 5.7. X coordinate of one semi-landmark’s trajectory during the resampling stage. The solid
line displays the raw trajectory which is the result of all the successive segmentations. The
dotted line shows the interpolated smooth trajectory and the dashed line represents the
resampled trajectory relatively to the end-systole time point.
any given time. Without this stage, the shape variability should have been weaken by the
fact that the n different heart geometries would correspond to different cardiac phases. In
other terms, temporal normalization enables to compare hearts at corresponding physiological phases of the cardiac cycle.
In order to emphasize this important property, an average model D̄ which describes a
mean trajectory for each semi-landmark L(i) has been computed as :
n
n
1 X i,p 1X
D(p, t) =
x (t) 1 ≤ i ≤ m .
D̄(t) =
n p=1
n p=1
(5.8)
An illustration of the LV volume curves of D̄ is given in Figure 5.9. These curves are
in good agreement with the one found in the medical literature (see for example Figure
1.2, in chapter 1).
The ejection fraction (equation (1.1)) of D̄ is equal to 60%. According to the medical experts it corresponds to the minimum acceptable value for an healthy subject. An
explanation of this weak value can be the smoothing effect of the average model computation. For comparison purpose, the ejection fraction value of the average model without
trajectory resampling was only 52%.
5.4
Time-dependent statistical modeling of the shape variability
Thanks to the previous modeling steps, instead of having a prior shape information
at a fixed time (end-diastolic time point for example), we are able to model the shape
variability at any time of the cardiac cycle. In this section, we propose a statistical repre-
5.4. TIME-DEPENDENT STATISTICAL MODELING OF THE SHAPE VARIABILITY101
F IG . 5.8. Volume curve of the left ventricle for all the 15 subjects. Thanks to the trajectories resampling, we can observe the strong temporal consistency of the LV volume curves through
the population.
102
CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING
F IG . 5.9. Volumic curves of the 4 chambers of the average dynamic model of the beating heart
sentation of the shape variability of the heart’s cavities leading to the so called Statistical
Dynamic Model (SDM) of the heart.
Let consider the state of the SDM at time t, t ∈ [0 1] and a given semi-landmark L(i).
The variability of the location of L(i) is available from a set of n geometrical points
(xi,p (t))1 ≤ p ≤ n . The location of L(i) is assumed to be a stochastic random vector X i . In
this section we intend to model its spatial distribution.


p(X i (t) = xi (t))
p(X i (t) = xi (t)) =  p(Y i (t) = y i (t)) 
p(Z i (t) = z i (t))
1 ≤ i ≤ m
(5.9)
denotes the probability for L(i) to appear at the geometrical coordinates xi at time
t. In the following, we will write p(xi (t)) for p(X i (t) = xi (t)) in order to lighten the
equations. We consider that xi,p (t) is the instance of the random variables X i (t).
In order to constrain the motion estimation algorithm (chapter 4), we are interested in
differential measure. This is not available from the set a discrete points. In order to circumvent this disadvantage, the joint density is approximated by a smooth differentiable
approximation function. Very often, a Gaussian distribution is assumed for the landmark
location. But in our case, such a representation may not be realistic for instance to represent the twisting component of the heart’s motion. Therefore, we preferred to consider non-linear probability distributions which are approximated from n samples using
Parzen windowing technique [Parzen, 1962] to more realistically model the variability
of each semi-landmark. The probability density functions are estimated by taking the
samples (xi,p (t))1 ≤ p ≤ n and convoluating kernel functions K() centered on the different
elements :
!
n
2
i
i,p
X
1
kx
(t)
−
x
(t)k
p(xi (t)) =
,
(5.10)
K
nh p=1
h
5.5. INTEGRATING THE SDM INTO THE SEGMENTATION TRACKING PROCESS103
where K(.) is a non negative absolutely integrable function defined by :
Z
K(x) dx = 1.
(5.11)
R3
If K is an isotropic gaussian kernel,
K(x) =
1 T
1
exp 2 x x .
2π
(5.12)
the equation (5.10) becomes :
1
T
n
X
− 2 (xi (t) − xi,p (t)) (xi (t) − xi,p (t))
1
p(x (t), h) = √ n
.
exp 2h
h 2π × n p=1
i
(5.13)
The parameter h is a scale parameter for the kernel functions. Its influence is of
particular importance. The bigger the value of h, the more smooth the probability density
function. An illustration is given in Figure 5.10, where we can observe that, the larger
the smoothing parameter, the wider the kernel function and hence the smoother the
density estimate. If the parameter is too large the distribution becomes too diffuse. On
the other hand, if the smoothing parameter is too small, the resulting density may be too
localized and be seen as a sum of dirac functions. The modeling of the point locations
density functions with Parzen windows allows to control the smoothness of the function
with the unique parameter h. This property can be used to progressively constrain the
segmentation tracking.
The mean model D̄ and the set of probabilities p(X i (t) = xi (t)), 1 ≤ i ≤
m, t = [0 , 1] constitute the statistical dynamic model (SDM) of the heart. The probabilistic framework is well-adapted to model the variability of shape and cardiac chambers
deformations. The introduction of the SDM within shape tracking algorithms allows to
constrain the results according to the dynamic evolution of the cardiac structures. The
next section is then dedicated to its introduction in the registration based method described in chapter 4.
5.5 Integrating the statistical model into the segmentation tracking process
Considering a new patient image set, the problem is to exploit the previously described
SDM model for the heart segmentation tracking purpose throughout the image sequence.
The first issue to consider is the temporal alignment of the data. Then, we will adapt the
registration cost function by incorporating an additional term based on the SDM model.
5.5.1 Time-dependent prior shape
We recall that (Itj )0≤j≤J denotes an image sequence. As a convention, we consider
that j = 0 corresponds to the end-diastolic time point, that j = l is the last frame in
104
CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING
F IG . 5.10. One 2D slice of a 3D non linear probability density function for one SL at time point
0.2 with different variance values for the kernel function : a) h = 2.0, b) h = 5.0, c)
h = 10.0, d) h = 20.0
5.5. INTEGRATING THE SDM INTO THE SEGMENTATION TRACKING PROCESS105
the sequence and that j = jsys corresponds to the end-systolic time point. The consistent
trajectories of the SL are resampled in order to adapt the prior information to the sequence
to process. The SDM is linearly discretized according to the jsys and l values so that
jsys = 1/3 and l = 1. Figure 5.11 illustrates this temporal resampling.
5.5.2 First frame initialization
The segmentation of the first frame with mean model D̄(0) at time t = 0 is a key point
for the processing of the whole sequence. In the case of a new sequence, the segmentation
also includes the registration of the segmented model with the SDM. We can for instance
register the synthetic volume Iart (see section 5.3.1) to the end-diastolic time frame of the
sequence and then warp the SDM according to the estimated transformation.
5.5.3 SDM adapted cost function
The SDM can be easily introduced as an additional constraint term in the costfunction. The prior knowledge of the shape can be taken into account through the term
C(ϕ) in the cost function (4.2).
In this section, we focus on the last term, C, whose expression is based on the prior
shape variability information provided by the SDM. The shape constraint energy term is
elaborated from the probability density function (5.13) :
m
with
1X
C(ϕ, h) =
(1 − p(xi (tj ), h))2
2 i=1
xi (tj ) = ϕt0 ;tj (xi (0), ξ)
(5.14)
(5.15)
Combining (5.14) and (5.15), we obtain :
m
C(ξ, h) =
1X
(1 − p(ϕt0 ;tj (xi (0), ξ), h))2
2 i=1
(5.16)
In order to minimize the global energy term in our framework, the first derivative of
this constraint energy term is computed as :
m
∂C(ξ, h)
1 X ∂Ci (ξ, h)
=
∂ξ
2 i=1
∂ξ
(5.17)
with
h
i
p(ϕt0 ;tj (xi (0), ξ), h))
∂Ci (ξ, h)
i
= −2 × 1 − p(ϕt0 ;tj (x (0), ξ), h)) × J1 ×
, (5.18)
∂ξ
∂x
where J1 corresponds to the first jacobian matrix described in section 4.3.6. The last
derivative terms denote the derivative value of the probability term with respect to spatial
dimensions at transformed point.
CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING
106
F IG . 5.11. Illustration of the SDM resampling in order to adapt the prior information to the new sequence to process.
5.6. PROPOSAL SUMMARY
107
5.6 Proposal summary
In this chapter, we built a new statistical dynamic model of the heart from 15 healthy volunteers. This model includes representations of ventricles, atria and pericardium.
The evaluation of cavities volumes over the full cardiac cycle is realistic. In particular, the
asymmetric temporal behavior of atria and ventricles is clearly observed. Probabilistic framework is well-adapted to model the variability of shape and cardiac chambers behaviors.
However, with this kind of method, the more cases in the data set, the more relevant the a
priori information. Therefore, the enrichment of the data set with additional experiments
is still needed. The influence of parameter h is of particular importance. The bigger the
value of h, the more smooth the probability density functions.
The introduction of the SDM in the registration algorithm allows to constrain the results
according to the shape variability of cardiac structures learned from samples. The method introduced in this chapter allows us to temporally constraint the segmentation over
the whole image sequence. However the estimation is still not truly spatio-temporal in
the sense that for a given time point previous and future estimations do not influence
the result. The next chapter gives a method which allows to take into account the whole
temporal image sequence.
108
CHAPITRE 5. INCLUDING PRIOR SHAPE IN SEGMENTATION TRACKING
Chapitre
6
Estimation spatio-temporelle de
mouvement
Sommaire
6.1
6.2
6.3
6.4
6.5
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
Définitions préalables . . . . . . . . . . . . . . . . . . . . . . . . . . 110
6.2.1 Notion de Trajectoire . . . . . . . . . . . . . . . . . . . . . . . 110
6.2.2 Description Lagrangienne du mouvement . . . . . . . . . . . . 111
6.2.3 Description Eulérienne du mouvement . . . . . . . . . . . . . . 111
6.2.4 Périodicité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
Techniques d’estimation et de filtrage de signaux stochastiques . . . 113
6.3.1 Processus markovien et modèle d’état . . . . . . . . . . . . . . 114
6.3.2 Estimateur d’état de Kalman . . . . . . . . . . . . . . . . . . . 115
Application à l’estimation de mouvement dans une séquence d’images116
6.4.1 Modèle spatio-temporel de mouvement . . . . . . . . . . . . . 117
6.4.2 Vecteur d’état . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.4.3 Prédiction et Filtrage . . . . . . . . . . . . . . . . . . . . . . . 119
6.4.4 Critère d’arrêt . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
6.4.5 Contrainte de passage à l’origine . . . . . . . . . . . . . . . . . 122
6.4.6 Approche Multiéchelle . . . . . . . . . . . . . . . . . . . . . . 122
6.4.7 Trajectoires de complexité adaptative . . . . . . . . . . . . . . 123
6.4.8 Remarques complémentaires . . . . . . . . . . . . . . . . . . . 124
6.4.9 Prétraitement des données . . . . . . . . . . . . . . . . . . . . 124
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
6.1 Introduction
L
a méthode que nous proposons dans ce chapitre est une extension au domaine spatiotemporel de l’algorithme de recalage d’images proposé au chapitre 4. Le problème
de l’estimation de mouvement repose sur l’étude des trajectoires et sur une modélisation
109
110
CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT
spatio-temporelle de la transformation sur l’ensemble de la séquence. Les paramètres de
la transformation sont considérés comme des signaux stochastiques. Nous utilisons une
formulation d’état de ces paramètres pour proposer un algorithme basé sur un estimateur et un prédicteur de Kalman qui permet d’estimer séquentiellement les mouvements
et les déplacements des organes étudiés sur l’ensemble d’une séquence. Afin de réduire
l’espace des solutions, certaines contraintes ont été ajoutées, comme la périodicité des
mouvements et des contraintes de déplacement nul aux instants de référence. Ce chapitre
est organisé de la manière suivante : dans un premier temps, nous donnons un complément
des notions de transformation et de déplacement introduites dans le paragraphe 4.3.1. Ces
bases sont nécessaires pour pouvoir exprimer de manière convenable et sans ambiguïté les
déformations spatio-temporelles estimées sur des séquences entières d’images. Puis, nous
présentons les techniques d’estimation et de filtrage que nous utilisons en focalisant plus
particulièrement sur le filtrage de Kalman dont les principales équations sont rappelées
dans l’annexe C. Ensuite, nous proposerons un moyen de combiner cet outil de filtrage et
notre algorithme de recalage en prenant en compte la périodicité des trajectoires. Pour finir, nous introduirons des éléments pour adapter la complexité des trajectoires en fonction
de l’énergie qu’elles véhiculent dans le but de réduire le nombre de paramètres du modèle
aux endroits qui ne justifient pas une grande précision.
6.2
Définitions préalables
Les définitions que nous proposons ici sont pour la plupart issues d’un document téléchargeable à l’adresse suivante : http ://jgarrigues.perso.egim-mrs.fr/mmc.html
6.2.1 Notion de Trajectoire
La trajectoire ΓM d’un point matériel M de l’espace est définie comme étant l’ensemble des positions géométriques occupées par ce point au cours de son déplacement. Si
l’on considère un domaine matériel D représentant un ensemble de points matériels {M},
à chaque instant t, le domaine D est repéré géométriquement par le domaine géométrique
Ωt . A chaque instant t, la position d’un point matériel M est donc repérable par un point
géométrique identifiable par ses coordonnées x dans un repère fixe.
On définit l’application ϕt,t′ qui, à tout point x ∈ Ωt à l’instant t fait correspondre de
manière unique un point x′ ∈ Ωt′ à l’instant t′ .
ϕt,t′ :
Ωt ⊂ Rd → Ωt′ ⊂ Rd
x 7−→ x′ = ϕt,t′ (x)
(6.1)
Pour être en accord avec les propriétés physiques des objets considérés, cette application doit être bijective (i.e. tout élément xt′ de Rd doit admettre un antécédent unique xt
de Rd par ϕt,t′ ). Cette application doit être au moins de classe C 0 pour éviter la rupture
dans la trajectoire des points matériels. Enfin, ϕ doit être transitive.
Il y a deux façons principales d’appréhender le mouvement d’objets animés. Ces deux descriptions sont succinctement décrites section 6.2.2 et 6.2.3. Pour plus de détails, le lecteur
pourra se référer à l’adresse http ://jgarrigues.perso.egim-mrs.fr/mmc.html ou [Linder,
2003].
6.2. DÉFINITIONS PRÉALABLES
111
6.2.2 Description Lagrangienne du mouvement
Cette description consiste à observer les modifications des propriétés d’un point matériel M que l’on suit dans son mouvement. Ces propriétés peuvent être de type scalaire
(pression, densité, température), vectoriel (déplacement, vitesse1 , accélération) ou tensoriel (contraintes, déformation). Cette description est directement liée à la notion de trajectoire puisqu’elle vise à suivre au cours du temps des objets d’intérêts repérés par un état
de référence Ωt0 à un temps de référence t0 . Si l’on note x0 la position géométrique d’un
point matériel M à l’instant de référence t0 , alors l’application (6.1) devient :
ϕt0 ,t :
Ωt0 ⊂ Rd → Ωt ⊂ Rd
x0 7−→ x(t) = ϕt0 ,t (x0 ).
(6.2)
Afin d’alléger ces écritures, nous utiliserons la notation suivante,
ϕ:
Ωt0 ⊂ Rd × R → Ωt ⊂ Rd
x0 , t 7−→ x(t) = ϕ(x0 , t)
(6.3)
soit pour reprendre les notations utilisées dans (4.3) :
x(t) = ϕ(x0 , t) = x0 + u(x0 , t).
(6.4)
6.2.3 Description Eulérienne du mouvement
Dans cette seconde approche, le domaine de référence n’est plus le domaine matériel,
mais le domaine géométrique qui est ’traversé’ par un objet en évolution. Chaque point
géométrique de coordonnées x constitue donc un point d’observation. L’ensemble des
propriétés scalaires, vectorielles et tensorielles observables en x au cours du temps correspondent donc à des points matériels différents. La description d’Euler du mouvement
se prête d’avantage à l’étude des vitesses. On définit v E (x, t) comme la description Eulérienne du champ de vitesse.
Malgré des points de vu différents, il existe une relation évidente entre ces deux descriptions. En effet, on peut connaître la position d’une particule particulière à l’instant t
grâce à l’équation (6.3). La vitesse de cette particule est donnée, en vertu de la description
lagrangienne, par la relation suivante :
∂ϕ(x0 , t)
∂u(x0 , t)
=
.
(6.5)
∂t
∂t
Pour obtenir la description Eulérienne, il faut exprimer le champ de vitesse en fonction
des positions actuelles. Autrement dit, il faut être capable d’exprimer la position de chaque
particule à l’instant t. Considérons pour cela le point x. Puisque ϕ est bijective et donc
inversible, il est possible de savoir quel point matériel M passe par x à l’instant t grâce à
la relation :
x0 = ϕ−1 (x, t)
(6.6)
v L (x0 , t) =
1
Le terme exact devrait être vélocité lequel regroupe à la fois la notion de direction et d’amplitude qui
elle doit être appelée vitesse. Cependant par abus de langage, le mot vitesse est généralement employé.
112
CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT
En substituant cette relation dans l’équation 6.5, on obtient :
v E (x, t) =
∂ϕ(ϕ−1 (x, t), t)
,
∂t
(6.7)
ΓM1
M0
ΓM 2
M1
vL (x0;M1 , t3 )
M2
vL (x0;M2 , t0 )
vL (x0;M , t4 )
0
vL (x0;M2 , t1 )
ΓM
0
vL (x0;M , t0 )
1
vL (x0;M , t0 )
0
vE (x , t )
t0
t1
t2
t3
t4
F IG . 6.1. Correspondance entre la description Lagrangienne et Eulérienne du mouvement. Sur
la partie haute de la figure, les trajectoires de 3 points différents (M0 , M1 et M2 ) sont
représentées sur l’ensemble d’une séquence. Au cours de leur déplacement, ces trois points
matériels se retrouvent sur une même position géométrique particulière x mais à des instants différents. La partie basse du schéma décrit le vecteur vitesse que l’on voit lorsqu’on
ne s’intéresse qu’à cette position particulière aux différents instants.
qui représente une description Eulérienne de la vitesse à partir de la fonction ϕ qui
décrit la trajectoire de l’ensemble des points d’intérêt. Ces notions sont résumées sur la
Figure 6.7 où les trajectoires de 3 points différents (M0 , M1 et M2 ) sont représentées.
6.3. TECHNIQUES D’ESTIMATION ET DE FILTRAGE DE SIGNAUX STOCHASTIQUES113
Ces trois points sont amenés à passer en un même point géométrique à des instants différents.
Le passage inverse de la formulation Eulérienne à la notion de trajectoire passe par la
résolution de l’équation différentielle
∂x(t)
= v E (x(t), t)
∂t
(6.8)
avec la contrainte x = x0 à t = t0 . On accède alors à l’ensemble des positions occupées
par M. Ces notations vont être prépondérantes dans la suite de ce chapitre pour décrire le
modèle spatio-temporel que nous proposons ainsi que pour évaluer les performances de
la méthode que nous proposons.
6.2.4 Périodicité
Comme on l’a vu au chapitre 1, le domaine applicatif concerne l’étude des mouvements physiologiques tels que la respiration ou le mouvement cardiaque. Ces phénomènes
sont considérés comme étant pseudo-périodiques dans le sens où ils ne sont pas exactement reproductibles et où la durée du cycle peut varier sur l’ensemble de l’acquisition.
Cependant les techniques d’imagerie auxquelles nous nous intéressons ne permettent pas
une acquisition en temps réel comme c’est le cas pour l’imagerie ultrasonore. Ainsi les
séquences d’images obtenues couvrent au mieux un cycle cardiaque ou respiratoire. Dès
lors, le bouclage de ces séquences nous permet de périodiser ces phénomènes. On note
alors I = {Ij , j = 0..J} où j ∈ N fait référence à l’axe temporel discrétisé et où l’image
Ij est définie sur Rd . I est alors un d−signal périodique bruité que nous allons filtrer pour
en extraire l’information qui nous intéresse, ici, un champ dense de mouvement spatiotemporel.
6.3 Techniques d’estimation et de filtrage de signaux stochastiques
Le problème du filtrage consiste à déterminer des estimateurs des variables d’un système lorsque l’environnement présente des perturbations aléatoires. Pour estimer le déplacement et le mouvement spatio-temporel des organes en évolution, nous proposons de
nous positionner dans le cadre des filtrages et de prédictions de signaux stochastiques où
le bruit d’acquisition et les variations des intensités d’un même point matériel au cours de
la séquence peuvent représenter des perturbations aléatoires .
Dans la suite, nous notons j la variable discrète de temps. L’estimation d’un signal utile xj
à partir de l’observation d’un signal qui lui est corrélé zj est un problème fondamental en
traitement du signal et en automatique. Dans certains cas, le signal zj n’est qu’une version
bruitée du signal utile que l’on cherche à estimer, dans d’autre cas, ce signal sera totalement différent mais contiendra de l’information sur xj pour conduire à son estimation.
114
CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT
6.3.1 Processus markovien et modèle d’état
Un processus aléatoire est dit markovien si l’état xj de ce processus et l’équation d’état
qui lui est associée contiennent toute l’information nécessaire sur le passé pour prédire
le comportement futur du système. En d’autres termes, l’état constitue une mémoire du
système depuis son initialisation jusqu’à l’instant présent. Ainsi la probabilité pour que
l’état du système prenne une certaine valeur p(xj ) à un instant donné t = tj ne dépend
que de sa valeur la plus récente :
p(xj |xj−1 , xj−2 , xj−3 , · · · , x0 ) = p(xj |xj−1 )
(6.9)
Si l’état ne peut prendre qu’un ensemble fini de valeur, on parle alors de chaîne de Markov.
Cependant, nous nous situerons uniquement dans le cadre de processus markovien car
l’espace des solutions admissibles pour les processus que nous décriront sera infini.
D’une manière générale, l’évolution de l’état d’un système s’écrit sous la forme [Arulampalam et al., 2002] :
xj = f j (xj−1 , vj−1 )
(6.10)
où f j : Rnx × Rnv → Rnx est une fonction non linéaire de l’état xj−1 ∈ Rnx , et du bruit
d’état vj−1 ∈ Rnv . L’état x du système dynamique étudié est estimé récursivement grâce
à une succession de mesures dont le principe est résumé sur la figure 6.2. L’équation
zj = hj (xj , wj )
(6.11)
détermine la mesure du système, où hj : Rnx × Rnw → Rnz est également une fonction non linéaire de l’état xj ∈ Rnx , et du bruit de mesure wj ∈ Rnw . La considération
conjointe des équations (6.10) et (6.11) constitue ce que l’on appelle le modèle d’état.
Il s’agit là bien entendu d’une définition très générale. Des distinctions peuvent être effectuées selon la nature des processus étudiés (gaussiens ou autres) ou selon la linéarité
du modèle. Un résumé des outils de filtrage a été proposé par Monin 2 et synthétisé dans
le tableau 6.1. Dans la suite, nous nous placerons dans le cadre de l’estimateur d’état de
Kalman.
wj
système
dynamique
X j+1 = f ( Xj , wj )
Xj
vj
Capteur
Zj
Estimateur
Xj
Z j = h( Xj , vj )
F IG . 6.2. Diagramme d’un système dynamique décrit sous forme d’état.
2
Nous n’avons pas trouvé de référence concernant ce résumé. Celui-ci a été établi dans le cadre d’une
réunion du projet Picasso visant au développement d’une plateforme d’intégration au sein du laboratoire
LAAS (www.laas.fr/ monin/TAS.ppt)
6.3. TECHNIQUES D’ESTIMATION ET DE FILTRAGE DE SIGNAUX STOCHASTIQUES115
TAB . 6.1. Synthèse des différents types de filtrage dynamique en fonction des modèles utilisés (issue de www.laas.fr/ monin/TAS.ppt).
Filtres numériques
Filtre de Kalman
Filtre de Kalman étendu
Filtrage polynomiale
Filtre de Kalman étendu en
parallèle
Mélange de
gaussiennes
Filtre particulaire
Modèle/Bruit
Nature
Linéaires
gaussiens/Bruits gaussiens
Localement linéaires/
Bruits gaussiens
Analytique/ Bruits linéaires non gaussiens
Localement linéaires/
Bruit gaussiens
Optimal
Localement linéaire/
Bruits quelconques
Quelconque
Coût algorithmique
Faible
Approximation
analytique
Sous optimal
Faible
Approximation
analytique
Moyen
Approximation
numérique
Approximation
numérique
Moyen à
fort
Très fort
Moyen
6.3.2 Estimateur d’état de Kalman
Le but du filtrage de Kalman [Kalman, 1960, Welch and Bishop, 2004] est de déterminer un système optimal au sens de la minimisation de la variance d’erreur entre la variable
réelle et son estimation. Le filtre de Kalman (approche temporelle) est une généralisation
du filtre de Wiener (approche fréquentielle) dans le cas d’un système non stationnaire
multivariable. Celui-ci permet d’appréhender le problème générale de l’estimation d’un
état de dimension finie d’un processus discret (ou d’un processus continu mesurable de
manière discrète) dans le cas où l’équation d’état (6.10) et l’équation de mesure (6.11)
sont linéaires par rapport à leurs variables. L’estimateur est gouverné par les équations
d’état :
xj = Aj xj−1 + Bj uj + vj
(6.12)
zj = Cj xj + wj
Les bruits vj et wj sont supposés être statistiquement indépendants entre eux. Nous
faisons l’hypothèse qu’ils sont blancs et qu’ils suivent une distribution normale.
p(v) ∽ N (0, Q)
p(w) ∽ N (0, R)
(6.13)
où Q et R sont respectivement les matrices de covariance du bruit d’état et de mesure.
Dans (6.12), la matrice de transition d’état Aj de taille nx × nx établit le lien entre l’état
du système à l’instant précédent j − 1 et l’état à l’instant courant j. La matrice de mesure
Cj de taille nx × nz relie l’information mesurable à l’état du système. Enfin, uj est un
signal de commande déterministe. Dans notre cas, le système n’étant pas influencé par
une commande extérieure, nous prendrons B = 0.
116
CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT
Les notations qui seront utilisées par la suite sont les suivantes :
– x̂j/j−1 représente la prédiction de l’état à l’instant j connaissant les mesures jusqu’à
l’instant j − 1
– x̂j/j représente l’estimation de l’état à l’instant j connaissant les mesures jusqu’à
l’instant j
– x̃j/j = x̂j/j − x̂j/j−1 représente l’erreur d’estimation à l’instant j
L’algorithme de l’estimateur d’état de Kalman, résumé
dansi Algorithme 2, minimise
h
l’erreur quadratique sur l’état du système (i.e. E x̃j/j · x̃Tj/j , voir l’Annexe C). La
prédiction du vecteur d’état x̂j/j−1 à l’instant j s’obtient en projetant son estimation
x̂j−1/j−1 obtenue à l’instant j −1. La prédiction de la mesure ẑj/j−1 est également obtenue
par projection. La différence entre cette prédiction et la mesure effective courante zj
s’appelle l’innovation car elle représente l’apport d’information, la partie non prédictible
de la mesure. On la note z̃j/j = zj − ẑj/j−1 . Cette nouvelle mesure, pondérée par le gain
de Kalman Kj , est ajoutée à la prédiction x̂j/j−1 afin d’obtenir l’estimation filtrée de
l’état x̂j/j à l’instant j.
Algorithme 2 Algorithme d’estimateur d’état de Kalman tel qu’il est décrit dans [Welch
and Bishop, 2004]
Initialisation de Q et de R
Initialisation de x0
Initialisation de P0
Tant Que Critère d’arrêt = faux Faire
uj ← LoadInput() ( = 0 dans notre cas ) /* Lecture de l’entrée courante */
x̂j/j−1 = Aj · x̂j−1/j−1 /* Prédiction de l’état courant */
Pj/j−1 = Aj · Pj−1/j−1 · Aj T + Q /* Prédiction de l’erreur d’état*/
Kj = Pj/j−1 · Cj · (Cj · Pj/j−1 · Cj T + Rj )−1 /* Mise à jour du gain de Kalman*/
ẑj/j−1 = Cj x̂j/j−1 /* Prédiction de la mesure courante */
zj ← LoadMeasure()
x̂j = x̂j/j−1 + Kj · (zj − ẑj/j−1 ) /* Estimation de l’état courant */
Pj/j = (I − Kj · Cj ) · Pj/j−1 /* Mise à jour de l’erreur d’état*/
Réévaluation du critère d’arrêt
Fin Tant Que
6.4
Application à l’estimation de mouvement dans une
séquence d’images
Cette section constitue le cœur de notre contribution dans ce chapitre. Nous y décrivons la modélisation que nous proposons dans le cadre du recalage d’images. Dans la
section 6.4.1, nous commençons par la mise en place d’un modèle de mouvement spatiotemporel qui prend en compte à la fois la non-rigidité et la périodicité des phénomènes
associés aux structures que nous voulons suivre au cours du temps. Ce modèle repose
sur la formulation FFD et sur la trajectoire décrite par chacun des points de contrôle. La
6.4. APPLICATION À L’ESTIMATION DE MOUVEMENT DANS UNE SÉQUENCE D’IMAGES117
non-rigidité est donc assurée par la non-linéarité de la transformation utilisée tandis que
la périodicité est intrinsèque à une décomposition harmonique des trajectoires.
Afin de clarifier les différentes étapes de la méthode que nous proposons, une vue d’ensemble de celle-ci est résumée dans l’Algorithme 3. L’estimation spatio-temporelle du
mouvement est toujours réalisée dans un contexte multiéchelle et multirésolution. Plus
précisément, un filtrage de Kalman est réalisé pour chaque niveau des pyramides de transformations et d’images PT rans et PIm . La projection des paramètres spatio-temporels
d’une échelle à l’échelle suivante sera décrite à la section 6.4.6.
A chaque niveau d’échelle, les paramètres du modèle de transformation sont utilisés pour
la construction du vecteur d’état (section 6.4.2). Le filtrage de ces paramètres est réalisé
par une succession de prédictions et de mesures (section 6.4.3) où les différents instants
de la séquence d’images analysée sont considérés séquentiellement mais contribuent à
l’estimation du mouvement sur l’ensemble de la séquence. Ainsi, toujours pour un niveau
d’échelle particulier, chaque itération de Kalman propose une initialisation pour le recalage entre l’image de référence I0 d’une séquence (par exemple l’instant télé-diastolique
dans le cas du cœur) et l’image Ij dont l’estimation finale constitue la mesure de Kalman
et donc l’apport d’information recherché. Cette opération est réalisée jusqu’à convergence
du filtre de Kalman. Le passage à une échelle ou une résolution supérieure peut alors être
enclenchée.
De manière à ne pas surcharger les temps de calcul, une prise en compte partielle de l’espace d’analyse est considérée lors du calcul du terme d’appariement entre l’image I0 et
l’image Ij . Préalablement au processus d’estimation, un prétraitement des données (6.4.9)
permet de détecter les régions susceptibles d’être concernées par le mouvement à estimer.
6.4.1 Modèle spatio-temporel de mouvement
Le modèle que nous décrivons est inspiré de [Oumsis et al., 2003]. Nous proposons
de considérer les trajectoires périodiques que peuvent suivre les points de contrôle (PDC)
qui pilotent la déformation (voir section 4.3.2). Dans un certain sens, cela revient à utiliser
des fonctions de contrôle et non plus de simples points dans la formulation FFD. Dans
un cadre Lagrangien de la description du mouvement (Eq. 6.3), la déformation spatiotemporelle est définie par :
X
u(x0 , t) =
ξ k (t)β k (x0 )
(6.14)
k∈Kinf
Cette expression est un modèle continu de mouvement pour tout point x de l’espace
et tout instant t. Chaque ξ k (t) est un vecteur de fonctions de dimension d. Pour un espace
géométrique à deux dimensions, nous avons :
ξ k (t) = [ξx;k (t) ξy;k (t)]T .
(6.15)
Chaque composante du vecteur représente une fonction F -périodique, continue décomposable en séries de Fourier. La décomposition Sξk de la trajectoire ξ k du PDC Pk est
donnée par :
Sξk (t) =
a0k
+
N
X
n=1
[ank cos(nωt) + bnk sin(nωt)] .
(6.16)
118
CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT
Algorithme 3 Algorithme de prédiction/estimation pour l’estimation spatio-temporelle
de mouvement dans une séquence d’images
B UT: Estimer les paramètres de la transformation spatio-temporelle
E NTRÉES : {I} (séquence d’images à analyser)
TImg : taille de la pyramide d’images
TT rans : taille de la pyramide de transformations
NM axKalmanIteration : Nombre maximum d’itérations pour le filtre de Kalman
D ÉBUT DE L’ ALGORITHME :
Calcul de la pyramide d’image PImg pour chaque image de la séquence
TT ot ← TIm + TT rans − 1
ni ← 0 /* niveau courant dans la pyramide d’images */
nt ← 0 /* niveau courant dans la pyramide de transformations */
ng ← 0 /* niveau courant global */
Tant Que ng < TT ot Faire
Initialisation du filtre de Kalman
Tant Que KalmanIteration < NM axKalmanIteration Faire
Prédiction
Initialisation des paramètres pour l’estimation de mouvement courante (recalage)
Mesure
Filtrage
KalmanIteration = KalmanIteration + 1
Fin Tant Que
Si Mettre à jour le niveau de transformation Alors
projection des paramètres
nt ← nt + 1
ng ← ng + 1
Sinon
ni ← ni + 1
ng ← ng + 1
Fin Si
Fin Tant Que
6.4. APPLICATION À L’ESTIMATION DE MOUVEMENT DANS UNE SÉQUENCE D’IMAGES119
où ω = 2πF . Cette formulation décrit de manière simple la trajectoire périodique d’un
PDC avec un ensemble fini de paramètres. La complexité de la trajectoire augmente
avec le nombre de coefficients. Ces coefficients sont représentatifs du poids accordé aux
différentes fréquences servant à décrire la trajectoire. Si l’ordre N de la décomposition
est faible (ie N=1) alors la trajectoire aura l’allure d’une ellipse et sera donc fortement
lissée temporellement.
Soit M le nombre total de PDC par dimension, le nombre total de coefficients pour
décrire la transformation est (2N + 1) × d × M d . A titre comparatif, pour les extensions
naturelles des algorithmes de déformations de formes libres en 4 dimensions (grille 4D,
voir section 3.4), on obtient (d + 1) × M d+1 paramètres. Pour d = 3, N = 3 et M = 11,
configuration typique, notre modèle nécessite 14641 paramètres contre 58564 pour les
grilles 4D.
6.4.2 Vecteur d’état
Nous définissons le vecteur d’état x à partir des paramètres du modèle spatio-temporel
décrit dans la section précédente. Pour cela nous considérons, en 2D, le sous-vecteur
suivant :

T



1
N
0
N
1
N 
(2N +1)·d
b
.
.
.
b
U k = a0x;k . . . aN
|
a
.
.
.
a
b
.
.
.
b
x;k x;k
x;k
y;k y;k
y;k  ∈ R
|
{z
} | y;k
{z
}
ΘN
ΘN
x;k
y;k
(6.17)
contenant l’ensemble des paramètres relatifs à la trajectoire du PDC Pk sur Rd . La
trajectoire d’ordre N de Pk suivant l’axe x (resp y) est décrite par le vecteur de paramètres
N
ΘN
x;k (resp Θy;k ). Le vecteur d’état
x = [U 0 U 1 . . . U K ]T ∈ R(2N +1)·d·M
d
(6.18)
est la concaténation de l’ensemble des sous-vecteurs U k . Il représente l’état global de
notre système. Nous rappelons en effet que la description continue du mouvement sur
l’ensemble de la séquence est totalement définie par la trajectoire empruntée par les PDC
qui pilotent la déformation. Ces trajectoires sont elle mêmes totalement décrites par les
coefficients de leur décomposition en séries de Fourier.
6.4.3 Filtrage de l’état sur l’ensemble de la séquence
Avant de décrire les trois étapes essentielles de l’estimateur de Kalman, nous
proposons un récapitulatif des différents vecteurs et matrices mis en jeux :
– Le vecteur d’état x ∈ R(2N +1)·d·M
paramètres de la transformation.
d
décrit par l’equation (6.18) contient les
120
CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT
d
d
– La matrice A ∈ R((2N +1)·d·M )×((2N +1)·d·M ) = I. Cela signifie qu’il s’agit d’une
matrice de projection. L’état prédit correspond à l’état estimé à l’instant précédent.
– Le commande u = 0 ainsi que la matrice de commande B = 0.
d
– La mesure z ∈ Rd·M correspond à la position estimée des PDC à un instant donné
dans la séquence.
d
d
– La matrice de mesure C ∈ R(d·M )×((2N +1)·d·M ) fait le lien entre l’état du système
et la position particulière des PDC à un instant donné. Les valeurs des éléments de
cette matrice sont calculées à partir de l’équation (6.16).
L’initialisation des matrices a été fixée de manière expérimentale. Tout d’abord,
nous posons l’état initial x̂0 = 0, ce qui signifie qu’au début de l’estimation,
∀x ∈ Ω, ∀t ∈ R, ϕ(x, t) = x. Nous avons fixé les deux matrices de covariance
associées au bruit d’état v et au bruit de mesure w à Q = I · 10−3 et R = I · 10−3 ,
respectivement. En comparant ces valeurs à celles de l’état ou de la mesure qui sont de
l’ordre de quelques millimètres, ceci traduit la bonne confiance que nous accordons à
l’état du système à chaque instant et à la mesure apportée.
La matrice de la covariance de l’erreur d’estimation est également initialisée à
P̂0 = I · 10−3
L’étape de prédiction Comme nous l’avons vu précédemment, dans notre cas, cette
étape n’est qu’une retranscription de l’état estimé à l’instant précédent j − 1 dans le
sens où l’ensemble des paramètres qu’il représente décrit le mouvement des organes
étudiés sur l’ensemble de la séquence. Le vecteur d’état que nous proposons représente
un processus stationnaire. Le vecteur d’état estimé à l’instant j à la même signification
physique qu’à l’instant précédent j − 1. Le filtrage de Kalman assure la convergence et
donc le régime transitoire de l’estimation sur l’ensemble de la séquence.
Si le vecteur d’état représente un processus stationnaire, il n’en est pas de même du
vecteur z de mesure dont la prédiction dépend de l’instant considéré dans la séquence.
Ceci justifie donc l’utilisation du filtre de Kalman.
Afin de ne pas trop alourdir les notations, nous ne considérons que la prédiction du
vecteur de mesure pour le point Pk . Notons zk la restriction du vecteur de mesure z au
PDC k et considérons le vecteur U k défini par (6.17) et la décomposition (6.16). En 2D,
nous avons la relation suivante :



 

N
N
Prj
0

 Θx;k 
 ξx;k (t)  


=
zk j/j−1 = ξ k (tj ) = 
·

 N 
 

N
ξy;k (t)
Θy;k
0
Prj
j/j−1
(6.19)
∈R
représente la matrice de projection qui fait le lien entre une coordonnée d’un PDC et les coefficients de Fourier relatifs à cette trajectoire. Cette matrice
PrN
j
1×(2N +1)
6.4. APPLICATION À L’ESTIMATION DE MOUVEMENT DANS UNE SÉQUENCE D’IMAGES121
est entièrement décrite par :
PrN
j
=
1 cos(wtj ) cos(2wtj ) · · · cos(N wtj ) sin(wtj ) · · · sin(N wtj )
(6.20)
j
PrN
j dépend donc bien de l’instant considéré j.
Finalement, l’étape de prédiction mobilise deux matrices : la matrice d’état

I




A=





2N +1
0
···
0
I2N +1 · · ·
0
0

..
.
..
.
...
..
.
0
0
· · · I2N +1











(6.21)
où I2N +1 est la matrice identité de taille (2N + 1) × (2N + 1) qui permet de calculer
la prédiction de l’état x̂j/j−1 et la matrice de mesure

PrN
j



 0

Cj = 

 ..
 .


0
0
···
PrN
j
···
..
.
...
0
···

0 


0 



.. 
. 


N
Prj
(6.22)
j
qui nous permet d’obtenir une prédiction de la mesure ẑj/j−1 à l’instant j.
L’étape de mesure L’opération ẑj/j−1 = Cj x̂j/j−1 nous permet d’obtenir une initialisation de l’algorithme de recalage. L’étape de mesure consiste à résoudre le problème
suivant :
ξ(tj ) = arg min p J (It0 , Itj , ξ(tj )).
(6.23)
ξ(tj )∈R
où p = d · M d est la dimension du vecteur de paramètre ξ à l’instant j. Une fois
le recalage effectué entre les image It0 et Itj , la mesure est introduite dans le filtre de
Kalman. La différence entre cette mesure ξ(tj ) = zj et la prédiction ẑj/j−1 représente
l’innovation à l’instant j. Elle correspond à l’apport d’information fourni par le recalage
à l’instant j pour l’ensemble du modèle spatio-temporel.
L’étape de filtrage L’opération de filtrage consiste à mettre à jour :
– le gain de Kalman, Kj = Pj/j−1 · Cj · (Cj · Pj/j−1 · Cj T + R)−1
– l’estimation de l’état, x̂j = x̂j/j−1 + Kj · (zk − ẑj/j−1 ) (voir annexe C)
122
CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT
6.4.4 Critère d’arrêt
Le filtrage de Kalman est interrompu lorsque le nombre d’itérations dépasse une valeur
NM axKalmanIteration fixée par l’utilisateur. En règle générale, nous observons une convergence en un peu plus de 2 périodes (cardiaques). Nous choisissons NM axKalmanIteration =
3(J + 1).
6.4.5 Contrainte de passage à l’origine
Lors de nos premières expérimentations, nous avons observé une dérive des trajectoires estimées. Nous avons donc ajouté une contrainte supplémentaire à la périodicité
des trajectoires. Nous avons imposé aux PDC de revenir à leur position initiale pour
t = 0 mod (F ). Ainsi nous imposons que, pour cette instant, ϕt0 = Id. En partant
mod F
de (6.16), ceci se traduit pour chaque PDC par l’équation suivante :
ξ k (t = 0) =
a0k
+
N
X
ank = 0
n=1
=⇒
N
X
ank = 0
(6.24)
n=0
L’équation (6.16) devient,
Sξk (t) = a0k +
N
−1
X
n=1
ank cos(nωt) −
N
−1
X
n=0
!
ank cos(N ωt) +
N
X
bnk sin(nωt).
(6.25)
n=1
Cette opération a pour but de réduire de d degrés la liberté de chacune des trajectoires.
Le vecteur d’état (6.17) est alors réécrit en supprimant les derniers coefficients aN
x;k et
N
ay;k :
T
N −1 1
−1 1
0
by;k . . . bN
bx;k . . . bN
U k = a0x;k . . . aN
∈ R(2N −1)·d
y;k
x;k | ay;k . . . ay;k
x;k
(6.26)
La matrice A est dorénavant composée de matrices identité de taille (2N −1)×(2N −
1). Finalement, cette contrainte de passage par zéro est traduite au sein de la matrice de
mesure en modifiant les sous-matrices de projection PrN
j , ainsi :
PrN
j = [1 − cos(N wtj ) cos(wtj ) − cos(N wtj ) cos(2wtj ) − cos(N wtj ) · · ·
cos((N − 1)wtj ) − cos(N wtj ) sin(wtj ) · · · sin(N wtj )]j
(6.27)
6.4.6 Approche Multiéchelle
La projection permettant le passage d’une échelle l à une échelle l + 1 est proche de
celle décrite dans le chapitre 4. Cependant, au lieu de considérer les paramètres ξ, nous
projetons l’état de notre système.
(6.28)
xl+1 = ↑2 xl ∗ H
6.4. APPLICATION À L’ESTIMATION DE MOUVEMENT DANS UNE SÉQUENCE D’IMAGES123
↑2 est l’opérateur de sur-échantillonnage qui consiste à intercaler des zéros entre
chaque paramètre au niveau l. Les coefficients du filtre miroir H dépendent de la fonction d’interpolation utilisée pour construire la base de notre espace de transformation.
1
1 1
1
pour r = 1,
H = √
2
2 2
1 1 1 3 1 1
H = √
pour r = 3.
2 8 2 4 2 8
6.4.7 Trajectoires de complexité adaptative
Le nombre N de paramètres augmente de façon exponentielle avec le nombre de PDC
et le nombre de coefficients pour décrire chaque trajectoire. Pour décrire précisément les
trajectoires dans des régions animées d’une amplitude et d’une complexité de mouvement
importante, nous utilisons la valeur N = 7 soit 15 paramètres en deux dimensions par
PDC dans la grille de déformation. Le modèle proposé dans la section 6.4.1 implique que
le nombre de paramètres est le même pour toutes les trajectoires malgré le fait que certains
PDC bougeant peu ne nécessitent pas une telle description. C’est le cas notamment des
PDC dont l’influence ne s’étend que sur des régions de l’image considérée comme du
fond. Une solution à ce problème consiste à adapter la complexité des trajectoires en
fonction de la zone d’influence que représente un PDC.
De plus, la taille des matrices A et C peut être généralement ajustée dynamiquement dans
les librairies spécialisées d’algèbre linéaire. En reprenant la notation de l’équation (6.22),
nous nous mettons dans la situation où pour un instant donnée j les différentes trajectoires
sont décrites par un nombre de coefficients différent :








Cj = 






Pr2j
0
···
0
0
Pr5j
···
0
..
.
..
.
...
..
.
0
0
···
Pr3j















(6.29)
j
Nous proposons de faire varier automatiquement l’ordre N pour chaque trajectoire
après l’estimation des différents paramètres obtenus sur l’ensemble d’un cycle de la séquence.
Considérons chaque vecteur ΘN
x;k ; la formule de Parseval nous renseigne sur la puissance
moyenne véhiculée par les trajectoires suivant chaque composante (par exemple pour x) :
Px;k
N
0 2 1 X
2 2
= ax;k +
(anx;k + anx;k )
2 n=1
où N représente l’ordre du modèle harmonique de la trajectoire.
(6.30)
124
CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT
Chaque puissance observée est normalisée suivant la puissance maximum obtenue :
Pnormx;k = Px;k / max(Px;k |k ∈ K). En faisant l’hypothèse qu’une forte puissance
moyenne traduit une forte amplitude de mouvement, il est possible de représenter une
cartographie des puissance mises en jeux lors de la déformation. Le choix d’un critère
de décision pertinent permettant de déterminer les trajectoires nécessitant davantage de
paramètres est actuellement à l’étude. Pour l’instant, un simple seuillage est envisagé.
6.4.8 Remarques complémentaires
Pour finir ce chapitre, il me semble important d’insister sur deux points :
1. Tout d’abord un certain nombre de matrices peut être précalculé. C’est le cas notamment de l’ensemble des matrices Cj pour j = 1 · · · J, dont les éléments ne
dépendent que du nombre d’images dans la séquence.
2. L’absence de corrélation entre les PDC dans le formalisme d’état peut surprendre
et on peut se demander l’intérêt d’avoir un état sur l’ensemble des PDC plutôt que
d’avoir un état et donc un filtre de Kalman par PDC. Cette modélisation donne un
cadre général où, par la suite, d’autres contraintes spatio-temporelles pourront être
ajoutées. Dans le cadre expérimental de cette méthode, nous n’avons pas voulu séparer les différents filtres de manière à pouvoir intégrer les prochaines contributions.
Je tiens à insister cependant sur le fait que les temps de calculs n’en souffrent pas
du fait de l’utilisation de librairies adaptées à la manipulation de matrices creuses
(VXL/VNL).3
6.4.9 Prétraitement des données
Le but de ce paragraphe est d’étendre la réduction de l’espace d’analyse que nous
avons décrite à la section 4.4.2.2 à la dimension temporelle. Pour rappel, le préfiltrage
proposé D2 est basé sur le filtre proposé dans [Liu et al., 1992]. Nous proposons d’adapter
ce filtre à l’ensemble d’une séquence temporelle grâce à ses propriétés de séparabilité.
Pour illustrer le résultat de ce filtrage, nous avons "empilé" un ensemble de coupes 2D
pour obtenir une image tridimensionnelle (Figure 6.3). Sur la partie haute de cette figure,
une coupe de ce volume 2D+temps suivant l’axe temporel a été représentée. Nous avons
appliqué le filtre D2 sur 3 profils (a), (b) et (c). Les profils (a) et (b) correspondent à
la variation de l’intensité d’un point géométrique pour lequel on est sensé détecter du
mouvement durant le traitement de la séquence. Le profil (c) correspond lui à une région
dont le signal varie peu car il correspond à une zone de l’image peu soumise à mouvement.
Les échelles sont les même pour les trois courbes et on remarque la nette différence du
signal de sortie selon les différents profils.
Un prétraitement des données consiste à appliquer ce type de filtre sur l’ensemble de
l’image 2D+temps. On s’attend à obtenir un a priori des régions de l’image qu’il faudra
prendre en compte pour estimer correctement le mouvement dans une séquence donnée.
Nous avons envisagé deux filtres différents (voir figure 6.4). Le premier ne tient
pas compte de la différence physique entre l’espace et le temps. Il considère l’image
2D+t comme une image 3D. Les masques de convolution du filtre de prétraitement sont
3
http ://paine.wiau.man.ac.uk/pub/doc_vxl/core/vnl/html/index.html
6.4. APPLICATION À L’ESTIMATION DE MOUVEMENT DANS UNE SÉQUENCE D’IMAGES125
600
Intensite
Reponse du Filtre de Liu
500
400
300
200
100
0
0
5
10
15
20
25
a)
600
Intensite
Reponse du Filtre de Liu
500
400
300
200
100
0
0
5
10
15
20
25
b)
600
Intensite
Reponse du Filtre de Liu
500
400
300
200
100
0
0
5
10
15
20
25
c)
F IG . 6.3. Illustration de l’intérêt du filtrage sur l’empilement d’une série d’images 2D. Sur la
figure du haut, nous avons représenté une coupe du volume 2D+temps suivant l’axe temporel. Pour chacun des trois profils sélectionnés (a),(b),(c), nous avons appliqué le filtre D2 .
Les graphes montrent la superposition du profil et de la réponse du filtre sur les signaux 1D
ainsi obtenus.
126
CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT
isotropes. Le second filtre utilise les propriétés de séparabilité de ce filtre pour distinguer
l’espace et le temps. Le filtre est alors anisotrope est seul l’axe temporel est considéré
pour détecter les variations d’intensité.
Finalement, une opération de seuillage et de ’réduction de dimension’ est réalisée afin
d’obtenir un masque binaire 2D à partir du volume obtenu. Nous notons If ilt ∈ Rd+1
l’image filtrée par le filtre isotrope ou le filtre anisotrope. Soit j = 0..J où j ∈ N représente l’indice temporel associé à la j ieme image de la séquence et soit i l’indice associé
au iieme pixel d’une image, on définit l’opérateur Dmask comme étant la succession d’un
opérateur de filtrage Dseuil et d’un opérateur de réduction Dred :
D
D
red
Dmask : If ilt −−seuil
→ Imask
−→ Ibin −−
| {z }
|{z}
|{z}
Rd+1
Rd+1
Rd
1. Dseuil : ∀(xi , tj ) ∈ N2 × N , Ibin (xi , tj ) = 1 si If ilt (xi , tj ) > 0.1 × M ax(If ilt )
(seuillage à 10 % de l’intensité maximale de l’image filtrée).
2. Dred : ∀(xi ) ∈ N2 , Imask (xi ) = Ibin (xi , t0 ) OU Ibin (xi , t1 ) OU · · · OU Ibin (xi , tJ )
OU représente l’opération de ’ou’ logique. Le résultat de ce prétraitement est illustré
sur la Figure 6.4. Deux masques binaires sont calculés pour une séquence d’images
par RM 2D. Le masque obtenu par filtrage isotrope est représenté en Figure 6.4(b) et
le masque obtenu par filtrage anisotrope en 6.4(c). On constate que le filtrage isotrope
est sensible à la fois aux gradients temporels et aux gradients spatiaux de la séquence.
Dans la suite, nous ne considérerons que le masque isotrope car même si tous les
pixels sélectionnés ne correspondent pas nécessairement à une information présumée de
mouvement, ils ont l’avantage d’offrir des points d’accroche supplémentaires pour guider
l’estimation de mouvement. Ainsi, seuls les pixels de ce masque seront utilisés pour le
calcul du terme d’appariement entre deux images.
F IG . 6.4. Construction d’un masque binaire à partir d’une séquence en petit axe d’images par
RM 2D (a). Masque binaire obtenu à partir d’un filtre isotrope (b) et d’un filtre anisotrope
(c).
6.5. CONCLUSION
127
6.5 Conclusion
Dans ce chapitre nous avons présenté un algorithme d’estimation spatio-temporelle
de mouvement. Dans un premier temps, nous avons décrit le modèle spatio-temporel que
nous proposons pour représenter la déformation de manière continue sur l’ensemble de
l’espace 2D+temps ou 3D+temps selon les séquences considérées. Nous proposons d’estimer l’ensemble des paramètres grâce à un estimateur de Kalman qui permet de prédire
et de corriger la position des PDC de l’algorithme de recalage entre deux images. Au delà
de cette notion de prédiction et de correction, l’une des propriétés importantes de l’algorithme proposé est que l’estimation spatio-temporelle finale repose sur la contribution
de tous les instants de la séquence. Ainsi les prédictions obtenues à chaque itération du
filtre de Kalman apparaissent comme le résultat de la prise en compte de l’ensemble des
estimations antérieures.
Le modèle d’état que nous proposons repose sur des hypothèses globales sur le mouvement des phénomènes étudiés (continuité et périodicité). Une contrainte supplémentaire
a été utilisée pour contraindre davantage le modèle et obliger les PDC à passer par leur
position initiale lorsque t = 0 (modulo la période). Le contexte d’estimation que nous introduisons laisse place à de nombreuses perspectives dont je parlerai plus en détail dans le
dernier chapitre de cette thèse. En particulier, il permet de gérer les relations entre les PDC
au sein même de la matrice d’état et de proposer des régularisations spatio-temporelles
plus adaptées et plus localisées.
Pour finir, les trajectoires adaptatives que nous avons décrites dans la section 6.4.7 de ce
chapitre vont permettre d’augmenter graduellement la complexité des trajectoires et de focaliser plus précisément sur les endroits qui le nécessitent sans considérer des paramètres
peu représentatifs aux endroits qui ne le demandent pas (gain notable d’espace mémoire).
Une évaluation de l’algorithme sera proposée dans la section 8.2 du chapitre 8.
128
CHAPITRE 6. ESTIMATION SPATIO-TEMPORELLE DE MOUVEMENT
Troisième partie
Evaluation
129
Chapitre
7
Méthodologie d’évaluation
Sommaire
7.1
7.2
7.3
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Brève revue des méthodes d’évaluation . . . . . . . . . . . . . . . .
7.2.1 Références synthétiques . . . . . . . . . . . . . . . . . . . . .
7.2.2 Détermination d’un bronze standard . . . . . . . . . . . . . . .
7.2.3 Qualité de la transformation . . . . . . . . . . . . . . . . . . .
Méthodes d’évaluation utilisées dans cet ouvrage . . . . . . . . . . .
7.3.1 Evaluation du mouvement . . . . . . . . . . . . . . . . . . . .
7.3.2 Evaluation dans une séquence d’images . . . . . . . . . . . . .
7.3.3 Evaluation du suivi de mouvement par recalage spatio-temporel
131
132
132
133
134
135
136
137
138
7.1 Introduction
ujourd’hui, le clinicien dispose d’un large ensemble de techniques d’imagerie médicale devenues incontournables dans les démarches diagnostiques et thérapeutiques.
Ces diverses modalités d’imagerie fournissent des images de plus en plus précises de nature anatomique et fonctionnelle. En parallèle de ces avancées technologiques, émerge un
grand nombre d’outils de traitements d’images qui restent très souvent dans le domaine
de la recherche. Leur transfert vers les systèmes industriels nécessite une étape importante
d’évaluation. Une ’validation clinique’ est requise, en particulier, dans la démarche d’accréditation des techniques pour une utilisation en routine clinique.
L’évaluation des méthodes de traitement d’images médicales reste un problème ouvert.
L’absence de référence ou de "vérité terrain" constitue un véritable frein pour la comparaison de celles-ci. En particulier, pour l’évaluation de méthodes de recalage nonrigides, il est toujours délicat pour les experts de déterminer si une méthode donne de
meilleurs résultats qu’une autre. La qualité d’une solution est en définitive directement
dépendante de l’application visée [Crum et al., 2003]. Dans le cadre de la mise en correspondance d’images, la nature du recalage (mono-modalité ou multi-modalités, intra
ou inter-patients, rigide en non-rigide) doit être prise en compte. Mais l’objectif spécifique du recalage a son importance pour la définition des critères de qualité. Dans le
A
131
132
CHAPITRE 7. MÉTHODOLOGIE D’ÉVALUATION
cadre de sa thèse [Pauna, 2004], N. Pauna s’appuie sur les études de [Pennec, 1996, Jannin et al., 2002] pour proposer une stratégie d’évaluation de méthodes de recalage rigide
multi-modalités (IRM et TEP) en imagerie cardiaque. Cette stratégie repose sur une référence numérique réaliste. Il s’agit d’une première proposition qui ne remplit pas encore
toutes les contraintes que devraient respecter les références requises pour une évaluation
rigoureuse [Pauna, 2004]. Pour le recalage non-rigide, il faut pouvoir évaluer la transformation estimée avec encore plus de finesse. D’une façon générale, on peut distinguer les
méthodes d’évaluation à partir de référence synthétique et les méthodes d’évaluation sur
données réelles qui font généralement appel à des experts (médecins). Dans ce chapitre,
nous présentons une classification des méthodes d’évaluation d’algorithmes de recalage
d’images. Puis, nous détaillerons les méthodes que nous avons utilisées dans le cadre de
ce mémoire. Celles-ci portent, d’une part sur la génération d’images et de séquences de
synthèse puis, d’autres part, sur la proposition de métriques d’évaluation de méthodes
d’estimation de mouvement non-rigide dans des séquences d’images.
7.2
Brève revue des méthodes d’évaluation
Nous proposons ici une classification de ce qui est généralement utilisé dans la communauté du recalage d’images pour évaluer les performances des algorithmes selon l’information disponible. Nous retrouvons tout d’abord les évaluations établies à partir de
références synthétiques où la déformation est parfaitement contrôlée. Une référence peut
être établie à partir d’informations supplémentaires issues d’un protocole ou d’experts. Finalement, lorsqu’aucune information n’est disponible, la qualité de recalage peut être appréhendée de manière visuelle (essentiellement pour le recalage rigide) à partir de critères
quantitatifs basés uniquement sur l’intensité dans les images ou à partir des propriétés des
transformations obtenues (dans le cas de recalage non-rigide).
7.2.1 Références synthétiques
La méthode la plus intuitive pour évaluer les algorithmes développés consiste à créer
soit même des références en imposant des champs synthétiques sur des données réelles.
Il est ainsi possible des générer des transformations possédant les propriétés désirées et
de bruiter les images obtenues pour tester la robustesse au bruit des algorithmes. Il est
possible d’évaluer la convergence des algorithmes et leur rapidité face à des références
entièrement numérique. Bien sûr, cette démarche n’est qu’une étape préalable à la validation des algorithmes puisqu’elle ne garantit pas le bon comportement des algorithmes
lorsqu’ils sont confrontés à des situations réelles. Généralement, ce type d’approche permet d’évaluer l’influence des paramètres face à certaines caractéristiques des images en
terme de bruit notamment. Dans le cadre de sa thèse [Noblet, 2006], Noblet propose d’utiliser des champs de mouvement synthétiques comme première étape de l’évaluation. En
imposant des contraintes de positivité du jacobien de la transformation, l’auteur assure à
ces champs synthétiques la propriété de conservation de topologie.
L’inconvénient principal des références synthétiques est qu’elles restent loin des situations réalistes qu’on trouve en pratique. Ainsi, dans le cas du recalage d’images, il faut
pouvoir garantir la génération de transformations réalistes à appliquer à des images elles
7.2. BRÈVE REVUE DES MÉTHODES D’ÉVALUATION
133
aussi suffisamment réalistes. Les simulateurs d’images dans différentes modalités sont
pour certains suffisamment avancés aujourd’hui pour produire des images réalistes. Ainsi,
R. Haddad dans le cadre de sa thèse [Haddad et al., 2005b, Haddad et al., 2005a], a développé un modèle anthropomorphique réaliste de cœur battant. L’intégration d’un tel
modèle numérique dans des simulateurs d’images par RM [Benoit-Cattin et al., 2005]
ou TEP [Reilhac et al., 2005] permet la simulation de séquences d’images réalistes dans
lesquelles le mouvement est parfaitement contrôlé et donc utilisable comme référence.
7.2.2 Détermination d’un bronze standard
La référence absolue (ou vérité terrain ou gold standard en anglais) n’existe pas dans
notre cas. Cependant, il est possible, en général, d’établir une référence non totalement
idéale mais qui permet néanmoins d’évaluer les performances dans un contexte de comparaison. Ce type de référence est appelé bronze standard dans la littérature anglo-saxonne
(on peut utiliser le terme référence approchée comme suggéré dans [Pauna, 2004]). Différents cas peuvent être envisagés.
7.2.2.1
Références obtenue par analyse d’experts
La sélection de points remarquables par un ou plusieurs experts (voir Fig. 7.1) sur
l’ensemble des images à étudier permet de quantifier le comportement des algorithmes en
des endroits précis. Le fait qu’une faible partie seulement des quelques millions de points
recalés ne soit considéré ne permet pas d’avoir un état exhaustif sur les performances du
recalage, cependant cette référence constitue un bon indicateur des erreurs commises dans
des régions géométriques qui intéressent particulièrement les utilisateurs. A partir d’amers
extraits, Hellier a proposé une métrique d’évaluation [Hellier et al., 2003] permettant
d’apprécier le comportement des algorithmes de recalage non-rigide dans un contexte
de mise en correspondance d’images par RM de cerveau de différents individus. Dans
le paragraphe 7.3.2, nous verrons comment nous étendons ce principe pour évaluer le
comportement spatio-temporel des algorithmes d’estimation de mouvement par recalage
d’images.
7.2.2.2
Références obtenues algorithmiquement
Nicolau a proposé la mise en place d’un bronze standard pour évaluer les performances des algorithmes de recalage [Nicolau et al., 2003] . L’idée de base est de contourner l’absence de référence pour l’évaluation en considérant le résultat exacte comme une
variable inconnue qu’il s’agit d’estimer. Cette méthode est basée sur l’exploitation d’une
grande ressource calculatoire rendue disponible par la mise en place de grilles de calcul. Le recalage de toutes les paires d’images possibles par de nombreux algorithmes
disponibles (différent de celui qu’il s’agit d’estimer) est mise à profit pour exploiter une
redondance d’information. Les résultats obtenus par la méthode à évaluer sont comparés à
la moyenne des résultats obtenus par les autres méthodes qui constitue ainsi une pseudoréférence. La distance à cette référence aléatoire est ensuite interprétée. Cette étude est
envisageable dans le cas où la masse de données à traiter est très importante dans l’espoir
de biaiser le moins possible les résultats et c’est précisément le but de ce projet. A l’heure
actuelle, les transformations considérées sont des transformations rigides ou affines pour
CHAPITRE 7. MÉTHODOLOGIE D’ÉVALUATION
134
F IG . 7.1. Exemple de sélection de point 3D par trois experts différents. La moyenne de ces sélections constitue ce que l’on appelle une pseudo-référence. Dans ce cas particulier, les trois
positions sont situées sur la même coupe ce qui n’est évidemment pas toujours le cas.
lesquelles il est possible de comparer les paramètres obtenus. Dans le cas de transformations non-rigides, la signification des paramètres dépend du modèle de transformation
utilisé ce qui rend difficile les comparaisons à moins d’être en mesure de comparer directement les champs de déformations.
7.2.3 Qualité de la transformation
7.2.3.1
Inspection visuelle
L’inspection visuelle est sans doute le premier critère utilisé pour évaluer la qualité
d’une méthode de recalage car elle permet à l’utilisateur de vérifier de manière très simple
le bon comportement des algorithmes. Pour des applications de mise en correspondance
d’images anatomiques et fonctionnelles, des erreurs concernant la transformation rigide
estimées de l’ordre de la résolution de l’image peuvent être détectées [Fitzpatrick et al.,
1998]. Il est alors possible de laisser à l’expert médical le soin de juger et de comparer
différents algorithmes. Quoiqu’il en soit, cette évaluation purement qualitative est d’autant
plus difficile à interpréter dans le cadre du recalage non-rigide.
7.2.3.2
Propriétés de la déformation
L’utilisation d’opérateur qui évaluent la cohérence de la transformation a été proposée. Ces opérateurs peuvent renseigner sur la non-réversibilité des transformations. C’est
le cas notamment pour l’identification des valeurs négatives du jacobien de la transformation [Hellier et al., 2003]. Une cartographie peut être établie sur l’ensemble de l’espace de transformation afin de repérer précisément les zones présentant des anomalies.
Dans [Rey et al., 2002], l’utilisation d’un tel opérateur permet de détecter automatiquement des régions où il y a une variation locale forte de volume et ainsi détecter des tu-
7.3. MÉTHODES D’ÉVALUATION UTILISÉES DANS CET OUVRAGE
135
meurs ou des lésions évolutives. L’étude de la consistance des champs est également un
critère pour évaluer les transformations non-rigides. Dans [Pennec et al., 1998, Jannin
et al., 2002, Boldea et al., 2005], les transformations estimées sont analysées en vérifiant la symétrie et la transitivité des transformations obtenues. Pour cela, il s’agit de
vérifier que la transformation ϕ1→2 obtenue par recalage de l’image 1 sur 2 et ϕ2→1
obtenue par recalage de l’image 2 sur 1 sont bien l’inverse l’une de l’autre. On peut également comparer les transformations ϕ1→2 ◦ ϕ2→1 et ϕ2→1 ◦ ϕ1→2 avec l’application
Identité. La notion de transitivité est vérifiée en comparant les ϕ2→3 ◦ ϕ1→2 avec ϕ1→3 .
Cette notion de transitivité est également reprise dans [Wierzbicki et al., 2004] où l’auteur
propose de comparer une image de référence (Iref ) avec l’image résultant de l’application successive des transformations estimées sur l’ensemble d’une séquence de n images
(Iref − ϕn−1→n ◦ · · · ◦ ϕ3→4 ◦ ϕ2→3 ◦ ϕ1→2 (Iref )).
7.2.3.3
Transport d’atlas
Lorsque l’on dispose d’une segmentation associée à l’image de référence, il est possible d’évaluer la segmentation obtenue par recalage d’une image flottante sur cette image
de référence. On dit alors que l’on transporte la carte de segmentation. La segmentation
de l’image recalée permet ainsi de quantifier les performances de l’algorithme proposé.
Cette méthode nécessite cependant une segmentation initiale et est donc dépendante de la
précision de cette segmentation.
7.3 Méthodes d’évaluation utilisées dans cet ouvrage
Cette section est consacrée à la définition des procédures et critères que nous allons
utiliser pour évaluer les méthodes proposées dans ce manuscrit.
1. Nous générerons des champs synthétiques (7.3.1) et proposons des métriques
d’évaluation (7.3.1) pour tester l’algorithme de recalage d’images décrit au chapitre
4. On étudiera ainsi, dans le chapitre 8, l’influence des paramètres qu’il convient de
fixer pour la suite des expérimentations.
2. La procédure d’évaluation est proposée au paragraphe 7.3.2 dans le but de
définir une stratégie pour évaluer les performances d’algorithmes d’estimation de
mouvement face au problème du suivi de tumeurs dans des séquences d’images
thoraciques TDM. Les résultats relatifs à cette méthode font l’objet du chapitre 9.
3. L’évaluation du modèle spatio-temporel développé au chapitre 6 portera à la fois sur
des séquences synthétiques dont la construction est décrite au paragraphe 7.3.3.1 et
sur des séquences réelles.
CHAPITRE 7. MÉTHODOLOGIE D’ÉVALUATION
136
QE
uest
utheo
AE
F IG . 7.2. Mesure d’erreur quadratique et angulaire entre un vecteur théorique et un vecteur estimé.
7.3.1 Evaluation de l’algorithme d’estimation de mouvement entre 2
images
Des outils de la librairie ITK1 permettent de générer une déformation de type plaque
mince à partir d’un ensemble de paires de marqueurs. Un ensemble de 20 marqueurs sont
aléatoirement choisi sur l’ensemble de l’image. Le déplacement 3D de chacun de ces marqueurs est également choisi aléatoirement dans un intervalle de [−10 ; +10] mm suivant
chaque direction. Il en résulte la génération d’une paire d’images dont le déplacement est
parfaitement connu, permettant ainsi l’évaluation de certains paramètres de la méthode.
Métriques d’erreurs La précision est évaluée en comparant les champs théorique et
estimé de mouvement. Nous prenons en compte les notions de distorsion angulaire et
d’amplitude entre le champ estimé et le champ théorique en 3D. Ces statistiques sont
calculées grâce aux critères suivants :
u
(x)
u
(x)
theo
est
AE(x) = arccos
·
kutheo (x)k kuest (x)k QE(x) = kutheo (x) − uest (x)k
(7.1)
(7.2)
ou utheo (x) (resp. uest (x)) est le vecteur de déplacement théorique (resp. estimé) au
point x. Le critère AE intègre l’écart angulaire entre les vecteurs estimés et les vecteurs
théoriques sur l’ensemble de l’image ou d’une région d’intérêt (figure 7.2). Le critère QE
mesure l’amplitude de la différence des deux ensembles de vecteurs sur l’ensemble de
l’image ou d’une région d’intérêt.
1
http ://www.itk.org/
7.3. MÉTHODES D’ÉVALUATION UTILISÉES DANS CET OUVRAGE
137
7.3.2 Evaluation de l’estimation de mouvement dans une séquence
d’images
Nous verrons au chapitre 9, qu’il peut s’avérer intéressant d’évaluer les mouvements
et les déformations tout en prenant en compte la nature temporelle du mouvement. Pour
cela, nous nous appuyons sur la mesure de l’erreur dans le suivi de mouvement de points
particuliers.
Mesure ponctuelle : T RE La mesure T RE (Target Registration Error) exprime une
erreur entre des points correspondants dans le cas d’un recalage entre deux images [Fitzpatrick and West, 2001,Hellier et al., 2003]. Nous proposons son extension à l’estimation
du mouvement dans une séquence d’images.
La mise en place du cadre d’évaluation est la suivante : un ensemble de K marqueurs
anatomiques est sélectionné et étiqueté par un expert médical sur la première image I0
d’une séquence {I0 , I1 , · · · , In } de telle manière qu’ils soient repérables sans ambiguïté
par d’autres experts. Notons pk0 la position du k ime marqueur dans l’image I0 . Le suivi
des amers sélectionnés est ensuite réalisé par plusieurs experts sans que le pointage de
chacun ne soit divulgué de manière à ne pas biaiser les résultats et notamment la variation
inter-opérateurs. Le nombre d’experts participant à l’étude sera noté E. On note qe,k
le
i
ime
k
pointage de l’amer k dans la i image obtenu par l’expert e. La pseudo-référence pi est
obtenue par moyennage de ces différents pointages :
pki =
E
1 X e,k
q .
E e=1 i
(7.3)
Une estimation de la variabilité inter-opérateurs est donnée par la formule :
E
σpki
1 X k
2
(p − qe,k
=
i ) .
E − 1 e=1 i
(7.4)
Nous définissons également rki = ϕ̂i (pk0 ) comme étant l’estimation (par recalage) de
la position de l’amer k à l’instant i (voir Figure 7.3). La mesure T RE pour l’instant i est
définie par :
T REi =
K q
1 X
(pki − rki )2 ,
K k=1
(7.5)
Erreur spatio-temporelle : ST E Nous notons Γkref et Γkest la trajectoire de référence
de l’amer k et son estimée, respectivement, et nous définissons un critère permettant de
quantifier la différence entre ces deux trajectoires sur un intervalle de temps donné [ta ; tb ].
L’erreur spatio-temporelle (ST E) est définie de la manière suivante :
ST Etka ,tb
1
=
tb − ta
Z
tb
ta
dist(Γkref , Γkest )dt
où dist représente ici la distance euclidienne. Soit
(7.6)
CHAPITRE 7. MÉTHODOLOGIE D’ÉVALUATION
138
F IG . 7.3. Description de la trajectoire d’un amer sur une séquence d’images. La contribution en
un instant pour cet amer à valeur de la T RE (7.5) est représentée par la distance en noir.
ST Etka ,tb
1
=
tb − ta
Z
tb
ta
k
xref (t) − xkest (t)2 dt
(7.7)
xref (t) est la position du point de référence k à l’instant t et xest (t) son estimée. Nous
notons que :
– ta = t0 , instant correspondant à l’image I0 (première image de la séquence)
– tb = tn , instant correspondant à l’image In (dernière image de la séquence)
– Pour t = ti , xkref (t) = xkref (ti ) = pki ainsi que xkest (t) = xkest (ti ) = rki
Finalement, en prenant en compte toutes les contributions, nous introduisons
ST Eta ,tb
K
1 X
ST Etka ,tb
=
K k=1
(7.8)
Le chapitre 9 présente la comparaison de plusieurs algorithmes d’estimation de mouvement des structures thoraciques dans un contexte de prise en compte de mouvement en
radiothérapie. Nous verrons notamment comment il est possible d’introduire des informations physiologiques supplémentaires comme la courbe de volume pour la détermination
’continue’ des points estimés de l’équation (7.7).
7.3.3 Evaluation du suivi de mouvement par recalage spatiotemporel
L’évaluation du suivi de mouvement par recalage spatio-temporel s’appuie sur des
séquences d’images de synthèse où la transformation spatio-temporelle est parfaitement
7.3. MÉTHODES D’ÉVALUATION UTILISÉES DANS CET OUVRAGE
139
connue. Nous considérons le cas de l’estimation de mouvement cardiaque dans une séquence d’images par RM 2D et nous nous appuyons sur un modèle analytique de mouvement issu de la littérature. L’intérêt de cette approche est de pouvoir agir à la fois sur les
paramètres de la transformation et les caractéristiques de l’image, notamment le bruit.
7.3.3.1
Séquences de synthèse
Afin de générer des séquences synthétiques de mouvement cardiaque, nous avons développé un outil permettant de déformer une image réelle de référence par une transformation définie analytiquement. Deux cercles concentrique, délimitant le myocarde ventriculaire gauche, sont positionnés sur un image réelle (Fig. 7.4(a)). L’anneau ainsi crée
partitionne l’espace selon une grille régulière G à laquelle la transformation est appliquée
(Fig. 7.4(b)). Les rayons internes et externes de G sont respectivement notés Rint et Rext .
La loi de mouvement appliquée à la zone sélectionnée est inspirée de [Clarysse et al.,
2000] et intègre plusieurs des composantes du mouvement de contraction d’une tranche
de myocarde à mi-hauteur du VG (rotation, torsion, épaississement myocardique, notamment). Elle est adaptée afin d’éviter les discontinuités sur les bords de la grille et pour
obtenir une séquence complète sur un cycle cardiaque.
(a)
(b)
F IG . 7.4. Définition de la zone de déformation sur la première image d’une séquence 2D (instant
télé-diastolique)(a) et superposition d’une grille G permettant d’appliquer un mouvement
réaliste afin d’obtenir une séquence de transformations (b).
Soient (R, θ) les coordonnées d’un point quelconque dans le repère local induit par G.
On note également (R′ , θ′ ) et (x′ ,y ′ ) les coordonnées polaires et cartésiennes de ce point
au cours du mouvement. Le modèle de déformation est défini de la manière suivante :
 q

2
R2 −Rint
2


int

pour Rint ≤ R < Rext −R
g(θ) + Rint
,
 ′
λ(t)
2
q
R =
2 −R2
(7.9)
 R2 − Rext
int
g(θ) pour Rext −R
≤ R < Rext ,
ext

λ(t)
2

 ′
θ = θ + ψ(t) · R + c(t),
140
CHAPITRE 7. MÉTHODOLOGIE D’ÉVALUATION
où Rint et Rext sont respectivement les rayons intérieur et extérieur de la grille pour
lesquelles le mouvement est nul. Les différentes fonctions sont définies de la façon suivante :
k (t)
′
′ e ell
0
R cos θ′
T rx (t)
x
+
(7.10)
·
=
R′ sin θ′
T ry (t)
y′
0
e−kell (t)
2π
× f (t),
360
2π
× f (t),
c(t) = 7.167 ×
360
λ(t) = 1 − 0.2 × f (t)
3π g(θ) = 1 − 0.15 cos θ +
+1
4
ψ(t) = −0.278 ×
et
  1 1 − cos πt
pour 0 ≤ t < Tsys
2
Tsys
f (t) =
 1 1 − cos π(t+Tdia −2Tsys )
pour Tsys ≤ t < Tdia
2
Tdia −Tsys
(7.11)
(7.12)
(7.13)
(7.14)
(7.15)
f (t) est une fonction de pondération qui permet de déterminer l’influence des termes de
rotations et de contraction au cours du temps. Tsys et Tdia sont respectivement les temps
de télé-systole et de télé-diastole. L’équation (7.11) représente la variation temporelle de
la rotation et dépend également de R. L’équation (7.12) est un terme de rotation globale.
L’équation (7.14) permet de contrôler l’amplitude de l’épaississement myocardique suivant l’angle θ. Un pas de résolution temporelle ∆t permet de fixer le nombre de phases
(images) souhaité dans la séquence. Un exemple de séquence est illustrée en Fig.7.5 pour
Tsys = 280ms, Tdia = 840ms et ∆t = 40ms. Notre implantation permet également d’introduire un bruit Gaussien additif afin d’évaluer la robustesse de notre algorithme à ce
type d’artefact. Le bruit est ajouté sur chaque image de manière indépendante de façon
à ce qu’il n’y ait pas de corrélation entre le bruit des différentes images de la séquence.
Sur la Figure 7.6, nous avons représenté l’image de référence de trois séquences pour
trois rapports signal sur bruit (RSB) différents. Les critères AE et QE, introduits en 7.3.1,
peuvent être utilisés afin d’estimer l’erreur de précision et d’en déduire une cartographie
des erreurs commises sur l’ensemble des images de la séquence.
7.3. MÉTHODES D’ÉVALUATION UTILISÉES DANS CET OUVRAGE
(a)
(b)
(c)
(d)
(e)
(f)
141
F IG . 7.5. Construction d’une séquence temporelle synthétique. Le mouvement appliqué correspond au modèle analytique défini par les équations (7.9)-(7.15) avec Tsys = 280ms et Tdia
= 840ms et ∆t = 40ms. Sur la colonne de gauche, le champ de déplacement théorique est
superposé à l’image correspondant à l’instant de référence (télé-diastolique) pour t = 80ms
(a), t = 200ms (c) et t = 280ms (télésystole)(e) par rapport à cet instant de référence. Sur
la colonne de droite, les images déformées correspondantes sont représentées.
CHAPITRE 7. MÉTHODOLOGIE D’ÉVALUATION
142
(a)
(b)
(c)
F IG . 7.6. Images de référence de trois séquences après ajout d’un bruit additif gaussien. (a) RSB
= 49.04dB (σ = 5)(b) RSB = 27.08dB (σ = 10) et (c) RSB =2.99dB (σ = 20).
Chapitre
8
Evaluation des algorithmes d’estimation
spatio-temporelle de mouvement
Sommaire
8.1
8.2
Evaluation du compromis précision / temps de calcul . . .
8.1.1 Résultats . . . . . . . . . . . . . . . . . . . . . . . .
8.1.2 Discussion . . . . . . . . . . . . . . . . . . . . . . .
Evaluation de l’estimation de mouvement spatio-temporelle
8.2.1 Résultats . . . . . . . . . . . . . . . . . . . . . . . .
8.2.2 Discussion . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
143
146
146
149
151
156
Introduction
’ensemble des développements logiciels a été réalisé à partir de la librairie ITK1 . Les
méthodes proposées dans cette librairie sont implantées de manière générique. Afin
d’optimiser l’implantation des méthodes que nous développons, seules les structures de
données (notamment la façon d’itérer sur une image) sont conservées. Le reste a été entièrement re-développé. Les manipulations de matrices et de vecteurs est réalisée grâce à
l’utilisation de la librairie VXL/VNL2 . Dans ce chapitre, nous proposons d’abord d’étudier le compromis entre la précision des champs estimés et le temps de calcul nécessaire
pour l’estimation. La seconde partie de ce chapitre propose une évaluation de l’apport de
l’estimation spatio-temporelle de mouvement par rapport à des estimations séquentielles.
L
8.1 Evaluation du compromis précision / temps de calcul
Pour étudier le compromis entre la précision du champ estimé entre deux instants et
le temps de calcul, nous avons généré 4 paires d’images de manière synthétique selon le
procédé décrit dans la section 7.3.1. Les deux images de chaque paire sont reliées par
1
2
http ://www.itk.org/
http ://vxl.sourceforge.net
143
144
CHAPITRE 8. RÉSULTATS
une transformation non rigide de type spline de plaque mince [Bookstein, 1989]. Deux
paires d’images, T h1 et T h2 , ont été construites à partir d’une image TDM du thorax en
fin d’expiration. Pour ces deux paires, un ensemble de 20 points est tiré aléatoirement
sur la partie centrale du volume réduit au 3/4 de sa taille. Pour chacun de ces points, les
composantes du déplacement sont également choisies aléatoirement
√ sur un intervalle de
±20mm ce qui correspond à un déplacement maximum de 20 3 mm pour chacun des
marqueurs. Selon le principe décrit dans [Sprengel et al., 1996], T h1 est généré avec un
coefficient de lissage λ = 0 ce qui correspond à une interpolation exacte du déplacement
de tous les marqueurs. T h2 est obtenue avec les mêmes marqueurs et les mêmes déplacements mais avec une coefficient λ = 20. Il s’agit cette fois d’une approximation et le
champ synthétique obtenu est plus lisse. Les séquences Co1 et Co2 sont obtenues avec le
même procédé mais à partir d’un volume cardiaque par RM en fin de diastole. Les composantes du déplacement des marqueurs sont cette fois limitées à ±10mm, l’amplitude
du mouvement étant moins importante pour le cœur que pour le thorax. Une illustration
des paires T h1 et Co1 est donnée sur les figures 8.1 et 8.2.
F IG . 8.1. Paire synthétique d’images TDM 3D du thorax pour l’évaluation de l’estimation de
transformations non rigides.
8.1. EVALUATION DU COMPROMIS PRÉCISION / TEMPS DE CALCUL
145
F IG . 8.2. Paire synthétique d’images IRM 3D du cœur pour l’évaluation de l’estimation de transformations non rigides.
146
CHAPITRE 8. RÉSULTATS
8.1.1 Résultats
Pour chacune des données synthétiques, nous avons estimé le champ de déplacement
avec et sans réduction de l’espace d’analyse, selon la méthode proposée en section 4.5.2.1,
pour vérifier si la perte d’information ne perturbe pas la qualité des champs obtenus. Pour
cette étude, la taille des pyramides de transformations NT rans est fixé à 5 et la taille de la
pyramide d’images NT rans à 4. Chaque transformation est exprimée sur une base de fonctions B-Splines cubiques (degré 3) et l’opérateur D1 est utilisé pour calculer la fonction
de coût. Le coefficient α pondérant la régularisation par rapport au critère d’appariement
est fixé à 0.2. Concernant la réduction de l’espace d’analyse, nous savons qu’elle est dépend de l’opérateur D2 et du seuil ici fixé à 10% de l’intensité maximum de la sortie de
l’opérateur D2 . Pour chacune des paires de test, nous estimons le mouvement en utilisant
l’image dans sa totalité, d’une part, et en utilisant une information partielle correspondant
au seuillage de la sortie du filtre D2 , d’autre part. Le tableau 8.1 résume les statistiques
liées à l’écart quadratique (eq. (7.1)) et angulaire (eq. (7.2)) obtenues sur l’ensemble de
l’image entre le champ théorique et le champ estimé. Pour chacune des paires, nous indiquons également le temps de calcul nécessaire pour obtenir chacune des estimations
sachant que les résultats sont obtenus sur la plateforme multiprocesseurs en utilisant 10
des 12 processeurs. Pour discuter les résultats obtenus, nous avons représenté sur la figure
8.3, deux cartographies d’erreurs obtenues sur la paire Co2 . La figure 8.3(a) représente
une coupe 2D du masque obtenu pour réduire l’information sur le dernier niveau de la pyramide des images. La cartographie d’erreur relative à cette coupe obtenue sans réduction
de l’information est illustrée sur la figure 8.3(b). La figure 8.3(c) représente la cartographie correspondante lorsque la réduction de l’espace d’analyse est prise en compte. Enfin
les courbes illustrant l’évolution de la moyenne des erreurs quadratiques en fonction des
différentes échelles de la transformation sont visibles sur la figure 8.4. Sur cette figure,
nous avons représenté la décroissance des erreurs obtenues pour les données T h2 et Co2
avec et sans réduction de l’espace d’analyse.
8.1.2 Discussion
L’ensemble de ces résultats suggère un certain nombre de remarques. Tout d’abord,
si l’on regarde le tableau 8.1, nous constatons que les valeurs obtenues sur l’ensemble
des paires de test suivent la même tendance. La transformation est toujours mieux
estimée lorsque tout le volume est pris en compte cependant, la différence entre les deux
approches n’est jamais très significative. On remarque que l’erreur angulaire est toujours
plus importante mais dans ce cas, la plage d’erreur se situe entre 0 et 180◦ alors que
pour l’erreur quadratique exprimée en mm, la valeur maximum observée est de 9 mm
pour Co1 et de 47 mm pour T h1. Une observation de la région correspondant à cette
forte valeur (47 mm) sur T h1 nous a permis de remarquer que le caractère aléatoire des
déplacements imposés nous a placé dans une configuration très défavorable dont on peut
voir une partie des effets sur l’image 8.1(b) (partie haute du poumon droit). D’une façon
générale, nous remarquons également que les déformations obtenues pour Co1 et T h1
(λ = 0) sont moins bien estimées que pour Co2 et T h2 (λ = 20). Le coefficient λ traduit
le lissage de la déformation imposée. Les fonctions B-Splines cubiques se comportent
mieux lorsque ce champ est lissé. Si la précision des champs estimés n’est que faiblement
réduit pour les deux approches, nous constatons un gain de temps toujours supérieur à 2
8.1. EVALUATION DU COMPROMIS PRÉCISION / TEMPS DE CALCUL
147
TAB . 8.1. Valeurs des critères d’écarts quadratiques (QE en mm) et angulaires (AE en degré)
pour quatre paires de tests. Les résultats de gauche correspondent au cas où les champs de
déplacement sont estimés à partir de la totalité du volume. La partie de droite correspond
au cas où une partie du volume seulement est considérée. Nous indiquons également les
temps de calcul nécessaires pour obtenir ces résultats.
moyenne
écart type
valeur max
valeur min
temps de calcul
Co1
Prise en compte totale du volume Prise en compte partielle du volume
QE
AE
QE
AE
0.90
7.14
1.19
12.90
1.00
8.09
1.56
13.21
6.72
96.85
9.00
109.03
3.7 × 10−4
1.4 × 10−3
5.3 × 10−4
1.3 × 10−3
325 secondes
114 secondes
moyenne
écart type
valeur max
valeur min
temps de calcul
Co2
Prise en compte totale du volume Prise en compte partielle du volume
QE
AE
QE
AE
0.82
6.65
1.05
8.1
0.89
7.52
1.4
10.3
5.9
90.92
7.85
99.31
−4
−4
−4
2.1 × 10
6.7 × 10
1.6 × 10
1.0 × 10−3
323 secondes
119 secondes
moyenne
écart type
valeur max
valeur min
temps de calcul
T h1
Prise en compte totale du volume Prise en compte partielle du volume
QE
AE
QE
AE
3.9
15.7
4.0
16.0
4.2
13.9
4.3
14.0
41.0
177.9
47.1
179.0
4.2 × 10−4
2.5 × 10−3
2.4 × 10−4
9.2 × 10−4
30 mn 13 s
12 mn 24 s
moyenne
écart type
valeur max
valeur min
temps de calcul
T h2
Prise en compte totale du volume Prise en compte partielle du volume
QE
AE
QE
AE
2.62
12.3
2.80
13.01
2.19
11.5
2.30
11.80
15.2
178.7
15.4
177.3
5.6 × 10−4
2.7 × 10−3
4.0 × 10−4
1.1 × 10−3
29 mn 58 s
13 mn 02 s
CHAPITRE 8. RÉSULTATS
148
(a)
(b)
moyenne de l’erreur quadratique (QE)\ sur l’ensemble de l’image (mm)
F IG . 8.3. Coupe 2D de la cartographie de l’écart quadratique entre le champ synthétique de référence et (b) le champ estimé sans réduction de l’espace d’analyse, et (c) avec réduction de
l’espace d’analyse. L’image en (a) représente le masque calculé pour réduire l’information
pour la paire Co2 .
7
Th2 - Espace Entier
Th2 - Espace Partiel
Co2 - Espace Entier
Co2 - Espace Partiel
6
5
4
3
2
1
0
0
1
2
3
4
echelle de transformation
F IG . 8.4. Evolution de la moyenne des erreurs quadratiques en fonction des différentes échelles de
la transformation pour les données T h2 et Co2 avec et sans réduction de l’espace d’analyse
8.2. EVALUATION DE L’ESTIMATION DE MOUVEMENT SPATIO-TEMPORELLE149
lorsque la réduction d’information intervient.
La figure 8.3 nous aide à interpréter la répartition des erreurs due à la prise en compte
partielle de l’information. Nous constatons que les fortes erreurs correspondent aux
régions peu prises en compte dans le masque binaire. Pour les applications visées, ces
régions où l’estimation est moins précise, ont peu d’importance puisqu’elles ne sont pas
exploitées pour décider du bon/mauvais comportement dynamique des organes. De plus,
ce sont ces régions qui viennent, en partie, entacher les résultats présentés dans le tableau
8.1. Pour les régions du volumes qui présentent un intérêt, la précision est quasiment
identique pour un gain de temps notable.
L’analyse de la figure 8.4 confirme ce qui vient d’être dit. Nous remarquons cependant que la différence entre la prise en compte totale et partielle de l’image est légèrement moins importante pour l’image du thorax obtenue par TDM, sans doute parce que le
masque binaire calculé couvre l’image de manière plus uniforme que dans le cas du cœur.
8.2 Evaluation de l’estimation de mouvement spatiotemporelle
Cette évaluation porte sur des séquences 2D. Dans l’ensemble de cette section, les paramètres suivants ont été utilisés : Pour cette étude, nous prenons les paramètres suivants :
–
–
–
–
–
–
taille des pyramides de transformations : NT rans = 5.
taille de la pyramide d’images : NImg = 4.
degré des B-Splines pour la base de fonctions FFD : 3.
opérateur pour la fonction de coût : D1 .
pondération de la régularisation : α = 0.2.
pas de réduction de l’espace d’analyse.
En ce qui concerne la méthode spatio-temporelle, 3 cycles cardiaques par étage de
pyramide sont pris en compte pour la convergence du filtre de Kalman, soit sur cette
séquence, 66 itérations au maximum.
Nous commençons la discussion de l’apport de l’estimation spatio-temporelle de mouvement en proposant une illustration des discontinuités observables lorsque une succession d’estimations de mouvement est réalisée (Figure 8.5). Afin d’obtenir ces trajectoires,
un ensemble de recalages a été effectué dans une séquence réelle. L’image de référence
a été recalée avec chacun des autres instants de la séquence 2D. Nous pouvons constater
que, quelque soit la région considérée (fond de l’image, pour le point de gauche et myocarde pour le point de droite), les trajectoires illustrées présentent une forte discontinuité.
Ces discontinuités montrent bien qu’il n’existe aucune relation entre les différentes estimations. Dans cette section, nous présentons une série de résultats qui montrent l’intérêt
de la méthode d’estimation spatio-temporelle de mouvement.
La proposition concernant l’adaptation de la complexité des trajectoires est toujours en
cours de développement et ne sera pas évaluée dans le cadre de ce mémoire.
150
CHAPITRE 8. RÉSULTATS
F IG . 8.5. Illustration des discontinuités de trajectoires obtenues par estimations séquentielles du
mouvement. Un zoom est porté arbitrairement sur deux points, l’un appartenant au fond de
l’image (à gauche), l’autre appartenant au myocarde. L’évolution des coordonnées x et y
sur l’ensemble du cycle est donnée sur les courbes du bas.
8.2. EVALUATION DE L’ESTIMATION DE MOUVEMENT SPATIO-TEMPORELLE151
8.2.1 Résultats
8.2.1.1
Evaluation sur des données synthétiques
La construction des données synthétiques utilisées est décrite dans la section 7.3.3.1.
Nous notons Seq1, Seq2 et Seq3 les séquences 2D+temps bruitées avec un rapport signal
sur bruit de 49.0dB, 27.1dB et 3.0dB, respectivement. Les critères QE et AE sont intégrés
sur l’ensemble du champ estimé et sur l’ensemble des instants de la séquence. Nous décidons de considérer le champ de vitesse plutôt que le champ de déplacement pour que
le résultat illustre au mieux la cohérence entre les instants de la séquence. Puisque notre
méthode fournit directement le déplacement u(x, t), la vitesse est calculée par l’équation 6.5 qui établit la correspondance entre le déplacement et la vitesse dans un contexte
lagrangien. La figure 8.6 compare les distributions de l’erreur quadratique (QE) sur l’ensemble de la séquence Seq1 obtenues par estimation séquentielle de mouvement (toujours
à partir de l’instant de référence) 8.6(a) et par l’algorithme d’estimation spatio-temporelle
de mouvement 8.6(b).
(a)
(b)
F IG . 8.6. Distribution de l’erreur quadratique (en mm) calculé sur l’ensemble de la séquence Seq1
à partir d’estimations de mouvement séquentielles (a) et de l’estimation spatio-temporelle
de mouvement (b).
La figure 8.7 compare les trajectoires d’un point particulier de la séquence Seq2 (pris
dans le segment inféro-septal du myocarde) obtenus par estimations séquentielles de mouvement et par l’algorithme d’estimation spatio-temporelle proposé à la trajectoire de référence. Nous constatons que la trajectoire estimée par l’algorithme d’estimation spatiotemporelle suit de près la référence avec une légère sous-estimation. La trajectoire issue
de l’estimation séquentielle présente quant à elle des discontinuités franches.
8.2.1.2
Evaluation sur des données réelles
Nous considérons maintenant des séquences réelles à partir desquelles, une évaluation quantitative est plus délicate. Nous comparons la trajectoire d’un point situé dans le
myocarde lorsque le mouvement est estimé par succession de recalages (figure 8.8(a)) et
avec la méthode proposée (figure 8.8(b)). On constate que la continuité de la trajectoire
est bien préservée.
CHAPITRE 8. RÉSULTATS
152
F IG . 8.7. Déplacement d’un point situé dans le myocarde pendant la phase systolique sur la séquence Seq2. Les trajectoires comparées sont la trajectoires de référence, la trajectoire
estimée séquentiellement et la trajectoire issue de l’estimation spatio-temporelle de mouvement.
(a)
(b)
F IG . 8.8. Trajectoire d’un point dans le myocarde estimée par succession d’estimations de mouvement (a) et par la méthode d’estimation spatio-temporelle de mouvement (b).
8.2. EVALUATION DE L’ESTIMATION DE MOUVEMENT SPATIO-TEMPORELLE153
F IG . 8.9. A gauche, différents instants d’une séquence réelle pendant la phase systolique. Dans
l’ordre, les instants 1, 3, 6 et 9 d’une séquence comportant 22 instants et dont l’instant 9
correspond à la télé-systole. A droite, déformation d’une grille régulière pour les instants
correspondants obtenue à partir de la transformation spatio-temporelle estimée.
154
CHAPITRE 8. RÉSULTATS
F IG . 8.10. Champ de déplacement (par rapport à l’instant de référence) pour les deux premiers
instants représentés sur la figure 8.9. A droite est représenté la valeur du jacobien de la
transformation associée (légendes disponibles sur la figure 8.11).
8.2. EVALUATION DE L’ESTIMATION DE MOUVEMENT SPATIO-TEMPORELLE155
F IG . 8.11. Champ de déplacement, à gauche, et jacobien de la transformation ,à droite, pour les
deux derniers instants de la figure 8.9.
156
CHAPITRE 8. RÉSULTATS
8.2.2 Discussion
Concernant la figure 8.8, la trajectoire a été discrétisée afin d’associer une position
particulière pour chacun des instants de la séquence. Cependant les résultats que nous
obtenons assurent une parfaite continuité. La modélisation que nous avons choisie nous
permet de calculer pour tout point de l’espace x et à n’importe quel instant t diverses
informations quantitatives. Positions, vitesses et déformations, entre autres, sont donc accessibles et temporellement cohérentes. Les figures 8.9, 8.10 et 8.11, illustrent cette intéressante propriété. Les tenseurs de déformation dans le myocarde peuvent être estimés
sur l’ensemble du cycle en vue de détecter des anomalies de mouvement du cœur. Sur
la figure 8.11, nous remarquons que l’algorithme est particulièrement sensible et instable
dans les régions homogènes en dehors du cœur. D’un point de vue applicatif, ce phénomène n’est pas pénalisant pour l’étude de la déformation cardiaque. En revanche, il s’agit
là d’une caractéristique des algorithmes de recalage qui ne savent pas comment se comporter dans ces régions homogènes. L’ambiguïté réside dans le fait que l’homogénéité en
termes d’intensité ne traduit pas l’immobilité.
Chapitre
9
Comparaison d’algorithmes sur des
séquences d’images thoraciques TDM
Sommaire
9.1
9.2
9.3
9.4
9.5
9.6
9.7
Introduction . . . . . . . . . . . . . . . . . . . . . . . . .
Le mouvement en radiothérapie . . . . . . . . . . . . . .
Matériel . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Procédure d’évaluation . . . . . . . . . . . . . . . . . . .
9.4.1 Sélection des amers . . . . . . . . . . . . . . . . . .
9.4.2 Evaluation quantitative de la précision des méthodes
9.4.3 Analyse des trajectoires . . . . . . . . . . . . . . .
9.4.4 Méthodes d’estimation de mouvement comparées . .
Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.5.1 Résultats relatifs au critère T RE . . . . . . . . . . .
9.5.2 Résultats relatifs au ST E . . . . . . . . . . . . . .
Discussion . . . . . . . . . . . . . . . . . . . . . . . . . .
9.6.1 Précision des méthodes . . . . . . . . . . . . . . . .
9.6.2 Etude des trajectoires . . . . . . . . . . . . . . . . .
Conclusion partielle . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
157
158
159
160
160
161
163
165
167
167
170
170
173
174
176
9.1 Introduction
C
e chapitre est issu d’un article actuellement en révision pour le journal IEEE Transactions on Medical Imaging sous le titre : A comparison framework for breathing
motion estimation methods from 4D imaging. Cette étude a été menée dans le cadre
d’une collaboration entre deux laboratoires : Creatis et le Liris1 , en partenariat avec le
Centre Léon Bérard2 . Le but de l’étude concerne la mise en place d’une stratégie et de
critères pour évaluer et comparer la précision de différentes méthodes face au problème
1
2
http ://liris.cnrs.fr/
http ://oncora1.lyon.fnclcc.fr/
157
158
CHAPITRE 9. COMPARAISON D’ALGORITHMES
de l’estimation de mouvement de structures thoraciques et du suivi de tumeur sur des
séquences d’images TDM 4D du thorax au cours de la respiration.
Dans le cadre de ma thèse, l’intérêt de cette étude est donc double. Elle permet bien
entendu de mettre en évidence l’apport de la prise en compte du mouvement pendant les
traitements radio-thérapeutiques, mais elle permet également de confronter la méthode
de recalage d’images que nous avons proposée au chapitre 4 avec d’autres algorithmes
destinés à suivre des structures d’intérêt pendant la respiration. Dans ce but, deux autres
approches, également en phase d’évaluation, ont été envisagées. L’une d’entre elles
appartient également à la catégorie des méthodes de recalage d’images tandis que la
seconde repose sur la déformation d’un modèle biomécanique.
Comme nous l’avons vu au chapitre 1, l’estimation de mouvement pour le suivi de tumeurs devient l’un des enjeux majeurs en radiothérapie des poumons en respiration libre.
On pourrait ainsi contrôler l’intensité de la dose délivrée et l’orientation des faisceaux
irradiants en fonction d’une information de mouvement pour réduire au maximum la destruction de cellules saines.
On peut alors se demander si, dans le cas de la respiration, la prise en compte de plusieurs
instants dans une séquence d’images permet de réduire l’erreur faite sur la position de
points précisément identifiés ou si les instants extrêmes suffisent à décrire leur mouvement. En d’autres termes, les déplacements peuvent-ils être considérés comme linéaires
sur l’ensemble du cycle ou y a t-il un intérêt à considérer des trajectoires plus complexes ?
Pour pouvoir répondre à ces questions, nous avons demandé à des experts de sélectionner
des points remarquables selon le principe décrit en 7.3.2. Un ensemble de 500 points a
été sélectionné sur trois séquences 4D TDM dont les caractéristiques sont données dans
le paragraphe 2.4.5. Pour chaque séquence, le pointage de ces amers a été réalisé par
trois experts différents sur 4 images réparties sur la phase d’expiration. L’ensemble de ces
sélections constitue alors une pseudo-référence en vue de répondre à ces questions.
9.2
Le mouvement en radiothérapie
Actuellement en routine clinique, le volume que l’on destine à l’irradiation (volume
cible prévisionnel) résulte d’une succession d’ajout de marges par rapport au contour
initialement tracé par les cliniciens autour de la tumeur. L’une d’entre elles concerne
la prévision de déplacement de la zone tumorale pendant la thérapie et peut parfois
être importante. Zhang et al ont proposé d’introduire le mouvement de la cible dans le
but d’optimiser le traitement en utilisant des champs de déplacement précalculés sur
différents instants de séquences TDM 4D [Zhang et al., 2004]. En demandant au patient
de respirer de manière régulière à l’aide d’un signal affiché, les auteurs cherchent à
réduire l’irradiation de cellules saines. Rietzel et al. [Rietzel et al., 2005a] ont proposé
d’utiliser des volumes contourés sur chaque image d’une séquence préalablement acquise
pour déterminer les trajectoires et les excursions autour des trajectoires des tumeurs. En
utilisant des techniques de recalages non-linéaires, ils tentent de quantifier l’impact du
mouvement respiratoire sur les doses délivrées.
Généralement, pour simuler l’irradiation d’une cible en mouvement, le clinicien
9.3. MATÉRIEL
159
estime l’accumulation des distributions de doses au cours de la thérapie. On note
DDeliv (x, t) la dose délivrée à l’instant t en un point x de l’espace. Considérons maintenant un état de référence t = 0 (correspondant, par exemple, à la fin de l’expiration du
patient) et un point anatomique particulier que l’on notera xana dans sont état de référence et dont la trajectoire peut être décrite par la relation xana (t) = ϕ(xana , t). La dose
délivrée à ce point anatomique à l’instant t est DDeliv (xana (t), t). Sur la durée totale du
traitement, la dose délivrée en chaque point anatomique s’exprime alors par :
DDelivtotal (xana ) =
Z
tf in
DDeliv (xana (t), t) dt
(9.1)
t=0
Nous voyons donc que, pour un volume donné, la dose calculée est proportionnelle
au temps d’irradiation. La dimension temporelle du mouvement doit donc être prise en
considération.
Brock et al. [Brock et al., 2003] ont proposé d’utiliser un modèle géométrique volumique
des poumons dont la déformation non-rigide est assurée par une modélisation par
éléments finis. Le modèle, composé de 6000 tétraèdres, est établi grâce au contourage
d’experts en fin d’expiration. Une carte de déformation est créée pour attirer ce modèle
en fin d’inspiration. La calcul de dose intègre alors la déformation non-rigide des corps
à irradier. Des positions intermédiaires sont utilisées pour pondérer en temps les doses
à appliquer. Plus récemment, Keall et al. [Keall et al., 2005] ont étendu ce concept
à l’utilisation de collimateurs dynamiques dont le principe général est d’adapter la
forme des faisceaux irradiants au cours du temps. La forme des contours est définie
sur une séquence d’images par recalage non rigide entre une image de référence en fin
d’inspiration et les autres images de la séquence.
Pour résumer, dans toutes les études récentes concernant la radiothérapie des poumons, il apparaît que le suivi du mouvement respiratoire devient fondamental et mérite
d’être validé en vue d’être appliqué dans les années à venir en routine clinique. Ce suivi
fait directement appel à la notion de temps qui doit être prise en compte lors de l’évaluation. Les critères et les outils d’évaluation introduits en 7.3.2 s’inscrivent dans ce contexte
et sont décrits plus en détail ici. Avant de débuter l’évaluation et la comparaison de notre
méthode, nous verrons comment nous introduisons une information temporelle basée,
dans ce cas précis, sur un signal respiratoire.
9.3 Matériel
Les caractéristiques des 3 séquences d’images de test utilisées sont décrites au chapitre 2.4.5. Nous noterons les séquences S1 S2 et S3 . Les patients qui caractérisent ces
acquisitions sont tous atteints de cancers bronchiques non à petites cellules (voir 1.3.3).
Pour chacun de ces patients, les tumeurs sont situées dans la partie basse du poumon droit
et les volumes de ces tumeurs sont de 160, 165 et 37 cm3 , respectivement. Les déplacements maximum observés près du diaphragme sont de 23 mm, 25 mm et 17 mm pour les
séquences S1 , S2 et S3 , respectivement.
Dans cette étude, nous nous focalisons sur la phase d’expiration du cycle respiratoire
en prenant en compte 4 images tridimensionnelles. Deux d’entre elles correspondent aux
CHAPITRE 9. COMPARAISON D’ALGORITHMES
160
instants de fin d’inspiration (I0 ) et de fin d’expiration (I3 ). Les deux autres images correspondent à des instants intermédiaires choisis parmi 4. Nous les noterons I1 et I2 . Les
autres images n’ont pas été retenues car elles présentaient trop d’artefacts qui risquaient de
perturber les résultats. Ces artefacts apparaissent généralement sur certaines coupes près
du diaphragme lorsque le patient respire trop rapidement ou lors d’un manque de précision
pendant l’acquisition du signal respiratoire (voir Fig. 9.1(a)). D’autres types d’artefacts,
moins fréquents, peuvent être dus aux mouvements du patient lors de l’acquisition (voir
Fig. 9.1(b)).
Il est important de noter, et c’est un point clé de cette étude, qu’une image de la
séquence pour différents patients peut correspondre à des phases physiologiques différentes. En d’autres termes, la résolution temporelle n’est pas régulière et l’intervalle de
temps entre deux images consécutives peut varier d’un patient à l’autre. Cette différence
provient du fait que chaque patient à sa propre façon de respirer. Cette irrégularité de
la résolution temporelle intervient également sur une même séquence où le temps passé
entre deux images est fonction de la courbe de respiration associée. C’est l’une des caractéristiques des séquences 4D TDM inhérente à l’algorithme de tri des projections. Nous
devons tenir compte de cet aspect lors de l’évaluation des algorithmes.
Les volumes pulmonaires indiqués dans le Tableau 9.1 ont été estimés à partir d’algorithme de segmentation automatique dont les différentes étapes sont décrites dans [Sarrut
et al., 2005].
TAB . 9.1. Volumes pulmonaires (en cm3 ) pour les trois séquences de tests. Le pourcentage exprimé
entre parenthèses correspond à la variation de volume par rapport au volume de référence
sur l’image I0 .
XX
XXX Séquence
XX
XX X
Image
XX
I0
I1
I2
I3
9.4
S1
S2
S3
5181 (100%)
5004 (50%)
4692 (44%)
4315 (0%)
3214 (100%)
2981 (49%)
2880 (27%)
2755 (0%)
3121 (100%)
2897 (47%)
2797 (24%)
2696 (0%)
Procédure d’évaluation
Cette section, concerne la mise en place des outils destinés à l’évaluation et à la
comparaison de méthodes d’estimation de mouvement du thorax respirant à partir d’un
nombre limité de phases. Nous y décrivons notamment comment nous prenons en compte
un modèle de respiration pour introduire le temps dans le critère que nous proposons équation (7.7). Nous décrivons aussi succinctement les deux autres méthodes avec lesquelles
nous comparons nos résultats.
9.4.1 Sélection des amers
Nous avons demandé à trois experts de suivre le protocole mis en place en section
7.3.2 pour la détermination d’un bronze standard. L’expert chargé d’extraire et d’étique-
9.4. PROCÉDURE D’ÉVALUATION
(a)
161
(b)
F IG . 9.1. Exemple d’artefacts dans les images 4D TDM. (a) Plusieurs coupes étaient manquantes
à cet instant précis de la reconstruction. (b) Structures floues à cause de mouvements du
patient pendant l’acquisition.
ter les points sur l’image de référence avait pour consigne de choisir des points facilement
identifiables : carène (séparation entre la bronche principale gauche et la bronche principale droite), nodules calcifiés, jonction culminale lingulaire, subdivisions d’artères pulmonaires, embranchements de faisceaux, etc. (voir Fig. 7.1). De plus, les amers devaient
être répartis le plus uniformément possible à l’intérieur des poumons de manière à ne pas
biaiser les résultats obtenus. Enfin, le nombre minimum d’amers devait être de 20. Il en
résulte une sélection de 27 points sur S1 , de 41 sur S2 et de 56 sur S3 . Les Eq. (7.3) et
(7.4) ont été utilisées pour définir notre référence.
9.4.2 Evaluation quantitative de la précision des méthodes
La précision des méthodes sera appréciée quantitativement grâce au critère T RE (7.5)
qui nous renseigne sur la pertinence des estimations en comparant les points déplacés avec
les pseudo-références des experts. Les dispersions des erreurs seront représentées grâce à
l’utilisation de boites à moustaches [Tukey, 1977](box and whiskers plots en anglais) qui
permettent de représenter schématiquement la distribution d’une variable. Une telle représentation permet de mettre en évidence les valeurs médianes et moyennes d’un échantillon, son étendue et éventuellement certains points aberrants. De plus, des diagrammes
de Bland-Altman [Bland and Altman, 1986] seront utilisés comme complément pour comparer les résultats obtenus par les différentes méthodes. Le principe du diagramme de
Bland-Altman est de représenter le degré de ressemblance entre deux méthodes. L’axe des
abscisses correspond à la moyenne des résultats obtenus pour chacune des deux méthodes
à comparer. En ordonnées sont représentées les différences entre les deux méthodes. Une
telle représentation constitue donc un outil très intéressant pour identifier visuellement
des situations pour lesquelles les résultats entre deux méthodes sont discordants.
Enfin, des t-tests de Student pour séries appariées seront réalisés pour vérifier si deux
162
CHAPITRE 9. COMPARAISON D’ALGORITHMES
(a)
(b)
(c)
F IG . 9.2. Volumes pulmonaires estimés pour les différentes images des séquences S1 (a), S2 (b) et
S3 (c). La position relative de ces images est déterminée à partir de la modélisation du signal respiratoire décrit dans la section 9.4.3.1. On remarque que les instants intermédiaires
ne correspondent pas à la même phase physiologique pour les trois séquences.
9.4. PROCÉDURE D’ÉVALUATION
163
méthodes se comportent de manière équivalente. Le choix d’utiliser des séries appariées
se justifie par le fait que la mesure de l’équivalence de deux estimateurs différents n’a de
sens que si les points sont considérés indépendamment.
9.4.3 Analyse des trajectoires
Le critère T RE ne nous renseigne que pour des instants ponctuels de la phase expiratoire. Pour prendre en compte le profil des mouvements, nous avons introduit le critère
ST E (7.8) permettant d’analyser l’ensemble des trajectoires des différents marqueurs. Ce
critère nous permet d’évaluer l’apport des méthodes d’estimation de mouvement sur les
incertitudes de position de cellules tumorales en radiothérapie. Nous allons voir comment
intégrer un signal respiratoire à ce critère particulier.
9.4.3.1
Modélisation du cycle respiratoire
Plusieurs modèles globaux de la respiration ont été proposés dans la littérature. Nous
avons choisi d’utiliser celui proposé par Lujan et al. [Lujan et al., 1999] (Eq. (9.2)) pour
déterminer la courbe dynamique de respiration. Cette description est réalisée grâce à une
fonction périodique mais asymétrique qui reflète bien la différence de comportement en
fin d’inspiration et en fin d’expiration. Généralement une phase plus longue est observée
en fin de respiration. Dans l’Eq. (9.2), Vexp est le volume en fin d’expiration et b correspond au volume courant (voir Fig. 1.6). Ainsi, Vexp + b représente le volume en fin d’inspiration. τ représente la période du cycle respiratoire et n est un paramètre permettant de
modifier la forme générale de la courbe représentée sur la Fig. 9.3. Plus ce paramètre est
élevé plus la courbe s’aplatit. θ est un terme de phase.
π
f (t) = Vexp + b cos2n ( t − θ).
(9.2)
τ
George et al. [George et al., 2005] ont étudié ce modèle à partir de 331 courbes
obtenues grâce à un spiromètre sur 4 patients différents atteints de cancers du poumon.
Une valeur de n = 2 reflète bien la corrélation entre les signaux réels et le modèle obtenu.
Dans la suite, nous utilisons n = 2, ϕ = 0 et τ = 2. L’amplitude du mouvement est
dépendante du patient.
Ne disposant pas du signal respiratoire acquis pendant les phases de reconstruction
des séquences d’images, les paramètres du modèle sont déterminés grâce aux valeurs
disponibles dans le tableau 9.1.
9.4.3.2
Erreur spatio-temporelle
Le calcul pratique du critère STE (7.7) est réalisé par discrétisation de l’intégrale en
une série de cent échantillons sur l’intervalle [ta , tb ]. Dans la suite, nous prendrons ta
= 0 et tb = 1 où 0 correspond à l’instant de fin d’inspiration et 1 correspond à l’instant
de fin d’expiration. La discrétisation est réalisée de telle manière que l’écart de temps
entre deux échantillons soit identique. On peut ainsi dire que l’échantillonnage est temporellement régulier. Si l’on représente la trajectoire d’un amer avec les échantillons, on
observera un rapprochement des échantillons en fin d’expiration et d’inspiration. Grâce
164
CHAPITRE 9. COMPARAISON D’ALGORITHMES
F IG . 9.3. Modélisation du cycle respiratoire proposé par [Lujan et al., 1999].
aux courbes de la Figure 9.2 et aux valeurs du Tableau 9.1, nous pouvons déterminer la
position des images intermédiaires sur la phase d’expiration par ti = f −1 (Vi ). Trois intervalles de respiration dont les tailles sont déterminées à partir du positionnement des
instants intermédiaires sur l’ensemble de la séquence (voir Figure 9.2) sont obtenus pour
échantillonner la trajectoire.
Si la ST E prend la valeur x, cela signifie que, en moyenne, sur la phase expiratoire, le fait
d’utiliser une trajectoire estimée Γkest pour un amer k au lieu de la trajectoire de référence
Γkref conduit à une différence moyenne de x mm.
9.4.3.3
Trajectoires directes et indirectes
Afin de clarifier les différentes notions que nous allons utiliser par la suite, nous
introduisons les acronymes suivants dont la signification est illustrée en Figure 9.4.
– La TDR correspond à la Trajectoire Directe de Référence. Il s’agit de la trajectoire
rectiligne que l’on obtient lorsque l’on relie directement les points issus des pointages des experts en début et en fin d’expiration.
– La TDE correspond à la Trajectoire Directe Estimée. Il s’agit de la trajectoire rectiligne que l’on obtient lorsque l’on relie directement la position d’un amer pointé
sur l’image en début d’expiration et la position estimée de ce point par une méthode
quelconque en fin d’expiration.
– La TIR correspond à la Trajectoire Indirecte de Référence. Il s’agit de la trajectoire
non-rectiligne obtenue en reliant les points issus des pointages experts sur les quatre
9.4. PROCÉDURE D’ÉVALUATION
165
images de la séquence.
– La TIE correspond à la Trajectoire Indirecte Estimée. Il s’agit de la trajectoire nonrectiligne obtenue en reliant les points issus des estimations successives obtenues
sur toutes les images de la séquence par une méthode quelconque.
TIR
TIE
TDR
TDE
F IG . 9.4. Illustration des acronymes utilisés pour différencier les trajectoires considérées par la
suite.
L’introduction d’une mesure d’erreur de type ST E a pour objectif d’évaluer l’impact
de la prise en compte du mouvement dans le suivi de tumeurs par rapport à la situation
actuelle où le mouvement n’est pas ou mal (marges d’erreur) pris en compte. On peut
ainsi comparer la ST E pour la TIR d’un marqueur particulier et la ST E dans le cas où
l’on considère la marqueur immobile c’est à dire la cas où le mouvement est complètement ignoré. Une autre situation est celle où l’on considère l’hypothèse de la linéarité des
trajectoires entre les instants extrêmes. Dans ce cas, il nous faut comparer le mesure de
ST E pour la TIR et la TDR/TDE. Ces différentes situations seront étudiées en section
9.5 à l’aide de diagrammes de Bland-Altman et de tests statistiques.
9.4.4 Méthodes d’estimation de mouvement comparées
Dans cette section, nous décrivons brièvement les méthodes que nous comparons
en faisant référence aux articles récents correspondants. Nous considérons en définitive
quatre différentes méthodes d’estimation de mouvement. Nous noterons m1 la méthode
de recalage paramétrique décrite au chapitre 4. La méthode m2 , inspirée de l’algorithme
des démons, est également une méthode de recalage mais de type non-paramétrique. Enfin, m3 est une méthode basée sur la déformation d’un modèle biomécanique. Finalement,
les résultats sont également comparés au cas extrême où aucun mouvement n’est estimé
(ϕ = Id). Cette pseudo-méthode sera notée m0 .
9.4.4.1
Notre méthode : m1
Pour cette étude, nous prenons les paramètres suivants :
– taille des pyramides de transformations : NT rans = 5.
– taille de la pyramide d’images : NImg = 4.
– degré des B-Splines pour la base de fonction FFD :3.
– opérateur pour la fonction de coût : D1 .
– pondération de la régularisation : α = 0.2.
– pas de réduction d’espace d’analyse.
CHAPITRE 9. COMPARAISON D’ALGORITHMES
166
9.4.4.2
Flux optique optimisé : m2
Cette méthode a été développée par V. Boldea dans le cadre sa thèse [Boldea, 2006].
Elle est basée sur l’approche proposée dans [Thirion, 1998]. Elle est décrite en détail
dans [Sarrut et al., 2006]. Elle procède en deux étapes :
1. Pré-traitement des données pour segmenter les différentes structures.
2. Estimation dense de mouvement en chaque pixel.
L’estimation finale de mouvement non-rigide est assurée par une optimisation de type
descente de gradient du critère SSD (version non-paramétrique de l’équation (4.34)) et une
régularisation gaussienne [Thirion, 1998]. Une approximation numérique de la dérivée
∇L(x, u) du critère est donnée dans [Pennec et al., 1999] :
∇L(x, u) =
I1 (x) − I2 (x + u(x))
∇I1 (x)
||∇I1 (x)||2 + α2 (I1 (x) − I2 (x + u(x)))2
(9.3)
A chaque itération, le déplacement de chaque composante est limité par α (qui représente le vecteur maximum de déplacement). Le processus itératif est donné par l’équation :
ui+1 (x) = Gσ (ui (x) + ∇L(x, ui ))
(9.4)
où ui représente le champ de déplacement à l’itération i et Gσ (.) est un noyau gaussien
de variance σ > 0. Le filtrage gaussien est réalisé selon [Deriche, 1993].
9.4.4.3
Méthode par modèle déformable biomécanique : m3
Cette méthode est développée par P.F. Villard dans le cadre de sa thèse. Une description est développée dans [Villard et al., 2005]. Le but de cette méthode est de simuler de
manière réaliste le comportement des poumons par une approche de type élément finis.
Les lois mécaniques utilisées reposent sur des hypothèses anatomiques et physiologiques.
Cette méthode peut être décomposée en deux étapes principales :
1. La construction d’un modèle mécanique dépendant de la séquence de tests.
2. La déformation de ce modèle à partir de caractéristiques issues de l’image.
La construction du modèle spécifique au patient repose sur la construction d’une
surface maillée [Lorensen and Cline, 1987] puis d’un volume maillé [Villard et al., 2004]
à partir d’un masque binaire obtenu sur l’image de référence de la séquence à traiter. Une
fois ce maillage créé, il s’agit de lui appliquer un champ de forces superficielles (calculé
sur l’ensemble des images de la séquence) de manière à ce qu’il s’adapte aux interfaces
poumons/thorax des images suivantes sous certaines contraintes. La Fig. 9.5 illustre ce
procédé.
La déformation du modèle conduit à l’estimation d’une déformation entre deux
images. Elle repose sur le formalisme des éléments finis. La résolution du problème est
assurée par l’algorithme de Newton-Raphson.
9.5. RÉSULTATS
167
F IG . 9.5. Illustration des conditions de bord imposées par le mouvement du diaphragme et de la
cage thoracique. Figure issue de [Villard et al., 2005].
9.5 Résultats
Dans cette section, nous décrivons les résultats obtenus pour les critères T RE
(7.5) et ST E (7.7) sur les trois séquences S1 , S2 et S3 avec chacune des trois méthodes
proposées. Des diagrammes de Bland-Altman, des représentations en boites à moustaches
et des analyses par t-tests de Student sont utilisés pour interpréter ces résultats qui seront
discutés dans la section 9.6.
Pour les méthodes m1 et m2 , chaque champ de déformation obtenu entre deux instants est utilisé comme point de départ pour l’estimation du champ suivant, permettant
ainsi d’initialiser l’algorithme avec des paramètres plus proches de la solution. Les tests
concernant notre méthode sont réalisés sur une machine parallèle (SGI SMP NUMA 12
processeurs). Chaque processeur est cadencé à 1.5 GHz. Le tout fonctionne sous un système UNIX. Le temps de calcul ne dépend que de la taille de l’image et le niveau de transformation n’a pas d’influence sur les performances. En utilisant 10 processeurs, les temps
de calculs ont varié entre 10 minutes pour S1 dont la taille des images est de 386×256×86
et 14 minutes pour S2 dont la taille des images est de 511 × 316 × 115.
Les résultats de la méthode m2 ont été obtenus sur un PC cadencé à 2.8 GHz. Le recalage
demande environ 10 minutes. Là aussi, ce temps dépend de la résolution de l’image. Enfin, la méthode m3 a été testée sur un PC à 3.2 GHz Les temps de calculs sont d’environ
2 heures pour un maillage composé de 7000 sommets et de 20000 cellules.
Nous avons rencontré quelques difficultés à appliquer la méthode m3 sur la séquence S3
car la tumeur est en contact direct avec le diaphragme. La segmentation des poumons
devient alors très délicate et conduit à des résultats non exploitables.
9.5.1 Résultats relatifs au critère T RE
La Fig. 9.6 représente la distribution des erreurs T RE par la représentation de boites à
moustaches pour chacune des trois séquences (une ligne par séquence). Les trois colonnes
correspondent aux transformations ϕ1 , ϕ2 et ϕ3 , respectivement. Chaque diagramme
montre les statistiques associées à chacune des quatre méthodes.
Le Tableau 9.2 synthétise les valeurs de T RE pour toutes les méthodes. Une analyse
CHAPITRE 9. COMPARAISON D’ALGORITHMES
168
(a) S1 / I1
(b) S1 / I2
(c) S1 / I3
(d) S2 / I1
(e) S2 / I2
(f) S2 / I3
(g) S3 / I1
(h) S3 / I2
(i) S3 / I3
F IG . 9.6. Boites à moustaches des T RE (en mm) obtenus pour les différentes méthodes. La première ligne correspond aux résultats obtenus sur la séquence S1 , la seconde pour la séquence S2 et la troisième pour la séquence S3 . La première colonne représente les résultats
en estimant le mouvement entre I0 et I1 , la seconde colonne entre I0 et I2 et la troisième
colonne entre I0 et I3 . Chaque boite représente les résultats obtenus pour les quatre méthodes. La méthode m0 représente l’erreur lorsque qu’aucune déformation n’est appliquée
(ϕ = Id). m1 est la méthode décrite au chapitre 4, m2 est la méthode inspirée de l’algorithme des démons et m3 est la méthode biomécanique.
9.5. RÉSULTATS
169
TAB . 9.2. T RE pour chaque méthode et chaque transformation. Les valeurs sont exprimées en
millimètre. Pour chaque cas, la première valeur traduit l’erreur moyenne. Les deux valeurs
entre parenthèses correspondent au premier et au troisième quartile, respectivement.
Méthode
m0
m1
m2
m3
Méthode
m0
m1
m2
m3
Méthode
m0
m1
m2
m3
ϕ1
5.1 (1.8 / 7.4)
2.7 (1.1 / 4.0)
3.0 (1.2 / 3.5)
5.2 (3.2 / 6.3)
ϕ1
3.9 (2.5 / 4.5)
2.2 (1.0 / 3.0)
1.8 (1.1 / 2.2)
5.2 (3.8 / 6.2)
ϕ1
2.5 (1.7 / 2.9)
1.7 (1.0 / 2.4)
2.2 (1.4 / 2.8)
–
S1
ϕ2
8.4 (4.3 / 10.8)
1.8 (1.1 / 2.2)
2.0 (1.0 / 2.4)
6.7 (5.5 / 8.2)
S2
ϕ2
5.8 (3.1 / 7.7)
2.5 (1.2 / 3.4)
1.8 (1.0 / 1.9)
5.5 (4.2 / 6.9)
S3
ϕ2
3.3 (2.2 / 3.8)
1.4 (0.9 / 1.7)
1.2 (0.6 / 1.7)
–
ϕ3
11.4 (7.6 / 15.1)
1.7 (1.0 / 2.3)
1.7 (0.9 / 2.5)
7.8 (5.6 / 9.6)
ϕ3
6.8 (3.5 / 9.2)
1.8 (0.5 / 2.2)
1.6 (1.8 / 2.0)
6.4 (4.6 / 7.6)
ϕ3
6.4 (4.8 / 7.7)
1.4 (0.9 / 1.8)
1.3 (0.9 / 1.5)
–
de Bland-Altman a été réalisée pour chaque paire de méthodes afin de les comparer entre
elles. Seules deux figures représentatives sont données (Fig. 9.7) sachant que les autres
suivent la même tendance. La Fig. 9.7(a) compare la méthode m3 à la méthode de référence que constitue le suivi manuel des marqueurs. Sur cette figure, seul le déplacement
dans l’axe cranio-caudal (axe tête-pieds) pour la transformation ϕ3 , sur la séquence S1 est
considéré. La Fig. 9.7(b) représente la même information pour méthode m1 comparée à
la référence manuelle. Dans ce cas précis, plus l’abscisse associée aux points représentés
est grande, plus le déplacement estimé est grand. Parallèlement, une valeur importante de
l’ordonnée signifie que la différence entre les deux méthodes est importante.
Pour chaque diagramme, 95% de la différence entre deux méthodes se situe entre les
deux limites repérées par une ligne en trait fort. Plus précisément cette limite correspond
à un intervalle de d − 1.96s et d + 1.96s, où d est la valeur moyenne de cette différence et
s son écart type.
Le Tableau 9.3 donne les résultats des t-tests de Student entre chaque paire de méthodes. Ces résultats permettent de mettre en évidence des différences statistiques significatives entre les distributions de valeurs de T RE obtenues pour les deux méthodes comparées. La p-valeur est une probabilité qui mesure le degré de confiance que l’on peut
accorder à l’hypothèse nulle H0 . Cette p-valeur est comparée à la valeur α qui constitue
le niveau limite de l’acceptation d’hypothèse. Dans notre cas, α est fixé à 0.05. L’ hypothèse H0 que nous utilisons est la suivante : "les deux méthodes sont équivalentes au sens
du critère T RE". Plus la p-valeur est faible, plus les chances de se tromper en rejetant
l’hypothèse H0 sont faibles. La différence entre les deux méthodes peut alors être considérée comme significative. En revanche, lorsque la p-valeur est supérieure à α les méthodes
CHAPITRE 9. COMPARAISON D’ALGORITHMES
170
sont considérées comme statistiquement proches, le rapprochement étant d’autant plus net
que la p-valeur est élevée.
a) Comparaison des déplacements
cranio-caudaux entre la pseudo-référence
issue des pointages des experts contre les
estimations obtenues grâce à m3 .
b) Comparaison des déplacements
cranio-caudaux entre la pseudo-référence
issue des pointages des experts contre les
estimations obtenues grâce à m1 .
F IG . 9.7. Exemple de représentations de Bland-Altman permettant de comparer les méthodes
entre elles. Résultats obtenus sur la séquence S1 et la transformation ϕ3 .
9.5.2 Résultats relatifs au ST E
La Figure 9.8 représente la longueur des TIR (sélection manuelle) en fonction de la
distance à l’apex des poumons sur la séquence S1 . Cette figure illustre le fait que les
déplacements les plus importants se situent près du diaphragme et que, dans ce cas précis,
l’amplitude du mouvement à estimer est variable selon la position dans le thorax (de 3 mm
environ près de l’apex à 25 mm près du diaphragme).
Le Tableau 9.4 donne les statistiques liées au critère ST E entre les TIR et les TIE
obtenues pour chaque méthode. Il permet de mettre en évidence les écarts commis par
chaque méthode dans l’estimation temporelle de mouvement par rapport à la référence
des experts. Les deux tableaux suivants (9.4 et 9.5) évaluent les différences entre les trajectoires directes et indirectes afin de tester la validité de l’hypothèse de linéarité et l’intérêt de prendre en compte des instants intermédiaires. Les t-tests de Student donnés dans
le Tableau 9.6 comparent les TDE et les TIE pour chacune des méthodes.
9.6
Discussion
Le cadre d’évaluation proposé dans ce chapitre nous permet d’apporter des éléments
de comparaison de différentes méthodes d’estimation de mouvement à partir de données
4D. Le nombre limité de séquences étudiées ne nous permet cependant pas de prétendre
donner des conclusions définitives mais des tendances.
9.6. DISCUSSION
171
TAB . 9.3. T-tests de Student appliqués à chaque paire de méthodes. Ici, nous avons considéré tous
les résultats en même temps (toutes les séquences, tous les instants, et tous les marqueurs).
Si les p-valeurs sont supérieures à 0.1, cela signifie que la différence n’est pas statistiquement significative et le symbole attribué dans la dernière case est ’=’. Si p < 0.1, la
différence est non négligeable (symboles ’+’ ou ’++’) et si p < 0.0001, alors la différence
devient très significative (symbole ’+ + +’).
S1
S2
S3
Méthodes comparées p-valeur La différence est-elle significative ?
m0 vs m1
<0.0001
+++
m0 vs m2
<0.0001
+++
m0 vs m3
0.00001
++
m1 vs m2
0.42
=
m1 vs m3
<0.0001
+++
m2 vs m3
<0.0001
+++
Méthodes comparées p-valeur La différence est-elle significative ?
m0 vs m1
<0.0001
+++
m0 vs m2
<0.0001
+++
m0 vs m3
0.5067
=
m1 vs m2
0.007
+
m1 vs m3
<0.0001
+++
m2 vs m3
<0.0001
+++
Méthodes comparées p-valeur La différence est-elle significative ?
m0 vs m1
<0.0001
+++
m0 vs m2
<0.0001
+++
m1 vs m2
0.34
=
F IG . 9.8. Distribution de la longueur des trajectoires indirectes obtenues par sélection des experts
en fonction de la distance des marqueurs par rapport à l’apex sur la séquence S1 .
CHAPITRE 9. COMPARAISON D’ALGORITHMES
172
TAB . 9.4. Valeurs de la métrique ST E (moyenne en mm, ± écart type), pour les trois séquences
entre les TIR et les TIE pour chaque méthode. Les valeurs maximum de la ST E sont
données sur les trois dernières colonnes.
Méthodes
m0
m1
m2
m3
S1
6.8 ± 3.6
2.2 ± 1.2
2.3 ± 1.5
5.6 ± 1.9
ST E
S2
4.2 ± 2.7
1.7 ± 0.9
1.3 ± 0.9
4.3 ± 1.4
S3
3.2 ± 1.7
1.17 ± 0.4
1.17 ± 0.5
–
Valeur max. de la ST E
S1
S2
S3
14.6 11.6
9.37
5.1 4.4
2.61
6.5 5.7
3.35
10.4 8.7
–
TAB . 9.5. Pour les trois séquences, ST E (moyenne en mm, ± écart type) entre les TIR et les
TDR d’une part (ligne 1) et les TDE d’autre part. Tous les marqueurs sont pris en compte
pour fournir ces valeurs par séquence.
Méthodes comparées
TIR vs. TDR
TIR vs. TDE (m1 )
TIR vs. TDE (m2 )
TIR vs. TDE (m3 )
S1
2.9 ± 1.7
3.3 ± 1.8
3.4 ± 2.0
5.6 ± 2.4
S2
1.2 ± 0.7
1.7 ± 1.1
1.7 ± 1.2
3.9 ± 1.8
S3
0.6 ± 0.2
1.0 ± 0.5
1.0 ± 0.4
–
TAB . 9.6. Tests statistiques réalisés pour comparer les TDE et les TIE pour chacune des méthodes. Tous les marqueurs sont pris en compte pour fournir ces valeurs par séquences.
S1
S2
S3
Méthodes comparées p-valeur La différence est-elle significative ?
TDE (m1 ) vs TIE (m1 ) <0.0001
+++
TDE (m2 ) vs TIE (m2 ) <0.0001
+++
TDE (m3 ) vs TIE (m3 )
0.63
=
Méthodes comparées p-valeur La différence est-elle significative ?
TDE (m1 ) vs TIE (m1 )
0.05
+
TDE (m2 ) vs TIE (m2 ) <0.0001
+++
TDE (m3 ) vs TIE (m3 ) 0.0039
++
Méthodes comparées p-valeur La différence est-elle significative ?
TDE (m1 ) vs TIE (m1 ) 0.0005
+++
TDE (m2 ) vs TIE (m2 ) <0.0001
+++
9.6. DISCUSSION
173
9.6.1 Précision des méthodes
La précision des trois méthodes comparées (m1 , m2 et m3 ) est d’abord évaluée grâce
au critère T RE (section 9.6.1) L’erreur globale issue du critère T RE (pour l’ensemble
des marqueurs et l’ensemble des images des séquences) est à mettre en relation avec
la taille des voxels des images testées. En ce qui concerne notre méthode (m1 ) et celle
basée sur l’algorithme des démons (m2 ), la moyenne des erreurs (Tableau 9.2) est de
2.1 mm et 2.0 mm, respectivement. Ces résultats sont en accord avec la taille des pixels
(0.9 × 0.9 × 2.5 mm) et l’incertitude liée à la sélection des experts (1.2 mm). L’analyse
des diagrammes de Bland-Altman (Figure 9.7), indique que les déplacements estimés
sont généralement plus faible que la référence désignée par les experts. En effet, la
différence entre les deux méthodes est toujours légèrement inférieure à 0 (le pointage des
experts étant considéré comme méthode de référence).
Une explication de ce phénomène peut être que les régularisations intégrées dans chacune
de ces méthodes limitent les déformations trop importantes et conduisent donc à une
légère sous-estimation de l’amplitude des déplacements.
En ce qui concerne la méthode basée sur le modèle biomécanique (m3 ), plusieurs
facteurs peuvent expliquer les résultats obtenus.
1. Les images testées ne contiennent pas toujours l’intégralité des structures pulmonaires ce qui pénalise l’extraction du masque binaire permettant la construction du
maillage volumique initial. Celui-ci est alors complété et extrapolé de manière arbitraire.
2. Pour limiter le temps de calcul, seul un maillage grossier a été pris en compte (taille
approximative des éléments du maillage volumique : S1 = 24 × 12 × 12mm3 et
S2 = 10 × 10 × 10mm3 ).
3. Les amers ont été définis dans des zones présentant de forts gradients (repères facilement interprétables par les experts) ce qui signifie qu’ils correspondent à des
régions présentant des propriétés physiques très hétérogènes. Ceci pénalise d’autant
plus le comportement du modèle biomécanique basé justement sur des propriétés
d’homogénéité des milieux étudiés.
Malgré tout, nous observons sur la Fig. 9.6 que l’erreur moyenne est en deçà de la
résolution du maillage.
Les diagrammes de Bland-Altman (Fig. 9.7) nous permettent de détecter des marqueurs spécifiques pour lesquels les pointages fournis par les experts n’étaient pas en
accord. Ces points peuvent être considérés comme aberrants. Après discussion avec les
experts, ils ont été supprimés de la liste des points à comparer.
On constate une légère différence entre les résultats obtenus par m1 et m2 pour
les séquences de test S1 et S2 (voir Tab. 9.2). Une explication à cette remarque peut
être donnée en considérant le modèle de transformation que nous utilisons. La méthode m2 permet d’obtenir un champ de déplacement où un vecteur de mouvement
est attribué en chaque voxel de l’image. C’est une caractéristique importante des
méthodes non-paramétriques. La précision ne dépend donc pas de la région d’intérêt
considérée. En revanche, pour notre méthode, le champ de mouvement est exprimé par
174
CHAPITRE 9. COMPARAISON D’ALGORITHMES
un modèle continu pour lequel l’influence de chaque paramètre dépend de la région
d’intérêt et de la taille de la grille utilisée. Sur S1 la taille des images est de 386 × 256.
La taille finale de la grille de déformation utilisée a été fixée à 19 par dimension.
Ceci correspond approximativement à un point de contrôle tous les 10 voxels. La
différence morphologique entre les patients correspondant aux séquences S1 et S2
entraîne la prise en compte d’une ROI légèrement plus grande sur les images de la
séquence S2 (taille : 511 × 316 pixels). L’espace entre chaque point de contrôle devient
alors plus important (14 voxels). Ceci peut expliquer ces légères différences de précisions.
Au regard du Tableau 9.2, les méthodes m1 et m2 peuvent être considérées comme
fournissant des résultats similaires. Cette remarque est confirmée par les tests de Student
résumés dans le Tableau 9.3 (surtout pour S1 et S3 ).
L’ensemble des résultats concernant la méthode m3 conduit à approfondir les notions de
condition de contact pour les modèles à Eléments Finis. Nous observons que les conditions de contact ne sont pas proprement établies. En particulier, les conditions de non pénétration ne sont pas respectées pour certains nœuds du maillage. Ceci explique pourquoi,
dans certains cas, la différence peut paraître importante. La précision (ou l’imprécision)
du contact est de l’ordre de 5 mm, nous comprenons pourquoi la différence est quasiment
constante pour l’ensemble des instants, et pourquoi la méthode m0 semble donner parfois de meilleurs résultats. Le développement d’un modèle biomécanique réaliste est très
complexe dans le sens où il faut prendre en compte les multiples phénomènes dynamiques
qui interagissent et trouver les bons modèles. Ceci est d’autant plus vrai pour le système
respiratoire.
9.6.2 Etude des trajectoires
9.6.2.1
La métrique ST E pour l’évaluation des méthodes
D’une manière générale l’évaluation spatio-temporelle des méthodes est réalisée en
comparant les TIR et les TIE. D’après le Tableau 9.4, les trajectoires étudiées montrent
que la distance moyenne entre les TIR et les TIE est d’environ 2 mm avec les méthodes
m1 et m2 et d’environ 5 mm avec la méthode m3 , conséquence direct de l’accumulation
des erreurs d’estimation sur l’ensemble des images d’une séquence. En pratique, il est
rare de constater que de fortes erreurs mises en évidence par le T RE puissent conduire
à de faibles valeurs de ST E. La différence entre les méthodes m1 et m2 peut être
considérée comme statistiquement négligeable. Sur la séquence S1 , avec les méthodes
m1 et m2 , le critère ST E (Tab. 9.4) est légèrement plus élevé que la moyenne des trois
valeurs de T RE sur cette même séquence (moyennes de 2.0 et 2.2 mm, voir Tableau. 9.2
sur l’ensemble des instants comparés à une moyenne de 2.2 et 2.3 mm, voir Tab. 9.2).
Les méthodes m1 et m2 conduisent à des résultats comparables, la valeur maximale du
ST E est un peu plus faible pour la méthode m1 .
Il ne s’agit pas, cependant, de tirer des conclusions trop générales car seulement trois
cas ont été considérés dans cette étude. En revanche, il est intéressant de noter que la
prise en compte du temps pour l’évaluation de l’estimation de mouvement sur l’ensemble
d’un séquence peut modifier l’erreur globale associée à une trajectoire : certains résultats
semblent être similaires pour S1 et S2 au regard du critère T RE alors que le critère ST E
9.6. DISCUSSION
175
permet de mettre en évidence quelques différences (voir ci-dessous).
9.6.2.2
La métrique ST E pour l’évaluation de l’apport du mouvement en radiothérapie
Le tableau 9.4 illustre, au travers de trois séquences, l’importance de la prise en compte
du mouvement. Les erreurs identifiées avec ST E entre les TIR et TIE sont considérablement réduites avec les méthodes m1 et m2 par rapport à la situation où le mouvement
n’est pas du tout pris en compte (ST E de l’ordre de 2 mm pour m1 et m2 dans S1 contre
presque 7 mm pour m0 , les valeurs maximales atteignant jusqu’à 14 mm !). Les méthodes
m1 et m2 compensent correctement le mouvement avec des valeurs de ST E de l’ordre
de 2 mm pour les 3 séquences. Une seconde question concerne l’intérêt de prendre en
compte des instants intermédiaires pour l’estimation de mouvement. Pour cela, nous disposons des statistiques du critère ST E entre les TIR et TDR d’une part et les TIR et TDE
d’autre part (tableau 9.5). Ici, l’écart observé dépend des séquences. Supérieur ou égal
à 3 mm pour S1 , il est proche de 1.5 mm pour S2 et inférieur ou égal au mm pour S3 .
Donc, il apparaît que selon les séquences, et les patients, la prise en compte d’instants
intermédiaires peut ou non avoir un impact. Comme il est difficile d’évaluer par avance
la dynamique respiratoire d’un patient, on ne peut que dire, qu’idéalement, il est préférable de disposer d’instants intermédiaires en vue d’une estimation de mouvement la plus
précise possible.
Nous remarquons également que les méthodes se comportent différemment face
à ce problème. Bien que les méthodes m1 et m2 conduisent à des ST E similaires, le
Tableau 9.6 montre que la différence entre les TDE et les TIE est significative avec la
méthode m2 alors que, pour la méthode m1 , cette différence n’est significative que pour
la séquence S1 et S3 . Il semble donc que les trajectoires estimées avec la méthode m1
soient plus linéaires que celles estimées avec la méthode m2 .
Tous les critères statistiques ont été calculés globalement sur l’ensemble de l’image.
Cependant le mouvement est loin d’être homogène sur l’ensemble du cycle. En particulier,
les trajectoires sont nettement plus longues et plus linéaires dans les régions proches du
diaphragme que près de l’apex (Fig. 9.8). Pour les études futures, l’utilisation de tels
critères peut conduire à des analyses précises et quantitatives du comportement in vivo
des poumons au cours de la respiration et notamment la mise en place de modèles de
mouvement adaptés aux différentes régions du thorax (partie haute/basse des poumons,
régions tumorales).
9.6.2.3
Comparaison de la T RE et de la ST E
La mesure T RE est une méthode intuitive d’évaluation du suivi de mouvement.
Cependant, elle ne tient compte que partiellement de la position des amers au cours de
la séquence. Ceci malgré le fait que les structures anatomiques en mouvement suivent
des lois physiologiques bien précises. La mesure ST E est un critère qui intègre le temps
dans cette évaluation afin de conclure de manière plus précise sur les performances
d’algorithmes de suivi de mouvement. L’évaluation devient ainsi plus cohérente avec la
176
CHAPITRE 9. COMPARAISON D’ALGORITHMES
notion de trajectoire ou de chemin emprunté.
Les mesures T RE et ST E apportent des informations complémentaires. Des méthodes qui semblent être identiques avec la métrique T RE (voir Tab. 9.3, séquence S2 ,
ligne 4), peuvent montrer certaines différences lorsque nous comparons la trajectoire complète des amers (voir Tableau 9.6, séquence S2 , ligne 1 et 2). Si nous considérons les deux
métriques conjointement, nous pouvons conclure que les trajectoires issues de l’estimation avec m1 sont plus linéaires que celles estimées avec m2 .
Ce contexte d’évaluation pourraient être utilisés pour étudier l’hystérésis observable
pendant le cycle respiratoire (les trajectoires empruntées lors de l’inspiration sont différentes de celles empruntées pendant l’expiration), cependant pour mener à bien cette étude
il faut sélectionner la position des points sur l’ensemble de la séquence respiratoire.
9.7
Conclusion partielle
Dans ce chapitre, nous avons proposé une stratégie pour l’évaluation de la précision
d’estimateurs de mouvement de structures thoraciques à partir de séquences 4D TDM.
Cette étude est intéressante au moins à deux niveaux :
1. Elle nous a permis de confronter, dans le cadre d’une collaboration entre trois laboratoires Lyonnais, les performances de notre algorithme face à d’autres méthodes
développées récemment.
2. Elle nous a permis de confirmer l’importance du mouvement respiratoire et de quantifier l’apport de la prise en compte de plusieurs images pour l’estimation des mouvements thoraciques.
La procédure d’évaluation est basée sur l’intervention d’experts qui, dans notre cas
ont accepté de repérer plus de 500 points repartis sur 4 phases de 3 séquences. Le critère
d’erreur spatio-temporelle de trajectoire (ST E) permet de prendre en compte l’aspect
temporel des déplacements en exploitant un modèle de la respiration. Il permet de faire
ressortir certaines propriétés des estimateurs (linéarité des trajectoires estimées) et de
souligner des différences entre deux estimateurs là où la simple considération du T RE
conduit à des conclusions identiques. Cependant, il ne faut pas perdre de vue que ces deux
informations sont complémentaires pour interpréter la précision des méthodes évaluées.
Le critère spatio-temporel ST E proposé permet d’évaluer la trajectoire de points anatomiques au cours du cycle respiratoire. Cette information est particulièrement intéressante
dans le cadre de la radiothérapie où des modèles 4D doivent être individualisés à partir
de données 4D CT et utilisés pour l’estimation de dépôts de dose durant les irradiations
thérapeutiques d’organes en mouvement.
Le cadre d’évaluation proposé a été mis en œuvre pour la comparaison de méthodes
différentes d’estimation de mouvement.
Les résultats de l’évaluation montrent que notre méthode et la méthode basée sur
l’algorithme des démons conduisent à des résultats similaires en terme de précision d’estimation. La précision obtenue est inférieure à la résolution spatiale des images. En ce qui
concerne l’approche basée sur une déformation biomécanique par éléments finis, l’erreur
9.7. CONCLUSION PARTIELLE
177
estimée est cohérente avec la résolution des maillages utilisés et ne peut être comparée directement avec la taille des voxels. Cependant, nous sommes convaincus que ces
approches (iconiques et basées sur un modèle biomécanique) sont complémentaires et
pourront être couplées par la suite.
Dans ce chapitre, les résultats obtenus sont issus de trois séquences 4D sur la moitié
d’un cycle respiratoire. Cette étude doit être approfondie en incluant d’autres séquences
et en prenant en compte l’ensemble du cycle respiratoire. Enfin, des contraintes physiques
sur les déformations et une régularisation temporelle peuvent être prises en compte pour
augmenter les performances des algorithmes proposés.
Remerciements
Nous remercions Greg Sharp, Steve Jiang et Noah Choi du Massachusetts General
Hospital à Boston pour nous avoir fourni, par l’intermédiaire du Centre Léon Bérard (D.
Sarrut), les données TDM 4D à partir desquelles nous avons réalisé nos expérimentations.
Nous remercions également Line Claude et toutes les autres personnes qui ont passé beaucoup de temps à sélectionner les marqueurs dans les images.
178
CHAPITRE 9. COMPARAISON D’ALGORITHMES
179
Conclusion et Perspectives
Bilan des contributions
Ce travail de thèse a été pour moi l’occasion d’aborder un certain nombre de problèmes liés à la mise en correspondance d’images médicales cardiaques et thoraciques.
Le recalage d’images a été exploité dans notre contexte comme un moyen d’estimer
des transformations locales non linéaires afin de caractériser l’évolution d’organes
comme le cœur et le thorax durant leur cycle physiologique. Tout au long de ce travail,
nous nous sommes efforcés d’intégrer les hypothèses et contraintes introduites par les
deux contextes applicatifs tout en proposant un cadre méthodologique général pour
l’estimation spatio-temporelle du mouvement et le suivi de structures déformables dans
des séquences d’images.
Concernant la méthode de recalage entre deux images, nous nous sommes basé sur un
modèle de déformation paramétrique de formes libres exprimée dans une base de fonctions B-Splines. Il nous permet de prendre en compte le caractère semi-local des transformations impliquées dans les phénomènes étudiés. La volonté d’introduire des contraintes
spatio-temporelles de déformations, nous a incité à privilégier une approche paramétrique.
L’approche de recalage repose sur la prise en compte d’une double pyramide. La première
permet de gérer la hiérarchie de la décomposition du modèle de transformation alors que
la seconde est une représentation multi-résolution des images à recaler. L’ensemble est
ordonnancé selon le choix de l’utilisateur. Une de nos contributions dans la méthode de
recalage sans a priori concerne l’exploitation d’un filtre détecteur de ruptures. La sortie
de ce filtre traduit la stationnarité locale de l’intensité des pixels. Trois différents critères
sont proposés pour la mise en correspondance des images. Le premier est uniquement basé
sur l’intensité des voxels, le second est un critère chargé de mettre en correspondance les
zones stationnaires d’intensité et s’appuie sur le filtre détecteur de ruptures. Le dernier
critère est un critère vectoriel combinant ces deux informations. Le filtre a également été
exploité pour réduire notablement les temps de calcul. Nous avons en effet proposé de
réduire l’espace d’analyse en fonction des informations fournies par le filtre sachant qu’il
nous renseigne sur la localisation des régions de l’image qui ont potentiellement une influence sur l’évolution des paramètres de la transformation. Enfin, notre algorithme a été
parallélisé pour palier l’un des inconvénients des méthodes paramétriques de recalage :
des temps de calculs élevés en 3D.
La suite de nos contributions concernent plus spécifiquement l’estimation du mouvement
181
182
CHAPITRE 9. COMPARAISON D’ALGORITHMES
et de l’évolution des structures cardiaques en IRM. Dans le cadre d’une collaboration avec
le VTT, Tampere et la laboratoire BME à Helsinki, Finlande, nous avons contribué à la
construction d’un modèle statistique de forme dynamique. L’intérêt de cette contribution
est lié au nombre d’examens utilisés pour la construction du modèle (15) et la prise en
compte à la fois des données en petit axe et en grand axe. Ce modèle reflète la variabilité de la forme des structures cardiaques sur un cycle dans la base d’images des 15 cas
normaux. Il a été utilisé dans le cadre de notre application cardiaque pour contraindre la
méthode de recalage afin de compenser deux effets indésirables. Le premier de ces effets est lié à la dérive observable lorsqu’une succession de recalages 3D est réalisée. Le
second concerne l’anisotropie de résolution intrinsèque aux techniques d’acquisitions en
cine-IRM cardiaque. L’information a priori fournit par le modèle permet de limiter ces
effets lorsque l’ensemble de la séquence est analysée. Cela permet d’obtenir, en plus de
l’information de mouvement, un suivi des différentes structures du cœur sur l’ensemble
de la séquence par transport d’atlas. L’approche par cascade de recalage ne permet cependant pas de garantir une continuité et une cohérence des estimations sur l’ensemble
de la séquence et suivant l’axe temporel. C’est là, l’intérêt de notre dernière contribution.
Nous proposons en effet dans le dernier chapitre méthodologique de combiner l’algorithme de recalage et un filtre de Kalman permettant de prédire et de filtrer les paramètres
d’un modèle dynamique à partir des résultats obtenus sur l’ensemble de la séquence. Pour
cela, nous avons introduit un modèle de mouvement spatio-temporel basé sur l’extension à l’axe temporel du modèle de déformation de forme libre. L’idée de base consiste à
considérer non plus des points de contrôle mais des fonctions de contrôle pour analyser
le mouvement sur l’ensemble d’une séquence. Ce modèle garantit la continuité et la périodicité des mouvements estimés. L’ensemble des paramètres est prédit et filtré dans le
cadre méthodologique du filtre de Kalman afin que l’estimation spatio-temporelle finale
repose sur la contribution de tous les instants de la séquence. Afin de limiter le nombre de
paramètres aux endroits qui ne le justifient pas, nous proposons d’adapter localement la
complexité des trajectoires en fonction de l’intensité de la déformation. Cette proposition
est en cours de d’implantation.
Pour finir, un apport également important dans le cadre de ce travail est la mise en place
d’un contexte d’évaluation permettant d’évaluer l’apport du recalage et de comparer différentes techniques de recalage sur l’ensemble d’une séquence dans un contexte de prise
en compte du mouvement respiratoire dans le traitement de tumeurs pulmonaires par radiothérapie.
Perspectives méthodologiques
Compensation de l’anisotropie de résolution
Dans le cadre spécifique de l’estimation du mouvement cardiaque, les données
fournies par les imageurs par RM souffrent toujours d’une forte anisotropie de la
résolution spatiale. L’empilement des coupes acquises et surtout la génération de volumes
isotropes par interpolation ne résolvent que partiellement les problèmes dus à un espacement entre coupes généralement beaucoup plus élevé que la résolution dans le plan de
coupe. Il s’agit donc d’un problème qu’il faut considérer afin d’améliorer les traitements
9.7. CONCLUSION PARTIELLE
183
réalisés sur ce type d’image, que ce soit pour l’estimation de mouvement ou pour la
segmentation. Une solution envisagée consiste à prendre en compte conjointement les
données en petit axe et les données en grand axe comme c’est le cas dans [Lötjönen et al.,
2004] dans le cadre de la segmentation des différentes structures du cœur. Cependant
cette perspective soulève la question de la masse de donnée sans cesse croissante à
prendre en compte pour améliorer les techniques actuelles et qui constitue une limite
pour les ordinateurs courants. Nous reviendrons sur ce point. L’imagerie TDM souffre
moins de ce problème d’anisotropie et l’estimation de mouvement obtenue entre deux
images 3D est cohérente suivant les trois dimensions.
Combinaison de deux processus physiologiques/ prise en compte des discontinuités
Tout au long de cette thèse nous avons orienté nos choix et nos développements
méthodologiques de manière à considérer soit le mouvement cardiaque soit le mouvement respiratoire. Une orientation possible concerne l’estimation conjointe des
mouvements engendrés par ces deux systèmes. Certains auteurs ont proposé des modèles
comportementaux pour tenir compte du glissement dû à la présence du liquide pleural
observable aux interfaces cœur/poumons et poumons/cage thoracique [Kaye et al., 1997].
Cette étude peut être intéressante pour mieux comprendre in vivo le comportement
et le type de mouvements observables à ces interfaces. Actuellement, les techniques
d’acquisition ne permettent pas encore d’obtenir des images permettant une telle étude,
cependant des modèles géométriques dynamiques incluant à la fois la respiration et le
cycle cardiaque sont à l’étude en vue de ce type de simulation.
Prise en compte de la causalité pour le suivi de forme
Au cours de nos travaux, nous n’avons pas discuté de l’adaptation de la contrainte de
déformation C (équation (5.14)) issue du modèle dynamique de cœur en fonction des
résultats obtenus aux instants précédents. Considérons en effet le résultat d’une déformation à l’instant j. Le modèle permet d’identifier les N sujets les plus proches du résultat
obtenu. Une solution pour tenir compte de cette information consiste à ne prendre en
compte que ces N individus au lieu de l’ensemble des sujets pour construire la variation
de forme à l’instant suivant. Cela revient à considérer une probabilité conditionnelle
p(X i (t) = xi (t)|t − 1) au lieu de p(X i (t) = xi (t)) dans l’équation (5.10).
Enrichissement par d’autres modalités d’imagerie cardiaque
L’instantiation du modèle dynamique du cœur est basé sur l’analyse exclusive
de séquences d’images en cine-IRM. La segmentation de l’ensemble des images de
chaque séquence ne permet pas d’assurer que les trajectoires établies suivent parfaitement
le mouvement réel des différentes structures. Nous sommes confronté au problème d’ouverture bien connu des méthodes d’estimation de mouvement. La composante normale
à la surface des structures peut être correctement estimée, en revanche l’estimation de
la composante tangentielle, particulièrement importante dans l’étude du mouvement
184
CHAPITRE 9. COMPARAISON D’ALGORITHMES
cardiaque (mouvement de torsion), n’est pas garantie. Ce modèle gagnerait énormément
à être enrichi d’informations issues d’images par RM de marquage tissulaire.
Réduction du temps de calcul par méthodes adaptatives
Le recalage déformable d’images volumiques implique la mobilisation d’un grand
nombre de paramètres. L’espace mémoire nécessaire n’est pas critique dans ce cas mais
il peut le devenir dans le cas du modèle spatio-temporel. Un effort spécifique doit être
réalisé pour réduire encore les temps de calcul et diminuer le nombre de paramètres
sans pour autant pénaliser la qualité du recalage. La grille de déformation que nous
utilisons est parfaitement uniforme sur l’ensemble du domaine. Pour certaines régions
où la dynamique est importante, il est possible d’améliorer la précision en raffinant
localement la grille de déformation [Hellier et al., 2001]. Cette adaptation est facilement
transposable à notre algorithme et constitue une alternative encore plus efficace au
modèle multi-échelle considéré dans nos travaux.
Cela nous amène à faire une distinction plus nette entre l’adaptation spatiale du modèle
de déformation et l’adaptation temporelle de la complexité locale des trajectoires.
Pour l’instant, l’adaptation des trajectoires ne peut se faire que sur un ensemble de
points uniformément distribués de la grille de déformation. Cette perspective nous
permet d’envisager conjointement l’adaptation spatiale et temporelle du modèle. Le gain
obtenu en terme de paramètres peut alors devenir très significatif. Il s’agit d’une étape
indispensable pour que nous puissions utiliser le modèle spatio-temporel en 3D+temps
ce qui demeure pour l’instant difficilement envisageable sur des ordinateurs standards où
l’espace mémoire est limité.
Amélioration de l’estimation de mouvement spatio-temporelle
Des améliorations sont envisageables à ce niveau lorsque l’on considère plus en
détail le filtrage de Kalman des paramètres du modèle spatio-temporel. Des techniques
de lissage sur l’ensemble de la séquence peuvent être préférées aux techniques de
prédiction/filtrage. En particulier, la technique de lissage à point fixe (fixed-point smoothing en anglais) est bien adaptée à notre modèle d’état considéré comme stationnaire.
Parallèlement à cela, on peut envisager de parcourir la séquence à l’endroit (forward) et
à l’envers (backward) et de confronter les résultats afin d’améliorer la pertinence de la
transformation estimée [Meyer et al., 1996].
Le cadre général des équations d’états que nous avons proposé n’est pas entièrement exploité. Notamment, la relation spatiale entre les points de contrôle n’a pas été considérée
dans le filtrage de l’état. Certaines relations pourront être introduites par la suite grâce à
la souplesse apportée par l’utilisation de matrices blocs.
Combinaison du modèle géométrique du cœur et du filtrage spatio-temporel de
Kalman
L’un de mes plus grands regrets dans le cadre de mes travaux de thèse est de
n’avoir pas eu le temps d’approfondir la combinaison entre l’algorithme d’estimation
spatio-temporelle de mouvement et le modèle dynamique que nous avons crée dans le
9.7. CONCLUSION PARTIELLE
185
cadre de notre collaboration avec la Finlande. Nous sommes convaincus qu’en combinant
ces deux modèles nous pouvons obtenir une méthode très intéressante pour à la fois
obtenir une estimation de mouvement et une segmentation temporellement cohérentes
sur l’ensemble de la séquence. Une possibilité pour combiner ces deux approches peut
consister à décomposer les trajectoires des pseudo-marqueurs (voir section 5.3.1) de la
même manière que pour les points de contrôle. Il s’agirait alors de ne plus considérer les
trajectoires des points de contrôle de la grille de déformation dans le vecteur d’état, mais
celles des pseudo-marqueurs pour lesquels nous possédons des informations statistiques
très intéressantes. Pour chacun de ces points particuliers, nous disposons en effet d’une
trajectoire moyenne décomposable sur une base de fonctions harmoniques et d’une
variation non-gaussienne autour de cette trajectoire qui pourra servir à modéliser le bruit
d’état de manière non-stationnaire. En stockant ces trajectoires dans le vecteur d’état, cela
nous ramène au cadre général des techniques de filtrage optimal et plus particulièrement
des techniques de filtrage polynomial.
Perspectives applicatives
Validation de la méthode d’estimation de mouvement spatio-temporel cardiaque
Tout d’abord, une évaluation plus consistante de la méthode spatio-temporelle
mise en place pour l’application cardiaque doit être mise en oeuvre. Nous envisageons
d’éprouver notre technique pour la détection de cas pathologiques par une étude des
tenseurs de déformations engendrés par les mouvements estimés. La continuité du modèle
assure une grande cohérence temporelle des estimations et les tenseurs de déformations
résultants sont alors pleinement exploitables pour détecter les zones présentant des
anomalies de mouvement. Nous n’avons pas encore eu la possibilité de tester la méthode
d’estimation de mouvement spatio-temporel avec des données IRM marquées. Il s’agit
bien entendu d’une perspective très intéressante envisagée à court terme.
Reconstruction d’images compensée par l’information de mouvement en imagerie
thoracique
Une fois la méthode adaptée pour une estimation 3D+temps du mouvement, il
sera possible de considérer les trajectoires et le suivi de tumeurs dans des images TDM.
Il deviendra alors intéressant d’étudier l’hystérésis des trajectoires et d’évaluer l’impact
du mouvement des tumeurs dans des simulations de dépôt de dose sur l’ensemble du
cycle respiratoire. Les trajectoires obtenues à partir de quelques instants de la séquence
pourraient aussi être exploitées pour améliorer la reconstruction d’images en TDM
dynamique.
186
CHAPITRE 9. COMPARAISON D’ALGORITHMES
Annexes
187
Annexe
A
La Tomodensitométrie à rayons X
L
a Tomodensitométrie (TDM), dénommée Computerized Tomography (CT) en anglais,
est une technique d’imagerie qui utilise la physique des rayons X. Littéralement le
terme tomographie signifie reconstruction de coupes. La TDM se démarque de la radiographie conventionnelle par l’acquisition d’un grand nombre de projections autour d’un
même objet. L’ensemble de ces projections servent ensuite à la reconstruction d’objets
tridimensionnels afin de mettre en évidence des tumeurs, des infections ou des hémorragies. Elle permet également de localiser avec précision un organe par rapport à un autre
et de guider des ponctions d’organes profonds (biopsies) évitant ainsi des interventions
chirurgicales. Il s’agit d’une imagerie essentiellement anatomique.
A.1 Principe Physique
La tomographie à rayons X repose sur le parcours de rayons X émis par une source
à travers l’objet étudié. Les rayons X ont été découverts par Wilhelm Röntgen en 1895,
ce qui lui value le premier prix Nobel de physique. La radiographie utilise le fait que tout
faisceau de rayons X traversant un objet subit une atténuation. Cette atténuation est directement reliée aux propriétés physiques du matériau traversé et notamment le coefficient
d’atténuation linéique µ. L’absorption des rayons X par la matière est décrite par la loi de
Beer-Lambert :
Iout = I0 e−Lµ
pour un milieu homogène
R
− µ(x)dx
Iout = I0 e
pour un milieu hétérogène
(A.1)
(A.2)
où I0 représente l’intensité du faisceau entrant, Iout , l’intensité du faisceau sortant et
L, la longueur de l’objet suivant la direction considérée. Cette relation établit que chaque
élément contribue à l’atténuation du faisceau. L’effet de l’atténuation est directement reliée à la longueur parcourue dans ce milieu (Fig. A.1). Pour réaliser une radiographie, on
utilise une source émettrice de rayons X et une plaque photosensible située de l’autre côté
de l’objet que l’on désire étudier.
189
ANNEXE A. LA TOMODENSITOMÉTRIE À RAYONS X
190
I0
µ1
µ2
µ0
µ1
µ3
Iout
F IG . A.1. Passage d’un rayon X dans un milieu hétérogène
A.2
Formation des Images
Nous décrivons sommairement les principales étapes de la reconstruction tomographique afin de mettre en évidence les difficultés liées à l’imagerie d’objets mobiles
(section 2.4). Dans ce qui suit, nous supposons que la géométrie d’acquisition est de type
parallèle, ce qui constitue un cas idéal qui n’est pas celui de la réalité. La manipulation de
géométries réalistes (géométrie en éventail ou géométrie conique) nécessite l’utilisation
de transformations géométriques particulières qui ne seront pas développées ici.
La TDM repose sur un ensemble de projections recueillies grâce à un capteur numérique et acquises lors de la rotation de l’ensemble source-capteur autour du patient.
Le capteur est composé d’un ensemble de petits détecteurs (actuellement de 800 à 4800)
alignés dans un anneau placé autour du patient (voir Fig. 2.7). Ces détecteurs captent
les rayons atténués et déterminent donc la densité des structures traversées. L’ensemble
de l’information est stockée puis traitée. La distribution tridimensionnelle de la fonction
d’atténuation de l’objet à reconstruire est déterminée numériquement en tant que solution
d’un problème inverse.
Le fondement théorique de la reconstruction d’images en TDM a été établi, bien avant son
apparition, par Radon en 1917 dont un théorème montre la possibilité de reconstruire un
objet volumique à partir de la totalité de ses projections. En 2D, la transformée de Radon
a pour expression :
Z
Rf (θ, p) =
f (M )dM
(A.3)
M∈D(θ,p)
La valeur de Rf (θ, p) représente l’intégrale de la fonction d’atténuation de l’objet f
sur la droite de projection D(θ, p) (Fig. A.2). M est le vecteur représentant les coordonnées géométriques de chaque élément de matière. Pour un angle de rotation donné θ, la
fonction Rf (θ, p) = Rfθ (p) représente la contribution en chaque abscisse p des rayons
atténués. En pratique, il n’est pas possible d’obtenir toutes les projections nécessaires à
la reconstruction exacte de l’objet. Les acquisitions sont obtenues pour un ensemble fini
de positions, sur l’intervalle [0, π], de l’arc portant la source X et les détecteurs. Des opérations de filtrage des données et diverses stratégies sont mises en œuvre pour parvenir à
produire une image numérique correspondant à une coupe de l’objet étudié.
Il existe une bibliographie extrêmement riche concernant les méthodes de reconstruc-
A.2. FORMATION DES IMAGES
191
y
f(M)
θ
D(θ ,p)
x
p
Récepteur
F IG . A.2. Objet f (M ) plongé dans le scanner et sa projection suivant l’angle θ
tions en tomographie. La plupart des méthodes sont adaptées à la reconstruction d’objets
statiques puisqu’elles reposent sur l’hypothèse très forte que la particule M d’atténuation linéique µ occupe la même position géométrique durant l’ensemble des acquisitions.
Mais que se passe t-il lorsque l’objet à imager est animé d’un mouvement comme dans
le cas du thorax respirant ou du cœur battant ? Si l’objet évolue, les données obtenues sur
un demi-tour ou un tour deviennent inconsistantes, comme s’il s’agissait d’objets différents. On constate ainsi l’apparition d’artefacts de mouvement qui se caractérisent par des
flous localisés sur les régions animées, comme le montre la Fig. 2.2. Sur cette illustration,
l’ensemble des projections a été obtenu durant le blocage volontaire de la respiration, ce
qui explique que l’interface entre les poumons et les autres structures apparaît de manière
précise. En revanche, le mouvement cardiaque n’a pas été pris en compte. L’ensemble
des projections ont été obtenues pour des états différents du cœur entraînant un flou sur
l’image reconstruite. Ce phénomène est mis en évidence par la zone entourée de rouge
dans la figure A.2. Ce type d’artefact peut dissimuler des éléments importants de l’image
et conduire à de mauvaises interprétations. La problématique de prise en compte du mouvement durant l’acquisition ne se limite pas au domaine cardiaque mais on la rencontre
pour l’imagerie de toute structure anatomique mobile ou évoluant au cours du temps. C’est
la cas notamment pour le suivi des structures pulmonaires au cour de la respiration dans
le cadre d’une intervention chirurgicale ou d’un traitement par rayonnements ionisants.
192
ANNEXE A. LA TOMODENSITOMÉTRIE À RAYONS X
Annexe
B
L’Imagerie par Résonance Magnétique
L
’Imagerie par Résonance Magnétique (IRM) est une technique d’imagerie tomographique capable de produire des images de l’intérieur d’un objet en exploitant les
propriétés magnétiques de la matière. Ces images peuvent mettre en évidence des caractéristiques anatomiques, physiques et chimiques de l’objet étudié. Cette partie est
consacrée à la description des principes physiques à la base de l’IRM et à la formation des images. La connaissance de ces principes fondamentaux permet de comprendre
les notions abordées à la section 2.3 et en particulier les techniques de synchronisation
pour l’imagerie d’organes en mouvement. Pour plus de détails, nous invitons le lecteur
à consulter par exemple [Liang and Lauterbur, 2000] ou l’adresse internet suivante :
http ://www.cis.rit.edu/htbooks/mri/
B.1 Fondements Physiques
La compréhension de l’IRM passe dans un premier temps par la compréhension des
principes de la Résonance Magnétique Nucléaire (RMN). Le principe de la RMN, étudiée
pour la première fois en 1946 par Purcell et Bloch, établit le comportement de noyaux des
atomes de la matière sous l’effet d’un champ magnétique.
Considérons l’atome d’hydrogène, abondamment présent dans le corps humain sous
forme de molécules d’eau. Son noyau est composé d’un proton de charge +e, de masse
m et caractérisé par une propriété quantique intrinsèque appelée Spin pouvant adopter
deux états d’énergie possible (±1/2). Le spin est généralement associé à un mouvement
de rotation de moment angulaire J (Figure B.1(a)) et de moment magnétique µ tel que :
µ = γJ où γ est le rapport gyromagnétique du proton.
Placés dans un champ magnétique statique B0 , les noyaux atomiques s’orientent selon
l’axe de ce champ et précessent1 autour de celui-ci (voir Figure B.1(b)). La fréquence
angulaire de Larmor,
ω0 = γ kB0 k
1
(B.1)
La précession est le changement graduel d’orientation de l’axe de rotation d’un objet quand un couple
lui est appliqué
193
ANNEXE B. L’IMAGERIE PAR RÉSONANCE MAGNÉTIQUE
194
caractérise ce mouvement de précession et la fréquence de résonance excitatrice des différents protons plongés dans le champ B0 .
J
z
B0
µ
y
x
(a)
(b)
F IG . B.1. a) Mouvement de rotation d’un nucléon autour du moment angulaire J appelé spin. b)
Mouvement de précession d’un noyau atomique autour de l’axe du champ B0 .
Parmi tous les protons soumis à B0 , certains s’alignent selon ce champ de manière
parallèle (Sud-Nord) et d’autre de manière anti-parallèle (Nord-Sud). Ces deux états correspondent à des niveaux discrets d’énergie différents Ep et Ea . Le protons se répartissent
sur ces deux niveaux selon une distribution de Boltzmann :
Np
Ea − Ep
)
= exp(
Na
kT
(B.2)
où Np et Na sont respectivement le nombre de protons dans l’état d’énergie Ep et
Ea , k la constante de Boltzmann et T la température absolue. Les protons sont plus
nombreux dans la configuration parallèle. L’aimantation macroscopique M , résultant de
~ , a même direction et sens que
la sommation de toutes les aimantations élémentaires µ
B0 . Si l’axe z correspond à la direction du champ B0 , alors nous avons Mz = kM k et
Mxy = 0 où Mz et Mxy sont la composante longitudinale et tangentielle, respectivement.
La valeur nulle de Mxy s’explique par le déphasage uniformément distribué des moments
de précession, annulant ainsi la composante tangentielle à B0 . En routine clinique,
l’intensité de ce champ statique est généralement de 1.5T et peut aller jusqu’à plus de
10T sur des systèmes expérimentaux.
Considérons maintenant que ce champ statique B 0 est temporellement perturbé par
~ 1 (t) qui lui est orthogonale. Ce champ, généré
une seconde source de champ magnétique B
par une impulsion radiofréquence (RF) dans la direction longitudinale, est modulé à la
fréquence ω0 de Larmor et son intensité est d’environ 50 mT. Cette perturbation modifie
l’aimantation globale obligeant le vecteur M à quitter son état d’équilibre et à basculer
d’un angle plus ou moins important (flip angle) selon la durée de l’impulsion (voir Figure
B.2(a)). Ainsi Mz est modifié et la composante Mxy devient non nulle. Tout l’intérêt
de la RMN réside dans l’observation du phénomène de relaxation (Figure B.2(b)). Ce
phénomène intervient lors de l’interruption de l’impulsion RF entraînant le retour à l’état
B.2. FORMATION DES IMAGES PAR RM
195
d’équilibre des noyaux. Le phénomène de relaxation est décrit par les équations de Bloch
[Torrey, 1956] :
Mxy (t) = Mxy (0+ )e−t/T 2
Mz (t) = Mze (1 − e−t/T 1 ) + Mz (0+)e−t/T 1
(B.3)
(B.4)
où Mxy (0+ ) et Mz (0+) sont respectivement la valeur de la composante tangentielle et
transverse de M juste après l’impulsion RF. Mze correspond à la valeur de Mz à l’équilibre. T 1 et T 2 sont les deux constantes qui caractérisent la durée de retour à l’équilibre
de Mz et Mxy respectivement et qui sont caractéristiques du tissu observé. L’équation
(B.3) correspond au premier phénomène de relaxation dû au déphasage des spins entre
eux annulant exponentiellement la composante tangentielle. L’équation (B.4) traduit la
volonté générale des protons à s’aligner à nouveau dans la direction du champ B0 . Ces
signaux, dont les énergies sont proportionnelles à la densité de spin, sont captés par des
bobines réceptrices. Ils se présentent sous forme de signaux sinusoïdaux amortis et sont
appelés signaux RMN (ou Free Induction Decay - FID - en anglais). Il est important de
noter que l’enveloppe du signal FID est imposée par la décroissance exponentielle de la
composante tangentielle Mxy (équation (B.3)) dont la composante de temps T 2 est plus
courte que celle de la composante longitudinale. La transformée de Fourier de ces signaux
sont des raies centrées sur la fréquence de résonance des protons. Les constantes de temps
T 1 et T 2 ont une grande importance car elles déterminent l’intensité et le contraste des
images. Elles dépendent de la composition et de la structure des tissus imagés. T 1 est
toujours supérieur à T 2 avec un rapport de 10 environ.
z
B0
M
Mz
B1
y
M
Mxy
x
(a)
(b)
F IG . B.2. a) Perturbation de l’aimantation M par le champ créé par une impulsion RF. L’angle
de bascule est fonction de la durée de cette impulsion. b) Retour à l’état d’équilibre des
spins pendant la période de relaxation. L’évolution de l’aimantation est gouvernée par les
équations (B.3) et (B.4).
B.2 Formation des Images par RM
A partir des principes physiques de noyaux dont on perturbe l’aimantation, il est possible de reconstruire des images. Pour cela, il est nécessaire de pouvoir différencier les
réponses provenant des différentes parties de l’objet imagé. On distingue la sélection de
coupe et l’encodage de deux directions pour la reconstruction d’une image.
196
ANNEXE B. L’IMAGERIE PAR RÉSONANCE MAGNÉTIQUE
B.2.1 Encodage spatial
Dans cette partie, nous décrivons comment chaque signal est spatialement différentié
et localisé pour permettre la reconstruction d’une image. Cette discrimination spatiale est
assurée par une excitation sélective puis par un encodage spatial.
L’excitation sélective est obtenue par l’application d’un gradient spatial orienté dans la direction orthogonale à la coupe que l’on désire acquérir. Si, par exemple, on désire obtenir
une coupe suivant l’axe z, le champ statique B s sera tel que :
B s (z) = B 0 + gz z iz
(B.5)
où iz est un vecteur orthonormé directeur et gz une constante. L’application d’un tel champ
statique impose une différentiation suivant l’axe z des fréquences de résonance de Larmor
(B.1) des noyaux d’hydrogènes. Grâce au phénomène de résonance, la sélection d’une fréquence de modulation adéquate du signal RF permet de n’exciter que les protons correspondant au plan de coupe souhaité. Le temps qui s’écoule entre deux excitations s’appelle
le temps de répétition (T R).
L’encodage spatial est réalisé pendant le retour à l’équilibre des protons excités. Cette
période est appelée période de précession libre. L’encodage spatial sert à discriminer les
protons suivant les deux axes restants (x et y dans notre cas). On distingue le codage de
phase et le codage de fréquence réalisés par application successive de deux gradients de
champ magnétique. En appliquant un gradient de champ suivant l’axe x, la fréquence de
précession des protons :
ω(x) = ωs + γgx x,
(B.6)
est différenciée suivant leur position sur l’axe x. Ceci permet de distinguer chaque ligne
du plan de coupe. Une fois ce déphasage réalisé, un second gradient de champ, appliqué
suivant l’axe y, modifie la vitesse de précession des protons proportionnellement à leur
ordonnée y. En pratique, le premier gradient est appliqué avant la lecture du signal. Le second champ est appliqué pendant la lecture. Le déphasage permet de localiser les protons
suivant l’axe x et les différentes vitesses de précession permettent de localiser les protons
suivant l’axe y.
B.2.2 Les séquences d’écho
On constate dans la pratique certaines hétérogénéités du champ B 0 . Si infimes soient
elles, elles ont tendance à déphaser de manière indésirable le retour des protons à leur
état d’origine. La diminution de la composante Mxy mesurée correspond au moyennage
des protons plongés dans ces hétérogénéités magnétiques. Les contributions élémentaires
déphasées tendent à accélérer l’annulation de la composante T 2 et donc du signal FID.
On parle alors d’une seconde composante T2∗ plus faible que T2 . L’écho de spin est une
solution utilisée pour corriger ce phénomène. En voici le principe : une première impulsion RF orientée suivant x fait basculer les aimantations élémentaires d’un angle de 90◦ de
manière à ce qu’elles se retrouvent orientées selon l’axe y. Les hétérogénéités du champ
B 0 ont pour conséquence que certaines particules précessent plus rapidement. Une seconde impulsion à 180◦ suivant l’axe des y inverse cet effet de déphasage et les protons
les plus rapides rattrapent les plus lents, impliquant un rehaussement du signal observé
dont l’intensité est à nouveau pondérée en T2 . Une illustration de cette description est
B.2. FORMATION DES IMAGES PAR RM
197
donnée Figure B.3. Un enchaînement d’impulsions à 180◦ permet la formation d’un train
d’échos de façon à prolonger le signal observé. Ce type de correction est largement utilisé
en pratique et prend un intérêt particulier pour l’imagerie rapide et donc l’acquisition de
séquence d’images.
180°
180°
180°
90°
TE
TE / 2
e −t / T2
*
e −t / T2
F IG . B.3. Formation d’un train d’échos de spin avec, en haut, une séquence d’impulsions à 180◦
et en bas le signal d’écho résultant.
Le second type d’écho que nous décrivons a aussi un rôle important dans la formation d’images ciné-IRM puisqu’il permet d’obtenir un grand nombre de signaux entre
deux T R. L’écho de gradient est généré par une succession de gradients de champ qui
déphasent et rephasent les signaux de manière contrôlée permettant ainsi la création de
nombreux échos. Il faut noter toutefois que l’écho de gradient n’utilise pas d’impulsion
d’inversion de spin et ne permet donc pas de corriger les hétérogénéités du champ magnétique statique : les images obtenues sont dites en T2∗ . Considérons la séquence de gradient
de la Figure B.4. Après l’application d’une impulsion RF faisant pivoter les aimantations
élémentaires d’un angle α (généralement les échos de gradient sont associées à de faibles
valeurs d’angle de bascule pour accélérer les acquisitions), un gradient négatif (utilisé
pour l’encodage spatial) déphase les spins proportionnellement à x selon la formule :
 Z τ

−Gx x dt si 0 ≤ t ≤ τ
γ
(B.7)
φ(x, t) =
0
 −γ G x τ
si t > τ
x
où τ est la durée d’application du gradient de champ. Gx est le scalaire qui traduit l’intensité de ce gradient et γ représente le rapport gyromagnétique du proton. Dans cet exemple,
le déphasage entre les spins est donc proportionnel à leur position suivant l’axe x. La cohérence de phase devient alors de plus en plus faible suivant cet axe. Ceci combiné à
l’hétérogénéité du champ B0 , le signal est caractérisé par une constante T2∗∗ . La décroissance du FID est alors très rapide. L’application d’un champ inverse rephase progressivement la magnétisation des différentes particules provoquant une augmentation du signal.
L’application d’une succession de champ inverses, permet de réaliser plusieurs encodages
ANNEXE B. L’IMAGERIE PAR RÉSONANCE MAGNÉTIQUE
198
spatiaux à partir d’une impulsion excitatrice initiale. Le nombre d’échos est limité par T2∗
et par la vitesse de bascule des gradients. Les imageurs par RM modernes permettent la
formation de plus de 64 échos et ainsi la formation d’une image avec une seule impulsion
RF.
α
Gx
*
e −t / T2
F IG . B.4. Formation d’un train d’échos en permutant les gradients de champ.
Ces notions sont à la base des séquences ultra-rapides en IRM dont nous donnons une
description au chapitre 2. Dans ce chapitre, nous nous intéressons à la façon de synchroniser les acquisitions sur le comportement des structures déformables étudiées.
Annexe
C
Filtrage de Kalman
L
es principaux développements permettant d’obtenir les équations de Kalman présentées dans la section 6.3.2 sont donnés dans cette annexe. Cette annexe est inspirée
d’un document disponible à l’adresse : http ://www.clubeea.org/
C.1 Notations
Soit un système linéaire stochastique dont l’évolution dynamique est modélisée à
l’aide des équations d’état :
xj ′ = Aj · xj + Bj ′ · uj ′ + vj ′
(C.1)
zj ′ = Cj ′ · xj ′ + wj ′
avec les contraintes suivantes :
• E[vj ] = 0
• E[vj · vj ′ T ] = Qj δjj ′ avec Qj définie positive et δjj ′ symbole de Kroknecker
• E[wj ] = 0
• E[wj · wj ′ T ] = Rj δjj ′ avec Rj définie positive
• E[vj · wj ′ T ] = 0
• E[x0 · vj ′ T ] = 0
• E[x0 · wj ′ T ] = 0
• E[x̂0 · x̂T0 ] = P0
Le but du filtre de Kalman est d’estimer x̂j′ /j de xj′ /j à l’instant j ′ lorsque les mesures
disponibles s’étendent de l’instant 0 jusqu’à l’instant j. Cette estimation est optimale au
sens de la minimisation de la variance d’erreur entre la variable réelle et son estimation :
2
E[xj ′ − x̂j ′ /j / {z0 , z1 , . . . , zj }] 6 E[k(xj ′ − x)k2 / {z0 , z1 , . . . , zj }]
(C.2)
avec kxk2 = xT · x
On distingue trois cas différents selon la position de j ′ par rapport à j :
• j ′ < j : lissage
• j ′ = j : filtrage
199
ANNEXE C. FILTRAGE DE KALMAN
200
• j ′ > j : prédiction
Dans la suite nous détaillons les équations dans le cas de la prédiction, mais elles sont
facilement dérivables pour les autres cas.
C.2
Prédicteur à l’horizon 1
Dans le cas où j ′ = j + 1 le prédicteur de Kalman est dit à l’horizon 1. Dans cette
description nous considérons le cas simplifié où uj = 0. La prédiction de x̂j+1/j est
donnée par l’espérance mathématique :
x̂j+1/j = E[xj+1 / {z0 , z1 , . . . , zj }]
= Aj · E[xj / {z0 , z1 , . . . , zj }] + E[vj / {z0 , z1 , . . . , zj }]
= Aj · x̂j/j
(C.3)
car le bruit d’état est orthogonal aux mesures. L’erreur de prédiction à l’instant j + 1
vaut alors :
x̃j+1/j =
=
=
=
xj+1 − x̂j+1/j
Aj xj + vj − Aj · x̂j/j
Aj · (xj − x̂j/j ) + vj
Aj · x̃j/j + vj
(C.4)
Le prédiction de la matrice de covariance vaut :
Pj+1/j = E[x̃j+1/j · x̃Tj+1/j ]
= Aj · E[x̃j/j · x̃Tj/j ] · Aj T + E[vj · vj T ]
= Aj · Pj/j · Aj T + Qj
(C.5)
De la même manière, en se référant à (C.1) on peut prédire la mesure :
ẑj+1/j = E[zj+1 / {z0 , z1 , . . . , zj }]
= Cj+1 · x̂j+1/j .
(C.6)
L’innovation représente la différence entre la mesure observée et sa prédiction. C’est donc
à ce niveau que se fait l’apport d’information :
z̃j+1/j = zj+1 − ẑj+1/j
= Cj+1 · (xj+1 − x̂j+1/j ) + wj+1
= Cj+1 · x̃j+1/j + wj+1
(C.7)
La covariance de la matrice de prédiction vaut alors :
Σj+1/j = E[z̃j+1/j · z̃Tj+1/j ]
= Cj+1 · Pj+1/j · Cj+1 T + Rj+1
(C.8)
C.2. PRÉDICTEUR À L’HORIZON 1
201
Finalement, l’estimation de l’état à l’instant j s’écrit sous la forme :
x̂j/j = E[xj / {z0 , z1 , . . . , zj−1 , zj }]
= E[xj / {z0 , z1 , . . . , zj−1 }] + E[xj+1 / {z̃j }]
= x̂j/j−1 + Kj · z̃j/j−1
(C.9)
Dans (C.9) le dernier terme apparait comme la somme de la prédiction de l’état et de l’innovation pondérée par le gain de Kalman. Cette notation est particulièrement importante
puisque l’on voit apparaître le gain de Kalman Kj . Ce gain varie au cours de l’estimation en fonction de la confiance relative apportée à l’innovation et à l’état prédit. Cette
confiance dépend bien évidemment des bruits associés à chacun de ces deux vecteurs.
Pour une convergence rapide, il faut dans un premier temps que la valeur de Kj soit grande
de manière à privilégier l’apport d’information dû à l’innovation. Puis au fil des estimations, l’erreur sur l’état représentée par Pj/j s’amenuise ce qui signifie que la confiance
accordée à x̂j/j−1 est de plus en plus importante. Kj diminue alors en conséquence.
Selon (C.9), l’erreur d’estimation vaut :
x̃j/j = xj − x̂j/j
= (xj − x̂j/j−1 ) − Kj · (zj − z̃j/j−1 )
= (I − Kj · Cj ) · (xj − x̂j/j−1 ) − Kj · wj
(C.10)
Le principe du filtre de Kalman repose sur la minisation de l’erreur quadratique :
Pj/j = E[x̃j/j · x̃Tj/j ]
= (I − Kj · Cj ) · Pj/j−1 · (I − Kj · Cj )T − Kj · Rj · Kj T
(C.11)
Le minimum de cette forme quadratique est obtenue par minimisation de T race(Pj/j )
ce qui donne :
Kj T = Pj/j−1 · Cj T · Σ−1
j/j−1
= Pj/j−1 · Cj · (Cj · Pj/j−1 · Cj T + Rj )−1
(C.12)
et
Pj/j = (I − Kj · Cj ) · Pj/j−1
(C.13)
202
ANNEXE C. FILTRAGE DE KALMAN
Bibliographie
203
Bibliographie personelle
Articles de revues
[Sarrut et al., 2006a] Sarrut, D., Delhay, B., Villard, P.F., Boldea B., Beuve, M.
and Clarysse, P., Spatio-temporal comparison technique for deformable registration
in a breathing thorax model, IEEE Transaction on Mediacal Imaging, soumis.1
Communications avec actes
[Delhay et al., 2006] Delhay, B., Clarysse, P., Pera, C. and Magnin, I.E., A spatiotemporal deformation model for dense motion estimation in periodic cardiac image
sequences, in : From Statistical Atlases to Personalized Models : Understanding
Complex Diseases in Populations and Individuals, Satellite Workshop MICCAI
2006, Copenhagen, Denmark, 2006, in press.
[Delhay et al., 2005b] Delhay, B., Lötjönen, J., Clarysse, P., Katila, T. and Magnin,
I.E., A dynamic 3D cardiac surface model from MR images, in : Computers In
Cardiology 2005’s Proceedings, IEEE, Lyon, France, 2006, pp. 423-426.
[Delhay et al., 2005a] Delhay, B., Clarysse, P., Lötjönen, J., Katila, T. and Magnin,
I.E., Evaluation of two free form deformation based motion estimators in cardiac
and chest imaging, in Functionnal Imaging and Modeling of the Heart 2005’
Proceedings, Barcelona, Spain, 2005, pp. 467-476.
[Delhay et al., 2004] Delhay, B., Clarysse, P., Bonnet, P., Grangeat, P. and Magnin,
I.E., Combined 3D object motion estimation in medical sequences, in ICIP 2004’s
Proceedings, IEEE, Singapore, 2004, pp. 1461-1464.
1
coécrit à 50% avec D. Sarrut
205
Bibliographie
[Alvarez et al., 2000] Alvarez, L., Weickert, J., Sanchez, J., Reliable estimation of dense
optical flow fields with large displacements, International Journal of Computer Vision, volume 39, no. 1, (2000), pp. 41–56.
[Amini and Duncan, 1992] Amini, A., Duncan, J. S., Bending and stretching models for
LV wall motion analysis from curves and surfaces, Image Vision Comput., volume 10, no. 6, (1992), pp. 418–430, ISSN 0262-8856.
[Arulampalam et al., 2002] Arulampalam, S., Maskell, S., Gordon, N., et al., A tutorial on particle filters for on-line non-linear/non-gaussian bayesian tracking, IEEE
Transactions on Signal Processing, volume 50, no. 2, (2002), pp. 174–188.
[Ashburner and Friston, 1999] Ashburner, J., Friston, K., Nonlinear spatial normalization using basis functions, Human Brain Mapping, volume 7, no. 4, (1999), pp.
254–266.
[Axel and Dougherty, 1989] Axel, L., Dougherty, L., MR imaging of motion with spatial
modulation of magnetization, Radiology, volume 171, no. 3, (1989), pp. 841–845.
[Bajcsy and Broit, 1982] Bajcsy, R., Broit, C., Matching of deformed images, in : Sixth
Int. Conf. on Pattern Recognition, 1982, (pp. 351–353).
[Bajcsy and Kovacik, 1989] Bajcsy, R., Kovacik, S., Multiresolution elastic matching,
CVGIP, volume 46, (1989), pp. 1–21, these PJ.
[Bardinet et al., 1998] Bardinet, E., Cohen, L. D., Ayache, N., A parametric deformable
model to fit unstructured 3D data, Computer vison and Image Understanding, volume 71, no. 1, (1998), pp. 39–54.
[Benoit-Cattin et al., 2005] Benoit-Cattin, H., Collewet, G., Belaroussi, B., et al., The
SIMRI project : a versatile and interactive MRI simulator, Journal of Magnetic
Resonance, volume 173, no. 1, (2005), pp. 97–115.
[Besl and McKay, 1992] Besl, P. J., McKay, N. D., A method for registration of 3-D
shapes, IEEE Trans. Pattern Anal. Mach. Intell., volume 14, no. 2, (1992), pp. 239–
256, ISSN 0162-8828.
[Bland and Altman, 1986] Bland, J., Altman, D., Statistical methods for assessing agreement between two methods of clinical measurement, Lancet, volume 1, (1986), pp.
307–310.
[Boldea, 2006] Boldea, V., Intégration de la respiration en radiothérapie : apport du
recalage déformable d’images, Ph.D. thesis, Université Lumière Lyon 2, 2006.
207
208
BIBLIOGRAPHIE
[Boldea et al., 2005] Boldea, V., Sarrut, D., Carrie, C., Comparison of 3D dense deformable registration methods for breath-hold reproducibility study in radiotherapy,
in : SPIE Medical Imaging : Visualization, Image-Guided Procedures, and Display, volume 5747, 2005, (pp. 222–230).
[Boldea et al., 2003] Boldea, V., Sarrut, D., Clippe, S., Lung deformation estimation with
non-rigid registration for radiotherapy treatment., in : MICCAI 03, Montreal, Canada, 2003, (pp. 770–777).
[Bonnet et al., 2003] Bonnet, S., Koenig, A., Roux, S., et al., Dynamic X-ray computed
tomography., Proceedings of the IEEE, volume 91, no. 10, (2003), pp. 1574–1587.
[Bookstein, 1989] Bookstein, F., Principal warps : thin plate splines and decomposition
of deformation, IEEE Transactions on Pattern Analysis and Machine Intelligence,
volume 11, (1989), pp. 567–585.
[Boukerroui et al., 1999] Boukerroui, D., Basset, O., Baskurt, A., et al., Segmentation of
echocardiographic data multiresolution 2D and 3D algorithm based on grey level
statistics, in : MICCAI ’99 : Proceedings of the Second International Conference on
Medical Image Computing and Computer-Assisted Intervention, Springer-Verlag,
London, UK, ISBN 3-540-66503-X, 1999, (pp. 516–523).
[Brock et al., 2003] Brock, K. K., McShan, D. L., Haken, R. K. T., et al., Inclusion of
organ deformation in dose calculations, Medical Physics, volume 30, no. 3, (2003),
pp. 290–295.
[Broit, 1981] Broit, C., Optimal registration of deformed images, Ph.D. thesis, University
of Pennsylvania, 1981.
[Brown, 1992] Brown, L. G., A survey of image registration techniques, ACM Computing Surveys, volume 24, no. 4, (1992), pp. 325–376.
[Cachier and Ayache, 2004] Cachier, P., Ayache, N., Isotropic energies, filters and splines
for vector field regularization, J. Math. Imaging Vis., volume 20, no. 3, (2004), pp.
251–265, ISSN 0924-9907.
[Cachier et al., October 2001] Cachier, P., Mangin, J.-F., Pennec, X., et al., Multipatient
registration of brain MRI using intensity and geometric features, in : MICCAI’01,
Utrecht, The Netherlands, October 2001, (pp. 734 – 742).
[Camara, 2003] Camara, O., Recalage non linéaire d’images TDM et TEP dans les régions thoraciques et abdominales : etude méthodologique et application en routine
clinique, Ph.D. thesis, Departement Traitement du Signal et des Images, Télécom
Paris, ENST., 2003.
[Camara et al., 2003] Camara, O., Delso, G., Bloch, I., Free form deformations guided
by gradient vector flow : a surface registration method in thoracic and abdominal
PET-CT applications., in : WBIR, Philadelphia, PA, USA, 2003, (pp. 224–233).
[Canny, 1986] Canny, J., A computational approach to edge detection, IEEE Trans. Pattern Anal. Mach. Intell., volume 8, no. 6, (1986), pp. 679–698, ISSN 0162-8828.
[Caspi and Irani, 2002] Caspi, Y., Irani, M., Spatio-temporal alignment of sequences,
IEEE Transactions on Pattern Analysis and Machine Intelligence, volume 24,
no. 11, (2002), pp. 1409–1424, ISSN 0162-8828.
BIBLIOGRAPHIE
209
[Christensen et al., 1996] Christensen, G., Rabbitt, R., Miller, M., Deformable templates
using large deformation kinematics, Image Processing, volume 5, (1996), pp.
1435–1447.
[Christensen, 1999] Christensen, G. E., Consistent linear-elastic transformations for
image matching, in : Proceedings of the 16th International Conference on Information Processing in Medical Imaging, Springer-Verlag, London, UK, ISBN 3540-66167-0, 1999, (pp. 224–237).
[Chui and Rangarajan, 2003] Chui, H., Rangarajan, A., A new point matchning algorithm for non-rigid registration, Computer Vision and Image Understanding, volume 89, (2003), pp. 114–141.
[Clarysse et al., 2000] Clarysse, P., Basset, C., Khouas, L., et al., 2D spatial and temporal displacement field fitting from cardiac MR tagging, Medical Image Analysis,
volume 3, (2000), pp. 253–268.
[Comaniciu et al., 2004] Comaniciu, D., Zhou, X. S., Krishnan, S., Robust real-time
myocardial border tracking for echocardiography : an information fusion approach., IEEE Trans. Med. Imaging, volume 23, no. 7, (2004), pp. 849–860.
[Coquillart, 1990] Coquillart, S., Extended free-form deformation : a sculpturing tool for
3D geometric modeling, in : SIGGRAPH ’90 : Proceedings of the 17th annual
conference on Computer graphics and interactive techniques, ACM Press, New
York, NY, USA, 1990, (pp. 187–196).
[Crum et al., 2004] Crum, W., Hartkens, T., Hill, D., Non-rigid image registration :
theory and practice, Br J Radiol., volume 77, no. 2, (2004), pp. 140–153.
[Crum et al., 2003] Crum, W. R., Griffin, L. D., Hill, D. L., et al., Zen and the art of
medical image registration : correspondence, homology, and quality., Neuroimage,
volume 20, no. 3, (2003), pp. 1425–1437.
[Declerck et al., 1998] Declerck, J., Feldmar, J., Ayache, N., Definition of a fourdimensional continuous planispheric transformation for the tracking and the analysis of left-ventricle motion, Medical Image Anlalysis, volume 2, no. 2, (1998), pp.
197–213.
[Declerck et al., 1996] Declerck, J., Feldmar, J., Goris, M. L., et al., Automatic registration and alignment on a template of cardiac stress & rest SPECT images, Technical
Report RR-2770, INRIA, 1996.
[Delhay et al., 2004] Delhay, B., Clarysse, P., Bonnet, P., et al., Combined 3D object motion estimation in medical sequences, in : International Conference on Image Processing, Singapore, 2004, (pp. 1461–1464).
[Deriche, 1990] Deriche, R., Fast Algorithms for Low-Level Vision, IEEE Trans. Pattern
Anal. Mach. Intell., volume 12, no. 1, (1990), pp. 78–87, ISSN 0162-8828.
[Deriche, 1993] Deriche, R., Recursively implementing the gaussian and its derivatives,
Technical Report 1893, INRIA, 1993, http ://www.inria.fr/rrrt/rr-1893.html.
[Deriche et al., 1996] Deriche, R., Kornprobst, P., Aubert, G., Optical-flow estimation
while preserving its discontinuities : a variational approach, in : ACCV ’95 : Invited
Session Papers from the Second Asian Conference on Computer Vision, SpringerVerlag, London, UK, ISBN 3-540-60793-5, 1996, (pp. 71–80).
210
BIBLIOGRAPHIE
[Duchon, 1976] Duchon, J., Interpolation des fonctions de deux variables suivant le principe de la flexion des plaques minces, Revue d’automation, informatique et recherche operationelle, volume 10, no. 12, (1976), pp. 5–12.
[Earls et al., 2002] Earls, J., Ho, V., Foo, T., et al., Cardiac MRI : recent progress and
continued challenges., Journal of magnetic resonance imaging, volume 16, no. 2,
(2002), pp. 111–127.
[Endo et al., 2003] Endo, M., Tsunoo, T., Kandatsu, S., et al., Four-dimensional computed tomography 4D CTŰconcepts and preliminary development, Radiation Medicine, volume 21, (2003), pp. 17–22.
[Ferrant et al., 2001] Ferrant, M., Nabavi, A., Macq, B., et al., Registration of 3D intraoperative MR Images of the brain using a finite-element biomechanical model, IEEE
Transactions on Medical Imaging, volume 20, no. 12, (2001), pp. 1384–1397.
[Fitzpatrick and West, 2001] Fitzpatrick, J., West, J., The distribution of target registration error in rigid-body point-based registration, IEEE Transactions on Medical
Imaging, volume 20, no. 9, (2001), pp. 917–927.
[Fitzpatrick et al., 1998] Fitzpatrick, J. M., Hill, D. L., Shyr, Y., et al., Visual assessment
of the accuracy of retrospective registration of MR and CT images of the brain.,
IEEE Trans Med Imaging, volume 17, no. 4, (1998), pp. 571–585.
[Flórez Valencia, 2006] Flórez Valencia, L., Modèle d’état de cylindre généralisé et la
quantification de sténoses artérielles en imagerie 3D, Phd thesis, INSA de Lyon,
2006.
[Frangi et al., 2002] Frangi, A., Rueckert, D., Schnabel, J., et al., Automatic construction of multiple-object three-dimensional statistical shape models : application to
cardiac modeling, IEEE Trans on Medical Imaging, volume 21, no. 9, (2002), pp.
1151–66.
[Fumihiko et al., 2005] Fumihiko, I., Kanrou, O., Kenichi, H., A data distributed parallel algorithm for nonrigid image registration, Parallel Comput., volume 31, no. 1,
(2005), pp. 19–43, ISSN 0167-8191.
[Gee et al., 1995] Gee, J., Barillot, L., Haynor, C., et al., Bayesian approach to the brain
image matching problem, in : SPIE, Medical Imaging 1995 : Image Processing,
Murray H. Loew, volume 2434, 1995, (pp. 145–156).
[Gee et al., 1997] Gee, J. C., Haynor, D. R., Briquer, L. L., et al., Advances in elastic
matching theory and its implementation, in : CVRMed-MRCAS ’97 : Proceedings
of the First Joint Conference on Computer Vision, Virtual Reality and Robotics in
Medicine and Medial Robotics and Computer-Assisted Surgery, Springer-Verlag,
London, UK, ISBN 3-540-62734-0, 1997, (pp. 63–72).
[Geman and McClure, 1987] Geman, S., McClure, D., Statistical methods for tomographic image reconstruction, in : Bulletin of the International Statistical Institute,
1987, (pp. LII–4 :5).
[George et al., 2005] George, R., Vedam, S., Chung, T., et al., The application of the
sinusoidal model to lung cancer patient respiratory motion, Medical physics, volume 32, no. 9, (2005), pp. 2850–2861.
BIBLIOGRAPHIE
211
[Ghosal and Vanek, 1996] Ghosal, S., Vanek, P., A fast scalable algorithm for discontinuous optical flow estimation, IEEE Transactions on Pattern Analysis and Machine
Intelligence, volume 18, no. 2, (1996), pp. 181–194, ISSN 0162-8828.
[Goitein, 2004] Goitein, M., Organ and tumor motion : an overview, Seminars in Radiation Oncology, volume 14, no. 1, (2004), pp. 2–9.
[Gorce et al., 1997] Gorce, J., Friboulet, D., Magnin, I., Estimation of three-dimensional
cardiac velocity fields : assessment of a differential method and application to 3D
CT data, Medical Image Analysis, volume 1, no. 3, (1997), pp. 245–261.
[Götte et al., 2001] Götte, M., A., V. R., A., T., et al., Quantification of regional contractile function after infraction : strain analysis superior to wall thickening in discrimination infarct from remote myocardium, Journal of american college of radiology,
volume 37, no. 3, (2001), pp. 808–817.
[Grava, 2003] Grava, C., Compensation de mouvement par réseaux neuronaux cellulaires. Application en imagerie médicale, Ph.D. thesis, Université Claude-Bernard
LYON I, 2003.
[Grevera and Udupa, 1996] Grevera, G., Udupa, J., Shape-based interpolation of multidimensional grey-level images, IEEE Transaction on Medical Imaging, volume 15,
no. 6, (1996), pp. 881–892.
[Guimond et al., 2001] Guimond, A., Roche, A., Ayache, N., et al., Multimodal brain
warping using the demons algorithm and adaptative intensity corrections, IEEE
Transaction on Medical Imaging, volume 20, no. 1, (2001), pp. 58–69.
[Hadamard, 1923] Hadamard, J., Lectures on Cauchy’s problem in linear partial differential equations, Yale Univ Press, New Haven, 1923.
[Haddad et al., 2005a] Haddad, R., Clarysse, P., Orkisz, M., et al., A realistic anthropomorphic dynamic heart phantom, in : Computers in Cardiology, Lyon, France,
2005a, (pp. 801–804).
[Haddad et al., 2005b] Haddad, R., Clarysse, P., Orkisz, M., et al., A realistic anthropomorphic numerical model of the beating heart, in : In Functional Imaging and
Modeling of the Heart, FIMH’05, Barcelona, Spain, 2005b, (pp. 384–393).
[Hajnal et al., 2001] Hajnal, J. V., Hill, D. L. G., Hawkes, D. J., Medical Image Registration, CRC Press, Boca Raton, 2001.
[Han, 1999] Han, M., Analyse exploratoire de la déformation spatio-temporelle du myocarde à partir de l’imagerie par résonnance magnétique de marquage tissulaire,
Ph.D. thesis, Institut National des Sciences appliquées de Lyon, 1999.
[Hartiala and Knuuti, 1995] Hartiala, J., Knuuti, J., Imaging of the heart by MRI and
PET., Annals of medicine, volume 14, (1995), pp. 35–45.
[Hellier and Barillot, 2000] Hellier, P., Barillot, C., Coupling dense and landmark-based
approaches for non rigid registration, Technical report, Sophia Antipolis, INRIA,
2000.
[Hellier et al., 2003] Hellier, P., Barillot, C., Corouge, I., et al., Retrospective cvaluation of intersubject brain registration, IEEE Transactions on Medical Imaging, volume 22, no. 9, (2003), pp. 1120–1130.
212
BIBLIOGRAPHIE
[Hellier et al., 2001] Hellier, P., Barillot, C., Memin, E., et al., Hierarchical estimation of
a dense deformation field for 3-D robust registration, IEEE Transactions on Medical Imaging, volume 20, no. 5, (2001), pp. 388–4402.
[Hinkley, 1971] Hinkley, D. V., Inference about the change-point from cumulative sum
tests, Biometrika, volume 58, no. 3, (1971), pp. 509–523.
[Horn and Schunck, 1981] Horn, B. K. P., Schunck, B. G., Determining optical flow, Artificial Intelligence, volume 17, (1981), pp. 185–203.
[Houdas, 1990] Houdas, Y., Physiologie cardio-vasculaire, Paris :Vigeot, 1990.
[Jacob et al., 1998] Jacob, G., Noble, J. A., Blake, A., Robust contour tracking in echocardiographic sequences, iccv, volume 00, (1998), p. 408.
[Jannin et al., 2002] Jannin, P., Fitzpatrick, J., Hawkes, D., et al., Validation of medical
image processing in image-guided therapy, IEEE Transaction on Medical Imaging,
volume 21, (2002), pp. 1445–1449.
[Johnson and Christensen, 2002] Johnson, H., Christensen, G., Consistent landmark and
intensity-based image registration, IEEE Transactions on Medical Imaging, volume 21, (2002), pp. 450–461.
[Kalender, 2006] Kalender, W. A., X-ray computed tomography, Physics in Medicine
and Biology, volume 51, (2006), pp. 29–43.
[Kalman, 1960] Kalman, A new approach to linear filtering and prediction problems,
Transactions of the ASME–Journal of Basic Engineering, volume 82, no. Series
D, (1960), pp. 35–45.
[Kaye et al., 1997] Kaye, J., Metaxas, D. N., Jr., F. P. P., A 3D virtual environment for modeling mechanical cardiopulmonary interactions, in : CVRMed, Grenoble, France,
1997, (pp. 389–398).
[Keall et al., 2005] Keall, P., Joshi, S., Vedam, S., et al., Four-dimensional radiotherapy planning for DMLC-based respiratory motion tracking, Medical physics, volume 32, no. 4, (2005), pp. 942–951.
[Keeling and Ring, 2005] Keeling, S. L., Ring, W., Medical image registration and interpolation by optical flow with maximal rigidity, J. Math. Imaging Vis., volume 23,
no. 1, (2005), pp. 47–65, ISSN 0924-9907.
[Kim and Fessler, 2004] Kim, J., Fessler, J. A., Intensity-based image registration using
robust correlation coefficients., IEEE Trans Med Imaging, volume 23, no. 11,
(2004), pp. 1430–1444, ISSN 0278-0062.
[Kirkpatrick et al., 1983] Kirkpatrick, S., Gelatt, C. D., Vecchi, M. P., Optimization by
simulated annealing, Science, Number 4598, 13 May 1983, volume 220, 4598,
(1983), pp. 671–680.
[Klein, 2000] Klein, G., Four-dimensional processing of deformable cardiac PET data,
in : MMBIA ’00 : Proceedings of the IEEE Workshop on Mathematical Methods
in Biomedical Image Analysis, IEEE Computer Society, Washington, DC, USA,
ISBN 0-7695-0737-9, 2000, (p. 127).
[Koikkalainen and Lötjönen, 2004] Koikkalainen, J., Lötjönen, J., Image segmentation
with the combination of the PCA- and ICA-based modes of shape variation, in :
ISBI, Arlington, USA, 2004, (pp. 149–152).
BIBLIOGRAPHIE
213
[Kybic, 2001] Kybic, J., Elastic image registration using parametric deformation models,
Ph.D. thesis, Ecole Polytechnique Fédérale de Lausanne, 2001.
[Kybic and Unser, 2003] Kybic, J., Unser, M., Fast parametric elastic image registration,
IEEE Transactions on Image Processing, volume 12, no. 11, (2003), pp. 1427–
1442, ISSN 1057-7149.
[Leal1 et al., 2006] Leal1, J., Luengo-Fernandez, R., Gray, A., et al., Economic burden
of cardiovascular diseases in theenlarged european union., European Heart Journal,
volume 27, (2006), pp. 1610–1619.
[Ledesma-Carbayo et al., 2005] Ledesma-Carbayo, M., Kybic, J., Desco, M., et al.,
Spatio-temporal nonrigid registration for ultrasound cardiac motion estimation,
IEEE Transactions on Medical Imaging, volume 24, no. 9, (2005), pp. 1113–1126.
[Lei and Sewchand, 1992] Lei, T., Sewchand, W., Statistical approach to X-ray CT imaging and its applications in image analysis—I : a new stochastic model-based image
segmentation technique for X-ray CT image, IEEE Transactions on Medical Imaging, volume 11, (1992), pp. 53–61.
[Liang and Lauterbur, 2000] Liang, Z.-P., Lauterbur, P. C., Principles of magnetic resonance imaging : a signal processing perspective., Bellingham, WA : SPIE Optical
Engineering Press ; Piscataway, NJ : IEEE Press ; 416 p., 2000.
[Linder, 2003] Linder, C., An arbitrary lagrangian-eulerian finite element formulation
for dynamics and finite strain plasticity models, Ph.D. thesis, University Stuttgart,
2003.
[Liu et al., 1992] Liu, W., Magnin, I., Gimenez, G., A statistic based approach for segmentation, in : 14th Int. Conf. IEEE Eng. in Medicine and Biology, volume 5, Paris,
1992, (pp. 1924–1925).
[Liu et al., 1995a] Liu, W., Magnin, I., Gimenez, G., Un nouvel opérateur pour la détection de ruptures dans des signaux bruités, Traitement du Signal, volume 12, no. 3,
(1995a), pp. 225–236.
[Liu et al., 1995b] Liu, W., Orkisz, M., Magnin, I., et al., Spatial Discontinuity Detection
and Temporal Smoothing for Heart-Wall Motion Estimation from TM-mode Echocardiographic Images, in : Computers in Cardiology, Vienne (Austria), 1995b, (pp.
561–564).
[Lorensen and Cline, 1987] Lorensen, W., Cline, H., Marching cubes : a high resolution
3D surface reconstruction algorithm, Computer Graphics, volume 21, (1987), pp.
163–169.
[Lorenzo-Valdés et al., 2003] Lorenzo-Valdés, M., Sanchez-Ortiz, G. I., Mohiaddin, R.,
et al., Segmentation of 4D cardiac MR images using a probabilistic atlas and the
EM algorithm., in : MICCAI, Montréal, Canada, 2003, (pp. 440–450).
[Lötjönen et al., 2004] Lötjönen, J., Kivistö, S., Koikkalainen, J., et al., Statistical shape
model of atria, ventricles and epicardium from short- and long-axis MR images,
Medical Image Analysis, volume 8, no. 3, (2004), pp. 371–386.
[Lötjönen et al., 1998] Lötjönen, J., Magnin, I., Reissman, P., et al., Segmentation of magnetic resonance images using 3D deformable model, in : Proceedings of First
International Conference on Medical Image Computing and Computer-Assisted Intervention, MICCAI 1998, Springer Verlag, Berlin, 1998, (pp. 1211–1221).
214
BIBLIOGRAPHIE
[Lötjönen and Mäkelä, 2001] Lötjönen, J., Mäkelä, T., Elastic matching using a deformation sphere, in : MICCAI, Utrecht, The Netherlands, 2001, (p. 541).
[Lötjönen et al., 2004] Lötjönen, J., Pollari, M., Kivistö, S., et al., Correction of movement artifacts from 4-D cardiac short- and long-axis MR data, in : Medical Image
Computing and Computer-Assisted Intervention, MICCAI 2004, Springer Berlin,
London, UK, ISBN 978-3-540-22977-3, 2004, (pp. 405–412).
[Lötjönen et al., 2005] Lötjönen, J., Pollari, M., Kivistö, S., et al., Correction of motion
artifacts from cardiac cine Magnetic Resonance Images, Academic Radiology, volume 12, no. 10, (2005), pp. 1273–1284.
[Low et al., 2003] Low, D., Nystrom, M., Kalinin, E., et al., A method for the reconstruction of four-dimensional synchronized CT scans acquired during free breathing.,
Medical Physics., volume 30, no. 6, (2003), pp. 1254–1263.
[Lujan et al., 1999] Lujan, A., EW, L., Balter, J., et al., A method for incorporating organ
motion due to breathing into 3D dose calculations, Medical physics, volume 26,
no. 5, (1999), pp. 715–20.
[Maes et al., 1997] Maes, F., Collignon, A., Vandermeulen, D., et al., Multimodality
image registration by maximization of mutual information, IEEE Transactions on
Medical Imaging, volume 16, no. 2, (1997), pp. 187–198.
[Mageras and Yorke, 2004] Mageras, G., Yorke, E., Deep inspiration breath hold and respiratory gating strategies for reducing organ motion in radiation treatment, Seminars in Radiation Oncology, volume 14, no. 1, (2004), pp. 65–75.
[Mäkelä et al., 2002] Mäkelä, T., Clarysse, P., Sipila, O., et al., A review of cardiac image
registration methods, IEEE Transactions On Medical Imaging, volume 21, (2002),
pp. 1011–21.
[Mäkelä et al., 2003] Mäkelä, T., Pham, Q., Clarysse, P., et al., A 3D model-based registration approach for the PET, MR and MCG cardiac data fusion, Medical Image
Analysis, volume 7, no. 3, (2003), pp. 377–389.
[Mallat, 1998] Mallat, S., A wavelet tour of signal processing, 2nd edition, Academic
Press, San Diego, 1998, 577 pp.
[Marquardt, 1963] Marquardt, D., An algorithm for least-squares estimation of nonlinear parameters., Journal of the Society for Industrial and Applied Mathematics,
volume 11, no. 2, (1963), pp. 431–441.
[Matheny and Goldgof, 1995] Matheny, A., Goldgof, D. B., The use of three- and fourdimensional surface harmonics for rigid and nonrigid shape recovery and representation, IEEE Transactions on Pattern Analysis and Machine Intelligence, volume 17, no. 10, (1995), pp. 967–981, ISSN 0162-8828.
[Maurer and Fitzpatrick, 1993] Maurer, C., Fitzpatrick, J., A review of medical image registration, in : Interactive Image Guided Neurosurgery, of Neurological Surgeons,
A. A., ed., Parkridge, IL, 1993, (pp. 17–44).
[McInerney and Terzopoulos, 1995] McInerney, T., Terzopoulos, D., A dynamic finite
element surface model for segmentation and tracking in multidimensional medical
images with application to cardiac 4d image analysis, in : Computarized Medical
Imaging and Graphics, volume 19, 1995, (pp. 69–83).
BIBLIOGRAPHIE
215
[Meyer et al., 1996] Meyer, F. G., Constable, R. T., Sinusas, A. J., et al., Tracking myocardial deformation using phase contrast MR velocity fields : a stochastic approach,
IEEE Transactions on Medical Imaging, volume 15, no. 4, (1996), pp. 453–465.
[Miller et al., 1993] Miller, M. I., Christensen, G. E., Amit, Y., et al., Mathematical textbook of deformable neuroanatomies, Proceedings of the National Academy of
Science, volume 90, (1993), pp. 11944–11948.
[Miller et al., 1999] Miller, M. I., Joshi, S. C., Christensen, G. E., Large deformation
fluid diffeomorphisms for landmark and image matching, in : Brain Warping, (pp.
115–132), A. Toga, Ed. San Diego, CA : Academic, 1999.
[Modersitzki, 2004] Modersitzki, J., Numerical methods for image registration, Oxford
University Press, New York, 2004.
[Montagnat and Delingette, 2005] Montagnat, J., Delingette, H., 4D deformable models
with temporal constraints : application to 4D cardiac image segmentation, Medical
Image Analysis, volume 9, no. 4, (2005), pp. 87–100.
[Murcia, 1996] Murcia, J. D., Reconstruction d’images cardiaques en tomographie
d’émision monophotonique à l’aide de modèles spatio-temporels., Ph.D. thesis,
Institut National Polytechnique de Grenoble, 1996.
[Murray, 1986] Murray, J. F., The normal lung, second edition, W.B.Saunders, Philadelphia, 1986, 377 pp.
[Musse et al., 2001] Musse, O., Heitz, H., Armspach, J. P., Topology preserving deformable image matching using constrained hierarchical parametric models, IEEE
Transactions on Medical Imaging, volume 10, (2001), pp. 1081–1093.
[Nagel, 1987] Nagel, H.-H., On the estimation of optical flow : relations between different approaches and some new results, Artif. Intell., volume 33, no. 3, (1987), pp.
298–324, ISSN 0004-3702.
[Napadow et al., 2001] Napadow, V. J., Mai, V., Bankier, A., et al., Determination of
regional pulmonary parenchymal strain during normal respiration using spin inversion tagged magnetization MRI, Journal of magnetic resonance imaging, volume 13, (2001), pp. 467–474.
[Nicolau et al., 2003] Nicolau, S., Pennec, X., Soler, L., et al., Evaluation of a new 3D/2D
registration criterion for liver radio-frequencies guided by augmented reality, in :
IS4TM, Juan-les-Pins, France, 2003, (pp. 274–287).
[Noblet, 2006] Noblet, V., Recalage non rigide d’images cérébrales 3D avec contrainte
de conservation de la topologie, Ph.D. thesis, Université Louis Pasteur- Strasbourg,
2006.
[Noblet et al., 2005] Noblet, V., Heinrich, C., Heitz, F., et al., 3D deformable image registration : a topology preservation scheme based on hierarchical defroamtnio models and interval analysis optimization, IEEE Transactions on image processing,
volume 21, no. 5, (2005), pp. 553–565.
[Noblet et al., 2006] Noblet, V., Heinrich, C., Heitz, F., et al., Retrospective evaluation
of a topology preserving non-rigid registration method, Medical Image Analysis,
volume 10, no. 3, (2006), pp. 366–384.
216
BIBLIOGRAPHIE
[Odobez and Bouthemy, 1995] Odobez, J.-M., Bouthemy, P., Estimation robuste multiéchelle de modèles paramétrés de mouvement sur des scènes complexes, Traitement
du Signal, volume 12, no. 2, (1995), pp. 113–128.
[Orkisz and Clarysse, 1996] Orkisz, M., Clarysse, P., Estimation du flot optique en présence de discontinuités : une revue, Traitement du Signal, volume 13, no. 5, (1996),
pp. 489–513.
[Oumsis et al., 2003] Oumsis, M., Pham, Q.-C., Sdigui, A. D., et al., Modeling and tracking of the cardiac left ventricular motion by a state space harmonic model in MRI
sequence., in : FIMH, Lyon, France, 2003, (pp. 184–193).
[Pan et al., 2004] Pan, T., Lee, T., Rietzel, E., et al., 4D-CT imaging of a volume influenced by respiratory motion on multi-slice CT, Medical Physics, volume 31, (2004),
pp. 333–340.
[Parzen, 1962] Parzen, E., On the estimation of a probability density function and mode,
Annals of Mathematical Statistics, volume 33, (1962), pp. 1065–1076.
[Pauna, 2004] Pauna, N., Evaluation des méthodes de mise en correspondance en imagerie multimodale IRM/TEP thoracique et cardiaque., Ph.D. thesis, Université
Claude-Bernard LYON I, 2004.
[Pennec, 1996] Pennec, X., L’incertitude dans les problèmes de reconnaissance et de
recalage – applications en imagerie médicale et biologie moléculaire, Thèse de
sciences (phd thesis), Ecole Polytechnique, Palaiseau (France), 1996.
[Pennec et al., 1999] Pennec, X., Cachier, P., Ayache, N., Understanding the demon’s algorithm : 3D non rigid registration by gradient descent, in : miccai99, Taylor, C.,
Colschester, A., eds., volume 1679, lncs, Cambridge, UK, 1999, (pp. 597–605).
[Pennec et al., 1998] Pennec, X., Guttmann, C. R. G., Thirion, J.-P., Feature-based registration of medical images : estimation and validation of the pose accuracy, in :
MICCAI ’98 : Proceedings of the First International Conference on Medical Image
Computing and Computer-Assisted Intervention, Springer-Verlag, London, UK,
ISBN 3-540-65136-5, 1998, (pp. 1107–1114).
[Penney et al., 1998] Penney, G., Weese, J., Little, J., et al., A comparison of similarity
measures for use in 2-D-3-D medical image registration, IEEE Transactions on
Medical Imaging, volume 17, no. 4, (1998), pp. 586–595.
[Perperidis et al., 2004] Perperidis, D., Lorenzo-Valdes, M., Chandrashekara, R., et al.,
Building a 4D atlas of the cardiac anatomy and motion using MR imaging, in :
Biomedical Imaging : Macro to Nano, 2004. IEEE International Symposium on,
volume 1, IEEE Computer Society, 2004, (pp. 412–415).
[Perperidis et al., 2005] Perperidis, D., Mohiaddin, R., Rueckert, D., Spatio-temporal
free-form registration of cardiac MR image sequences, Medical Image Analysis,
volume 9, (2005), p. 5.
[Perperidis et al., 2003] Perperidis, D., Rao, A., Valdes, M. L., et al., Spatio-temporal
alignement of 4D cardianc images, in : FIMH, Lyon, France, 2003, (pp. 205–214).
[Petitjean, 2003] Petitjean, C., Recalage non rigide d’images par approches variationnelles statistiques : application à l’analyse et à la modélisation de la fonction myocardique en IRM, Ph.D. thesis, Université René Descrates- Paris V, 2003.
BIBLIOGRAPHIE
217
[Pettigrew et al., 1999] Pettigrew, R., Oshinski, J., Chatzimavroudis, G., et al., MRI techniques for cardiovascular imaging., Journal of magnetic resonance imaging, volume 10, no. 5, (1999), pp. 590–601.
[Pham et al., 2001] Pham, Q., Vincent, F., Clarysse, P., et al., A FEM-based deformable
model for the 3D segmentation and tracking of the heart in cardiac MRI, in : ISPA
2001, Pula, Croatia, 2001, (pp. 250–254).
[Planat, 1999] Planat, A. C., Estimation de mouvement par maillage actif multiéchelle
avec prise en compte des discontinuités : Application à l’imagerie cardiaque en
Résonance Magnétique., Ph.D. thesis, INSA de Lyon, 1999.
[Press et al., 1992] Press, W., Teukolsky, S., Vetterling, W., et al., Numerical Recipes in
C : the art of scientific computing, 2 edition, Cambridge University Press, Cambridge, 1992.
[Promayon, 1997] Promayon, E., Modélisation et simulation de la respiration, Ph.D. thesis, Université Joseph Fourier, 1997.
[Reilhac et al., 2005] Reilhac, A., Batan, G., Michel, C., et al., PET-SORTEO : validation and development of database of simulated PET volumes, IEEE Transactions
on Nuclear Science, volume 52, no. 1, (2005), pp. 1321– 1328.
[Rey et al., 2002] Rey, D., Subsol, G., Delingette, H., et al., Automatic detection and segmentation ofevolving processes in 3D medical images : application to multiple sclerosis, Medical Image Analysis, volume 6, no. 2, (2002), pp. 163–179.
[Reynard et al., 1995] Reynard, D., Blake, A., Azzawi, A., et al., Computer tracking of
tagged 1H MR Images for motion analysis, in : CVRMed ’95 : Proceedings of the
First International Conference on Computer Vision, Virtual Reality and Robotics
in Medicine, Springer-Verlag, London, UK, ISBN 3-540-59120-6, 1995, (pp. 272–
276).
[Rhor et al., 2001] Rhor, K., Stiehl, H. S., Sprengel, R., et al., Landmark-based elastic
registration using approximating thin-plate splines, IEEE Transactions on Medical
Imaging, volume 20, no. 6, (2001), pp. 526–534.
[Rietzel et al., 2005a] Rietzel, E., Chen, G., Choi, N., et al., Four-dimensional imagebased treatment planning : target volume segmentation and dose calculation in the
presence of respiratory motion, International Journal of Radiation Oncology Biology Physics, volume 61, no. 5, (2005a), pp. 1535–50.
[Rietzel et al., 2005b] Rietzel, E., Pan, T., Chen, G., Four-dimensional computed tomography : image formation and clinical protocol., Medical Physics, volume 32,
(2005b), pp. 874–889.
[Rit et al., 2005] Rit, S., Sarrut, D., Ginestet, C., Respiratory signal extraction for 4D
CT imaging of the thorax from cone-beam CT projections., in : Medical Image
Computing and Computer-Assisted Intervention Ű MICCAI 2005, Springer Berlin,
2005, (pp. 556–563).
[Ritchie et al., 1992] Ritchie, C., Godwin, J., Crawford, C., et al., Minimum scan speeds
for suppression of motion artifacts in CT., Radiology, volume 185, (1992), pp. 37–
42.
218
BIBLIOGRAPHIE
[Roche et al., 1999] Roche, A., Malandain, G., Ayache, N., Unifying maximum likelihood
approaches in medical image registration, Technical report, Sophia Antipolis, INRIA, 1999.
[Roche et al., 1998] Roche, A., Malandain, G., Ayache, N., et al., Multimodal image registration by maximization of the correlation ratio, Technical Report RR-3378, INRIA, 1998.
[Rohlfing and Maurer, 2003] Rohlfing, T., Maurer, C., Non-rigid image registration in
shared-memory multiprocessor environments with application to brains, IEEE
Transactions on Information Technology in Biomedicine, volume 7, (2003), pp.
16–25.
[Rohlfing et al., 2003] Rohlfing, T., Maurer, C. R., Bluemke, D. A., et al., Volumepreserving nonrigid registration of MR breast images using free-form deformation
with an incompressibility constraint, IEEE Transactions on Medical Imaging, volume 22, (2003), pp. 730–741.
[Rohr, 2001] Rohr, K., Landmark-Based Image Analysis : Using Geometric and Intensity Models, Kluwer Academic Publishers, Norwell, MA, USA, 2001, ISBN
0792367510.
[Rousseeuw and Leroy, 1987] Rousseeuw, P. J., Leroy, A. M., Robust regression and outlier detection, John Wiley & Sons, Inc., New York, NY, USA, 1987, ISBN 0-47185233-3.
[Roux, 2004] Roux, S., Modèles dynamiques en tomographie- application à l’imagerie
cardiaque, Ph.D. thesis, Université Joseph Fourier Grenoble, 2004.
[Rueckert et al., 1999] Rueckert, D., Sonoda, L., Hayes, C., et al., Nonrigid registration
using free form deformation : application to breast MR images, IEEE Transactions
on Medical Imaging, volume 11, (1999), pp. 712–721.
[Sanchez-Ortiz et al., 2000] Sanchez-Ortiz, G. I., Declerck, J., Mulet-Parada, M., et al.,
Automating 3D echocardiographic image analysis, in : MICCAI ’00 : Proceedings
of the Third International Conference on Medical Image Computing and ComputerAssisted Intervention, Springer-Verlag, London, UK, ISBN 3-540-41189-5, 2000,
(pp. 687–696).
[Sarrut, 2006] Sarrut, D., Deformable registration for image-guided radiation therapy,
Zeitschrift fuer Medizinische Physik, volume 16, no. 4, (2006), pp. 285–297.
[Sarrut et al., 2005] Sarrut, D., Boldea, V., Ayadi, M., et al., Non-rigid registration method to assess reproducibility of breath-holding with ABC in lung cancer, International Journal of Radiation Oncology Biology Physics, volume 61, no. 2, (2005),
pp. 594–607.
[Sarrut et al., 2006] Sarrut, D., Boldea, V., Miguet, S., et al., Simulation of 4D CT images
from deformable registration between inhale and exhale breath-hold CT scans, Medical Physics, volume 33, no. 3, (2006), pp. 605–617.
[Sederberg and Parry, 1986] Sederberg, T. W., Parry, S. R., Free-form deformation of solid geometric models, in : SIGGRAPH ’86 : Proceedings of the 13th annual conference on Computer graphics and interactive techniques, ACM Press, New York,
NY, USA, ISBN 0-89791-196-2, 1986, (pp. 151–160).
BIBLIOGRAPHIE
219
[Shen and Castan, 1992] Shen, J., Castan, S., An Optimal Linear Operator for Step Edge
Detection, GMIP, volume 54, no. 1, (1992), pp. 112–133.
[Shepp et al., 1979] Shepp, L. A., Hilal, S. K., Schulz, R. A., Tuning fork artifact in
computerized tomography, Computer Graphics and Image Processing, volume 10,
no. 3, (1979), pp. 246–255.
[Shimizu et al., 2000] Shimizu, S., Shirato, H., Kagei, K., et al., Impact of respiratory
movement on the computed tomographic images of small lung tumors in threedimensional radiotherapy, International Journal of Radiation Oncology Biology
Physics, volume 46, no. 5, (2000), pp. 1127–1133.
[Shirato et al., 2003] Shirato, H., Harada, T., Harabayashi, T., et al., Feasibility of insertion/implantation of 2.0-mm-diameter gold internal fiducial markers for precise
setup and real-time tumor tracking in radiotherapy, International Journal of Radiation Oncology Biology Physics, volume 56, no. 1, (2003), pp. 240–247.
[Sprengel et al., 1996] Sprengel, R., Rohr, K., Stiehl, H., Thin-plate spline approximation
for image registration, in : Proceedings of the 18th Annual International Conference of the IEEE, volume 3, 1996, (pp. 1190–1191).
[Stiller and Konrad, 1999] Stiller, C., Konrad, J., Estimating motion in image sequences,
a tutorial on modeling and computation of 2D motion, IEEE Signal Process. Mag.,
volume 16, (1999), pp. 70–91.
[Thirion, 1998] Thirion, J., Image matching as a diffusion process : an analogy with Maxwell’s demons, Medical Image Analysis, volume 2, no. 3, (1998), pp. 243–260.
[Torrey, 1956] Torrey, H. C., Bloch equations with diffusion terms, Phys. Rev., volume
104, no. 3, (1956), pp. 563–565.
[Tukey, 1977] Tukey, J. W., Box-and-whisker plots, in : Exploratory Data Analysis,
Addison-Wesley, Reading, Mass., 1977, (pp. 39–43).
[Vedam et al., 2003] Vedam, S., Keall, P., Kini, V., et al., Acquiring a four-dimensional
computed tomography dataset using an external respiratory signal, Physics in Medicine and Biology, volume 48, no. 1, (2003), pp. 45–62.
[Viergever and Maintz, 1998] Viergever, M., Maintz, J., A survey of medical image registration, Medical Image Analysis, volume 2, (1998), pp. 1–36.
[Villard et al., 2005] Villard, P., Beuve, M., Shariat, B., et al., Simulation of lung behaviour with finite elements : influence of bio-mechanical parameters, in : MEDIVIS
’05 : Proceedings of the Third International Conference on Medical Information
Visualisation–BioMedical Visualisation, IEEE Computer Society, Washington, DC,
USA, 2005, (pp. 9–14).
[Villard et al., 2004] Villard, P.-F., Beuve, M., Shariat, B., et al., Lung mesh generation
to simulate breathing motion with a finite element method, in : IEEE Conference
on Information Visualization, volume 00, IEEE Computer Society, London, UK,
2004, (pp. 194–199).
[Viola, 1995] Viola, P., Alignment by maximization of mutual information, Ph.D. thesis,
Massachusetts Institute of Technology (MIT), 1995.
[Weickert and Schnörr, 2001] Weickert, J., Schnörr, C., Variational optic flow computation with spatio-temporal smoothness constraint, Journal of Mathematical Imaging
and Vision, volume 14, (2001), pp. 245–255.
220
BIBLIOGRAPHIE
[Welch and Bishop, 2004] Welch, G., Bishop, G., An introduction to the kalman filter,
Technical Report TR 95-041, University of North Carolina at Chapel Hill, 2004.
[Wendland, 2004] Wendland, H., Scattered data approximation, Cambridge University
Press, Cambridge, UK, 2004.
[Wierzbicki et al., 2004] Wierzbicki, M., Drangova, M., Guiraudon, G., et al., Validation
of dynamic heart models obtained using non-linear registration for virtual reality
training, planning, and guidance of minimally invasive cardiac surgeries, Medical
Image Analysis, volume 8, no. 3, (2004), pp. 387–401.
[Woods et al., 1998] Woods, R. P., Grafton, S. T., Watson, J. D. G., et al., Automated
image registration. II. intersubject validation of linear and nonlinear models., Journal of Computer Assisted Tomography, volume 22, no. 1, (1998), pp. 153–165.
[Wright, 1997] Wright, G. A., Magnetic resonance imaging, IEEE Transactions on Singal
Processing, volume 14, no. 1, (1997), pp. 56–66.
[Young et al., 1995] Young, A., Kraitchman, D., Dougherty, L., et al., Tracking and finite element analysis of stripe deformation in magnetic resonance tagging, IEEE
Transactions on Medical Imaging, volume 14, no. 3, (1995), pp. 413–421.
[Zerhouni et al., 1988] Zerhouni, E., Parish, D., Rogers, W., et al., Human heart : tagging
with MR imaging - a method for non invasive assessment of myocardial motion,
Radiology, volume 169, no. 1, (1988), pp. 59–63.
[Zhang et al., 2004] Zhang, T., Jeraj, R., Keller, H., et al., Treatment plan optimization
incorporating respiratory motion, Medical physics, volume 31, no. 6, (2004), pp.
1576–86.
F OLIO A DMINISTRATIF
T HÈSE SOUTENUE DEVANT L’I NSTITUT N ATIONAL
DES S CIENCES A PPLIQUÉES DE LYON
N OM : DELHAY
P RÉNOM : Bertrand
DATE DE SOUTENANCE : 13 Décembre 2006
T ITRE : Estimation spatio-temporelle de mouvement et suivi de structures déformables. Application à
l’imagerie dynamique du cœur et du thorax
N ATURE : Doctorat
N UMÉRO D ’ ORDRE : 2006-ISAL-00119
F ORMATION DOCTORALE : Sciences de l’Information, des Dispositifs et des Systèmes
F ILIÈRE : Instrumentation, Système, Signal & Image
C OTE B.I.U. LYON : T 50/210/19
/
C LASSE :
R ÉSUMÉ : Cette étude a pour cadre l’extraction de paramètres quantitatifs caractérisant la dynamique d’organes (thorax & cœur) en mouvement à partir de séquences d’images tridimensionnelles acquises en imagerie médicale. Notre approche s’appuie sur des techniques de recalage non-linéaires paramétriques et des
transformations dites déformations de formes libres. Une représentation multi-résolution et multi-échelle
de recalage non-linéaire 3D dans une base de fonctions B-splines est d’abord proposée. Nous constatons
les limites de l’approche 3D pour l’estimation et le suivi de mouvement dans une séquence d’images et
la nécessité d’introduire des contraintes temporelles. Nous avons contribué à la construction d’un modèle
dynamique probabiliste des 4 cavités cardiaques. Le modèle géométrique des structures est constitué d’un
ensemble de pseudo-marqueurs qui décrit l’évolution des surfaces cardiaques. Un échantillonnage des trajectoires de ces pseudo-marqueurs adapté à la séquence d’images à traiter permet d’obtenir, pour chacun des
instants, un modèle statistique composé d’une forme moyenne et de variations estimées par une méthode
de fenêtrage de Parzen. Un modèle d’état paramétrique et continu des transformations spatio-temporelles
est ensuite introduit. Un algorithme basé sur le filtrage de Kalman estime les paramètres de ce modèle sous
la contrainte de périodicité du mouvement. L’avantage principal de cette méthode est de prendre en compte
de manière globale l’ensemble des images de la séquence. Le cadre théorique proposé permet également
l’adaptation locale de la complexité du modèle au mouvement à estimer. Afin de diminuer les temps de calcul, une version parallèle et diverses stratégies ont été mises en oeuvre, en particulier sur une architecture
multi-processeurs. Enfin, une évaluation de l’influence des paramètres est proposée sur des cas synthétiques
et réels en imagerie cardiaque. La mise en place d’un cadre d’évaluation permet d’effectuer des comparaisons avec d’autres méthodes dans un contexte de prise en compte du mouvement dans la préparation de
traitements en radiothérapie des poumons.
M OTS - CLÉS : Analyse d’images, Estimation spatio-temporelle de mouvement, Recalage non linéaire
d’images, imagerie 4D, Contrainte temporelle, Filtrage de Kalman, Multirésolution, Modèle statistique de
forme 4D, Imagerie thoracique et cardiaque.
L ABORATOIRE DE R ECHERCHES :
Centre de Recherche et d’Applications en Traitement de l’Image et du Signal (CREATIS), UMR CNRS
5515, U630 Inserm
C O -D IRECTEURS DE T HÈSE : Patrick Clarysse, Isabelle Magnin
P RÉSIDENT DU J URY :
C OMPOSITION DU J URY : Grégoire Malandain, Isabelle Bloch, Jérôme Pousin, Jyrki Lötjönen, Patrick
Clarysse et Isabelle Magnin