Corrélation spatiale de la chromatine et de la machinerie

Transcription

Corrélation spatiale de la chromatine et de la machinerie
ÉCOLE NORMALE
S U P É R I E U R E
Stage de troisième année de licence
Corrélation spatiale de la
chromatine et de la machinerie
transcriptionnelle à l’échelle de la
molécule unique
Maxime Woringer
[email protected]
Sous la direction de :
Ignacio Izeddin
Vincent Récamier
et Xavier Darzacq
Juin–Juillet 2013
Stage au laboratoire
d’Imagerie Fonctionnelle de la transcription
(Functonal Imaging of Transcription — FIT)
au département de biologie de l’École normale Supérieure.
Paris, France
Corrélation spatiale de la chromatine et de la machinerie
transcriptionnelle à l’échelle de la molécule unique
Maxime Woringer
15 septembre 2013
Table des matières
1 Matériel et méthodes
1.1 Acquisition des données . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1 Microscopie tridimensionnelle superrésolutive PALM et dSTORM
Imagerie de molécules uniques . . . . . . . . . . . . . . . . . . . .
Imagerie en trois dimensions grâce à de l’optique adaptative . . . .
Imagerie en deux couleurs . . . . . . . . . . . . . . . . . . . . . . .
1.1.2 Marquage en deux couleurs . . . . . . . . . . . . . . . . . . . . . .
Culture cellulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Transfections . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Fluorophores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Traitement des données . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Extraction des coordonnées des détections . . . . . . . . . . . . . .
1.2.2 Aspects mathématiques . . . . . . . . . . . . . . . . . . . . . . . .
Description et caractérisation d’un point pattern . . . . . . . . . .
Indépendance de deux point patterns. . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
4
4
4
6
7
8
9
9
10
11
11
11
11
12
2 Résultats
2.1 Détermination du couple idéal de fluorophores . . . . .
2.1.1 Toxicité . . . . . . . . . . . . . . . . . . . . . .
Effet du remplacement de la protéine Rpb1 par
Effet des fluorophore dans la lignée Rpb1 Halo
2.1.2 Marquage in cellulo . . . . . . . . . . . . . . .
Cellule vivante . . . . . . . . . . . . . . . . . .
Cellule fixée . . . . . . . . . . . . . . . . . . . .
2.2 Acquisitions en deux couleurs . . . . . . . . . . . . . .
2.2.1 Jeu de données . . . . . . . . . . . . . . . . . .
2.2.2 Forme des PSF . . . . . . . . . . . . . . . . . .
2.2.3 Précision des localisations . . . . . . . . . . . .
2.3 Analyses spatiales . . . . . . . . . . . . . . . . . . . .
2.3.1 Couleurs individuelles . . . . . . . . . . . . . .
Histone . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
13
14
14
14
15
15
15
16
16
16
18
18
19
19
1
. . . . . . .
. . . . . . .
Rpb1-Halo.
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2.3.2
Polymérase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Deux couleurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3 Discussion
21
22
23
Introduction
Le noyau est chez les eucaryotes le siège de la première étape de l’expression génétique, la
transcription. Il posséde également une structure spatiale fortement hétérogène : la chromatine
présente des zones de densités variables, et les protéines qui baignent et diffusent dans l’espace
laissé libre d’ADN ne sont pas uniformément réparties ([1], pp. 433–439 et [3], pp. 383–405).
Cette structuration de l’espace n’est pas sans conséquences pour les protéines qui diffusent plus
ou moins librement dans le noyau. Ainsi, le temps nécessaire à une molécule (par exemple un facteur
de transcription, protéine impliquée dans l’expression des gènes) pour trouver une cible définie dans
le noyau (par exemple la séquence régulatrice du gène en question) varie suivant la structure de
l’espace dans lequel elle se déplace (Figure 1). Par exemple, si la diffusion de la molécule est extrêmement contrainte (Figure 1.b), son déplacement se rapproche de celui d’une marche aléatoire 1
à une dimension. Dans ce type de marche aléatoire, chaque point est asymptotiquement visité un
nombre infini de fois [24] : on parle d’exploration compacte, les régions proches du point de départ
sont plus visitées que celles éloignées. À l’inverse, si la molécule diffuse librement en trois dimensions (Figure 1.a), la probabilité que la molécule explore deux fois un point donné de l’espace est
constante et strictement inférieure à un, et tous les points ont la même probabilité d’être recroisés. Autrement dit, dans ce régime diffusif, la notion «être à proximité de» n’existe pas et, dans
le cadre du problème de recherche de cible, la structuration spatiale du noyau n’a pas d’importance.
Figure 1 – Trois manières d’explorer le noyau, trois régimes de diffusion. (a) Diffusion libre d’une
molécule dans un espace à trois dimensions. (b) Marche aléatoire dans un espace contraint, la
dimension de la marche est inférieure à 2. (c) Sous-diffusion/confinement.
Au-delà de ces remarques théoriques, plusieurs régimes diffusifs ont été mis en évidence in vivo
sur des facteurs de transcription, impliqués dans la formation du complexe de pré-initiation de la
1. Cette notion est définie rigoureusement dans [8], Chapitre 16, page 258 et suivantes.
2
transcription : certains diffusent librement en trois dimensions, d’autres suivent des marches de dimension inférieure, tandis que d’autres encore paraissent plus ou moins confinés 2 . Ainsi, l’existence
de plusieurs régimes diffusifs pour les facteurs de transcription suggère un rôle de la structuration
spatiale du noyau dans la régulation des processus transcriptionnels
De plus, si le noyau est hétérogène, son organisation n’est pas aléatoire. Par exemple, de nombreuses expériences [21], notamment de FISH (Fluorescence in situ hybidization) et de hi-C/3C
(chromosome conformation capture) montrent l’association statistique de certains gènes et chromosomes, regroupés entre autres en « territoires chromosomiques ». Ces expériences permettent
de poser la question de la relation qu’entretiennent la structure spatiale complexe du noyau et
la régulation de l’expression génétiqe. Dans cette régulation, le complexe de pré-initiation de la
transcription (PIC ou pre-initiation complex ) joue un rôle majeur. Structure impliquant environ
80 protéines, dont l’ARN polymérase II (ARNpolII), il constitue un point de contrôle central dans
l’amorce de la transcription. La compréhension du fonctionnement du PIC implique d’élucider les
mécanismes régissant son assemblage. En effet, si celui-là est gouverné par des interactions fortes,
les possibilités de régulation sont réduites. À l’inverse, dans le cas d’interactions faibles, les options
sont plus nombreuses, en particulier le jeu des variations de concentrations locales en protéines
du PIC peut rapidement déplacer l’équilibre thermodynamique dans le sens de son assemblage ou
désassemblage.
En pratique, on sait que la concentration de l’ARNpolII est hétérogène et que celle-ci se concentre
au sein de structures parfois appelées transcription factories [21]. Plus récemment, l’équipe de Xavier
Darzacq a montré l’existence de clusters labiles d’ARNpolII [4]. Par ailleurs, l’équipe a également
montré en étudiant en superrésolution l’organisation de l’histone H2B que la chromatine adopte
elle aussi une structure hétérogène en clusters à de multiples échelles [19].
Ainsi, si l’organisation de la chromatine et de l’ARNpolII sont désormais connues, on en sait
peu sur les relations spatiales qu’entretiennent ces deux complexes. Existe-t-il un enrichissement
local de polymérase dans les zones denses en chromatine comme le suggère le dogme actuel ? Dans
ce cas-là, les zones accessibles du noyau seraient plus fortement transcrites. À l’inverse, existe-il
une relation de colocalisation entre les deux molécules ? Enfin, il est également possible qu’aucune
relation n’existe entre les deux. D’une manière générale, peu d’éléments confortent à l’heure actuelle
l’une ou l’autre hypothèse.
Néanmoins, un certain nombre d’outils physiques, chimiques, biologiques, computationnels et
mathématiques permettent aujurd’hui de poser précisément ces questions ; tout d’abord, la mise au
point par un collaborateur de l’équipe [13] de nouveaux fluorophores aux propriétés optiques améliorées couplée à de l’imagerie optique tridimemnsionnelle à superrésolution (PALM ou dSTORM,
Photo-Activated Localization Microscopy, direct Stochastic Optical Reconstruction Microscopy, deux
techniques permettant la localisation de dizaines de milliers, voire millions, de molécules uniques
avec une précision de pointé de l’ordre de quelques dizaines de nanomètres) permettent d’imaginer
un protocole d’imagerie testant l’éventuelle relation entre la chromatine et le PIC. L’histone H2B,
marqueur de la chromatine, et l’ARNpolII, composante du PIC ont été utilisées, l’équipe disposant
d’une expérience de ces molécules. Enfin, des outils mathématiques issus des statistiques spatiales
et des processus pontuels permettent la recherche de corrélations entre les deux nuages de points
(resp. H2B et PolII) issus des données de superrésolution.
À l’aide des techniques et du savoir-faire présents au laboratoire, et en utilisant comme modèle
le couple ARNpolII/H2B dans des cellules humaines cancéreuses U2OS, nous avons tenté de mettre
au point une méthode permettant de tester les relations spatiales en question à la fois sur des
2. Travaux non publiés de l’équipe
3
cellules vivantes et fixées.
1
1.1
Matériel et méthodes
Acquisition des données
Pour répondre à la question posée, de nombreuses étapes sont nécessaires, de la mise en culture
des cellules et au choix des fluorophores adapté jusqu’à l’obtention de nuages de points correspondant aux localisations des molécules. À chaque fois, les optimisations réalisées gravitent autour de la
microscopie superrésolutive, technique de choix pour tenter de cerner les relations PIC/chromatine.
De plus, la technologie d’optique adaptative en place au laboratoire permet d’acquérir des structures en trois dimensions. Cette troisième dimension est indispensable pour mettre en évidence des
corrélations spatiales. Sans cela, il est possible que la projection du noyau de la cellule sur un plan
crée fortuitement des colocalisations.
1.1.1
Microscopie tridimensionnelle superrésolutive PALM et dSTORM
Imagerie de molécules uniques
Principe Le PALM (Photo-Activated Localization Microscopy) et le dSTORM (direct Stochastic Optical Reconstruction Microscopy) sont deux techniques de microscopie optique à fluorescence
qui permettent de localiser des molécules fluorescentes au-delà de la limite de diffraction de la lumière 3 . En effet, les lois de l’optique gaussienne imposent que l’image d’une source pontuelle (i.e.
un fluorophore) n’est pas un point, mais une tache de diffraction, ou PSF (Point Spread Functions,
Figure 2.d), prenant idéalement la forme d’une fonction de Airy, laquelle peut être approximée par
une gaussienne à deux dimensions. La limite de résolution est atteinte lorsque les PSF de deux
points trop proches se chevauchent et ne peuvent plus être distinguées (visible en fluorescence plein
champ, tous les fluorophores sont allumés simultanément, Figure 2.d).
La superrésolution contourne ce problème en séparant temporellement la détection des molécules, dans un régime dit de molécule unique. En effet, les techniques de PALM/dSTORM employées
durant le stage reposent sur des fluorophores pouvant alterner entre un état on fluorescent et un
état off. Le passage stochastique d’un fluorophore vers l’état on puis sa destruction (par exemple
par photoblanchiment) assure leur séparation dans l’espace. L’itération de la séquence activation
stochastique → prise d’une image → blanchiment permet en théorie d’imager tous les fluorophores
en réalisant un film (Figure 2.b), chaque image permettant de localiser quelques fluorophores (Figure 2.c).
Cette localisation tire parti de la forme quasi-gaussienne de la PSF. Sous l’hypothèse de distribution normale des photons, l’incertitude sur l’estimation du centre de la gaussienne (d’écart-type
σ) est l’erreur standard sur la moyenne : √σn , (n : nombre de photons collectés au-dessus du bruit).
Il est possible de récolter suffisamment de photons pour localiser le fluorophores en quelques dizaines de millisecondes (10–100 ms). L’opération de localisation est répétée des dizaines de milliers
de fois et fournit les dizaines de milliers (ou plus) de détections permettant la reconstruction d’une
structure.
3. Cette limite est de l’ordre de la longueur d’onde λ utilisée et impose que deux point situés à une distance
inférieure à λ ne peuvent être distingués. Cette limite vaut pour un microscope NλA , avec N A l’ouverture numérique
de l’objectif, de l’ordre de 1.
4
a
b.1
b.2
c
*
*
b.3
d
Figure 2 – Reconstruction d’image en PALM/STORM : noyau avec l’histone H2B marquée avec le
fluorophore Dendra2 (a). Cellule en fluorescence plein champ. Dendra2 est dans sa forme verte non
photoconvertie, filtre d’émission centré sur 505 nm, (b.1 à b.3). Acquisition en régime de molécules
uniques, images tirées d’un film en comportant 20000. Dendra2 est observée dans sa forme rouge
(après photoconversion stochastique), filtre à 575 nm. (c). Structure reconstruite après localisation
des points détectés. (d). PSF correspondant à la détection d’une molécule.
La résolution de la structure reconstruite est limitée par deux facteurs. (1) la précision de pointé :
il n’est pas possible d’obtenir des informations à des rayons inférieurs à celle-ci. (2) le nombre de
détections : d’après le théorème d’échantillonnage de Nyquist, la résolution spatiale est bornée par
la moitié de la fréquence de l’échantillonnage réalisé, lié au nombre de détections.
La différence entre les techniques PALM et STORM ne réside pas dans le dispositif d’acquisition, mais dans la nature des fluorophores utilisés. En PALM, les fluorophores sont des protéines
fluorescentes fusionnées aux molécules d’intérêt, ils sont organiques en dSTORM.
5
Dispositif expérimental Le dispositif expérimental dérive d’un microscope à fluorescence
plein champ et permet des reconstructions à une résolution nanométrique. Il présente plusieurs
composants notables (Figure 3) :
– Un banc laser muni d’un AOTF (acousto-optical tunable filter ), un dispositif permettant de
moduler les quantités de rayonnement laser transmises à l’échantillon.
– Un miroir associé à un objectif 100x permettant d’incliner le rayonnement d’excitation afin
qu’il traverse le moins possible la cellule (réduisant dispersion et bruit).
– Des filtres dichroïques multibandes, transmettant les longueurs d’onde d’émission des fluorophores, et filtrant celles d’excitation.
– Une platine accueillant les échantillons sur lamelles, qui doivent être extrêmement propres
(lavage à l’isopropanol, éthanol, eau puis passées au sonicateur et Plasma Cleaner) car la
poussière fluoresce fortement.
– Un miroir déformable, instrument d’optique adaptative compensant les aberrations du système, et permettant d’en introduire à dessein de nouvelles.
– Une caméra à haute sensibilité précédée d’une lentille de grossissement assurant qu’un pixel
corresponde à 106 nm dans l’échantillon. Grossir les PSF par rapport au détecteur permet de
satisfaire la condition de Nyquist sus-citée.
Banc laser
Microscope
Lamelle
405 nm
561 nm
Analyseur
de
front d'onde
Objectif
AOTF
Beam
expander
{
Optique adaptative
miroir
déformable
EMCCD
Focusing
lens
Tube lens
Figure 3 – Schéma (d’après [11]) du microscope utilisé.
Imagerie en trois dimensions grâce à de l’optique adaptative
Principe Dans un système optique sans aberrations, l’image d’un point au plan focal objet est
une fonction de Airy sur le détecteur situé au plan focal image. Si l’on éloigne la source ponctuelle
du plan focal objet, les rayons ne vont plus converger au niveau du détecteur, mais en amont ou
au-delà de celui-ci : le point est défocalisé et apparaît d’abord flou, puis disparaît à mesure qu’on
l’éloigne du plan focal ; un fluorophore est détectable à plusieurs centaines de nanomètres du plan
focal.
6
Si un fluorophore défocalisé reste visible sur le détecteur, il n’est pas facile de remonter à
sa position en z. En revanche, avec un système optique présentant des aberrations, comme de
l’astigmatisme (introduit par exemple par de l’optique adaptative [11]), les PSF présentent des
asymétries caractéristiques de leur localisation en z. Pour un système astigmate, la gaussienne est
étirée suivant sa localisation en z (Figure 4), permettant ainsi d’estimer la position du fluorophore
en trois dimensions.
z
Plan focal
Figure 4 – Forme de la PSF en fonction de sa position en z. Rond bleu : position en z de la
molécule.
La reconstruction de structures en trois dimensions donne accès à des informations qui ne
peuvent pas être estimées lorsqu’on travaille sur une projection. En particulier, les distances entre
les points sont vraies, les coefficients de diffusion dans les expériences de suivi de molécules sont
moins biaisés. Enfin, les données tridimensonnelles permettent de calculer la dimension fractale de
la structure [19], interprétable en termes d’accessibilité de la chromatine et inaccessible en deux
dimensions.
Si l’utilisation d’un système astigmate permet l’étude tridimensionnelle du noyau, l’ajout d’aberrations diminue la quantité de photons récupérés, et donc la précision de pointé. Pour introduire un
astigmatisme limité, un miroir déformable (Figure 3) est placé sur le chemin optique. Le miroir sert
d’abord à corriger les aberrations du système de manière à ce que les PSF détectées ressemblent une
fonction de Airy. Ensuite, une fois les imperfections du système corrigées, il est possible d’introduire
un astigmatisme limité pour faire de la 3d.
Calibration du système optique L’optique adaptative fonctionne en deux temps : (1) calibration des aberrations et leur correction par déformation du miroir. Elle s’effectue sur des billes
fluorescentes, dont la PSF est connue. (2) éventuelle déformation du miroir pour introduire les aberrations optiques souhaitées, dont l’astigmatisme. (3) calibration de la relation entre la forme de la
PSF et la position en z : une bille fluorescente est observée à différentes profondeurs de champ et les
paramètres σx et σy (écarts-types suivant les deux grands axes) de la gaussienne asymétrique sont
estimés (Figure 5). Après calibration, il est possible d’estimer la position en z des points détectés.
Imagerie en deux couleurs Le système décrit supra permet de reconstruire une structure en
détectant une fraction des molécules d’intérêt. Néanmoins, des questions sur l’alignement et la
coïncidence des nuages de points se posent. Celles-ci découlent en partie de l’usage d’un système
non-achromatique : les longueurs d’onde utilisées ne se propagent pas de la même façon.
Double calibration et aberrations chromatiques La microscopie en deux couleurs nécessite deux calibrations, une par couleur : chaque fluorophore a son propre spectre d’émission, et les
7
a.
-492 nm
-312 nm
-160 nm
0 nm
+204 nm
+396 nm
+600 nm
2
wx−wy [px]
b.
wx−wy
Fit
0
−2
−400
−200
0
200
400
Figure 5 – Procédure de calibration d’une PSF avec une bille. (a) Bille à différentes profondeur
de champ. Images tirées d’une séquence de 170 images au pas de 12 nm. Aberrations optiques
importantes loin du plan focal. Pour chaque détection, les paramètres σx et σy sont modélisés. (b)
Courbe de calibration de la PSF. Abscisse : profondeur en z, ordonnée : différence entre σx et σy
estimés sur la gaussienne.
PSF peuvent différer entre couleurs, à cause des aberrations chromatiques du microscope et d’une
intensité de fluorescence différente.
Acquisitions in vivo et choix de dichroïques Il est possible de réaliser les acquisitions en
deux couleurs en faisant un film dans une couleur, puis dans l’autre sur cellule fixée. In vivo, cette
stratégie n’est pas adaptée, il faut entrelacer les prises de vue : les lasers sont synchronisés avec le
balayage de la caméra (fréquences jusqu’à 100 Hz). Un dichroïque multibande est nécessaire pour
que les longueurs d’onde d’émission soient transmises et celles d’excitation non.
1.1.2
Marquage en deux couleurs
Le dispositif décrit supra permet de reconstruire avec précision la structure de deux protéines
marquées avec deux fluorophores différents. Pour répondre à la question posée, on cherche à mettre
en place un marquage de la chromatine et d’un composant du PIC. Le choix du laboratoire s’est
porté respectivement sur l’histone H2B et sur l’ARN polymérase II.
Il est toujours possible de marquer en plusieurs couleurs avec des anticorps spécifiques puis des
anticorps secondaires fluorescents. Cette méthode pourait être employée. Néanmoins, le marquage
par anticorps présente plusieurs désavantages : (1) l’existence d’un marquage non spécifique. (2)
la taille importante du complexe anticorps–anticorps secondaire–fluorophore (plusieurs dizaines de
nanomètres) limite la résolution maximale. (3) le marquage d’une fraction seulement des épitopes,
limitant aussi la résolution de la structure. Ces arguments nous ont poussé à explorer une autre
voie : les Halo-tags et les protéines de fusion.
8
Culture cellulaire Deux lignées cellulaires dérivant des cellules U2OS (issues d’un ostéosarcome humain) et exprimant des versions modifiées de la protéine Rpb1 (sous-unité catalytique de
l’ARNpolII) ont été utilisées. Des lignées stables pour l’ARNpolII sont requises, car son niveau
d’expression est fortement régulé.
Deux stratégies de marquage pour Rpb1 ont été testées, s’appuyant sur deux lignées cellulaires
utilisées au laboratoire :
– Lignée 4ADP : Un marquage par insertion dans le génome d’une protéine de fusion
Rpb1–protéine fluorescente photoconvertible Dendra2 (Figure 6.a).
– Lignée Rpb1-Halo : Un marquage par insertion d’une protéine de fusion Rpb1—Halo-tag
(Figure 6.b).
Le Halo-tag [15] est une enzyme modifiée capable de se lier in vivo de manière covalente et
permanente à un ligand synthétique. Il permet de fixer très spécifiquement n’importe quelle molécule organique couplée à un ligand Halo-tag. La réaction permet de coupler une protéine d’intérêt
(ARNpolII) à un fluorophore organique. Il est ainsi possible de choisir le fluorophore le plus adapté
à la question posée sans refaire de transgenèse.
a. 4ADP
CMV
Dendra2 Rpb1*
-693
b. Rpb1-Halo
CMV
0
Halo-tag
-881
6380
Rpb1*
0
6380
*. Rpb1 -amanitine résistante
Figure 6 – Construits introduits dans les lignées 4ADP (a) et Rpb1-Halo (b).
Un promoteur viral CMV régule l’expression des protéines de fusion et le construit est inséré
aléatoirement dans le génome : l’expression de l’ARN messager devrait être importante, mais des
Western Blot ont montré qu’une régulation s’opère au niveau post-transcriptionnel. Le niveau d’expression de la protéine exogène n’est pas significativement différent de celui de Rpb1 endogène. Il
en va de même pour sa localisation ([4], figures supplémentaires). La version introduite du gène
Rpb1 est résistante à l’α-amanitine, un inhibiteur de l’ARN polymérase II. De l’α-amanitine dans
le milieu de culture assure que seule l’ARNpolII exogène s’exprime.
Le choix des lignées cellulaire permet donc de localiser l’ARNpolII en observant soit Dendra2
soit un fluorophore couplé au Halo-tag.
Transfections H2B est observable par l’expression d’une histone fusionnée à un fluorophore protéique ou à un Halo-tag. Plusieurs protéines de fusion disponibles au laboratoireont été expérimentées. Les plasmides correspondants ont été transfectés (Fugene, Promega) dans les 4ADP ou
Rpb1-Halo. Une transfection permet d’obtenir une expression forte comparable au niveau de l’histone endogène. Contrairement à Rpb1, une surexpression de H2B n’entraîne pas de phénotype
visible.
Les cellules ont été observées 48h après transfection car les histones marquées néosynthétisées
s’intègrent à la chromatine durant une mitose. On note que H2B endogène est toujours exprimée :
les histones marquées sont un sous-échantillonnage de la populations d’histones, ce qui pose peu
de problèmes car le nombre d’histones par noyau est élevé (environ 10 millions de nucléosomes par
9
cellule 4 ), la résolution n’est donc pas affectée.
Fluorophores
Description Deux grandes catégories de fluorophores ont été testées :
– Des fluorophores protéiques, utilisés ici pour faire du PALM (Photo-Activated Localization
Microscopy). Dans le cadre de la superrésolution, ce sont des protéines, souvent dérivées de
la GFP et modifiées pour pouvoir être activées sous l’action d’un pulse d’ultraviolets. Cette
activation peut entraîner le changement de longueur d’onde d’émission (photoconversion) ou
l’apparition de celle-ci (photoactivation), il est alors possible d’observer de la fluorescence en
réponse à une autre longueur d’onde d’excitation. Les fluorophores observés sont rapidement
photoblanchis par le laser d’excitation. Ainsi, en réglant la puissance relative du laser d’activation et d’excitation, il est possible de se placer dans un régime où un faible nombre de
molécules est visible à la fois (régime de molécules uniques).
– Des fluorophores organiques, utilisés ici pour faire de l’imagerie dSTORM (direct Stochastic
Optical Reconstruction Microscopy). En superrésolution, ce sont souvent des dérivés de la
cyanine (e.g. Cy3, Cy5) ou de la rhodamine, qui disposent d’une plus grande photostabilité
et sont plus brillants que les fluorophores protéiques. Ces fluorophores fonctionnent différemment des fluorophores protéiques : ils peuvent osciller (clignoter) entre deux états, un état on
fluorescent et un état off non fluorescent, ce dernier correspondant à un état excité du fluorophore dit état triplet. Initialement tous dans l’état off, une expérience en STORM débute
par une excitation intense pour envoyer un maximum de fluorophores dans l’état triplet. Le
régime de molécules uniques est atteint lors du retour individuel et stochastique vers l’état
on. Cette conversion n’est possible que dans un milieu réducteur (cytoplasme in vivo ou un
tampon ad hoc sur cellule fixée, voir Annexe 5, p.5).
Les spectres des fluorophores testés sont présentés en Annexe 1.1, p.2. Six des fluorophores
organiques sont issus d’une série de synthèses réalisées par un collaborateur de l’équipe [13]. Ils
dérivent de la rhodamine [16], ont été peu testés sur cellules vivantes et n’avaient jamais été utilisés
par l’équipe, qui dispose par ailleurs d’une expertise avec certains fluorophores (Dendra2, TMR et
Alexa 647).
Toxicité La toxicité des fluorophores a été comparée dans un premier temps : il est inutile de
marquer des cellules avec des fluorophores toxiques car leur programme transcriptionnel en serait
altéré, limitant la portée d’éventuelles interprétations. La toxicité des fluorophores organiques a été
évaluée avec l’appareil xCelligence (Roche Applied Science) [22]. Il permet de réaliser automatiquement des mesures d’impédance pendant plusieurs jours. Ces mesures permettent de calculer
le Cell Index, un indice corrélé avec la croissance/la confluence des cellules. En effet, l’impédance
du système, mesurée grâce à deux électrodes placées au fond du puits, est maximale en l’absence
de cellules (le contact des électrodes avec le milieu chargé d’ions est maximal) et diminue lorsque
les cellules croissent et s’attachent. La concentration optimale pour la microscopie a été déterminée
pour chaque fluorophore.
4. Calcul réalisé à partir des données Ensembl ([9], page http ://sep2013.archive.ensembl.org/Homo_sapiens/Info/Annotation)
et des données disponibles sur Bionumers ([17], entrées 104516, 103111 et 100419).
10
1.2
1.2.1
Traitement des données
Extraction des coordonnées des détections
Une première étape d’analyse des séquences vidéos est nécessaire pour extraire les coordonnées
des détections. Le logiciel MTT [20], développé spécifiquement dans ce but a été utilisé pendant le
stage. Ce logiciel permet la prise en mains de films de superrésolution et l’exploitations de données
3d. Son fonctionnement est décrit en Annexe 3, p.9.
1.2.2
Aspects mathématiques
MTT produit en sortie une liste de coordonnées (x, y, z) représentant un nuage de points. Formellement, on considère que ces nuages de points, dont la répartition est en partie dûe au hasard, sont
la réalisation d’un «point process», une variable aléatoire déterminant le nombre de points ainsi que
leur position dans l’espace. Plusieurs approches pour corréler des point patterns ont été développées.
Elles répondent à des questions légèrement différentes, tout en utilisant parfois les mêmes objets.
Description et caractérisation d’un point pattern
Définitions informelles
– Point process (processus ponctuel) : on considère un espace (noté B, typiquement R2 ou R3 )
dans lequel les points seront observés. Si les processus ponctuels dans R2 sont le plus souvent
considérés dans la littérature appliquée (en particulier en écologie, ou encore dans le paquet R
spatstat [2] qui fait référence en la matière), les processus ponctuels à trois dimensions sont
moins souvent développés, et une partie des formules et caractérisations doivent être adaptées
au cas tridimensionnel.
On définit N la variable aléatoire donnant le nombre de points du processus, et Xi , i ∈ [1, N ]
les variables aléatoires à valeurs dans l’espace B défini précédemment.
Dans le cadre d’un point pattern (une réalisation d’un processus ponctuel), on appelle événement
la réalisation ([X = x], x ∈ B : il y a un point du processus en x). On s’intéresse par la suite aux
processus ponctuels finis (toute zone de l’espace contient un nombre fini de points) et simple il y a
au plus un événement en chaque point de l’espace.
– Isotropie/homogénéité
– Isotropie : la distribution du point pattern est invariante par rotation.
– Homogénéité : la distribution du point pattern est invariante par translation (dans le cas
des images PALM/STORM, ces hypothèses ne sont pas respectées, en particulier à cause
de la présence de la limite du noyau et du fait qu’on image une tranche. Il est néanmoins
possible d’appliquer un certain nombre de corrections pour se ramener à ce cas)
– Intensité d’un point pattern : un point pattern peut être défini par le nombre moyen de points
se trouvant dans une région donnée, ou intensité (voir par exemple [10], p. 189) (notée λ(x)).
Cette grandeur dépend de la position dans le cas d’un processus ponctuel non homogène
(B(x,r))
(en notant
ou non isotrope. On la définit donc formellement comme λ(x) = lim E Ns(B(x,r))
r→0
s(B(x, r)) la surface/volume de la sphère B de centre x et de rayon r, et N (B(x, r)) le nombre
de points dans celle-ci).
Cette définition pose malheureusement problème lorsqu’on cherche à estimer empiriquement la
densité d’un processus ponctuel : la mesure consiste en un nombre fini de réplications de l’expérience,
et par conséquent faire tendre le volume considéré vers zéro entraîne le calcul de densités très
11
déformées (la densité est nulle partout sauf aux endroits où des événements ont été mesurés). Pour
pallier ce problème, on a en général recours à une estimation qui procède à un lissage entre les points
(en général par convolutin de l’espace par une gaussienne, ou encore une fonction d’Epanechnikov
[10], p.481). Ce procédé permet d’approcher l’intensité, mais nécessite d’introduire un paramètre : la
bande passante de la fonction, qui détermine l’influence d’événements lointains sur un point donné,
et les résultats sont très dépendants du choix de ce paramètre. D’autres méthodes d’estimation de
l’intensité existent également, en particulier des estimateurs paramétriques (détaillés dans [14]).
(B)
R NP
On a donc : λ(x0 ) =
1[Xi = x]I(x − x0 )dx, avec I une fonction donnant le poids à donner
B i=1
à un point à distance x − x0 d’un événement. C’est dans l’expression de I que le paramètre de
bande passante est présent. Si on choisit une gaussienne pour I, la bande passante représente alors
sa largeur à mi-hauteur.
Outil traditionnel d’analyse : fonction K de Ripley Il existe un certain nombre de
techniques permettant d’analyser et de caractériser des processus ponctuels. La plus utilisée est la
fonction K de Ripley, en particulier parce qu’elle présente une interprétation simple : la fonction
de Ripley donne pour chaque événement le nombre d’évenements situés dans un rayon r. Ainsi, en
deux dimensions et si les points sont placés au hasard dans l’espace (cas d’un processus homogène
de Poisson d’intensité λ), K(r) = λπr2 . En particulier, l’écart par rapport au processus de Poisson
donne une idée des phénomènes de clusturing ou de répulsion qui peuvent exister à diffférentes
échelles dans le processus.
Test de l’hypothèse de Complete Spatial Randomness Dans le cas où l’on s’intéresse
à un processus ponctuel univarié (un seul nuage de points), une des principales questions est de
caractériser l’écart à une distribution uniforme des points (ou complete spatial randomness – CSR)
afin de mettre en évidence des échelles où les points sont plutôt regroupés en clusters ou au contraire
séparés par des distances bien définies.
Pour cela, il est nécessaire de comparer le pattern observé à un modèle nul présentant les caractéristique d’un arrangement «au hasard» des points. Les processus de Poisson homogène (présentés
dans [10]), présentent les propriétés de ce type d’arrangement.
Dans le cas des processus de Poisson homogènes, il existe une expression analytique simple
de K(r) dans le cas d’un processus non borné. Par contre, si le processus présente des bords,
l’expression analytique ne peut plus être utilisée telle quelle, et il est nécessaire de mettre en place
des méthodes, souvent numériques et lourdes en calculs, permettant de prendre en compte les bords
(voir par exemple 5 et [18]).
Lorsqu’elle est réalisée, la simulation d’une répartition homogène de points permet d’aboutir
à la fois à une estimation de la fonction sous l’hypothèse nulle et de proposer des intervalles de
confiance sur ces mesures (approche de type Monte-Carlo).
Indépendance de deux point patterns.
5. La littérature sur la correction de bord est particulièrement riche, je ne m’y suis pas plongé, mais deux techniques
intuitives sont généralement employées (érosion et pondération par la surface de intersection du cercle de rayon
considéré et la zone d’observation).
12
Définition Dans ce cas, on considère que deux nuages de point sont générés par des mécanismes (processus) différents. Les premières applications ont été réalisées en écologie (position
de différentes espèces d’arbres par exemple). Le questionnement qui arrive naturellement de cette
description est de savoir si les deux point patterns sont indépendants ou non. Les tests de cette
hypothèse prennent en compte le fait que les deux point patterns peuvent avoir une distribution
différente.
Tests d’indépendance Une manière simple de tester l’indépendance de deux processus ponctuels consiste à calculer une distribution (par exemple K) entre les deux nuages, puis à les comparer
à des simulations où les deux processus sont indépendants.
Ainsi, Peter Diggle (dans [7]) calcule la distribution inter-types KI,II (r) (correspondant à l’histogramme du nombre de voisins de l’autre type dans un rayon r). Si les processus I et II sont
indépendants, alors KI,II (r) suit la distribution du hasard. En particulier, en deux dimensions et
sans correction de bords, KI,II (r) = πr2 , et ce quelle que soit la forme de KI,I et de KII,II .
Une fois la distribution calculée empiriquement, il reste à déterminer si celle-ci s’éloigne significativement de l’indépendance théorique. Pour cela, on fait appel à des simulations de Monte-Carlo
pour déterminer la variance de KI,II (r) sous l’hypothèse d’indépendance.
La difficulté consiste à trouver comment simuler un processus ponctuel qui possède la même
distribution et les mêmes propriétés statistiques que l’original, tout en étant à coup sûr indépendant
de l’autre processus ponctuel. Une solution traditionnellement retenue consiste à translater un point
pattern par rapport à l’autre suivant un vecteur de direction et norme aléatoire. On génère ainsi
un point pattern de même distribution, mais indépendant du second. Traditionnellement, la région
testée est «mappée» sur un tore, ce qui permet de ne pas perdre d’information ou de créer des
trous. Néanmoins, dans le cas d’un point pattern fini et borné dans un espace non rectangulaire, je
ne sais pas trop si un tel «mapping» est possible. . .
Une fois les simulations réalisées, il est possible de déterminer l’enveloppe de la courbe K (en
prenant par exemple le premier et le dix-neuvième vingtile de la simulation pour chaque point) et
observer la position de la courbe expérimentale.
2
Résultats
Pour obtenir des nuages de points bien résolus (i.e. avec suffisamment de détections avec une
bonne précision de pointé) des prérequis sont nécessaires : (1) déterminer le couple idéal de fluorophores. (2) calibrer le microscope et résoudre les biais en deux couleurs. (3) déterminer la qualité
des structures reconstruites individuellement. Ces étapes permettent d’assurer la validité des interprétations issues de l’analyse des structures reconstruites.
2.1
Détermination du couple idéal de fluorophores
Les données liminaires disponibles au laboratoire indiquent que Dendra2 est un bon candidat
pour la superrésolution. Photoconvertible, il permet de voir les cellules sans blanchir les fluorophores.
Néanmoins, l’existence de deux longueurs d’onde d’excitation et d’émission (correspondant à la
forme verte, non photoconvertie, et à la forme rouge, photoconvertie) réduit le nombre de partenaires
potentiels avec lequel il ne possède pas de spectre commun.
13
2.1.1
Toxicité
Si, à l’œil nu et lors des expériences de microscopie, aucune anomalie flagrante de croissance
ou de morphologie des cellules n’était visible, le suivi des courbes de croissance (Cell Index de la
machine xCelligence) montre une croissance différente entre les différentes conditions testées.
Effet du remplacement de la protéine Rpb1 par Rpb1-Halo. On compare tout d’abord
la lignée Rpb1 Halo et la lignée 4ADP dont elle est issue (Figure 7.a). Les résultats sont similaires
au premier abord : les indices de croissance obtenus au bout de quelques jours sont similaires.
Ces résultats corroborent les courbes de croissance de [4] sur les mêmes lignées. Ainsi, l’expérience
confirme l’innocuité du construit Rpb1 Halo et de la culture permanente sous α-amanitine.
Effet des fluorophore dans la lignée Rpb1 Halo Afin de déterminer une plage de concentrations optimale en vue des expériences de microscopie, plusieurs concentrations de fluorophores
ont été testées sur cellules Rpb1 Halo (concentrations de 100 nM à 2500 nM, exemple de résultat
présenté Figure 7.b). D’une manière générale, la toxicité augmente avec la concentration, et les
cellules n’ont jamais poussé à la concentration de 2500 nM. À 500 nM, les effets sont le plus souvent
très limités, voire invisibles (croissance relative des cellules proches du contrôle). Les données à 100
nM ne sont pas présentés car leur toxicité pour les sept fluorophores testés était supérieure à celle
à 2500 nM, laissant présager l’hypothèse d’une erreur de manipulation. Les résultats détaillés sont
présentés en Annexe 1.2.3, p.4.
a. U2OS wt / U2OS Rpb1 Halo
b. Silicon−rhodamine
6
Cell Index
8
10
12
U2OS Rpb1 Halo
dye 500 nM
dye 1000 nM
dye 2500 nM
0
2
4
6
0
2
4
Cell Index
8
10
12
U2OS wt
Rpb1 Halo
0
50
100
150
0
Temps (h)
50
100
150
Temps (h)
Figure 7 – Courbe de croissance des cellules (i.e. Cell Index au cours du temps). (a) Effet du remplacement de Rpb1 endogène par Rpb1-Halo. (b) Effet de concentrations croissantes du fluorophore
SiR sur les cellules Rpb1-Halo.
Ainsi, l’ajout du fluorophore organique n’est pas anodin. Une trop grande concentration (supérieure à 1 µmol.L−1 ) entraîne la mort des cellules en quelques jours. Néanmoins, une concentration
inférieure à 500 nM semble ne pas avoir d’effet notable. Des fluorophores conentrés entre 250 nM
et 500 nM ont été utilisées par la suite.
14
2.1.2
Marquage in cellulo
Une fois la toxicité des fluorophores déterminée, des essais in cellulo ont été réalisés et les
cellules ont été observées au microscope en champ large (Figure 8). Deux types d’observations ont
été réalisées lorsque c’était possible : en cellule vivante et en cellule fixée. L’usage conjoint de ces
deux observations apporte un maximum d’informations : la cellule fixée permet de reconstruire une
structure avec grande précision tandis que la cellule vivante permet d’interroger la dynamique des
molécules.
PolII-Dendra2
PolII-Alexa
H2B-SiR
PolII-TMR
PolII-SiR
H2B-pa-GFP
Figure 8 – Noyaux marqués observés en microscopie champ large. (PolII-Alexa) Marquage Halo-tag
après fixation et perméabilisation. Cellule entière visible. Lignée Rpb1 halo. (PolII-Dendra2) Cellule
vivante, lignée Rpb1-Halo, observation de la forme verte de Dendra2. (H2B-SiR) Marquage observé
48h après transfection d’un plasmide H2B-Halo puis marquage avec SiR peu avant l’acquisition,
cellule vivante, lignée 4ADP. (PolII-TMR) Marquage TMR, cellule vivante, lignée Rpb1-Halo. (H2BpaGFP) Cellule vivante, observation 48h après transfection d’un plasmide H2B-paGFP. (PolII-SiR)
idem PolII-TMR, mais fluorophore SiR employé. Barres d’échelle : 4µm.
Cellule vivante Les marquages in vivo ont été plus aisés : le marquage par Halo-tag est facilité car
la protéine du Halo-tag fonctionne dans le cytoplasme. De plus, les fluorophores STORM clignotent
souvent dans les conditions réductrices du cytoplasme. Les tests en cellule vivante ont permis
d’exclure des fluorophores protéiques : YFP et paGFP (Figure 8, au milieu en bas) car le régime
de molécules uniques n’a pas été atteint.
Cellule fixée Des observations en cellule fixée ont été réalisées en complément des observations
in vivo lorsque le marquage était inefficace (cas du fluorophore Alexa) ou le clignotement du fluorophore non optimal. Dans ce dernier cas, le tampon d’observation optimal a été recherché. Nous
nous sommes inspirés de tampons utilisés dans la littérature ([23] et [16]) et avons fait varier la
concentration du principal réactif, un agent réducteur modulant en théorie l’intensité du clignotement (protocole et résultats décrits en Annexe 1.5, p.5).
15
Les tests ont permis de sélectionner trois fluorophores : TMR, SiR, et Dendra2. Par ailleurs
TMR est incompatible avec Dendra2 (spectres d’émission confondus) et SiR (deux marquages par
Halo tag), le seul couple possible est donc Dendra2–SiR. Ce couple a été utilisé pour réaliser les
tests suivants.
2.2
Acquisitions en deux couleurs
Les marquages avec les deux fluorophores ont suivi deux stratégies : (1) dans la lignée 4ADP :
ARNpolII-Dendra2 et H2B-Halo-SiR transfecté. (2) dans la lignée Rpb1-Halo : ARNpolII-Halo-SiR
et H2B-Dendra2 transfecté.
Utiliser les deux a plusieurs avantages. La première est que l’on s’assure que l’on n’observe pas
des localisations fluorophore-spécifique. Une autre est liée à la nature différente de Dendra2 et de
SiR. Dendra2 a une faible durée de vie avant de blanchir, mais l’usage d’une protéine de fusion
assure que l’intégralité des protéines exprimées seront marquées. SiR est à l’inverse un fluorophore
organique, il a une plus longue durée de vie, ce qui permet de le localiser plus précisément que
Dendra2, mais nécessite une réaction chimique de marquage, pas forcément totale.
2.2.1
Jeu de données
Une vingtaine d’acquisitions 6 en deux couleurs a été réalisée (Figure 9). Celles-ci comportent
assez peu de détections, en particulier pour la polymérase (H2B : 25000–45000, PolII : 900–2000
détections suivant les cellules). De plus, ce nombre représente le nombre de détections dans le noyau,
pas le nombre de molécules : le comptage comporte d’une part des fausses détections (sur ce point,
l’algorithme est réputé particulièrement robuste [20]), mais surtout les fluorophores à durée de vie
supérieure à une image (25 ms) sont détectés plusieurs fois. Pour obtenir une estimation du nombre
de molécules détectées, une étape d’estimation de la durée de vie et des paramètres du blinking est
nécessaire pour chaque fluorophore.
Les acquisitions sont de qualité inégale, et les biais sont parfois évident (i.e. absence de détection
d’un fluorophore), dans d’autres cas, une analyse un peu plus poussée est nécessaire pour identifier
le biais et exclure l’acquisition du jeu de données (voir par exemple Annexe 2.4, p.9). Ainsi, un
certain nombre d’études préliminaires ont été réalisées afin de s’assurer de la qualité des données
avant l’étude statistique en deux couleurs.
2.2.2
Forme des PSF
Un premier contrôle concerne la calibration du système optique et la forme des PSF. La calibration de l’optique adaptative est un processus itératif dont la convergence n’est pas systématique,
et dans le cas du stage, une calibration optimale n’a pas toujours été atteinte. Par conséquent,
les PSF astigmates observées présentent des aberrations supplémentaires parfois importantes, et
celles-ci s’éloignent des gaussiennes astigmates théoriques.
Cet écart n’est pas sans conséquences : l’algorithme MTT de localisation des détections implémente
spécifiquement une gaussienne bidimensionnelle dans la procédure de détermination des écarts-types
σx et σy . Une déviation par rapport à cette forme fonctionnelle rend les PSF moins identifiables,
et influence négativement la précision de pointé en z.
Un autre biais, détaillé en Annexe 2.3, p.7, est la non coïncidence des profils de détections en z
en deux couleurs.
6. Certaines acquisitions sont visibles à l’adresse http ://www.eleves.ens.fr/home/woringer/DarzacqLab.
16
H2B−Dendra2/PolII−SiR
35000
Protéine de réparation (H2B−Dendra2/XP−Alexa)
●
●
●
H2B (829150 pts)
XP (103032 pts)
2000
y (nm)
25000
3000
H2B (39163 pts)
PolII (5821 pts)
0
15000
1000
20000
y (nm)
30000
●
15000
20000
25000
0
500
1000
1500
2000
x (nm)
H2B−Dendra2/PolII−SiR
H2B/PolII
●
●
2500
3000
2500
x (nm)
2500
10000
H2B (43013 pts)
PolII (20303 pts)
●
H2B (28510 pts)
PolII (922 pts)
y (nm)
1000
0
0
500
500
1000
y (nm)
1500
1500
2000
2000
●
500
1000
1500
2000
500
1000
x (nm)
1500
2000
2500
x (nm)
●
H2B (40827 pts)
PolII (5313 pts)
2000
2500
●
H2B−SiR/PolII−Dendra2
3000
2500
H2B−SiR/PolII−Dendra2
●
H2B (27328 pts)
PolII (2927 pts)
1500
1000
y (nm)
0
−500
0
500
500
1000
y (nm)
1500
2000
●
0
500
1000
1500
0
x (nm)
500
1000
1500
2000
2500
3000
x (nm)
Figure 9 – Acquisitions réalisées en deux couleurs pendant le stage. (à l’exception de la première
représentation, données du laboratoire). (de gauche à droite et de haut en bas) Pemière image :
acquisition H2B et une protéine de réparation s’accumulant aux zones de cassure double brin de
l’ADN, trois suivantes : lignée 4ADP, deux dernières : Rpb1-Halo.
17
2.2.3
Précision des localisations
Une calibration sous-optimale des PSF peut également influer sur la précision de localisation, en
particulier en z. En effet, l’observation à l’œil nu des données en trois dimensions révèle des clusters
de détections, en particulier lors de l’utilisation de fluorophores STORM. Néanmoins, au lieu d’être
sphériques, ceux-ci apparaissent fortement étirés suivant l’axe z, suggérant une faible précision de
localisation suivant cet axe.
Estimer ce biais est important, car il conditionne d’une part la résolution de l’expérience, et
il indique d’autre part que d’un point de vue spatial l’axe z n’a pas la même «valeur» que les
deux autres axes. En particulier, si la dispersion en z est trop importante, celle-ci n’apporte plus
d’information et on peut se ramener à des analyses en deux dimensions.
Nous avons estimé la dispersion des données sur des détections multiples. Pour cela, nous avons
sélectionné des clusters (Figure 10.b, détaillé en c.) uniques de détections, c’est-à-dire constitués
d’un seul fluorophore ou de fluorophores très proches l’un de l’autre, et estimé leur dispersion en
x, y et z. La décision de considérer ce qui apparaît en deux dimensions comme un cluster unique
en trois dimensions repose sur l’analyse temporelle d’acquisitions in vivo (Figure 10.d). En effet,
nous avons sélectionné des suites de détections très proches dans le temps, assimilables à un cluster
labile de polymérase ou à la longue durée de vie d’un fluorophore. Si deux clusters étaient situés
au même endroit en x et y, la probabilité qu’ils ne coïncident pas également en z est faible devant
celle qu’il s’agisse d’un unique cluster. Au final, les dispersions du cluster sont estimées en trois
dimensions (Figure 10.a).
Il apparaît à la lumière de cette analyse qu’alors que la précision de pointé est correcte en x et
y (de l’ordre de la dizaine de nm), celle-ci est très faible en z : la dispersion des détections dépasse
cent nanomètres (dans une tranche d’observation qui ne dépasse pas 1000 nm). Ainsi, il semble a
priori illusoire de vouloir reconstruire des structures en trois dimensions, puisqu’en gros les points
sont positionnés au hasard en z.
Si les informations véhiculées en z ont très bruitées, les données ne sont pas forcément identiques
à des données en deux dimensions. Pour le montrer, nous avons évalué la dispersion en z de multiples
clusters (Figure 5, p.7 en Annexe 2.2). L’analyse montre que les clusters n’occupent pas tous la
même localisation en z, signe que l’axe z véhicule une information spatiale (tous les points ne sont
pas tirés dans la même loi).
Cette technique permet en√théorie d’améliorer la précision de localisation des molécules : moyenner n détections diminue en n l’incertitude de localisation. Initialement développée pour pallier
à une calibration sous-optimale du miroir et multiplier la résolution par un facteur 10 (pour 100
détections), cette méthode peut être appliquée dès que des détections multiples sont observées, y
compris avec un miroir bien calibré, et devrait permettre des gains de résolution du même ordre.
2.3
Analyses spatiales
La majorité des acquisitions ont dû être écartées suite aux analyses préliminaires. Celles-ci ont
aussi montré la résolution limitée en z des acquisitions. Ces données étant à présent connues, il
est possible de réaliser les analyses proprement dites dans le but d’élucider les relations qu’entretiennent la polymérase et l’histone H2B. Dans un premier temps, nous avons analysé les deux
couleurs séparément, avec pour ambition de répliquer un certain nombre de découvertes réalisées
en superrésolution.
18
a.
Nombre de localisations à la position x
b.
Nombre de localisations à la position y
Comptage
Nombre de localisations à la position z
c.
1
d.
frame
Figure 10 – Mauvaise résolution en z d’une acquisition (ARNpolII-Halo, fluorophore SiR). (a)
dispersion des détections d’un même fluorophore : alors que la majorité des points sont dans une
fenêtre de quelques dizaines de nanomètres en x et y, ceux-ci sont dispersés en z, (b) ensemble des
détections de la polymérase, des clusters sont nettement visibles ; en rouge, l’ensemble de détections
analysées, correspondant à la détection multiple d’un même fluorophore, (c) coordonnées des points
analysés, (d) analyse temporelle des points considérés ; toutes les détections sont concentrées dans
un intervalle de 150 images, signe que les détections correspondent à la même molécule.
2.3.1
Couleurs individuelles
Histone Les données d’histone sont relativement bien résolues : une centaine de millier de détections permet de visualiser la structure à l’œil nu. Une première inspection de visu montre que la
répartition de l’histone est hétérogène (Figure 11, gauche).
Accumulation au niveau des bords Sur plusieurs acquisitions, les noyaux semble présenter
une accumulation d’histones au niveau de l’enveloppe nucléaire. Pour le démontrer, nous avons eu
recours à deux méthodes. Une première, graphique, a constitué à estimer en deux dimensions
l’intensité locale du processus ponctuel (Figure 11). Cette méthode permet de faire apparaître
nettement et sur plusieurs reconstructions une accumulation au niveau des bords.
La seconde consiste à tester l’hypothèse de complete spatiale randomness, i.e. calculer l’écart
entre la répartition observée des points et la répartition théorique de points distribués aléatoirement
dans le même volume et comparer les fonctions de Ripley obtenues dans les deux cas (Figure 12).
Ce calcul montre une tendance générale à l’agrégation à de nombreuses échelles (le nombre de
voisins d’un point est toujours supérieur à la valeur donnée par le CSR), de quelques nanomètres
19
à plusieurs centaines de nanomètres. Ces observations reproduisent celles réalisées par Récamier et
coll. [19] sur un matériel biologique similaire.
bandwidth = 100 nm
0.015
0.005
0
0.01
1000
0.02
0.01
0.03
0.04
2000
y (nm)
0.05
0.02
0.06
3000
0.07
0.025
bandwidth = 25 nm
0
1000
2000
3000
x (nm)
bandwidth = 100 nm
0.025
0.02
0.015
0.01
0.005
0
0.01
500
0.02
1000
0.03
0.04
y (nm)
1500
0.05
0.06
2000
0.07
2500
bandwidth = 25 nm
500
1000
1500
2000
2500
Figure 11 – Estimation de la densité de points à différents rayons par estimation de l’intensité du
processus ponctuel à différents rayons. (gauche) représentation des détections individuelles, (centre
et droite) intensités estimées avec des noyaux respectivement de 25 nm et 100 nm. Une accumulation
au niveau des bords est visible. Axes gradués en nanomètres.
Dimension fractale La reconstruction de la structure de l’histone en trois dimensions offre de
nombreuses perspectives pour l’analyse fine de l’organisation du spatiale du noyau. La chromatine,
occupant plus de 50% du volume du noyau, pourrait jouer un rôle important sur la régulation
transcriptionnelle en influant la diffusion des facteurs de transcription (données non publiées du
laboratoire). Pour étudier ces structures, les mathématiques fractales sont un outil particulièrement
adapté, et le calcul de la dimension fractale de l’espace engendré par le réseau d’histones est un
indice aux significations biologiques importantes. En effet, plus celui-ci est faible, plus la diffusion
des facteurs se rapprochera de marches à une dimension dans lequel la recherche de cible est plus
rapide et plus locale qu’en trois dimensions.
La dimension fractale représente la relation entre le rayon r d’une sphère et le nombre de
détections qu’il contient. Ainsi, si on considère des détections échantillonnant une structure à deux
dimensions (une membrane par exemple), le nombre de détections croîtra avec le carré du rayon de
la sphère et la dimension fractale est de deux. Par contre, si les points sont disposés au hasard dans
l’espace, ce nombre croîtra avec le cube du rayon, impliquant une dimension fractale de trois. Cet
exemple permet également de tirer deux intuitions, vérifiées par la suite au niveau mathématique :
20
Figure 12 – Calcul de la fonction K de Ripley (nombre de voisins dans un disque de rayon r)
pour les deux cellules présentées Figure 11. Pour chaque cellule (resp a et b) : (gauche) : Fonction
de Ripley et (droite) zoom sur les faibles distances. Kobs (r) : Fonction de Ripley estimée sur les
données. Cette fonction est corrigée des bords, Ktheo (r) : Fonction de Ripley théorique (λ ∗ π ∗ r2 ),
Khi (r) et Klow (r), confondus avec Ktheo (r) : enveloppes issues d’au moins cinq simulations du
processus.
– Il est impossible de déterminer des dimensions fractales supérieures à deux sur des données à
deux dimensions ([8], p.93).
– Lorsque les détections sont dans un volume fini, le noyau par exemple, il faudra tenir compte
des bords qui peuvent biaiser le calcul : sans correction des bords, des points disposés au
hasard dans le noyau n’auront pas une dimension fractale de trois, puisqu’il n’y a pas de
points hors du noyau à considérer lorsque r grandit.
En pratique, le calcul de dimension fractale nécessite un calcul coûteux de convolutions multiples en trois dimensions pour réaliser la correction de bords. Avec les algorithmes disponibles au
laboratoire, pour des acquisitions de bonne qualité (plusieurs centaines de milliers de points), et en
considérant une discrétisation à un pas de 10 nm, le calcul d’une dimension fractale prend environ
24h.
Nousa avons imaginé un algorithme explicitant la correction de bords comme une succession de
convolutions, réalisables rapidement et parallélisables à l’aide de transformées de Fourier. Les détails
de l’algorithme, et ses performances sont présentées en (Annexe 3.3, p.22). L’exactitude numérique
du programme a été évaluée pour des petites tailles de matrice (un cinquantième de la taille réelle
du problème), et l’écart relatif maximal entre la sortie du programme et la référence est de l’ordre
de 10−6 . Au-delà, aucun des algorithmes testés ne s’est montré capable de fournir un résultat dans
un temps raisonnable. Les performances actuelles sont encourageantes, démontrant une preuve du
concept. Une future version s’appuyant sur la parallélisation de l’algorithme sur cartes graphiques
est en préparation.
Polymérase Les observations des nuages de points montrent une forte agrégation. Le laboratoire
a récemment décrit ([4]) l’existence de clusters très labiles de quelques polymérases, et nous avons
tenté de savoir si les agrégations observées étaient assimilables à ceux-ci. Pour cela, nous avons tenté
de compter le nombre de fluorophores détectés au cours du temps dans chaque cluster en analysant
21
Intensité
1000
2000
l’intensité des détections (Figure 13). En effet, si le cluster est constitué de plusieurs molécules,
celles-ci devraient peu à peu blanchir une par une, et l’intensité détectée devrait diminuer par
palliers.
Pour la dizaine de clusters considérés, on n’observe pas une diminution monotone de l’intensité
des détections (à une exception près, présentée en Annexe 2.5, p.9), ni une quelconque régularité,
dans la hauteur des pas (évaluée par transformée de Fourier), indiquant que les clusters observés
sont plus probablement des molécules uniques à très longue durée de vie. Cette observation est
corroborée par le fait que les clusters sont bien moins marqués lors des observations en PALM dont
la durée de vie est plus faible.
760
780
800
Frame
820
840
Figure 13 – Évolution de l’intensité d’un cluster représentatif au cours du temps. Les traits en
gris marquent les images où une détection a été réalisées. L’intensité ne semble pas suivre le motif
que l’on attend de la dégradation d’une population réduite de fluorophores.
2.3.2
Deux couleurs
Malgré la faible qualité des données (nombre de points et précision de pointé en particulier), nous
avons cherché des corrélations spatiales entre l’histone et la polymérase. Une approche similaire à
celle entreprise en une couleur a été mise en œuvre.
Tout d’abord, une la densité relative locale entre les deux molécules a été calculée (Figure 14) :
en chaque point de l’espace, on compare la densité estimée de H2B et PolII en calculant un ratio.
Plusieurs pas d’estimation de la densité ont été réalisés. On observe à plusieurs échelles des enrichissements relatifs en polymérase se superposant aux clusters de polymérase précédemment décrits,
indiquant qu’en ces points, il n’y a pas d’enrichissement particulier en chromatine.
Ensuite, la fonction de Ripley inter-type KH2B,P olII a été calculée (Figure 15). Elle montre
l’évolution du nombre de voisins dans un rayon r. Les mesures ont été comparées à l’hypothèse
CSR et un enrichissement relatif a là aussi été calculé. Il représente l’écart par rapport au nombre
de voisins attendu sous CSR, et permet donc de tester la dépendance entre les deux nuages de points.
En effet, si les deux nuages sont indépendants, les voisins de l’autre type apparaîtront ditribués au
hasard (i.e. suivant le CSR). L’analyse montre un enrichissement léger, mais significatif, qui se
manifeste surtout aux petits rayons. Ainsi, à un rayon de 150 nm, l’enrichissement au voisinage de
la polymérase est de l’odre de 60% : on trouve une fois et demie plus d’histone lorsqu’on est proche
d’une polymérase que si on se situait à un point quelconque de l’espace.
22
a.
b.
Figure 14 – Enrichissement local de PolII par rapport à H2B. (a) Calculé à une échelle de 500 nm.
(b) À une échelle de 200 nm.
Figure 15 – Analyse en deux couleurs d’une cellule. (a) Estimation de la fonction K de Ripley et
comparaison au CSR. (b) zoom à faibles rayons. (c) Calcul de l’enrichissement relatif par rapport
au CSR. KH2B,P olobs (r) : K observée, corrigée des bords. KH2B,P oltheo (r) : K théorique (avec
KH2B,P olhi (r) et KH2B,P ollo (r) un intervalle de confiance estimé sur 5 simulations).
3
Discussion
La qualité des données obtenue est très faible par rapport à ce qu’on peut attendre d’une
expérience de superrésolution en trois dimensions et pour reconstruire avec certitude une structure.
En effet, la marge de progression est importante, puisqu’il y a environ dix millions d’histones dans
la cellules, et certaines exprériences récentes laissent à penser que la population d’ARNpolII dépasse
la centaine de milliers par noyau. Par conséquent, les analysés réalisées sur ces acquisitions sont
extrêmement préliminaires, tout comme l’interprétation qui pourrait en être tirée. Il va de soi que
les protocoles d’analyse de données devront être répétés en s’appuyant sur des acquisitions de bonne
qualité.
23
Néanmoins, des tendances sont visibles sur les données dont nous disposions pendant le stage,
et il est possible de réfléchir à la signification biologique de ce résultat, tout en gardant à l’esprit
qu’il s’agit avant tout d’un cas d’étude.
Le calcul des fonctions K de Ripley suggère l’existence d’une colocalisation importante entre
la chromatine et la polymérase, avec un enrichissement relatif significatif pouvant atteindre 50%.
Cette donnée est contraire au dogme traditionnel de l’expression génétique, qui affirme que pour
des raisons d’encombrement spatial, les régions denses en chromatine ne sont pas transcrites. Dans
cette hypothèse, la régulation de la transcription s’opère par l’accessibilité mécanique du gène.
Cependant, des travaux suggèrent un mode de régulation de la transcription différent. En effet,
pour un locus accessible, Darzacq et coll. [6] ont montré que l’initiation de la transcription est un
processus stochastique dont le taux d’échec dépasse les 99 %. De plus, il a été montré que plus des
trois quarts des polymérases du noyau ont une mobilité trop importante pour être impliqués dans
la transcription d’un ARNm ou dans le PIC [12]. En conclusion, la majorité des polymérases du
noyau sont inactives et ne transcrivent pas. Quelle est alors leur utilité ? Du point de vue thermodynamique, disposer d’une concentration élevée de molécules déplace les équilibres dans le sens de
la réaction, comme par exemple l’amorce de la transcription. Si l’on suit cette hypothèse, les transcription factories, mises en évidence depuis plusieurs années [21], et les clusters très labiles de PolII
découverts récemment [4] permettent d’émettre l’hypothèse d’une régulation par la concentration
locale des facteurs d’assemblage du PIC.
Si l’on accepte cette hypothèse de travail, alors les régions denses en chromatine deviennent
un substrat de choix pour l’initiation de la transcription, non parce que les promoteurs des gènes
pourraient y être concentrés, mais parce que c’est un espace dans lequel la dimensionnalité est
réduite (des données suggèrent une dimension fractale de 2,2 dans l’hétérochromatine). Autrement
dit, les facteurs diffusant dans ce réseau extrêment dense de chromatine adopteraient une marche
aléatoire similaire à celle en deux dimensions. Or, en deux dimensions, l’exploration de l’espace
est compacte, la molécule sur-échantillonne l’espace et la recherche de cible est rapide. Ainsi, la
chromatine peut alors jouer le rôle d’un catalyseur hétérogène au sens de la chimie traditionnel :
une surface en deux dimensions qui permet de localiser les substrats dans un espace où l’exploration
est compacte et donc la réaction facilitée. Cette hypothèse met en lumière le caractère particulier
de l’interface entre la chromatine et le reste du noyau. En effet, c’est à la fois un réseau à même
de faciliter les réactions, mais aussi une zone de contact : une zone accessible où la machinerie
transcriptionnelle est déjà présente, et des expériences suggèrent que les gènes actifs se trouvent à
la périphérie des territoires chromosomiques [5].
Par ailleurs, si le résultat de l’expérience avait été opposé et que l’on avait observé une relation
d’exclusion entre la chromatine et l’ARN polymérase, des conclusions intéressantes auraient là aussi
pu être déduites. En effet, si les régions actives du noyau sont celles peu denses en chromatine et que
les réactions se font dans un espace de dimension fractale élevée (proche de 3), alors la régulation
doit alors se faire de manière biochimique, par de nombreux facteurs favorisant ou défavorisant
l’initiation de la transcription.
Ainsi, quel que soit le résultat de l’expérience, la mesure des corrélations spatiales chromatine/polymérase revêt un intérêt particulier pour la compréhension de la transcription, puisqu’elle
permet et implique des modes de régulation fondamentalement différents.
Par conséquent, il y a un intérêt à réaliser des observations de meilleure qualité. À court terme,
il est possible d’obtenir de bien meilleures images en trois dimensions au laboratoire. En effet, le
miroir déformable était désaligné et déréglé pendant le stage, ce qui explique la faible qualité des
24
acquisitions. De plus, le fluorophore SiR utilisé n’est pas photoactivables : il n’est pas possible de
régler la quantité de molécules dans l’état actif avec un laser ultaviolet comme c’est possible avec
Dendra2. Il s’ensuit que la majorité des fluorophores est observée pendant les premières secondes
de l’acquisition. Tous allumés en même temps, il n’est pas possible de les localiser. L’usage de
fluorophores photoactivables, par exemple ceux nouvellement synthétisés au laboratoire de Luke
Lavis [13] permettrait d’augmenter grandement le nombre de détections.
Concernant l’analyse des données, il est nécessaire de réaliser les calculs en tenant compte des
trois dimensions, ce qui n’a pas été fait durant le stage, faute de temps. Les outils restent en effet
à adapter légèrement pour pouvoir fonctionner en trois dimensions. En particulier, la correction de
bords et le calcul des fonctions de Ripley inter-types peuvent facilement être adaptés et optimisés.
Dans le cas de l’interprétation des fonctions de Ripley, un soin devra être apporté à la recherche
de la signification biologique, au-delà de la significativité statistique. En effet, les simulations présentent un écart-type très faible du fait de l’usage d’un très grand jeu de données (de l’ordre du
million de points). Autrement dit, la puissance statistique des tests est telle qu’il devient possible de
détecter des écarts au CSR extrêmement faibles. Dans ce cas-là, il est nécessaire de questionner la
signification des enrichissements/appauvrissements mis en évidence. Par exemple, si l’on trouve que
le voisinage d’une molécule est enrichi en une autre molécule à hauteur de 0.01 %, la signification
biologique de cet enrichissement est difficile à imaginer, tant bien même si le test affirme que cet
écart est significatif.
Au final, il est clair que la question des relations entre la chromatine et l’ARN polymérase reste
en suspens. Néanmoins, un pas a été effectué vers la résolution de cette question, notamment par la
mise en place d’un protocole d’analyse des données et par l’acquisitions de résultats préliminaires
(choix des fluorophores, calibration en deux couleurs, etc.) et il est intéressant de poursuivre ce
projet, en particulier parce que les techniques et outils qu’il permet de développer ont une utilité
plus large que l’étude de H2B/PolII.
Conclusion
Dans le cadre de l’étude des conséquences fonctionnelles de l’organisation spatiale du noyau,
ce stage a été l’occasion de réaliser un certain nombre d’avancées, indispensables préalables à la
résolution de structures en deux couleurs :
– Le test de plusieurs techniques de marquage, et la mise en évidence du potentiel d’un fluorophore récemment synthétisé.
– L’évaluation de la toxicité des fluorophores sur les cellules considérées, et la détermination
d’une concentration limite au-delà de laquelle les conséquences sur la croissance cellulaire sont
importantes.
– L’acquisition et la reconstruction de structures spatiales en deux couleurs, permettant en
théorie de comparer sur une même cellule la répartition de l’ARNpolII et de l’histone H2B.
– La recherche d’outils statistiques à même de révéler des corrélations spatiales ainsi que d’implémentations efficaces de ceux-ci.
Néanmoins, le travail entrepris n’a pas permis de répondre à toutes les questions initialement
posées. En particulier, il s’est révélé très difficile de réaliser des acquisitions précises en trois dimensions, notamment sur cellules fixées, dans lesquelles la difficulté de trouver un tampon adéquat
s’ajoute à la minutie nécessaire à la calibration de l’optique adaptative. Par ailleurs, les films réalisés sur cellules vivantes ne fournissent pas suffisamment de détections pour réaliser une analyse
25
temporelle des relations H2B-ARNpolII.
Malgré cela, l’application du protocole prévu pour les cellules fixées aux acquisitions sur cellules vivantes fournit deux nuages de points, utilisables avec précautions certes, mais qui peuvent
être employés à la recherche de corrélations spatiales. Loin d’être idéale, cette méthode constitue
néanmoins un premier pas vers une meilleure résolution des interactions spatiales entre les deux
protéines.
De plus, les optimisations réalisées en amont des acquisitions et les acquisitions elles-mêmes
ouvrent un certain nombre de perspectives.
– Pour le laboratoire, elles démontrent la faisabilité de ce type de manipulation, débroussaillent
le champ des techniques utilisables et mettent en lumière les pistes d’amélioration et principaux écueils techniques. Par exemple, la calibration de l’optique adaptative est une difficulté
surmontable, puisque des expériences en une couleur de grande résolution ont été réalisées
précédemment par l’équipe. Plus généralement, le potentiel de l’observation en superrésolution
est grand, et de nombreuses déclinaisons sont envisageables.
– De plus, les techniques statistiques identifiées et les scripts d’analyse développés pendant le
stage sont une base à parfaire, mais pourraient permettre d’accélérer un certain nombre d’analyses, ouvrant la voie à l’étude d’un plus grand nombre de cellules et à l’étude de variations
intercellulaires.
D’une manière plus générale, ces premiers résultats amènent à poser de nouvelles questions.
Tout d’abord, si les relations H2B-PolII sont probablement fortement conservées, la question de la
généralité de celles-ci entre les types cellulaires et au cours de la vie de la cellule mérite d’être posée.
Ensuite, on ne sait pas grand chose de la signification fonctionnelle de la proximité H2B-PolII. Les
clusters de polymérase sont-ils des clusters de polymérase active ? L’étude conjointe de l’état de
phosphorylation des protéines considérées et de leur localisation spatiale pourrait répondre à cette
question. Par ailleurs, si la résolution sur cellules fixées des relations H2B-ARNpolII est à portée de
main, des questions se posent sur la dynamique de ces interactions. La diffusion de la polymérase
est-elle affectée par la proximité de la chromatine ? De manière similaire, peut-on observer une
dynamique particulière de l’histone à proximité d’une polymérase ou d’un cluster de molécules ? À
l’heure actuelle, l’acquisition de ce type de données est possible, et leur analyse fait appel à des
statistiques à la fois spatiales et temporelles. Celles-ci restent à inventer, ou du moins à transposer
depuis la littérature mathématique jusqu’à une implémentation efficace pour traiter des centaines
de milliers d’événements.
Enfin, au-delà du contexte transcriptionnel, les relations entre structure spatiale et fonction se
posent dans de nombreux domaines (mouvement cellulaire, neurosciences, etc.), et la compréhension
de modes d’interaction spatiale entre deux protéines, ici impliquées dans la transcription, dépasse
naturellement le cadre du noyau et pourrait être exportée vers de nombreux constituants dans toute
la cellule.
Références
[1] Bruce Alberts, Alexander Johnson, Julian Lewis, Martin Raff, Keith Roberts, and Peter Walter. Molecular
Biology of the Cell. Garland Science, 5 edition, November 2007.
[2] Adrian Baddeley and Rolf Turner. Spatstat : An r package for analyzing spatial point patterns. In Journal of
Statistical Software, volume 12, pages 1–42, 2005.
[3] Neil A. Campbell, Jane B. Reece, and Lawrence G. Mitchell. Biology (5th Edition). Benjamin-Cummings Pub
Co, 5th edition, 2011.
26
[4] Ibrahim I. Cisse, Ignacio Izeddin, Sebastien Z. Causse, Lydia Boudarene, Adrien Senecal, Leila Muresan, Claire
Dugast-Darzacq, Bassam Hajj, Maxime Dahan, and Xavier Darzacq. Real-time dynamics of rna polymerase ii
clustering in live human cells. Science, 341(6146) :664–667, 2013.
[5] T. Cremer and C. Cremer. Chromosome territories, nuclear architecture and gene regulation in mammalian
cells. Nature reviews. Genetics, 2(4) :292–301, April 2001.
[6] Xavier Darzacq, Yaron Shav-Tal, Valeria de Turris, Yehuda Brody, Shailesh M. Shenoy, Robert D. Phair, and
Robert H. Singer. In vivo dynamics of RNA polymerase II transcription. Nat Struct Mol Biol, 14(9) :796–806,
September 2007.
[7] Peter J. Diggle. Displaced amacrine cells in the retina of a rabbit : analysis of a bivariate spatial point pattern.
Journal of the London Mathematical Society, 15 :188–92, 1986.
[8] Kenneth Falconer. Fractal Geometry : Mathematical Foundations and Applications. Wiley, 2 edition, November
2003.
[9] T. Hubbard. The ensembl genome database project. Nucleic Acids Research, 30(1) :38–41, 2002.
[10] Janine Illian, Antti Penttinen, Helga Stoyan, and Dietrich Stoyan. Statistical Analysis and Modelling of Spatial
Point Patterns (Statistics in Practice). Wiley-Interscience, 1 edition, March 2008.
[11] Ignacio Izeddin, Mohamed El Beheiry, Jordi Andilla, Daniel Ciepielewski, Xavier Darzacq, and Maxime Dahan.
Psf shaping using adaptive optics for three-dimensional single-molecule super-resolution imaging and tracking.
Opt. Express, 20(5) :4957–4967, Feb 2012.
[12] Hiroshi Kimura, Kimihiko Sugaya, and Peter R. Cook. The transcription cycle of rna polymerase ii in living
cells. The Journal of Cell Biology, 159(5) :777–782, 2002.
[13] Luke Lavis. Lavis’lab at the Howard Hugues Medical Institute. http://janelia.org/lab/lavis-lab.
[14] Richard Law, Janine Illian, David F. R. P. Burslem, Georg Gratzer, C. V. S. Gunatilleke, and I. A. U. N.
Gunatilleke. Ecological information from spatial patterns of plants : insights from point process theory. Journal
of Ecology, 97(4) :616–628, 2009.
[15] Georgyi V. Los, Lance P. Encell, Mark G. McDougall, Danette D. Hartzell, Natasha Karassina, Chad Zimprich,
Monika G. Wood, Randy Learish, Rachel F. Ohana, Marjeta Urh, Dan Simpson, Jacqui Mendez, Kris Zimmerman, Paul Otto, Gediminas Vidugiris, Ji Zhu, Aldis Darzins, Dieter H. Klaubert, Robert F. Bulleit, and
Keith V. Wood. HaloTag : A novel protein labeling technology for cell imaging and protein analysis. ACS
Chemical Biology, 3(6) :373–382, June 2008.
[16] Gražvydas Lukinavičius, Keitaro Umezawa, Nicolas Olivier, Alf Honigmann, Guoying Yang, Tilman Plass,
Veronika Mueller, Luc Reymond, Ivan R. Corrêa, Zhen-Ge G. Luo, Carsten Schultz, Edward A. Lemke, Paul
Heppenstall, Christian Eggeling, Suliana Manley, and Kai Johnsson. A near-infrared fluorophore for live-cell
super-resolution microscopy of cellular proteins. Nature chemistry, 5(2) :132–139, February 2013.
[17] Ron Milo, Paul Jorgensen, Uri Moran, Griffin Weber, and Michael Springer. BioNumbers—the database of key
numbers in molecular and cell biology. Nucleic Acids Research, 38(Database issue) :D750–D753, January 2010.
http://bionumbers.hms.harvard.edu.
[18] George L. W. Perry, Ben P. Miller, and Neal J. Enright. A comparison of methods for the statistical analysis of
spatial point patterns in plant ecology. Plant Ecology, 187(1) :59–82, March 2006.
[19] Vincent Récamier, Ignacio Izeddin, Lana Bosanac, and Xavier Darzacq. Single cell correlation fractal dimension
of chromatin. soumis, 2013.
[20] Arnauld Serge, Nicolas Bertaux, Herve Rigneault, and Didier Marguet. Dynamic multiple-target tracing to
probe spatiotemporal cartography of cell membranes. Nat Meth, 5(8) :687–694, August 2008.
[21] Bickmore WA. Sutherland H. Transcription factories : gene expression in unions ? Nat Rev Genet., 10(7) :457–66,
july 2009.
27
[22] Ebru Urcan, Ursula Haertel, Marianthi Styllou, Reinhard Hickel, Harry Scherthan, and Franz X. Reichl. Realtime xCELLigence impedance analysis of the cytotoxicity of dental composite components on human gingival
fibroblasts. Dental Materials, September 2009.
[23] Sebastian van de Linde, Anna Löschberger, Teresa Klein, Meike Heidbreder, Steve Wolter, Mike Heilemann, and
Markus Sauer. Direct stochastic optical reconstruction microscopy with standard fluorescent probes. Nature
protocols, 6(7) :991–1009, 2011.
[24] Eric W. Weisstein.
Pólya’s random walk constants.
http://mathworld.wolfram.com/
PolyasRandomWalkConstants.html. From MathWorld–A Wolfram Web Resource.
28