Corrélation spatiale de la chromatine et de la machinerie
Transcription
Corrélation spatiale de la chromatine et de la machinerie
ÉCOLE NORMALE S U P É R I E U R E Stage de troisième année de licence Corrélation spatiale de la chromatine et de la machinerie transcriptionnelle à l’échelle de la molécule unique Maxime Woringer [email protected] Sous la direction de : Ignacio Izeddin Vincent Récamier et Xavier Darzacq Juin–Juillet 2013 Stage au laboratoire d’Imagerie Fonctionnelle de la transcription (Functonal Imaging of Transcription — FIT) au département de biologie de l’École normale Supérieure. Paris, France Corrélation spatiale de la chromatine et de la machinerie transcriptionnelle à l’échelle de la molécule unique Maxime Woringer 15 septembre 2013 Table des matières 1 Matériel et méthodes 1.1 Acquisition des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Microscopie tridimensionnelle superrésolutive PALM et dSTORM Imagerie de molécules uniques . . . . . . . . . . . . . . . . . . . . Imagerie en trois dimensions grâce à de l’optique adaptative . . . . Imagerie en deux couleurs . . . . . . . . . . . . . . . . . . . . . . . 1.1.2 Marquage en deux couleurs . . . . . . . . . . . . . . . . . . . . . . Culture cellulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . Transfections . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fluorophores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Traitement des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Extraction des coordonnées des détections . . . . . . . . . . . . . . 1.2.2 Aspects mathématiques . . . . . . . . . . . . . . . . . . . . . . . . Description et caractérisation d’un point pattern . . . . . . . . . . Indépendance de deux point patterns. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 4 4 4 6 7 8 9 9 10 11 11 11 11 12 2 Résultats 2.1 Détermination du couple idéal de fluorophores . . . . . 2.1.1 Toxicité . . . . . . . . . . . . . . . . . . . . . . Effet du remplacement de la protéine Rpb1 par Effet des fluorophore dans la lignée Rpb1 Halo 2.1.2 Marquage in cellulo . . . . . . . . . . . . . . . Cellule vivante . . . . . . . . . . . . . . . . . . Cellule fixée . . . . . . . . . . . . . . . . . . . . 2.2 Acquisitions en deux couleurs . . . . . . . . . . . . . . 2.2.1 Jeu de données . . . . . . . . . . . . . . . . . . 2.2.2 Forme des PSF . . . . . . . . . . . . . . . . . . 2.2.3 Précision des localisations . . . . . . . . . . . . 2.3 Analyses spatiales . . . . . . . . . . . . . . . . . . . . 2.3.1 Couleurs individuelles . . . . . . . . . . . . . . Histone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 13 14 14 14 15 15 15 16 16 16 18 18 19 19 1 . . . . . . . . . . . . . . Rpb1-Halo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Polymérase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Deux couleurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Discussion 21 22 23 Introduction Le noyau est chez les eucaryotes le siège de la première étape de l’expression génétique, la transcription. Il posséde également une structure spatiale fortement hétérogène : la chromatine présente des zones de densités variables, et les protéines qui baignent et diffusent dans l’espace laissé libre d’ADN ne sont pas uniformément réparties ([1], pp. 433–439 et [3], pp. 383–405). Cette structuration de l’espace n’est pas sans conséquences pour les protéines qui diffusent plus ou moins librement dans le noyau. Ainsi, le temps nécessaire à une molécule (par exemple un facteur de transcription, protéine impliquée dans l’expression des gènes) pour trouver une cible définie dans le noyau (par exemple la séquence régulatrice du gène en question) varie suivant la structure de l’espace dans lequel elle se déplace (Figure 1). Par exemple, si la diffusion de la molécule est extrêmement contrainte (Figure 1.b), son déplacement se rapproche de celui d’une marche aléatoire 1 à une dimension. Dans ce type de marche aléatoire, chaque point est asymptotiquement visité un nombre infini de fois [24] : on parle d’exploration compacte, les régions proches du point de départ sont plus visitées que celles éloignées. À l’inverse, si la molécule diffuse librement en trois dimensions (Figure 1.a), la probabilité que la molécule explore deux fois un point donné de l’espace est constante et strictement inférieure à un, et tous les points ont la même probabilité d’être recroisés. Autrement dit, dans ce régime diffusif, la notion «être à proximité de» n’existe pas et, dans le cadre du problème de recherche de cible, la structuration spatiale du noyau n’a pas d’importance. Figure 1 – Trois manières d’explorer le noyau, trois régimes de diffusion. (a) Diffusion libre d’une molécule dans un espace à trois dimensions. (b) Marche aléatoire dans un espace contraint, la dimension de la marche est inférieure à 2. (c) Sous-diffusion/confinement. Au-delà de ces remarques théoriques, plusieurs régimes diffusifs ont été mis en évidence in vivo sur des facteurs de transcription, impliqués dans la formation du complexe de pré-initiation de la 1. Cette notion est définie rigoureusement dans [8], Chapitre 16, page 258 et suivantes. 2 transcription : certains diffusent librement en trois dimensions, d’autres suivent des marches de dimension inférieure, tandis que d’autres encore paraissent plus ou moins confinés 2 . Ainsi, l’existence de plusieurs régimes diffusifs pour les facteurs de transcription suggère un rôle de la structuration spatiale du noyau dans la régulation des processus transcriptionnels De plus, si le noyau est hétérogène, son organisation n’est pas aléatoire. Par exemple, de nombreuses expériences [21], notamment de FISH (Fluorescence in situ hybidization) et de hi-C/3C (chromosome conformation capture) montrent l’association statistique de certains gènes et chromosomes, regroupés entre autres en « territoires chromosomiques ». Ces expériences permettent de poser la question de la relation qu’entretiennent la structure spatiale complexe du noyau et la régulation de l’expression génétiqe. Dans cette régulation, le complexe de pré-initiation de la transcription (PIC ou pre-initiation complex ) joue un rôle majeur. Structure impliquant environ 80 protéines, dont l’ARN polymérase II (ARNpolII), il constitue un point de contrôle central dans l’amorce de la transcription. La compréhension du fonctionnement du PIC implique d’élucider les mécanismes régissant son assemblage. En effet, si celui-là est gouverné par des interactions fortes, les possibilités de régulation sont réduites. À l’inverse, dans le cas d’interactions faibles, les options sont plus nombreuses, en particulier le jeu des variations de concentrations locales en protéines du PIC peut rapidement déplacer l’équilibre thermodynamique dans le sens de son assemblage ou désassemblage. En pratique, on sait que la concentration de l’ARNpolII est hétérogène et que celle-ci se concentre au sein de structures parfois appelées transcription factories [21]. Plus récemment, l’équipe de Xavier Darzacq a montré l’existence de clusters labiles d’ARNpolII [4]. Par ailleurs, l’équipe a également montré en étudiant en superrésolution l’organisation de l’histone H2B que la chromatine adopte elle aussi une structure hétérogène en clusters à de multiples échelles [19]. Ainsi, si l’organisation de la chromatine et de l’ARNpolII sont désormais connues, on en sait peu sur les relations spatiales qu’entretiennent ces deux complexes. Existe-t-il un enrichissement local de polymérase dans les zones denses en chromatine comme le suggère le dogme actuel ? Dans ce cas-là, les zones accessibles du noyau seraient plus fortement transcrites. À l’inverse, existe-il une relation de colocalisation entre les deux molécules ? Enfin, il est également possible qu’aucune relation n’existe entre les deux. D’une manière générale, peu d’éléments confortent à l’heure actuelle l’une ou l’autre hypothèse. Néanmoins, un certain nombre d’outils physiques, chimiques, biologiques, computationnels et mathématiques permettent aujurd’hui de poser précisément ces questions ; tout d’abord, la mise au point par un collaborateur de l’équipe [13] de nouveaux fluorophores aux propriétés optiques améliorées couplée à de l’imagerie optique tridimemnsionnelle à superrésolution (PALM ou dSTORM, Photo-Activated Localization Microscopy, direct Stochastic Optical Reconstruction Microscopy, deux techniques permettant la localisation de dizaines de milliers, voire millions, de molécules uniques avec une précision de pointé de l’ordre de quelques dizaines de nanomètres) permettent d’imaginer un protocole d’imagerie testant l’éventuelle relation entre la chromatine et le PIC. L’histone H2B, marqueur de la chromatine, et l’ARNpolII, composante du PIC ont été utilisées, l’équipe disposant d’une expérience de ces molécules. Enfin, des outils mathématiques issus des statistiques spatiales et des processus pontuels permettent la recherche de corrélations entre les deux nuages de points (resp. H2B et PolII) issus des données de superrésolution. À l’aide des techniques et du savoir-faire présents au laboratoire, et en utilisant comme modèle le couple ARNpolII/H2B dans des cellules humaines cancéreuses U2OS, nous avons tenté de mettre au point une méthode permettant de tester les relations spatiales en question à la fois sur des 2. Travaux non publiés de l’équipe 3 cellules vivantes et fixées. 1 1.1 Matériel et méthodes Acquisition des données Pour répondre à la question posée, de nombreuses étapes sont nécessaires, de la mise en culture des cellules et au choix des fluorophores adapté jusqu’à l’obtention de nuages de points correspondant aux localisations des molécules. À chaque fois, les optimisations réalisées gravitent autour de la microscopie superrésolutive, technique de choix pour tenter de cerner les relations PIC/chromatine. De plus, la technologie d’optique adaptative en place au laboratoire permet d’acquérir des structures en trois dimensions. Cette troisième dimension est indispensable pour mettre en évidence des corrélations spatiales. Sans cela, il est possible que la projection du noyau de la cellule sur un plan crée fortuitement des colocalisations. 1.1.1 Microscopie tridimensionnelle superrésolutive PALM et dSTORM Imagerie de molécules uniques Principe Le PALM (Photo-Activated Localization Microscopy) et le dSTORM (direct Stochastic Optical Reconstruction Microscopy) sont deux techniques de microscopie optique à fluorescence qui permettent de localiser des molécules fluorescentes au-delà de la limite de diffraction de la lumière 3 . En effet, les lois de l’optique gaussienne imposent que l’image d’une source pontuelle (i.e. un fluorophore) n’est pas un point, mais une tache de diffraction, ou PSF (Point Spread Functions, Figure 2.d), prenant idéalement la forme d’une fonction de Airy, laquelle peut être approximée par une gaussienne à deux dimensions. La limite de résolution est atteinte lorsque les PSF de deux points trop proches se chevauchent et ne peuvent plus être distinguées (visible en fluorescence plein champ, tous les fluorophores sont allumés simultanément, Figure 2.d). La superrésolution contourne ce problème en séparant temporellement la détection des molécules, dans un régime dit de molécule unique. En effet, les techniques de PALM/dSTORM employées durant le stage reposent sur des fluorophores pouvant alterner entre un état on fluorescent et un état off. Le passage stochastique d’un fluorophore vers l’état on puis sa destruction (par exemple par photoblanchiment) assure leur séparation dans l’espace. L’itération de la séquence activation stochastique → prise d’une image → blanchiment permet en théorie d’imager tous les fluorophores en réalisant un film (Figure 2.b), chaque image permettant de localiser quelques fluorophores (Figure 2.c). Cette localisation tire parti de la forme quasi-gaussienne de la PSF. Sous l’hypothèse de distribution normale des photons, l’incertitude sur l’estimation du centre de la gaussienne (d’écart-type σ) est l’erreur standard sur la moyenne : √σn , (n : nombre de photons collectés au-dessus du bruit). Il est possible de récolter suffisamment de photons pour localiser le fluorophores en quelques dizaines de millisecondes (10–100 ms). L’opération de localisation est répétée des dizaines de milliers de fois et fournit les dizaines de milliers (ou plus) de détections permettant la reconstruction d’une structure. 3. Cette limite est de l’ordre de la longueur d’onde λ utilisée et impose que deux point situés à une distance inférieure à λ ne peuvent être distingués. Cette limite vaut pour un microscope NλA , avec N A l’ouverture numérique de l’objectif, de l’ordre de 1. 4 a b.1 b.2 c * * b.3 d Figure 2 – Reconstruction d’image en PALM/STORM : noyau avec l’histone H2B marquée avec le fluorophore Dendra2 (a). Cellule en fluorescence plein champ. Dendra2 est dans sa forme verte non photoconvertie, filtre d’émission centré sur 505 nm, (b.1 à b.3). Acquisition en régime de molécules uniques, images tirées d’un film en comportant 20000. Dendra2 est observée dans sa forme rouge (après photoconversion stochastique), filtre à 575 nm. (c). Structure reconstruite après localisation des points détectés. (d). PSF correspondant à la détection d’une molécule. La résolution de la structure reconstruite est limitée par deux facteurs. (1) la précision de pointé : il n’est pas possible d’obtenir des informations à des rayons inférieurs à celle-ci. (2) le nombre de détections : d’après le théorème d’échantillonnage de Nyquist, la résolution spatiale est bornée par la moitié de la fréquence de l’échantillonnage réalisé, lié au nombre de détections. La différence entre les techniques PALM et STORM ne réside pas dans le dispositif d’acquisition, mais dans la nature des fluorophores utilisés. En PALM, les fluorophores sont des protéines fluorescentes fusionnées aux molécules d’intérêt, ils sont organiques en dSTORM. 5 Dispositif expérimental Le dispositif expérimental dérive d’un microscope à fluorescence plein champ et permet des reconstructions à une résolution nanométrique. Il présente plusieurs composants notables (Figure 3) : – Un banc laser muni d’un AOTF (acousto-optical tunable filter ), un dispositif permettant de moduler les quantités de rayonnement laser transmises à l’échantillon. – Un miroir associé à un objectif 100x permettant d’incliner le rayonnement d’excitation afin qu’il traverse le moins possible la cellule (réduisant dispersion et bruit). – Des filtres dichroïques multibandes, transmettant les longueurs d’onde d’émission des fluorophores, et filtrant celles d’excitation. – Une platine accueillant les échantillons sur lamelles, qui doivent être extrêmement propres (lavage à l’isopropanol, éthanol, eau puis passées au sonicateur et Plasma Cleaner) car la poussière fluoresce fortement. – Un miroir déformable, instrument d’optique adaptative compensant les aberrations du système, et permettant d’en introduire à dessein de nouvelles. – Une caméra à haute sensibilité précédée d’une lentille de grossissement assurant qu’un pixel corresponde à 106 nm dans l’échantillon. Grossir les PSF par rapport au détecteur permet de satisfaire la condition de Nyquist sus-citée. Banc laser Microscope Lamelle 405 nm 561 nm Analyseur de front d'onde Objectif AOTF Beam expander { Optique adaptative miroir déformable EMCCD Focusing lens Tube lens Figure 3 – Schéma (d’après [11]) du microscope utilisé. Imagerie en trois dimensions grâce à de l’optique adaptative Principe Dans un système optique sans aberrations, l’image d’un point au plan focal objet est une fonction de Airy sur le détecteur situé au plan focal image. Si l’on éloigne la source ponctuelle du plan focal objet, les rayons ne vont plus converger au niveau du détecteur, mais en amont ou au-delà de celui-ci : le point est défocalisé et apparaît d’abord flou, puis disparaît à mesure qu’on l’éloigne du plan focal ; un fluorophore est détectable à plusieurs centaines de nanomètres du plan focal. 6 Si un fluorophore défocalisé reste visible sur le détecteur, il n’est pas facile de remonter à sa position en z. En revanche, avec un système optique présentant des aberrations, comme de l’astigmatisme (introduit par exemple par de l’optique adaptative [11]), les PSF présentent des asymétries caractéristiques de leur localisation en z. Pour un système astigmate, la gaussienne est étirée suivant sa localisation en z (Figure 4), permettant ainsi d’estimer la position du fluorophore en trois dimensions. z Plan focal Figure 4 – Forme de la PSF en fonction de sa position en z. Rond bleu : position en z de la molécule. La reconstruction de structures en trois dimensions donne accès à des informations qui ne peuvent pas être estimées lorsqu’on travaille sur une projection. En particulier, les distances entre les points sont vraies, les coefficients de diffusion dans les expériences de suivi de molécules sont moins biaisés. Enfin, les données tridimensonnelles permettent de calculer la dimension fractale de la structure [19], interprétable en termes d’accessibilité de la chromatine et inaccessible en deux dimensions. Si l’utilisation d’un système astigmate permet l’étude tridimensionnelle du noyau, l’ajout d’aberrations diminue la quantité de photons récupérés, et donc la précision de pointé. Pour introduire un astigmatisme limité, un miroir déformable (Figure 3) est placé sur le chemin optique. Le miroir sert d’abord à corriger les aberrations du système de manière à ce que les PSF détectées ressemblent une fonction de Airy. Ensuite, une fois les imperfections du système corrigées, il est possible d’introduire un astigmatisme limité pour faire de la 3d. Calibration du système optique L’optique adaptative fonctionne en deux temps : (1) calibration des aberrations et leur correction par déformation du miroir. Elle s’effectue sur des billes fluorescentes, dont la PSF est connue. (2) éventuelle déformation du miroir pour introduire les aberrations optiques souhaitées, dont l’astigmatisme. (3) calibration de la relation entre la forme de la PSF et la position en z : une bille fluorescente est observée à différentes profondeurs de champ et les paramètres σx et σy (écarts-types suivant les deux grands axes) de la gaussienne asymétrique sont estimés (Figure 5). Après calibration, il est possible d’estimer la position en z des points détectés. Imagerie en deux couleurs Le système décrit supra permet de reconstruire une structure en détectant une fraction des molécules d’intérêt. Néanmoins, des questions sur l’alignement et la coïncidence des nuages de points se posent. Celles-ci découlent en partie de l’usage d’un système non-achromatique : les longueurs d’onde utilisées ne se propagent pas de la même façon. Double calibration et aberrations chromatiques La microscopie en deux couleurs nécessite deux calibrations, une par couleur : chaque fluorophore a son propre spectre d’émission, et les 7 a. -492 nm -312 nm -160 nm 0 nm +204 nm +396 nm +600 nm 2 wx−wy [px] b. wx−wy Fit 0 −2 −400 −200 0 200 400 Figure 5 – Procédure de calibration d’une PSF avec une bille. (a) Bille à différentes profondeur de champ. Images tirées d’une séquence de 170 images au pas de 12 nm. Aberrations optiques importantes loin du plan focal. Pour chaque détection, les paramètres σx et σy sont modélisés. (b) Courbe de calibration de la PSF. Abscisse : profondeur en z, ordonnée : différence entre σx et σy estimés sur la gaussienne. PSF peuvent différer entre couleurs, à cause des aberrations chromatiques du microscope et d’une intensité de fluorescence différente. Acquisitions in vivo et choix de dichroïques Il est possible de réaliser les acquisitions en deux couleurs en faisant un film dans une couleur, puis dans l’autre sur cellule fixée. In vivo, cette stratégie n’est pas adaptée, il faut entrelacer les prises de vue : les lasers sont synchronisés avec le balayage de la caméra (fréquences jusqu’à 100 Hz). Un dichroïque multibande est nécessaire pour que les longueurs d’onde d’émission soient transmises et celles d’excitation non. 1.1.2 Marquage en deux couleurs Le dispositif décrit supra permet de reconstruire avec précision la structure de deux protéines marquées avec deux fluorophores différents. Pour répondre à la question posée, on cherche à mettre en place un marquage de la chromatine et d’un composant du PIC. Le choix du laboratoire s’est porté respectivement sur l’histone H2B et sur l’ARN polymérase II. Il est toujours possible de marquer en plusieurs couleurs avec des anticorps spécifiques puis des anticorps secondaires fluorescents. Cette méthode pourait être employée. Néanmoins, le marquage par anticorps présente plusieurs désavantages : (1) l’existence d’un marquage non spécifique. (2) la taille importante du complexe anticorps–anticorps secondaire–fluorophore (plusieurs dizaines de nanomètres) limite la résolution maximale. (3) le marquage d’une fraction seulement des épitopes, limitant aussi la résolution de la structure. Ces arguments nous ont poussé à explorer une autre voie : les Halo-tags et les protéines de fusion. 8 Culture cellulaire Deux lignées cellulaires dérivant des cellules U2OS (issues d’un ostéosarcome humain) et exprimant des versions modifiées de la protéine Rpb1 (sous-unité catalytique de l’ARNpolII) ont été utilisées. Des lignées stables pour l’ARNpolII sont requises, car son niveau d’expression est fortement régulé. Deux stratégies de marquage pour Rpb1 ont été testées, s’appuyant sur deux lignées cellulaires utilisées au laboratoire : – Lignée 4ADP : Un marquage par insertion dans le génome d’une protéine de fusion Rpb1–protéine fluorescente photoconvertible Dendra2 (Figure 6.a). – Lignée Rpb1-Halo : Un marquage par insertion d’une protéine de fusion Rpb1—Halo-tag (Figure 6.b). Le Halo-tag [15] est une enzyme modifiée capable de se lier in vivo de manière covalente et permanente à un ligand synthétique. Il permet de fixer très spécifiquement n’importe quelle molécule organique couplée à un ligand Halo-tag. La réaction permet de coupler une protéine d’intérêt (ARNpolII) à un fluorophore organique. Il est ainsi possible de choisir le fluorophore le plus adapté à la question posée sans refaire de transgenèse. a. 4ADP CMV Dendra2 Rpb1* -693 b. Rpb1-Halo CMV 0 Halo-tag -881 6380 Rpb1* 0 6380 *. Rpb1 -amanitine résistante Figure 6 – Construits introduits dans les lignées 4ADP (a) et Rpb1-Halo (b). Un promoteur viral CMV régule l’expression des protéines de fusion et le construit est inséré aléatoirement dans le génome : l’expression de l’ARN messager devrait être importante, mais des Western Blot ont montré qu’une régulation s’opère au niveau post-transcriptionnel. Le niveau d’expression de la protéine exogène n’est pas significativement différent de celui de Rpb1 endogène. Il en va de même pour sa localisation ([4], figures supplémentaires). La version introduite du gène Rpb1 est résistante à l’α-amanitine, un inhibiteur de l’ARN polymérase II. De l’α-amanitine dans le milieu de culture assure que seule l’ARNpolII exogène s’exprime. Le choix des lignées cellulaire permet donc de localiser l’ARNpolII en observant soit Dendra2 soit un fluorophore couplé au Halo-tag. Transfections H2B est observable par l’expression d’une histone fusionnée à un fluorophore protéique ou à un Halo-tag. Plusieurs protéines de fusion disponibles au laboratoireont été expérimentées. Les plasmides correspondants ont été transfectés (Fugene, Promega) dans les 4ADP ou Rpb1-Halo. Une transfection permet d’obtenir une expression forte comparable au niveau de l’histone endogène. Contrairement à Rpb1, une surexpression de H2B n’entraîne pas de phénotype visible. Les cellules ont été observées 48h après transfection car les histones marquées néosynthétisées s’intègrent à la chromatine durant une mitose. On note que H2B endogène est toujours exprimée : les histones marquées sont un sous-échantillonnage de la populations d’histones, ce qui pose peu de problèmes car le nombre d’histones par noyau est élevé (environ 10 millions de nucléosomes par 9 cellule 4 ), la résolution n’est donc pas affectée. Fluorophores Description Deux grandes catégories de fluorophores ont été testées : – Des fluorophores protéiques, utilisés ici pour faire du PALM (Photo-Activated Localization Microscopy). Dans le cadre de la superrésolution, ce sont des protéines, souvent dérivées de la GFP et modifiées pour pouvoir être activées sous l’action d’un pulse d’ultraviolets. Cette activation peut entraîner le changement de longueur d’onde d’émission (photoconversion) ou l’apparition de celle-ci (photoactivation), il est alors possible d’observer de la fluorescence en réponse à une autre longueur d’onde d’excitation. Les fluorophores observés sont rapidement photoblanchis par le laser d’excitation. Ainsi, en réglant la puissance relative du laser d’activation et d’excitation, il est possible de se placer dans un régime où un faible nombre de molécules est visible à la fois (régime de molécules uniques). – Des fluorophores organiques, utilisés ici pour faire de l’imagerie dSTORM (direct Stochastic Optical Reconstruction Microscopy). En superrésolution, ce sont souvent des dérivés de la cyanine (e.g. Cy3, Cy5) ou de la rhodamine, qui disposent d’une plus grande photostabilité et sont plus brillants que les fluorophores protéiques. Ces fluorophores fonctionnent différemment des fluorophores protéiques : ils peuvent osciller (clignoter) entre deux états, un état on fluorescent et un état off non fluorescent, ce dernier correspondant à un état excité du fluorophore dit état triplet. Initialement tous dans l’état off, une expérience en STORM débute par une excitation intense pour envoyer un maximum de fluorophores dans l’état triplet. Le régime de molécules uniques est atteint lors du retour individuel et stochastique vers l’état on. Cette conversion n’est possible que dans un milieu réducteur (cytoplasme in vivo ou un tampon ad hoc sur cellule fixée, voir Annexe 5, p.5). Les spectres des fluorophores testés sont présentés en Annexe 1.1, p.2. Six des fluorophores organiques sont issus d’une série de synthèses réalisées par un collaborateur de l’équipe [13]. Ils dérivent de la rhodamine [16], ont été peu testés sur cellules vivantes et n’avaient jamais été utilisés par l’équipe, qui dispose par ailleurs d’une expertise avec certains fluorophores (Dendra2, TMR et Alexa 647). Toxicité La toxicité des fluorophores a été comparée dans un premier temps : il est inutile de marquer des cellules avec des fluorophores toxiques car leur programme transcriptionnel en serait altéré, limitant la portée d’éventuelles interprétations. La toxicité des fluorophores organiques a été évaluée avec l’appareil xCelligence (Roche Applied Science) [22]. Il permet de réaliser automatiquement des mesures d’impédance pendant plusieurs jours. Ces mesures permettent de calculer le Cell Index, un indice corrélé avec la croissance/la confluence des cellules. En effet, l’impédance du système, mesurée grâce à deux électrodes placées au fond du puits, est maximale en l’absence de cellules (le contact des électrodes avec le milieu chargé d’ions est maximal) et diminue lorsque les cellules croissent et s’attachent. La concentration optimale pour la microscopie a été déterminée pour chaque fluorophore. 4. Calcul réalisé à partir des données Ensembl ([9], page http ://sep2013.archive.ensembl.org/Homo_sapiens/Info/Annotation) et des données disponibles sur Bionumers ([17], entrées 104516, 103111 et 100419). 10 1.2 1.2.1 Traitement des données Extraction des coordonnées des détections Une première étape d’analyse des séquences vidéos est nécessaire pour extraire les coordonnées des détections. Le logiciel MTT [20], développé spécifiquement dans ce but a été utilisé pendant le stage. Ce logiciel permet la prise en mains de films de superrésolution et l’exploitations de données 3d. Son fonctionnement est décrit en Annexe 3, p.9. 1.2.2 Aspects mathématiques MTT produit en sortie une liste de coordonnées (x, y, z) représentant un nuage de points. Formellement, on considère que ces nuages de points, dont la répartition est en partie dûe au hasard, sont la réalisation d’un «point process», une variable aléatoire déterminant le nombre de points ainsi que leur position dans l’espace. Plusieurs approches pour corréler des point patterns ont été développées. Elles répondent à des questions légèrement différentes, tout en utilisant parfois les mêmes objets. Description et caractérisation d’un point pattern Définitions informelles – Point process (processus ponctuel) : on considère un espace (noté B, typiquement R2 ou R3 ) dans lequel les points seront observés. Si les processus ponctuels dans R2 sont le plus souvent considérés dans la littérature appliquée (en particulier en écologie, ou encore dans le paquet R spatstat [2] qui fait référence en la matière), les processus ponctuels à trois dimensions sont moins souvent développés, et une partie des formules et caractérisations doivent être adaptées au cas tridimensionnel. On définit N la variable aléatoire donnant le nombre de points du processus, et Xi , i ∈ [1, N ] les variables aléatoires à valeurs dans l’espace B défini précédemment. Dans le cadre d’un point pattern (une réalisation d’un processus ponctuel), on appelle événement la réalisation ([X = x], x ∈ B : il y a un point du processus en x). On s’intéresse par la suite aux processus ponctuels finis (toute zone de l’espace contient un nombre fini de points) et simple il y a au plus un événement en chaque point de l’espace. – Isotropie/homogénéité – Isotropie : la distribution du point pattern est invariante par rotation. – Homogénéité : la distribution du point pattern est invariante par translation (dans le cas des images PALM/STORM, ces hypothèses ne sont pas respectées, en particulier à cause de la présence de la limite du noyau et du fait qu’on image une tranche. Il est néanmoins possible d’appliquer un certain nombre de corrections pour se ramener à ce cas) – Intensité d’un point pattern : un point pattern peut être défini par le nombre moyen de points se trouvant dans une région donnée, ou intensité (voir par exemple [10], p. 189) (notée λ(x)). Cette grandeur dépend de la position dans le cas d’un processus ponctuel non homogène (B(x,r)) (en notant ou non isotrope. On la définit donc formellement comme λ(x) = lim E Ns(B(x,r)) r→0 s(B(x, r)) la surface/volume de la sphère B de centre x et de rayon r, et N (B(x, r)) le nombre de points dans celle-ci). Cette définition pose malheureusement problème lorsqu’on cherche à estimer empiriquement la densité d’un processus ponctuel : la mesure consiste en un nombre fini de réplications de l’expérience, et par conséquent faire tendre le volume considéré vers zéro entraîne le calcul de densités très 11 déformées (la densité est nulle partout sauf aux endroits où des événements ont été mesurés). Pour pallier ce problème, on a en général recours à une estimation qui procède à un lissage entre les points (en général par convolutin de l’espace par une gaussienne, ou encore une fonction d’Epanechnikov [10], p.481). Ce procédé permet d’approcher l’intensité, mais nécessite d’introduire un paramètre : la bande passante de la fonction, qui détermine l’influence d’événements lointains sur un point donné, et les résultats sont très dépendants du choix de ce paramètre. D’autres méthodes d’estimation de l’intensité existent également, en particulier des estimateurs paramétriques (détaillés dans [14]). (B) R NP On a donc : λ(x0 ) = 1[Xi = x]I(x − x0 )dx, avec I une fonction donnant le poids à donner B i=1 à un point à distance x − x0 d’un événement. C’est dans l’expression de I que le paramètre de bande passante est présent. Si on choisit une gaussienne pour I, la bande passante représente alors sa largeur à mi-hauteur. Outil traditionnel d’analyse : fonction K de Ripley Il existe un certain nombre de techniques permettant d’analyser et de caractériser des processus ponctuels. La plus utilisée est la fonction K de Ripley, en particulier parce qu’elle présente une interprétation simple : la fonction de Ripley donne pour chaque événement le nombre d’évenements situés dans un rayon r. Ainsi, en deux dimensions et si les points sont placés au hasard dans l’espace (cas d’un processus homogène de Poisson d’intensité λ), K(r) = λπr2 . En particulier, l’écart par rapport au processus de Poisson donne une idée des phénomènes de clusturing ou de répulsion qui peuvent exister à diffférentes échelles dans le processus. Test de l’hypothèse de Complete Spatial Randomness Dans le cas où l’on s’intéresse à un processus ponctuel univarié (un seul nuage de points), une des principales questions est de caractériser l’écart à une distribution uniforme des points (ou complete spatial randomness – CSR) afin de mettre en évidence des échelles où les points sont plutôt regroupés en clusters ou au contraire séparés par des distances bien définies. Pour cela, il est nécessaire de comparer le pattern observé à un modèle nul présentant les caractéristique d’un arrangement «au hasard» des points. Les processus de Poisson homogène (présentés dans [10]), présentent les propriétés de ce type d’arrangement. Dans le cas des processus de Poisson homogènes, il existe une expression analytique simple de K(r) dans le cas d’un processus non borné. Par contre, si le processus présente des bords, l’expression analytique ne peut plus être utilisée telle quelle, et il est nécessaire de mettre en place des méthodes, souvent numériques et lourdes en calculs, permettant de prendre en compte les bords (voir par exemple 5 et [18]). Lorsqu’elle est réalisée, la simulation d’une répartition homogène de points permet d’aboutir à la fois à une estimation de la fonction sous l’hypothèse nulle et de proposer des intervalles de confiance sur ces mesures (approche de type Monte-Carlo). Indépendance de deux point patterns. 5. La littérature sur la correction de bord est particulièrement riche, je ne m’y suis pas plongé, mais deux techniques intuitives sont généralement employées (érosion et pondération par la surface de intersection du cercle de rayon considéré et la zone d’observation). 12 Définition Dans ce cas, on considère que deux nuages de point sont générés par des mécanismes (processus) différents. Les premières applications ont été réalisées en écologie (position de différentes espèces d’arbres par exemple). Le questionnement qui arrive naturellement de cette description est de savoir si les deux point patterns sont indépendants ou non. Les tests de cette hypothèse prennent en compte le fait que les deux point patterns peuvent avoir une distribution différente. Tests d’indépendance Une manière simple de tester l’indépendance de deux processus ponctuels consiste à calculer une distribution (par exemple K) entre les deux nuages, puis à les comparer à des simulations où les deux processus sont indépendants. Ainsi, Peter Diggle (dans [7]) calcule la distribution inter-types KI,II (r) (correspondant à l’histogramme du nombre de voisins de l’autre type dans un rayon r). Si les processus I et II sont indépendants, alors KI,II (r) suit la distribution du hasard. En particulier, en deux dimensions et sans correction de bords, KI,II (r) = πr2 , et ce quelle que soit la forme de KI,I et de KII,II . Une fois la distribution calculée empiriquement, il reste à déterminer si celle-ci s’éloigne significativement de l’indépendance théorique. Pour cela, on fait appel à des simulations de Monte-Carlo pour déterminer la variance de KI,II (r) sous l’hypothèse d’indépendance. La difficulté consiste à trouver comment simuler un processus ponctuel qui possède la même distribution et les mêmes propriétés statistiques que l’original, tout en étant à coup sûr indépendant de l’autre processus ponctuel. Une solution traditionnellement retenue consiste à translater un point pattern par rapport à l’autre suivant un vecteur de direction et norme aléatoire. On génère ainsi un point pattern de même distribution, mais indépendant du second. Traditionnellement, la région testée est «mappée» sur un tore, ce qui permet de ne pas perdre d’information ou de créer des trous. Néanmoins, dans le cas d’un point pattern fini et borné dans un espace non rectangulaire, je ne sais pas trop si un tel «mapping» est possible. . . Une fois les simulations réalisées, il est possible de déterminer l’enveloppe de la courbe K (en prenant par exemple le premier et le dix-neuvième vingtile de la simulation pour chaque point) et observer la position de la courbe expérimentale. 2 Résultats Pour obtenir des nuages de points bien résolus (i.e. avec suffisamment de détections avec une bonne précision de pointé) des prérequis sont nécessaires : (1) déterminer le couple idéal de fluorophores. (2) calibrer le microscope et résoudre les biais en deux couleurs. (3) déterminer la qualité des structures reconstruites individuellement. Ces étapes permettent d’assurer la validité des interprétations issues de l’analyse des structures reconstruites. 2.1 Détermination du couple idéal de fluorophores Les données liminaires disponibles au laboratoire indiquent que Dendra2 est un bon candidat pour la superrésolution. Photoconvertible, il permet de voir les cellules sans blanchir les fluorophores. Néanmoins, l’existence de deux longueurs d’onde d’excitation et d’émission (correspondant à la forme verte, non photoconvertie, et à la forme rouge, photoconvertie) réduit le nombre de partenaires potentiels avec lequel il ne possède pas de spectre commun. 13 2.1.1 Toxicité Si, à l’œil nu et lors des expériences de microscopie, aucune anomalie flagrante de croissance ou de morphologie des cellules n’était visible, le suivi des courbes de croissance (Cell Index de la machine xCelligence) montre une croissance différente entre les différentes conditions testées. Effet du remplacement de la protéine Rpb1 par Rpb1-Halo. On compare tout d’abord la lignée Rpb1 Halo et la lignée 4ADP dont elle est issue (Figure 7.a). Les résultats sont similaires au premier abord : les indices de croissance obtenus au bout de quelques jours sont similaires. Ces résultats corroborent les courbes de croissance de [4] sur les mêmes lignées. Ainsi, l’expérience confirme l’innocuité du construit Rpb1 Halo et de la culture permanente sous α-amanitine. Effet des fluorophore dans la lignée Rpb1 Halo Afin de déterminer une plage de concentrations optimale en vue des expériences de microscopie, plusieurs concentrations de fluorophores ont été testées sur cellules Rpb1 Halo (concentrations de 100 nM à 2500 nM, exemple de résultat présenté Figure 7.b). D’une manière générale, la toxicité augmente avec la concentration, et les cellules n’ont jamais poussé à la concentration de 2500 nM. À 500 nM, les effets sont le plus souvent très limités, voire invisibles (croissance relative des cellules proches du contrôle). Les données à 100 nM ne sont pas présentés car leur toxicité pour les sept fluorophores testés était supérieure à celle à 2500 nM, laissant présager l’hypothèse d’une erreur de manipulation. Les résultats détaillés sont présentés en Annexe 1.2.3, p.4. a. U2OS wt / U2OS Rpb1 Halo b. Silicon−rhodamine 6 Cell Index 8 10 12 U2OS Rpb1 Halo dye 500 nM dye 1000 nM dye 2500 nM 0 2 4 6 0 2 4 Cell Index 8 10 12 U2OS wt Rpb1 Halo 0 50 100 150 0 Temps (h) 50 100 150 Temps (h) Figure 7 – Courbe de croissance des cellules (i.e. Cell Index au cours du temps). (a) Effet du remplacement de Rpb1 endogène par Rpb1-Halo. (b) Effet de concentrations croissantes du fluorophore SiR sur les cellules Rpb1-Halo. Ainsi, l’ajout du fluorophore organique n’est pas anodin. Une trop grande concentration (supérieure à 1 µmol.L−1 ) entraîne la mort des cellules en quelques jours. Néanmoins, une concentration inférieure à 500 nM semble ne pas avoir d’effet notable. Des fluorophores conentrés entre 250 nM et 500 nM ont été utilisées par la suite. 14 2.1.2 Marquage in cellulo Une fois la toxicité des fluorophores déterminée, des essais in cellulo ont été réalisés et les cellules ont été observées au microscope en champ large (Figure 8). Deux types d’observations ont été réalisées lorsque c’était possible : en cellule vivante et en cellule fixée. L’usage conjoint de ces deux observations apporte un maximum d’informations : la cellule fixée permet de reconstruire une structure avec grande précision tandis que la cellule vivante permet d’interroger la dynamique des molécules. PolII-Dendra2 PolII-Alexa H2B-SiR PolII-TMR PolII-SiR H2B-pa-GFP Figure 8 – Noyaux marqués observés en microscopie champ large. (PolII-Alexa) Marquage Halo-tag après fixation et perméabilisation. Cellule entière visible. Lignée Rpb1 halo. (PolII-Dendra2) Cellule vivante, lignée Rpb1-Halo, observation de la forme verte de Dendra2. (H2B-SiR) Marquage observé 48h après transfection d’un plasmide H2B-Halo puis marquage avec SiR peu avant l’acquisition, cellule vivante, lignée 4ADP. (PolII-TMR) Marquage TMR, cellule vivante, lignée Rpb1-Halo. (H2BpaGFP) Cellule vivante, observation 48h après transfection d’un plasmide H2B-paGFP. (PolII-SiR) idem PolII-TMR, mais fluorophore SiR employé. Barres d’échelle : 4µm. Cellule vivante Les marquages in vivo ont été plus aisés : le marquage par Halo-tag est facilité car la protéine du Halo-tag fonctionne dans le cytoplasme. De plus, les fluorophores STORM clignotent souvent dans les conditions réductrices du cytoplasme. Les tests en cellule vivante ont permis d’exclure des fluorophores protéiques : YFP et paGFP (Figure 8, au milieu en bas) car le régime de molécules uniques n’a pas été atteint. Cellule fixée Des observations en cellule fixée ont été réalisées en complément des observations in vivo lorsque le marquage était inefficace (cas du fluorophore Alexa) ou le clignotement du fluorophore non optimal. Dans ce dernier cas, le tampon d’observation optimal a été recherché. Nous nous sommes inspirés de tampons utilisés dans la littérature ([23] et [16]) et avons fait varier la concentration du principal réactif, un agent réducteur modulant en théorie l’intensité du clignotement (protocole et résultats décrits en Annexe 1.5, p.5). 15 Les tests ont permis de sélectionner trois fluorophores : TMR, SiR, et Dendra2. Par ailleurs TMR est incompatible avec Dendra2 (spectres d’émission confondus) et SiR (deux marquages par Halo tag), le seul couple possible est donc Dendra2–SiR. Ce couple a été utilisé pour réaliser les tests suivants. 2.2 Acquisitions en deux couleurs Les marquages avec les deux fluorophores ont suivi deux stratégies : (1) dans la lignée 4ADP : ARNpolII-Dendra2 et H2B-Halo-SiR transfecté. (2) dans la lignée Rpb1-Halo : ARNpolII-Halo-SiR et H2B-Dendra2 transfecté. Utiliser les deux a plusieurs avantages. La première est que l’on s’assure que l’on n’observe pas des localisations fluorophore-spécifique. Une autre est liée à la nature différente de Dendra2 et de SiR. Dendra2 a une faible durée de vie avant de blanchir, mais l’usage d’une protéine de fusion assure que l’intégralité des protéines exprimées seront marquées. SiR est à l’inverse un fluorophore organique, il a une plus longue durée de vie, ce qui permet de le localiser plus précisément que Dendra2, mais nécessite une réaction chimique de marquage, pas forcément totale. 2.2.1 Jeu de données Une vingtaine d’acquisitions 6 en deux couleurs a été réalisée (Figure 9). Celles-ci comportent assez peu de détections, en particulier pour la polymérase (H2B : 25000–45000, PolII : 900–2000 détections suivant les cellules). De plus, ce nombre représente le nombre de détections dans le noyau, pas le nombre de molécules : le comptage comporte d’une part des fausses détections (sur ce point, l’algorithme est réputé particulièrement robuste [20]), mais surtout les fluorophores à durée de vie supérieure à une image (25 ms) sont détectés plusieurs fois. Pour obtenir une estimation du nombre de molécules détectées, une étape d’estimation de la durée de vie et des paramètres du blinking est nécessaire pour chaque fluorophore. Les acquisitions sont de qualité inégale, et les biais sont parfois évident (i.e. absence de détection d’un fluorophore), dans d’autres cas, une analyse un peu plus poussée est nécessaire pour identifier le biais et exclure l’acquisition du jeu de données (voir par exemple Annexe 2.4, p.9). Ainsi, un certain nombre d’études préliminaires ont été réalisées afin de s’assurer de la qualité des données avant l’étude statistique en deux couleurs. 2.2.2 Forme des PSF Un premier contrôle concerne la calibration du système optique et la forme des PSF. La calibration de l’optique adaptative est un processus itératif dont la convergence n’est pas systématique, et dans le cas du stage, une calibration optimale n’a pas toujours été atteinte. Par conséquent, les PSF astigmates observées présentent des aberrations supplémentaires parfois importantes, et celles-ci s’éloignent des gaussiennes astigmates théoriques. Cet écart n’est pas sans conséquences : l’algorithme MTT de localisation des détections implémente spécifiquement une gaussienne bidimensionnelle dans la procédure de détermination des écarts-types σx et σy . Une déviation par rapport à cette forme fonctionnelle rend les PSF moins identifiables, et influence négativement la précision de pointé en z. Un autre biais, détaillé en Annexe 2.3, p.7, est la non coïncidence des profils de détections en z en deux couleurs. 6. Certaines acquisitions sont visibles à l’adresse http ://www.eleves.ens.fr/home/woringer/DarzacqLab. 16 H2B−Dendra2/PolII−SiR 35000 Protéine de réparation (H2B−Dendra2/XP−Alexa) ● ● ● H2B (829150 pts) XP (103032 pts) 2000 y (nm) 25000 3000 H2B (39163 pts) PolII (5821 pts) 0 15000 1000 20000 y (nm) 30000 ● 15000 20000 25000 0 500 1000 1500 2000 x (nm) H2B−Dendra2/PolII−SiR H2B/PolII ● ● 2500 3000 2500 x (nm) 2500 10000 H2B (43013 pts) PolII (20303 pts) ● H2B (28510 pts) PolII (922 pts) y (nm) 1000 0 0 500 500 1000 y (nm) 1500 1500 2000 2000 ● 500 1000 1500 2000 500 1000 x (nm) 1500 2000 2500 x (nm) ● H2B (40827 pts) PolII (5313 pts) 2000 2500 ● H2B−SiR/PolII−Dendra2 3000 2500 H2B−SiR/PolII−Dendra2 ● H2B (27328 pts) PolII (2927 pts) 1500 1000 y (nm) 0 −500 0 500 500 1000 y (nm) 1500 2000 ● 0 500 1000 1500 0 x (nm) 500 1000 1500 2000 2500 3000 x (nm) Figure 9 – Acquisitions réalisées en deux couleurs pendant le stage. (à l’exception de la première représentation, données du laboratoire). (de gauche à droite et de haut en bas) Pemière image : acquisition H2B et une protéine de réparation s’accumulant aux zones de cassure double brin de l’ADN, trois suivantes : lignée 4ADP, deux dernières : Rpb1-Halo. 17 2.2.3 Précision des localisations Une calibration sous-optimale des PSF peut également influer sur la précision de localisation, en particulier en z. En effet, l’observation à l’œil nu des données en trois dimensions révèle des clusters de détections, en particulier lors de l’utilisation de fluorophores STORM. Néanmoins, au lieu d’être sphériques, ceux-ci apparaissent fortement étirés suivant l’axe z, suggérant une faible précision de localisation suivant cet axe. Estimer ce biais est important, car il conditionne d’une part la résolution de l’expérience, et il indique d’autre part que d’un point de vue spatial l’axe z n’a pas la même «valeur» que les deux autres axes. En particulier, si la dispersion en z est trop importante, celle-ci n’apporte plus d’information et on peut se ramener à des analyses en deux dimensions. Nous avons estimé la dispersion des données sur des détections multiples. Pour cela, nous avons sélectionné des clusters (Figure 10.b, détaillé en c.) uniques de détections, c’est-à-dire constitués d’un seul fluorophore ou de fluorophores très proches l’un de l’autre, et estimé leur dispersion en x, y et z. La décision de considérer ce qui apparaît en deux dimensions comme un cluster unique en trois dimensions repose sur l’analyse temporelle d’acquisitions in vivo (Figure 10.d). En effet, nous avons sélectionné des suites de détections très proches dans le temps, assimilables à un cluster labile de polymérase ou à la longue durée de vie d’un fluorophore. Si deux clusters étaient situés au même endroit en x et y, la probabilité qu’ils ne coïncident pas également en z est faible devant celle qu’il s’agisse d’un unique cluster. Au final, les dispersions du cluster sont estimées en trois dimensions (Figure 10.a). Il apparaît à la lumière de cette analyse qu’alors que la précision de pointé est correcte en x et y (de l’ordre de la dizaine de nm), celle-ci est très faible en z : la dispersion des détections dépasse cent nanomètres (dans une tranche d’observation qui ne dépasse pas 1000 nm). Ainsi, il semble a priori illusoire de vouloir reconstruire des structures en trois dimensions, puisqu’en gros les points sont positionnés au hasard en z. Si les informations véhiculées en z ont très bruitées, les données ne sont pas forcément identiques à des données en deux dimensions. Pour le montrer, nous avons évalué la dispersion en z de multiples clusters (Figure 5, p.7 en Annexe 2.2). L’analyse montre que les clusters n’occupent pas tous la même localisation en z, signe que l’axe z véhicule une information spatiale (tous les points ne sont pas tirés dans la même loi). Cette technique permet en√théorie d’améliorer la précision de localisation des molécules : moyenner n détections diminue en n l’incertitude de localisation. Initialement développée pour pallier à une calibration sous-optimale du miroir et multiplier la résolution par un facteur 10 (pour 100 détections), cette méthode peut être appliquée dès que des détections multiples sont observées, y compris avec un miroir bien calibré, et devrait permettre des gains de résolution du même ordre. 2.3 Analyses spatiales La majorité des acquisitions ont dû être écartées suite aux analyses préliminaires. Celles-ci ont aussi montré la résolution limitée en z des acquisitions. Ces données étant à présent connues, il est possible de réaliser les analyses proprement dites dans le but d’élucider les relations qu’entretiennent la polymérase et l’histone H2B. Dans un premier temps, nous avons analysé les deux couleurs séparément, avec pour ambition de répliquer un certain nombre de découvertes réalisées en superrésolution. 18 a. Nombre de localisations à la position x b. Nombre de localisations à la position y Comptage Nombre de localisations à la position z c. 1 d. frame Figure 10 – Mauvaise résolution en z d’une acquisition (ARNpolII-Halo, fluorophore SiR). (a) dispersion des détections d’un même fluorophore : alors que la majorité des points sont dans une fenêtre de quelques dizaines de nanomètres en x et y, ceux-ci sont dispersés en z, (b) ensemble des détections de la polymérase, des clusters sont nettement visibles ; en rouge, l’ensemble de détections analysées, correspondant à la détection multiple d’un même fluorophore, (c) coordonnées des points analysés, (d) analyse temporelle des points considérés ; toutes les détections sont concentrées dans un intervalle de 150 images, signe que les détections correspondent à la même molécule. 2.3.1 Couleurs individuelles Histone Les données d’histone sont relativement bien résolues : une centaine de millier de détections permet de visualiser la structure à l’œil nu. Une première inspection de visu montre que la répartition de l’histone est hétérogène (Figure 11, gauche). Accumulation au niveau des bords Sur plusieurs acquisitions, les noyaux semble présenter une accumulation d’histones au niveau de l’enveloppe nucléaire. Pour le démontrer, nous avons eu recours à deux méthodes. Une première, graphique, a constitué à estimer en deux dimensions l’intensité locale du processus ponctuel (Figure 11). Cette méthode permet de faire apparaître nettement et sur plusieurs reconstructions une accumulation au niveau des bords. La seconde consiste à tester l’hypothèse de complete spatiale randomness, i.e. calculer l’écart entre la répartition observée des points et la répartition théorique de points distribués aléatoirement dans le même volume et comparer les fonctions de Ripley obtenues dans les deux cas (Figure 12). Ce calcul montre une tendance générale à l’agrégation à de nombreuses échelles (le nombre de voisins d’un point est toujours supérieur à la valeur donnée par le CSR), de quelques nanomètres 19 à plusieurs centaines de nanomètres. Ces observations reproduisent celles réalisées par Récamier et coll. [19] sur un matériel biologique similaire. bandwidth = 100 nm 0.015 0.005 0 0.01 1000 0.02 0.01 0.03 0.04 2000 y (nm) 0.05 0.02 0.06 3000 0.07 0.025 bandwidth = 25 nm 0 1000 2000 3000 x (nm) bandwidth = 100 nm 0.025 0.02 0.015 0.01 0.005 0 0.01 500 0.02 1000 0.03 0.04 y (nm) 1500 0.05 0.06 2000 0.07 2500 bandwidth = 25 nm 500 1000 1500 2000 2500 Figure 11 – Estimation de la densité de points à différents rayons par estimation de l’intensité du processus ponctuel à différents rayons. (gauche) représentation des détections individuelles, (centre et droite) intensités estimées avec des noyaux respectivement de 25 nm et 100 nm. Une accumulation au niveau des bords est visible. Axes gradués en nanomètres. Dimension fractale La reconstruction de la structure de l’histone en trois dimensions offre de nombreuses perspectives pour l’analyse fine de l’organisation du spatiale du noyau. La chromatine, occupant plus de 50% du volume du noyau, pourrait jouer un rôle important sur la régulation transcriptionnelle en influant la diffusion des facteurs de transcription (données non publiées du laboratoire). Pour étudier ces structures, les mathématiques fractales sont un outil particulièrement adapté, et le calcul de la dimension fractale de l’espace engendré par le réseau d’histones est un indice aux significations biologiques importantes. En effet, plus celui-ci est faible, plus la diffusion des facteurs se rapprochera de marches à une dimension dans lequel la recherche de cible est plus rapide et plus locale qu’en trois dimensions. La dimension fractale représente la relation entre le rayon r d’une sphère et le nombre de détections qu’il contient. Ainsi, si on considère des détections échantillonnant une structure à deux dimensions (une membrane par exemple), le nombre de détections croîtra avec le carré du rayon de la sphère et la dimension fractale est de deux. Par contre, si les points sont disposés au hasard dans l’espace, ce nombre croîtra avec le cube du rayon, impliquant une dimension fractale de trois. Cet exemple permet également de tirer deux intuitions, vérifiées par la suite au niveau mathématique : 20 Figure 12 – Calcul de la fonction K de Ripley (nombre de voisins dans un disque de rayon r) pour les deux cellules présentées Figure 11. Pour chaque cellule (resp a et b) : (gauche) : Fonction de Ripley et (droite) zoom sur les faibles distances. Kobs (r) : Fonction de Ripley estimée sur les données. Cette fonction est corrigée des bords, Ktheo (r) : Fonction de Ripley théorique (λ ∗ π ∗ r2 ), Khi (r) et Klow (r), confondus avec Ktheo (r) : enveloppes issues d’au moins cinq simulations du processus. – Il est impossible de déterminer des dimensions fractales supérieures à deux sur des données à deux dimensions ([8], p.93). – Lorsque les détections sont dans un volume fini, le noyau par exemple, il faudra tenir compte des bords qui peuvent biaiser le calcul : sans correction des bords, des points disposés au hasard dans le noyau n’auront pas une dimension fractale de trois, puisqu’il n’y a pas de points hors du noyau à considérer lorsque r grandit. En pratique, le calcul de dimension fractale nécessite un calcul coûteux de convolutions multiples en trois dimensions pour réaliser la correction de bords. Avec les algorithmes disponibles au laboratoire, pour des acquisitions de bonne qualité (plusieurs centaines de milliers de points), et en considérant une discrétisation à un pas de 10 nm, le calcul d’une dimension fractale prend environ 24h. Nousa avons imaginé un algorithme explicitant la correction de bords comme une succession de convolutions, réalisables rapidement et parallélisables à l’aide de transformées de Fourier. Les détails de l’algorithme, et ses performances sont présentées en (Annexe 3.3, p.22). L’exactitude numérique du programme a été évaluée pour des petites tailles de matrice (un cinquantième de la taille réelle du problème), et l’écart relatif maximal entre la sortie du programme et la référence est de l’ordre de 10−6 . Au-delà, aucun des algorithmes testés ne s’est montré capable de fournir un résultat dans un temps raisonnable. Les performances actuelles sont encourageantes, démontrant une preuve du concept. Une future version s’appuyant sur la parallélisation de l’algorithme sur cartes graphiques est en préparation. Polymérase Les observations des nuages de points montrent une forte agrégation. Le laboratoire a récemment décrit ([4]) l’existence de clusters très labiles de quelques polymérases, et nous avons tenté de savoir si les agrégations observées étaient assimilables à ceux-ci. Pour cela, nous avons tenté de compter le nombre de fluorophores détectés au cours du temps dans chaque cluster en analysant 21 Intensité 1000 2000 l’intensité des détections (Figure 13). En effet, si le cluster est constitué de plusieurs molécules, celles-ci devraient peu à peu blanchir une par une, et l’intensité détectée devrait diminuer par palliers. Pour la dizaine de clusters considérés, on n’observe pas une diminution monotone de l’intensité des détections (à une exception près, présentée en Annexe 2.5, p.9), ni une quelconque régularité, dans la hauteur des pas (évaluée par transformée de Fourier), indiquant que les clusters observés sont plus probablement des molécules uniques à très longue durée de vie. Cette observation est corroborée par le fait que les clusters sont bien moins marqués lors des observations en PALM dont la durée de vie est plus faible. 760 780 800 Frame 820 840 Figure 13 – Évolution de l’intensité d’un cluster représentatif au cours du temps. Les traits en gris marquent les images où une détection a été réalisées. L’intensité ne semble pas suivre le motif que l’on attend de la dégradation d’une population réduite de fluorophores. 2.3.2 Deux couleurs Malgré la faible qualité des données (nombre de points et précision de pointé en particulier), nous avons cherché des corrélations spatiales entre l’histone et la polymérase. Une approche similaire à celle entreprise en une couleur a été mise en œuvre. Tout d’abord, une la densité relative locale entre les deux molécules a été calculée (Figure 14) : en chaque point de l’espace, on compare la densité estimée de H2B et PolII en calculant un ratio. Plusieurs pas d’estimation de la densité ont été réalisés. On observe à plusieurs échelles des enrichissements relatifs en polymérase se superposant aux clusters de polymérase précédemment décrits, indiquant qu’en ces points, il n’y a pas d’enrichissement particulier en chromatine. Ensuite, la fonction de Ripley inter-type KH2B,P olII a été calculée (Figure 15). Elle montre l’évolution du nombre de voisins dans un rayon r. Les mesures ont été comparées à l’hypothèse CSR et un enrichissement relatif a là aussi été calculé. Il représente l’écart par rapport au nombre de voisins attendu sous CSR, et permet donc de tester la dépendance entre les deux nuages de points. En effet, si les deux nuages sont indépendants, les voisins de l’autre type apparaîtront ditribués au hasard (i.e. suivant le CSR). L’analyse montre un enrichissement léger, mais significatif, qui se manifeste surtout aux petits rayons. Ainsi, à un rayon de 150 nm, l’enrichissement au voisinage de la polymérase est de l’odre de 60% : on trouve une fois et demie plus d’histone lorsqu’on est proche d’une polymérase que si on se situait à un point quelconque de l’espace. 22 a. b. Figure 14 – Enrichissement local de PolII par rapport à H2B. (a) Calculé à une échelle de 500 nm. (b) À une échelle de 200 nm. Figure 15 – Analyse en deux couleurs d’une cellule. (a) Estimation de la fonction K de Ripley et comparaison au CSR. (b) zoom à faibles rayons. (c) Calcul de l’enrichissement relatif par rapport au CSR. KH2B,P olobs (r) : K observée, corrigée des bords. KH2B,P oltheo (r) : K théorique (avec KH2B,P olhi (r) et KH2B,P ollo (r) un intervalle de confiance estimé sur 5 simulations). 3 Discussion La qualité des données obtenue est très faible par rapport à ce qu’on peut attendre d’une expérience de superrésolution en trois dimensions et pour reconstruire avec certitude une structure. En effet, la marge de progression est importante, puisqu’il y a environ dix millions d’histones dans la cellules, et certaines exprériences récentes laissent à penser que la population d’ARNpolII dépasse la centaine de milliers par noyau. Par conséquent, les analysés réalisées sur ces acquisitions sont extrêmement préliminaires, tout comme l’interprétation qui pourrait en être tirée. Il va de soi que les protocoles d’analyse de données devront être répétés en s’appuyant sur des acquisitions de bonne qualité. 23 Néanmoins, des tendances sont visibles sur les données dont nous disposions pendant le stage, et il est possible de réfléchir à la signification biologique de ce résultat, tout en gardant à l’esprit qu’il s’agit avant tout d’un cas d’étude. Le calcul des fonctions K de Ripley suggère l’existence d’une colocalisation importante entre la chromatine et la polymérase, avec un enrichissement relatif significatif pouvant atteindre 50%. Cette donnée est contraire au dogme traditionnel de l’expression génétique, qui affirme que pour des raisons d’encombrement spatial, les régions denses en chromatine ne sont pas transcrites. Dans cette hypothèse, la régulation de la transcription s’opère par l’accessibilité mécanique du gène. Cependant, des travaux suggèrent un mode de régulation de la transcription différent. En effet, pour un locus accessible, Darzacq et coll. [6] ont montré que l’initiation de la transcription est un processus stochastique dont le taux d’échec dépasse les 99 %. De plus, il a été montré que plus des trois quarts des polymérases du noyau ont une mobilité trop importante pour être impliqués dans la transcription d’un ARNm ou dans le PIC [12]. En conclusion, la majorité des polymérases du noyau sont inactives et ne transcrivent pas. Quelle est alors leur utilité ? Du point de vue thermodynamique, disposer d’une concentration élevée de molécules déplace les équilibres dans le sens de la réaction, comme par exemple l’amorce de la transcription. Si l’on suit cette hypothèse, les transcription factories, mises en évidence depuis plusieurs années [21], et les clusters très labiles de PolII découverts récemment [4] permettent d’émettre l’hypothèse d’une régulation par la concentration locale des facteurs d’assemblage du PIC. Si l’on accepte cette hypothèse de travail, alors les régions denses en chromatine deviennent un substrat de choix pour l’initiation de la transcription, non parce que les promoteurs des gènes pourraient y être concentrés, mais parce que c’est un espace dans lequel la dimensionnalité est réduite (des données suggèrent une dimension fractale de 2,2 dans l’hétérochromatine). Autrement dit, les facteurs diffusant dans ce réseau extrêment dense de chromatine adopteraient une marche aléatoire similaire à celle en deux dimensions. Or, en deux dimensions, l’exploration de l’espace est compacte, la molécule sur-échantillonne l’espace et la recherche de cible est rapide. Ainsi, la chromatine peut alors jouer le rôle d’un catalyseur hétérogène au sens de la chimie traditionnel : une surface en deux dimensions qui permet de localiser les substrats dans un espace où l’exploration est compacte et donc la réaction facilitée. Cette hypothèse met en lumière le caractère particulier de l’interface entre la chromatine et le reste du noyau. En effet, c’est à la fois un réseau à même de faciliter les réactions, mais aussi une zone de contact : une zone accessible où la machinerie transcriptionnelle est déjà présente, et des expériences suggèrent que les gènes actifs se trouvent à la périphérie des territoires chromosomiques [5]. Par ailleurs, si le résultat de l’expérience avait été opposé et que l’on avait observé une relation d’exclusion entre la chromatine et l’ARN polymérase, des conclusions intéressantes auraient là aussi pu être déduites. En effet, si les régions actives du noyau sont celles peu denses en chromatine et que les réactions se font dans un espace de dimension fractale élevée (proche de 3), alors la régulation doit alors se faire de manière biochimique, par de nombreux facteurs favorisant ou défavorisant l’initiation de la transcription. Ainsi, quel que soit le résultat de l’expérience, la mesure des corrélations spatiales chromatine/polymérase revêt un intérêt particulier pour la compréhension de la transcription, puisqu’elle permet et implique des modes de régulation fondamentalement différents. Par conséquent, il y a un intérêt à réaliser des observations de meilleure qualité. À court terme, il est possible d’obtenir de bien meilleures images en trois dimensions au laboratoire. En effet, le miroir déformable était désaligné et déréglé pendant le stage, ce qui explique la faible qualité des 24 acquisitions. De plus, le fluorophore SiR utilisé n’est pas photoactivables : il n’est pas possible de régler la quantité de molécules dans l’état actif avec un laser ultaviolet comme c’est possible avec Dendra2. Il s’ensuit que la majorité des fluorophores est observée pendant les premières secondes de l’acquisition. Tous allumés en même temps, il n’est pas possible de les localiser. L’usage de fluorophores photoactivables, par exemple ceux nouvellement synthétisés au laboratoire de Luke Lavis [13] permettrait d’augmenter grandement le nombre de détections. Concernant l’analyse des données, il est nécessaire de réaliser les calculs en tenant compte des trois dimensions, ce qui n’a pas été fait durant le stage, faute de temps. Les outils restent en effet à adapter légèrement pour pouvoir fonctionner en trois dimensions. En particulier, la correction de bords et le calcul des fonctions de Ripley inter-types peuvent facilement être adaptés et optimisés. Dans le cas de l’interprétation des fonctions de Ripley, un soin devra être apporté à la recherche de la signification biologique, au-delà de la significativité statistique. En effet, les simulations présentent un écart-type très faible du fait de l’usage d’un très grand jeu de données (de l’ordre du million de points). Autrement dit, la puissance statistique des tests est telle qu’il devient possible de détecter des écarts au CSR extrêmement faibles. Dans ce cas-là, il est nécessaire de questionner la signification des enrichissements/appauvrissements mis en évidence. Par exemple, si l’on trouve que le voisinage d’une molécule est enrichi en une autre molécule à hauteur de 0.01 %, la signification biologique de cet enrichissement est difficile à imaginer, tant bien même si le test affirme que cet écart est significatif. Au final, il est clair que la question des relations entre la chromatine et l’ARN polymérase reste en suspens. Néanmoins, un pas a été effectué vers la résolution de cette question, notamment par la mise en place d’un protocole d’analyse des données et par l’acquisitions de résultats préliminaires (choix des fluorophores, calibration en deux couleurs, etc.) et il est intéressant de poursuivre ce projet, en particulier parce que les techniques et outils qu’il permet de développer ont une utilité plus large que l’étude de H2B/PolII. Conclusion Dans le cadre de l’étude des conséquences fonctionnelles de l’organisation spatiale du noyau, ce stage a été l’occasion de réaliser un certain nombre d’avancées, indispensables préalables à la résolution de structures en deux couleurs : – Le test de plusieurs techniques de marquage, et la mise en évidence du potentiel d’un fluorophore récemment synthétisé. – L’évaluation de la toxicité des fluorophores sur les cellules considérées, et la détermination d’une concentration limite au-delà de laquelle les conséquences sur la croissance cellulaire sont importantes. – L’acquisition et la reconstruction de structures spatiales en deux couleurs, permettant en théorie de comparer sur une même cellule la répartition de l’ARNpolII et de l’histone H2B. – La recherche d’outils statistiques à même de révéler des corrélations spatiales ainsi que d’implémentations efficaces de ceux-ci. Néanmoins, le travail entrepris n’a pas permis de répondre à toutes les questions initialement posées. En particulier, il s’est révélé très difficile de réaliser des acquisitions précises en trois dimensions, notamment sur cellules fixées, dans lesquelles la difficulté de trouver un tampon adéquat s’ajoute à la minutie nécessaire à la calibration de l’optique adaptative. Par ailleurs, les films réalisés sur cellules vivantes ne fournissent pas suffisamment de détections pour réaliser une analyse 25 temporelle des relations H2B-ARNpolII. Malgré cela, l’application du protocole prévu pour les cellules fixées aux acquisitions sur cellules vivantes fournit deux nuages de points, utilisables avec précautions certes, mais qui peuvent être employés à la recherche de corrélations spatiales. Loin d’être idéale, cette méthode constitue néanmoins un premier pas vers une meilleure résolution des interactions spatiales entre les deux protéines. De plus, les optimisations réalisées en amont des acquisitions et les acquisitions elles-mêmes ouvrent un certain nombre de perspectives. – Pour le laboratoire, elles démontrent la faisabilité de ce type de manipulation, débroussaillent le champ des techniques utilisables et mettent en lumière les pistes d’amélioration et principaux écueils techniques. Par exemple, la calibration de l’optique adaptative est une difficulté surmontable, puisque des expériences en une couleur de grande résolution ont été réalisées précédemment par l’équipe. Plus généralement, le potentiel de l’observation en superrésolution est grand, et de nombreuses déclinaisons sont envisageables. – De plus, les techniques statistiques identifiées et les scripts d’analyse développés pendant le stage sont une base à parfaire, mais pourraient permettre d’accélérer un certain nombre d’analyses, ouvrant la voie à l’étude d’un plus grand nombre de cellules et à l’étude de variations intercellulaires. D’une manière plus générale, ces premiers résultats amènent à poser de nouvelles questions. Tout d’abord, si les relations H2B-PolII sont probablement fortement conservées, la question de la généralité de celles-ci entre les types cellulaires et au cours de la vie de la cellule mérite d’être posée. Ensuite, on ne sait pas grand chose de la signification fonctionnelle de la proximité H2B-PolII. Les clusters de polymérase sont-ils des clusters de polymérase active ? L’étude conjointe de l’état de phosphorylation des protéines considérées et de leur localisation spatiale pourrait répondre à cette question. Par ailleurs, si la résolution sur cellules fixées des relations H2B-ARNpolII est à portée de main, des questions se posent sur la dynamique de ces interactions. La diffusion de la polymérase est-elle affectée par la proximité de la chromatine ? De manière similaire, peut-on observer une dynamique particulière de l’histone à proximité d’une polymérase ou d’un cluster de molécules ? À l’heure actuelle, l’acquisition de ce type de données est possible, et leur analyse fait appel à des statistiques à la fois spatiales et temporelles. Celles-ci restent à inventer, ou du moins à transposer depuis la littérature mathématique jusqu’à une implémentation efficace pour traiter des centaines de milliers d’événements. Enfin, au-delà du contexte transcriptionnel, les relations entre structure spatiale et fonction se posent dans de nombreux domaines (mouvement cellulaire, neurosciences, etc.), et la compréhension de modes d’interaction spatiale entre deux protéines, ici impliquées dans la transcription, dépasse naturellement le cadre du noyau et pourrait être exportée vers de nombreux constituants dans toute la cellule. Références [1] Bruce Alberts, Alexander Johnson, Julian Lewis, Martin Raff, Keith Roberts, and Peter Walter. Molecular Biology of the Cell. Garland Science, 5 edition, November 2007. [2] Adrian Baddeley and Rolf Turner. Spatstat : An r package for analyzing spatial point patterns. In Journal of Statistical Software, volume 12, pages 1–42, 2005. [3] Neil A. Campbell, Jane B. Reece, and Lawrence G. Mitchell. Biology (5th Edition). Benjamin-Cummings Pub Co, 5th edition, 2011. 26 [4] Ibrahim I. Cisse, Ignacio Izeddin, Sebastien Z. Causse, Lydia Boudarene, Adrien Senecal, Leila Muresan, Claire Dugast-Darzacq, Bassam Hajj, Maxime Dahan, and Xavier Darzacq. Real-time dynamics of rna polymerase ii clustering in live human cells. Science, 341(6146) :664–667, 2013. [5] T. Cremer and C. Cremer. Chromosome territories, nuclear architecture and gene regulation in mammalian cells. Nature reviews. Genetics, 2(4) :292–301, April 2001. [6] Xavier Darzacq, Yaron Shav-Tal, Valeria de Turris, Yehuda Brody, Shailesh M. Shenoy, Robert D. Phair, and Robert H. Singer. In vivo dynamics of RNA polymerase II transcription. Nat Struct Mol Biol, 14(9) :796–806, September 2007. [7] Peter J. Diggle. Displaced amacrine cells in the retina of a rabbit : analysis of a bivariate spatial point pattern. Journal of the London Mathematical Society, 15 :188–92, 1986. [8] Kenneth Falconer. Fractal Geometry : Mathematical Foundations and Applications. Wiley, 2 edition, November 2003. [9] T. Hubbard. The ensembl genome database project. Nucleic Acids Research, 30(1) :38–41, 2002. [10] Janine Illian, Antti Penttinen, Helga Stoyan, and Dietrich Stoyan. Statistical Analysis and Modelling of Spatial Point Patterns (Statistics in Practice). Wiley-Interscience, 1 edition, March 2008. [11] Ignacio Izeddin, Mohamed El Beheiry, Jordi Andilla, Daniel Ciepielewski, Xavier Darzacq, and Maxime Dahan. Psf shaping using adaptive optics for three-dimensional single-molecule super-resolution imaging and tracking. Opt. Express, 20(5) :4957–4967, Feb 2012. [12] Hiroshi Kimura, Kimihiko Sugaya, and Peter R. Cook. The transcription cycle of rna polymerase ii in living cells. The Journal of Cell Biology, 159(5) :777–782, 2002. [13] Luke Lavis. Lavis’lab at the Howard Hugues Medical Institute. http://janelia.org/lab/lavis-lab. [14] Richard Law, Janine Illian, David F. R. P. Burslem, Georg Gratzer, C. V. S. Gunatilleke, and I. A. U. N. Gunatilleke. Ecological information from spatial patterns of plants : insights from point process theory. Journal of Ecology, 97(4) :616–628, 2009. [15] Georgyi V. Los, Lance P. Encell, Mark G. McDougall, Danette D. Hartzell, Natasha Karassina, Chad Zimprich, Monika G. Wood, Randy Learish, Rachel F. Ohana, Marjeta Urh, Dan Simpson, Jacqui Mendez, Kris Zimmerman, Paul Otto, Gediminas Vidugiris, Ji Zhu, Aldis Darzins, Dieter H. Klaubert, Robert F. Bulleit, and Keith V. Wood. HaloTag : A novel protein labeling technology for cell imaging and protein analysis. ACS Chemical Biology, 3(6) :373–382, June 2008. [16] Gražvydas Lukinavičius, Keitaro Umezawa, Nicolas Olivier, Alf Honigmann, Guoying Yang, Tilman Plass, Veronika Mueller, Luc Reymond, Ivan R. Corrêa, Zhen-Ge G. Luo, Carsten Schultz, Edward A. Lemke, Paul Heppenstall, Christian Eggeling, Suliana Manley, and Kai Johnsson. A near-infrared fluorophore for live-cell super-resolution microscopy of cellular proteins. Nature chemistry, 5(2) :132–139, February 2013. [17] Ron Milo, Paul Jorgensen, Uri Moran, Griffin Weber, and Michael Springer. BioNumbers—the database of key numbers in molecular and cell biology. Nucleic Acids Research, 38(Database issue) :D750–D753, January 2010. http://bionumbers.hms.harvard.edu. [18] George L. W. Perry, Ben P. Miller, and Neal J. Enright. A comparison of methods for the statistical analysis of spatial point patterns in plant ecology. Plant Ecology, 187(1) :59–82, March 2006. [19] Vincent Récamier, Ignacio Izeddin, Lana Bosanac, and Xavier Darzacq. Single cell correlation fractal dimension of chromatin. soumis, 2013. [20] Arnauld Serge, Nicolas Bertaux, Herve Rigneault, and Didier Marguet. Dynamic multiple-target tracing to probe spatiotemporal cartography of cell membranes. Nat Meth, 5(8) :687–694, August 2008. [21] Bickmore WA. Sutherland H. Transcription factories : gene expression in unions ? Nat Rev Genet., 10(7) :457–66, july 2009. 27 [22] Ebru Urcan, Ursula Haertel, Marianthi Styllou, Reinhard Hickel, Harry Scherthan, and Franz X. Reichl. Realtime xCELLigence impedance analysis of the cytotoxicity of dental composite components on human gingival fibroblasts. Dental Materials, September 2009. [23] Sebastian van de Linde, Anna Löschberger, Teresa Klein, Meike Heidbreder, Steve Wolter, Mike Heilemann, and Markus Sauer. Direct stochastic optical reconstruction microscopy with standard fluorescent probes. Nature protocols, 6(7) :991–1009, 2011. [24] Eric W. Weisstein. Pólya’s random walk constants. http://mathworld.wolfram.com/ PolyasRandomWalkConstants.html. From MathWorld–A Wolfram Web Resource. 28