Sequencage :Electrophorèse sur capillaires
Transcription
Sequencage :Electrophorèse sur capillaires
ACTIVITE Extrait du rapport de Stage de Séverine ESCAICH SOMMAIRE I. RÉACTION DE SÉQUENCE .................................................................................................2 I1. Principe de la méthode de SANGER ......................................................................2 I2. Adaptation de la technique à la fluorescence.........................................................3 I3. Conditions techniques ............................................................................................5 I4. Thermocyclage........................................................................................................6 I5. Purification de la réaction de séquence par sephadex G50...................................6 II. DÉTERMINATION DE LA SÉQUENCE DU BRIN MATRICE .....................................................7 II1. Principe du fonctionnement de l’appareil ..............................................................7 II2. Fonctionnement de l’appareil ................................................................................7 II2a. Présentation de l’analyseur génétique 3100 .......................................................8 II2b. Déroulement d’un run.........................................................................................8 II2c. Collection des données par le logiciel DATA COLLECTION (ABI). ............10 II2d. Calibration spatiale...........................................................................................13 II2e. Calibration spectrale .........................................................................................13 II2f. Analyse des données brutes par le logiciel DATA ANALYSIS (ABI) ...........15 II2g. Entretien de l’appareil ......................................................................................15 I. REACTION DE SEQUENCE La réaction de séquence que l’on utilise au laboratoire repose sur la méthode de SANGER ou méthode des interrupteurs de chaîne, adaptée a la fluorescence. I1. Principe de la méthode de SANGER Le recopiage d’un brin matrice par une ADN polymérase ADN dépendante est initiée par la fixation d’un oligonucléotide spécifique (amorce), complémentaire du brin matrice. Cette ADN polymérase va permettre l’élongation d’un nouveau brin complémentaire du brin matrice dans le sens 5’® 3’ (cf schéma p13) L’ADN polymérase permet l’incorporation de nucléotides (dNTP: déoxynucléotides) libres présents dans le milieu réactionnel par la formation d’un pont phosphodiester entre le 3’OH de la chaîne et le 5’ phosphate du dNTP suivant. La réaction de Sanger repose sur l’incorporation alléatoire par cette ADN polymérase de didéoxynucléotides interrupteurs de chaîne (ddNTP) eux aussi présents dans le milieu réactionnel. Ces ddNTP diffèrent des dNTP par leur extrémité 3’. L’extrémité 3’OH des dNTP est remplacée par une extrémité 3’H. Cette modification empêche la formation de la liaison phosphodiester entre le ddNTP incorporé dans la chaîne et le nucléotide suivant. L’allongement de la chaîne est alors interrompu. Dans le milieu réactionnel il y a compétition entre les dNTP et les ddNTP. Le rapport spécifique ddNTP/dNTP et l’affinité de la taq pour chaque nucléotide sont optimisés de telle façon qu’un ddNTP soit statistiquement incorporé à toutes les positions possibles. Une migration électrophorétique du produit de cette réaction de séquence sur un gel très résolutif (polyacrylamide) va séparer tous les fragments présents en fonction de leur masse moléculaire(taille). Les plus petits fragments vont migrer plus rapidement que les grands. La grande résolution de ce gel permet de distinguer des fragments différents entre eux d’une paire de base. L’identification du ddNTP présent à l’extrémité 3’ de chaque fragment déterminera la séquence nucléotidique du brin matrice initial. ___________________________________________________________________________ 2 I2. Adaptation de la technique à la fluorescence L’élongation de chaque produit monobrin se termine par l’incorporation d’un ddNTP spécifique (voir schéma p13 ). Ici, chaque ddNTP (ddATP,ddTTP,ddCTP,ddGTP) est marqué par un fluorochrome différent dont le spectre d’émission est spécifique. Une analyse spectrale va différencier les différents fluorochromes, associer la base correspondante et donc définir la séquence nucléotidique du brin d’ADN initial. Nous utilisons la technologie Big Dye TerminatorÒversion2 (Applied Biosystems : ABI), version 2. La technologie Big Dye Terminator (BDT) utilise un système de transfert d’énergie par résonance (FRET) entre deux fluorochromes fixés sur le même ddNTP et reliés entre eux par un linker. Le premier est une fluorescéine (6 carboxyfluoréscéine) appelé fluorochrome donneur, commun aux quatre ddNTP. Le second est une dichlororhodamine (dRhodamine) qui joue le rôle de fluorochrome accepteur. Le fluorochrome donneur est excité par un rayon laser à argon émettant à 488nm et 514,5nm. Son énergie de fluorescence émise (515-520nm) est captée intégralement par le fluorochrome accepteur qui est excité à son tour. Le fluorochrome accepteur ou dichloroRhodamine est différent pour chaque type de ddNTP. ddNTP A T C G dichloroRhodamines utilisées dR6G dROX dR110 dTAMRA Spectre d’émission maximum 560-565nm 615-620nm 530-535nm 590-595nm Le spectre de la fluorescence réémise sera ainsi spécifique de chaque type de ddNTP. Le transfert du signal de la fluorescéine vers la dRhodamine permet une amplification du signal et, par conséquent, une augmentation de la sensibilité de la technique(fig1). Fluorescéine : fluorochrome donneur commun à tous les dNTP Laser d’excitation FRET Dichlororhodamine : fluorochrome accepteur, spécifique du ddNTP Fluorescence émise ddNTP Fig 1 : Mécanisme de la fluorescence par la technique du transfert d’énergie par résonance ___________________________________________________________________________ 3 Etapes de la réaction de séquence 5’ 3’ T A C T T C A G C G T A C A A T G A A G T C G C A T G T 3’ 5’ . Dénaturation de l’ADN double brin 5’ 3’ T A C T T C A G C G T A C A A T G A A G T C G C A T G T 3’ 5’ Hybridation entre l’amorce et le brin matrice 1 Cycle 5’ 3’ T A C + A T G A A G T C G C A T G T 3’ 5’ Fixation de la Taq polymérase et alongement de la molécule d’ADN par incorporation de dntp. 5’ F 3’ T A C T T C A T G A A G T C G C A T G T 3’ 5’ 5’ F 3’ T 5’ F 3’ T A 5’ T A C 5’ 3’ F T A C T 5’ 3’ F 3’ F T A C T T 5’ F T A C T T C 5’ Le brin allongé se termine par incorporation d’un didéoxynucléotide marqué par un fluorochrome différent selon la base présente (A,T,C ou G ). Au bout de 30 cycles on obtient un pool d’ADN simple brins de taille croissante. 3’ F T A C T T C A 5’ 3’ F T A C T T C A G 5’ 3’ F T A C T T C A G C 5’ 5’ 5’ T A C T T C A G C G 3’ F 3’ F T A C T T C A G C G T T A C T T C A G C G T A 3’ F 3’ ___________________________________________________________________________ 4 L’adaptation de la technique de Sanger à la fluorescence permet d’effectuer la réaction de séquence dans un tube unique. Nous utilisons depuis peu de temps le Kit DYEnamic ET Terminator (Amersham) qui utilise une chimie proche du kit BDT V2 (Technologie FRET). Sa spécificité est l’utilisation d’une polymérase différente (la Thermo-Sequenase II) et de fluorochromes différents. I3. Conditions techniques Ò L’ADN polymérase utilisée dans le kit BDT est la Taq polymérase FS (ABI). Celle utilisée dans le kit Amersham est la Thermo-Sequenase. Ces enzymes sont thermorésistantes et permettent d’effectuer plusieurs cycles d’élongation successifs. Par conséquent la matrice d’ADN peut être réutilisée plusieurs fois et donc être présente en quantité plus réduite. Cela permet une amplification linéaire du signal. De plus l’utilisation de fortes températures pour la dénaturation de la matrice aide à déstabiliser d’éventuelles structures secondaires. La Taq FS est modifiée génétiquement pour le séquençage (Taq FS pour Fluorescent Sequencing). Elle possède une première mutation au sein de son site actif qui facilite l’incorporation des ddNTP par rapport aux dNTP. La seconde mutation se situe au niveau de son domaine amino-terminal pour éliminer son activité exonucléasique 5’® 3’. La thermo-Sequenase est également dédiée à l’activité de séquence. Elle se caractérise par une très forte processivité. Les nucléotides utilisés classiquement sont les dATP, dCTP, dITP, dUTP (kit BDT version2). Le dUTP remplace le dTTP car il permet une meilleur incorporation des ddTTP. Le dITP est un analogue du dGTP. Le dITP va se fixer avec le dCTP de manière moins forte que le dGTP (formation de seulement 2 liaisons hydrogènes au lieu de 3). L’utilisation du dITP évite l’obtention de bandes de compression. Les bandes de compressions sur le gel résultent de la formation de structures secondaires des simples brins d’ADN (dans le cas de structures GC riches) qui rendent la migration anarchique. La faible énergie de liaison des paires I-C permet aux structures secondaires d’être plus facilement dénaturées par l’urée présente dans le gel (7mol/L)(cf III3b1). La qualité de la séquence est complètement dépendante de la qualité et de la quantité des réactifs ajoutés dans la réaction (cf mode opératoire en annexe). Cela est plus particulièrement valable pour la matrice d’ADN qui doit être de très bonne qualité. La préparation de plasmide nécessite une purification de qualité permettant l’élimination de débris cellulaires divers (ARN, protéines résiduelles) et de sels afin d’obtenir une matrice propre. Ensuite un dosage par spectrophotométrie ou une migration sur gel d’agarose permet une estimation de la quantité de matrice à ajouter. ___________________________________________________________________________ 5 Il est nécessaire pour obtenir une réaction de séquence de bonne qualité d’avoir un rapport amorce / matrice proche 10 pour 1. Un surdosage (cf.III3a4) ou un sous-dosage (cf.III3a2) de la quantité de matrice présenteront des profils caractéristiques souvent difficiles à interpréter. La qualité de l’amorce utilisée pour la réaction de séquence est, elle aussi, déterminante (cf.III3a1 et III3a3). Elle doit avoir une taille de 17 à 25 nucléotides et une température de fusion (Tm) autour de 50-60°c. Il est aussi nécessaire d’éviter certaines structures secondaires pouvant gêner la réaction (répétitions de G, épingles à cheveux). I4. Thermocyclage On effectue 30 cycles d’amplification sur le thermocycleur dans des conditions spécifiques à la réaction de séquence. Un cycle correspond à : Une étape de dénaturation de l’ADN à 95°c pendant 10 sec pour obtenir l’ADN sous forme simple brin. Une étape d’hybridation à 50°c pendant 5 sec ( température moyenne d’hybridation pour la majorité des amorces utilisées). Elle va permettre la fixation de l’amorce spécifique sur l’ADN matrice monobrin. Cette amorce va permettre l’initiation de l’élongation par la Taq polymérase. Une étape d’élongation de l’ADN par la taq polymérase à 60°c pendant 4 min. Cette température faible ralentit la Taq et va déplacer l’équilibre pour permettre une meilleure incorporation des ddNTP. La plupart du temps, l’élongation se termine par incorporation d’un ddNTP. Il arrive cependant qu’elle se termine par l’incorporation d’un dNTP. Dans ce cas, l’absence de fluorochromes sur les dNTP permet de ne pas visualiser ces faux stop. Une fois l’étape de thermocyclage effectuée, il est nécessaire de purifier la réaction de séquence. Plusieurs techniques sont possibles comme la précipitation ( Acétate de sodium / Alcool ) ou la chromatographie d’exclusion. I5. Purification de la réaction de séquence par sephadex G50 La chromatographie d’exclusion va permettre le piégeage de particules de bas poids moléculaire sur une colonne Sephadex G50 constituée de billes perforées dont les trous ont un diamètre déterminé (ici de 20 à 50µm). Les petites particules de diamètre inférieur à ceux-ci entrent et sont piégées. A l’inverse les grosses vont passer autour et être éluées très rapidement. La réaction de séquence est purifiée par chromatographie pour piéger les ddNTP libres, en excès. En effet ces ddNTP libres non incorporés lors de la réaction pourraient parasiter les signaux de fluorescence spécifiques. Les sels éventuellement présents sont piégés de la même manière que les ddNTP. ___________________________________________________________________________ 6 II. DETERMINATION DE LA SEQUENCE DU BRIN MATRICE II1. Principe du fonctionnement de l’appareil Une électrophorèse capillaire en conditions dénaturantes va séparer les produits de la réaction de séquence purifiée. L’enregistrement et l’analyse spectrale de la fluorescence spécifique du ddNTP permettra alors d’assigner la base correspondante et de déterminer la séquence nucléotidique du brin matrice. Ces différentes étapes de séparation et d’analyse sont réalisées sur l’Analyseur Génétique ABI3100 (Applied Biosystem)(fig2). Le support de migration est un polymère liquide (pop6-ABI) contenant le polymère de séparation, les sels nécessaires à la migration et l’urée (conditions dénaturantes). L’utilisation de capillaires permet d’appliquer une différence de potentiel plus importante (ddp de 12kV) que pour un appareil à plaques classique (ddp de 2,5kV). La migration des fragments d’ADN sera donc plus rapide. Dans les appareils à plaques l’effet joule était le facteur limitant le voltage utilisé (une trop forte dissipation d’énergie peut entraîner des risques de surchauffe). Sur les capillaires l’augmentation de la surface d’échange thermique permet d’utiliser sans danger un voltage plus élevé. Dans les conditions de PH utilisées, les ADN simple brin issus de la réaction de séquence sont chargés négativement. Placés sous une différence de potentiel (ddp) ces polyanions vont migrer du pôle négatif (cathode) vers le pôle positif (anode) du circuit électrique. II2. Fonctionnement de l’appareil Ò Nous utilisons l’analyseur génétique 3100 (ABI). Il permet une activité de séquençage ainsi qu’une activité d’analyse de fragments (fig2). Ò Fig2 : Photographie de l’analyseur génétique 3100 (ABI) ___________________________________________________________________________ 7 II2a. Présentation de l’analyseur génétique 3100 Cet appareil est caractérisé par sa grande sensibilité de détection grâce à l’utilisation d’une caméra ccd (Charge Couple Device). Il utilise un système d’électrophorèse capillaire qui permet une grande rapidité de migration (obtention de 750bases en 2h30) et une bonne automatisation (200 séquences en 30 heures sans intervention humaine). La longueur des capillaires est dépendante de l’activité utilisée. Les runs courts des analyses de fragments nécessitent des capillaires de petite taille (22cm). La résolution et la longueur de lecture exigées par l’activité de séquence nécessitent des capillaires de taille supérieure (50 à 80cm). Nous utilisons des capillaires de 50cm. II2b. Déroulement d’un run Seize capillaires sont physiquement associés pour permettre la co-migration simultanée de seize échantillons par run. Pour effectuer la migration des 96 échantillons 6 runs successifs de 16 échantillons seront nécessaires. Le séquenceur est piloté par une plate-forme PC qui commande pour chaque run : le remplissage des capillaires, l’injection des échantillons, la détection et l’analyse. Fig 3 : Différentes étapes d’un run effectué par l’analyseur génétique 3100 ___________________________________________________________________________ 8 Un plateau articulé appelé autosampler supporte les plaques 96 puits contenant les réactions de séquence purifiées, les réservoirs de tampon et d’eau nécessaires respectivement à la migration électrophorétique, au rinçage et à l’évacuation des déchets. Le plateau se déplace dans deux dimensions (x,y) et assure ainsi le transfert des seize capillaires entre les différents constituants (fig3) : - (1) et (2) Rejet de l’ancien polymère Le polymère est stocké dans deux seringues, l’une sert de réserve, l’autre permet le remplissage des capillaires. L’injection de polymère neuf sous pression (50-60µl de pop6 par run) dans les capillaires est effectuée au début de chaque run. Le polymère de la migration précédente est chassé dans la cuve servant de poubelle. Lors du remplissage le polymère va venir effectuer un coating dynamique. Il va neutraliser les charges positives de la silice dont sont composés les capillaires pour empêcher, par la suite, la fixation de l’ADN monobrin (chargé négativement) aux parois des capillaires. - (3) Placement des plaques de dépôt Après évacuation des déchets dans la poubelle, l’autosampler présente aux capillaires la plaque de 96 puits pour l’électroinjection des échantillons. - (4) Injection électrocinétique Les capillaires descendent dans la plaque 96 puits contenant les produits de la réaction de séquence. Une ddp d’injection (1,5kv) est appliqué pendant quelques secondes (de 20 à 40 sec), elle permet aux molécules chargées de migrer dans les capillaires. - (5) Rinçage des capillaires L’autosampler vient placer les capillaires dans de l’eau pour les rincer. - (6) Electrophorèse L’autosampler vient placer les capillaires dans le tampon de migration. Une différence de potentiel de 12 kv est appliquée entre l’anode et la cathode et va permettre au molécules d’ADN de migrer vers l’anode. ___________________________________________________________________________ 9 II2c. Collection des données par le logiciel DATA COLLECTION (ABI). Les données de fluorescences sont récupérées au niveau d’une cellule de détection et transmises vers une caméra CCD pour être analysées. Excitation par le faisceau laser Ré-émission de la fluorescence perpendiculairement Set de 16 capillaires Excitation par le faisceau laser Fig 4 : Cellule de détection permettant la récupération de la fluorescence et la détection par une caméra CCD La cellule de détection est située à distance variable (selon la taille des capillaires) de la zone de dépôt. Un faisceau laser à argon vient exciter les fluorochromes de part et d’autre de la cellule de détection (fig4). Les fluorochromes excités vont ré-émettre une fluorescence spécifique perpendiculairement (cf.I2). Elle passe à travers un filtre qui va sélectionner uniquement la fluorescence provenant des capillaires et éliminer la lumière directe provenant du laser. Une lentille concave appelée spectrographe va décomposer pour chacun des capillaires la fluorescence entre 500 et 700 nm et diriger chaque faisceau en direction de la caméra CCD (cf.schéma p23). La caméra CCD est une puce en silicone en deux dimensions composée de milliers de cellules photoélectriques (pixels). Chacun de ces pixels va accumuler une charge électrique proportionnelle a l’intensité de la fluorescence émise. La caméra CCD collecte simultanément les fluorescences des 16 capillaires (fig5). Les données brutes vont être extraites et vont subir une correction spectrale. Les calibrations spectrales et spatiales de la caméra CCD sont nécessaires pour une collection correcte et précise des données. ___________________________________________________________________________ 10 Dimention spatiale Dimention spectrale Fig 5 : Positionnement des 16 capillaires à un instant t sur la caméra CCD (axe des ordonnées: dimension spatiale) et décomposition spectrale de la fluorescence émise par chaque capillaire (axe des abscisses: dimension spectrale). ___________________________________________________________________________ 11 ___________________________________________________________________________ 12 II2d. Calibration spatiale La position des seize capillaires sur la caméra CCD varie en fonction de la localisation exacte des capillaires dans la fenêtre de détection. La calibration spatiale permet de déterminer la position exacte de chaque capillaire sur la caméra CCD. On détermine l’endroit sur la caméra CCD où la fluorescence de chaque capillaire est maximale, le polymère présent dans les capillaires est suffisamment fluorescent pour effectuer la calibration. La localisation des trois pixels encadrant ce point est enregistrée. Elle servira « d’empreinte » lors de la collections des données pour l’attribution de la fluorescence au capillaire qui lui correspond. A chaque réinstallation des capillaires une calibration spatiale est effectuée et sauvegardée (Fig6). Fig 6 : Visualisation de l’emplacement des 16 capillaires au niveau de la fenêtre de détection lors de la calibration spatiale II2e. Calibration spectrale Les spectres d’émissions des fluorochromes utilisés se superposent en partie. Pour remédier à ce recouvrement il est nécessaire de faire une calibration spectrale. La calibration spectrale est effectuée une seule fois par série de fluorochromes, avec des standards d’ADN marqués (Fig7). La calibration sera spécifique des consommables utilisés mais aussi de la machine sur laquelle elle est réalisée. En effet les différents composés optiques tels que le spectrographe sont uniques et il y a de légères variations d’une machine à l’autre. 13 Pour chaque capillaire la zone de lecture sur la caméra CCD se fait sur 20 bins pour enregistrer un profil spectral allant de 500 nm (bleu) à 700 nm (rouge). Un bin correspond à 3 pixels dans la dimension spatiale et 14 pixels dans la dimension spectrale. Les standards d’ADN marqués permettent d’établir une matrice de calcul qui va tenir compte du recouvrement des spectres des fluorochromes les uns par rapport aux autres. La décomposition du spectre sur 20 bins permet l’augmentation de la spécificité du signal. Elle est utilisée au cours de la collection des données lors d’une étape de pré-analyse appelée multicomponenting. Fig 7 : Décomposition spectrale (effectuée sur le capillaire 1) des fluorochromes constituant la technologie Big Dye (ABI) 14 II2f. Analyse des données brutes par le logiciel DATA ANALYSIS (ABI) La calibration spatiale sur la caméra CCD et l’identification de la fluorescence émise (après correction spectrale) permet d’extraire des données brutes pour chaque capillaire. Au cours des 2h30 de collection, les données brutes sont stockées sur la base Oracle du PC. A la fin de cette collection, les séquences brutes de 16 fichiers sont automatiquement extraites et analysées par le logiciel « Data Analysis » au cours d’une étape appelée « Base calling » (assignation des bases). Le sous-programme Base Caller va permettre cette bonne assignation après plusieurs étapes. Ce programme prend d’abord en compte les différences de mobilité des différents fluorochromes. En effet les fluorochromes utilisés vont entraîner des modifications de migration qui seront différentes pour chaque fluorochrome et dont il faut tenir compte. La modification de mobilité dépend du poids moléculaire et de l’encombrement du fluorochrome. Les mobilités spécifiques de chaque set de fluorochromes sont regroupées dans des fichiers spécifiques appelés mobility shift. Ensuite toute la séquence brute est scannée afin de déterminer un espacement moyen entre 2 pics (valeur comprise entre 10-12 points de scan) sur toute la séquence. La fluorescence va être normalisée en tenant compte des différences d’intensité de fluorescence de chacun des fluorochromes. Enfin la position du premier pic de fluorescence est déterminée automatiquement à partir d’une valeur seuil (start point). II2g. Entretien de l’appareil L’appareil nécessite un nettoyage hebdomadaire complet. Il est d’abord nécessaire de démonter le set de capillaires et de le stocker transitoirement avant de le remonter sur la machine. Ensuite il faut nettoyer à l’eau chaude les blocs qui permettent l’acheminement du polymère des seringues (pour l’injection) jusqu’aux capillaires. Après nettoyage les différents constituants sont remontés, les tampons de migration renouvelés. Le polymère est injecté dans les 2 seringues. Il est nécessaire d’éliminer soigneusement toute bulle du circuit de remplissage. Le polymère est stable sur la machine pendant quelques jours seulement. Son coût élevé nécessite une attention particulière au moment du remplissage. Sa durée de vie limitée oblige à anticiper de façon optimale son activité. 15