Sequencage :Electrophorèse sur capillaires

Transcription

Sequencage :Electrophorèse sur capillaires
ACTIVITE
Extrait du rapport de Stage de Séverine ESCAICH
SOMMAIRE
I.
RÉACTION DE SÉQUENCE .................................................................................................2
I1.
Principe de la méthode de SANGER ......................................................................2
I2.
Adaptation de la technique à la fluorescence.........................................................3
I3.
Conditions techniques ............................................................................................5
I4.
Thermocyclage........................................................................................................6
I5.
Purification de la réaction de séquence par sephadex G50...................................6
II. DÉTERMINATION DE LA SÉQUENCE DU BRIN MATRICE .....................................................7
II1.
Principe du fonctionnement de l’appareil ..............................................................7
II2.
Fonctionnement de l’appareil ................................................................................7
II2a. Présentation de l’analyseur génétique 3100 .......................................................8
II2b. Déroulement d’un run.........................................................................................8
II2c. Collection des données par le logiciel DATA COLLECTION (ABI). ............10
II2d. Calibration spatiale...........................................................................................13
II2e. Calibration spectrale .........................................................................................13
II2f. Analyse des données brutes par le logiciel DATA ANALYSIS (ABI) ...........15
II2g. Entretien de l’appareil ......................................................................................15
I.
REACTION DE SEQUENCE
La réaction de séquence que l’on utilise au laboratoire repose sur la méthode de SANGER ou
méthode des interrupteurs de chaîne, adaptée a la fluorescence.
I1. Principe de la méthode de SANGER
Le recopiage d’un brin matrice par une ADN polymérase ADN dépendante est initiée par la
fixation d’un oligonucléotide spécifique (amorce), complémentaire du brin matrice. Cette
ADN polymérase va permettre l’élongation d’un nouveau brin complémentaire du brin
matrice dans le sens 5’® 3’ (cf schéma p13)
L’ADN polymérase permet l’incorporation de nucléotides (dNTP: déoxynucléotides) libres
présents dans le milieu réactionnel par la formation d’un pont phosphodiester entre le 3’OH
de la chaîne et le 5’ phosphate du dNTP suivant.
La réaction de Sanger repose sur l’incorporation alléatoire par cette ADN polymérase de
didéoxynucléotides interrupteurs de chaîne (ddNTP) eux aussi présents dans le milieu
réactionnel.
Ces ddNTP diffèrent des dNTP par leur extrémité 3’. L’extrémité 3’OH des dNTP est
remplacée par une extrémité 3’H. Cette modification empêche la formation de la liaison
phosphodiester entre le ddNTP incorporé dans la chaîne et le nucléotide suivant.
L’allongement de la chaîne est alors interrompu.
Dans le milieu réactionnel il y a compétition entre les dNTP et les ddNTP. Le rapport
spécifique ddNTP/dNTP et l’affinité de la taq pour chaque nucléotide sont optimisés de telle
façon qu’un ddNTP soit statistiquement incorporé à toutes les positions possibles.
Une migration électrophorétique du produit de cette réaction de séquence sur un gel très
résolutif (polyacrylamide) va séparer tous les fragments présents en fonction de leur masse
moléculaire(taille).
Les plus petits fragments vont migrer plus rapidement que les grands. La grande résolution de
ce gel permet de distinguer des fragments différents entre eux d’une paire de base.
L’identification du ddNTP présent à l’extrémité 3’ de chaque fragment déterminera la
séquence nucléotidique du brin matrice initial.
___________________________________________________________________________
2
I2. Adaptation de la technique à la fluorescence
L’élongation de chaque produit monobrin se termine par l’incorporation d’un ddNTP
spécifique (voir schéma p13 ).
Ici, chaque ddNTP (ddATP,ddTTP,ddCTP,ddGTP) est marqué par un fluorochrome différent
dont le spectre d’émission est spécifique. Une analyse spectrale va différencier les différents
fluorochromes, associer la base correspondante et donc définir la séquence nucléotidique du
brin d’ADN initial.
Nous utilisons la technologie Big Dye TerminatorÒversion2 (Applied Biosystems : ABI),
version 2.
La technologie Big Dye Terminator (BDT) utilise un système de transfert d’énergie par
résonance (FRET) entre deux fluorochromes fixés sur le même ddNTP et reliés entre eux par
un linker. Le premier est une fluorescéine (6 carboxyfluoréscéine) appelé fluorochrome
donneur, commun aux quatre ddNTP. Le second est une dichlororhodamine (dRhodamine)
qui joue le rôle de fluorochrome accepteur.
Le fluorochrome donneur est excité par un rayon laser à argon émettant à 488nm et 514,5nm.
Son énergie de fluorescence émise (515-520nm) est captée intégralement par le fluorochrome
accepteur qui est excité à son tour. Le fluorochrome accepteur ou dichloroRhodamine est
différent pour chaque type de ddNTP.
ddNTP
A
T
C
G
dichloroRhodamines
utilisées
dR6G
dROX
dR110
dTAMRA
Spectre d’émission
maximum
560-565nm
615-620nm
530-535nm
590-595nm
Le spectre de la fluorescence réémise sera ainsi spécifique de chaque type de ddNTP. Le
transfert du signal de la fluorescéine vers la dRhodamine permet une amplification du signal
et, par conséquent, une augmentation de la sensibilité de la technique(fig1).
Fluorescéine : fluorochrome donneur
commun à tous les dNTP
Laser
d’excitation
FRET
Dichlororhodamine : fluorochrome
accepteur, spécifique du ddNTP
Fluorescence émise
ddNTP
Fig 1 : Mécanisme de la fluorescence par la technique du transfert d’énergie par résonance
___________________________________________________________________________
3
Etapes de la réaction de séquence
5’
3’
T A C T T C A G C G T A C A
A T G A A G T C G C A T G T
3’
5’
.
Dénaturation de l’ADN double brin
5’
3’
T A C T T C A G C G T A C A
A T G A A G T C G C A T G T
3’
5’
Hybridation entre l’amorce et
le brin matrice
1 Cycle
5’
3’
T A C
+
A T G A A G T C G C A T G T
3’
5’
Fixation de la Taq polymérase et
alongement de la molécule d’ADN
par incorporation de dntp.
5’
F 3’
T A C T T C
A T G A A G T C G C A T G T
3’
5’
5’
F
3’
T
5’
F
3’
T A
5’
T A C
5’
3’
F
T A C T
5’
3’
F
3’
F
T A C T T
5’
F
T A C T T C
5’
Le brin allongé se termine par incorporation
d’un didéoxynucléotide marqué par un
fluorochrome différent selon la base présente
(A,T,C ou G ).
Au bout de 30 cycles on obtient un pool
d’ADN simple brins de taille croissante.
3’
F
T A C T T C A
5’
3’
F
T A C T T C A G
5’
3’
F
T A C T T C A G C
5’
5’
5’
T A C T T C A G C G
3’
F
3’
F
T A C T T C A G C G T
T A C T T C A G C G T A
3’
F 3’
___________________________________________________________________________
4
L’adaptation de la technique de Sanger à la fluorescence permet d’effectuer la réaction de
séquence dans un tube unique.
Nous utilisons depuis peu de temps le Kit DYEnamic ET Terminator (Amersham) qui utilise
une chimie proche du kit BDT V2 (Technologie FRET). Sa spécificité est l’utilisation d’une
polymérase différente (la Thermo-Sequenase II) et de fluorochromes différents.
I3. Conditions techniques
Ò
L’ADN polymérase utilisée dans le kit BDT est la Taq polymérase FS (ABI). Celle utilisée
dans le kit Amersham est la Thermo-Sequenase.
Ces enzymes sont thermorésistantes et permettent d’effectuer plusieurs cycles d’élongation
successifs. Par conséquent la matrice d’ADN peut être réutilisée plusieurs fois et donc être
présente en quantité plus réduite. Cela permet une amplification linéaire du signal. De plus
l’utilisation de fortes températures pour la dénaturation de la matrice aide à déstabiliser
d’éventuelles structures secondaires.
La Taq FS est modifiée génétiquement pour le séquençage (Taq FS pour Fluorescent
Sequencing).
Elle possède une première mutation au sein de son site actif qui facilite l’incorporation des
ddNTP par rapport aux dNTP.
La seconde mutation se situe au niveau de son domaine amino-terminal pour éliminer son
activité exonucléasique 5’® 3’.
La thermo-Sequenase est également dédiée à l’activité de séquence. Elle se caractérise par
une très forte processivité.
Les nucléotides utilisés classiquement sont les dATP, dCTP, dITP, dUTP (kit BDT
version2).
Le dUTP remplace le dTTP car il permet une meilleur incorporation des ddTTP.
Le dITP est un analogue du dGTP. Le dITP va se fixer avec le dCTP de manière moins forte
que le dGTP (formation de seulement 2 liaisons hydrogènes au lieu de 3). L’utilisation du
dITP évite l’obtention de bandes de compression.
Les bandes de compressions sur le gel résultent de la formation de structures secondaires des
simples brins d’ADN (dans le cas de structures GC riches) qui rendent la migration
anarchique. La faible énergie de liaison des paires I-C permet aux structures secondaires
d’être plus facilement dénaturées par l’urée présente dans le gel (7mol/L)(cf III3b1).
La qualité de la séquence est complètement dépendante de la qualité et de la quantité des
réactifs ajoutés dans la réaction (cf mode opératoire en annexe). Cela est plus particulièrement
valable pour la matrice d’ADN qui doit être de très bonne qualité.
La préparation de plasmide nécessite une purification de qualité permettant l’élimination de
débris cellulaires divers (ARN, protéines résiduelles) et de sels afin d’obtenir une matrice
propre. Ensuite un dosage par spectrophotométrie ou une migration sur gel d’agarose permet
une estimation de la quantité de matrice à ajouter.
___________________________________________________________________________
5
Il est nécessaire pour obtenir une réaction de séquence de bonne qualité d’avoir un rapport
amorce / matrice proche 10 pour 1.
Un surdosage (cf.III3a4) ou un sous-dosage (cf.III3a2) de la quantité de matrice présenteront
des profils caractéristiques souvent difficiles à interpréter.
La qualité de l’amorce utilisée pour la réaction de séquence est, elle aussi, déterminante
(cf.III3a1 et III3a3). Elle doit avoir une taille de 17 à 25 nucléotides et une température de
fusion (Tm) autour de 50-60°c. Il est aussi nécessaire d’éviter certaines structures secondaires
pouvant gêner la réaction (répétitions de G, épingles à cheveux).
I4. Thermocyclage
On effectue 30 cycles d’amplification sur le thermocycleur dans des conditions spécifiques à
la réaction de séquence. Un cycle correspond à :
Une étape de dénaturation de l’ADN à 95°c pendant 10 sec pour obtenir l’ADN sous forme
simple brin.
Une étape d’hybridation à 50°c pendant 5 sec ( température moyenne d’hybridation pour la
majorité des amorces utilisées). Elle va permettre la fixation de l’amorce spécifique sur
l’ADN matrice monobrin. Cette amorce va permettre l’initiation de l’élongation par la Taq
polymérase.
Une étape d’élongation de l’ADN par la taq polymérase à 60°c pendant 4 min. Cette
température faible ralentit la Taq et va déplacer l’équilibre pour permettre une meilleure
incorporation des ddNTP. La plupart du temps, l’élongation se termine par incorporation d’un
ddNTP. Il arrive cependant qu’elle se termine par l’incorporation d’un dNTP. Dans ce cas,
l’absence de fluorochromes sur les dNTP permet de ne pas visualiser ces faux stop.
Une fois l’étape de thermocyclage effectuée, il est nécessaire de purifier la réaction de
séquence.
Plusieurs techniques sont possibles comme la précipitation ( Acétate de sodium / Alcool ) ou
la chromatographie d’exclusion.
I5. Purification de la réaction de séquence par sephadex G50
La chromatographie d’exclusion va permettre le piégeage de particules de bas poids
moléculaire sur une colonne Sephadex G50 constituée de billes perforées dont les trous ont un
diamètre déterminé (ici de 20 à 50µm). Les petites particules de diamètre inférieur à ceux-ci
entrent et sont piégées. A l’inverse les grosses vont passer autour et être éluées très
rapidement.
La réaction de séquence est purifiée par chromatographie pour piéger les ddNTP libres, en
excès. En effet ces ddNTP libres non incorporés lors de la réaction pourraient parasiter les
signaux de fluorescence spécifiques.
Les sels éventuellement présents sont piégés de la même manière que les ddNTP.
___________________________________________________________________________
6
II.
DETERMINATION DE LA SEQUENCE DU BRIN MATRICE
II1.
Principe du fonctionnement de l’appareil
Une électrophorèse capillaire en conditions dénaturantes va séparer les produits de la
réaction de séquence purifiée. L’enregistrement et l’analyse spectrale de la fluorescence
spécifique du ddNTP permettra alors d’assigner la base correspondante et de déterminer la
séquence nucléotidique du brin matrice. Ces différentes étapes de séparation et d’analyse sont
réalisées sur l’Analyseur Génétique ABI3100 (Applied Biosystem)(fig2).
Le support de migration est un polymère liquide (pop6-ABI) contenant le polymère de
séparation, les sels nécessaires à la migration et l’urée (conditions dénaturantes).
L’utilisation de capillaires permet d’appliquer une différence de potentiel plus importante
(ddp de 12kV) que pour un appareil à plaques classique (ddp de 2,5kV). La migration des
fragments d’ADN sera donc plus rapide.
Dans les appareils à plaques l’effet joule était le facteur limitant le voltage utilisé (une trop
forte dissipation d’énergie peut entraîner des risques de surchauffe). Sur les capillaires
l’augmentation de la surface d’échange thermique permet d’utiliser sans danger un voltage
plus élevé.
Dans les conditions de PH utilisées, les ADN simple brin issus de la réaction de séquence sont
chargés négativement. Placés sous une différence de potentiel (ddp) ces polyanions vont
migrer du pôle négatif (cathode) vers le pôle positif (anode) du circuit électrique.
II2.
Fonctionnement de l’appareil
Ò
Nous utilisons l’analyseur génétique 3100 (ABI). Il permet une activité de séquençage ainsi
qu’une activité d’analyse de fragments (fig2).
Ò
Fig2 : Photographie de l’analyseur génétique 3100 (ABI)
___________________________________________________________________________
7
II2a.
Présentation de l’analyseur génétique 3100
Cet appareil est caractérisé par sa grande sensibilité de détection grâce à l’utilisation d’une
caméra ccd (Charge Couple Device).
Il utilise un système d’électrophorèse capillaire qui permet une grande rapidité de migration
(obtention de 750bases en 2h30) et une bonne automatisation (200 séquences en 30 heures
sans intervention humaine).
La longueur des capillaires est dépendante de l’activité utilisée. Les runs courts des analyses
de fragments nécessitent des capillaires de petite taille (22cm). La résolution et la longueur de
lecture exigées par l’activité de séquence nécessitent des capillaires de taille supérieure (50 à
80cm). Nous utilisons des capillaires de 50cm.
II2b.
Déroulement d’un run
Seize capillaires sont physiquement associés pour permettre la co-migration simultanée de
seize échantillons par run.
Pour effectuer la migration des 96 échantillons 6 runs successifs de 16 échantillons seront
nécessaires. Le séquenceur est piloté par une plate-forme PC qui commande pour chaque run :
le remplissage des capillaires, l’injection des échantillons, la détection et l’analyse.
Fig 3 : Différentes étapes d’un run effectué par l’analyseur génétique 3100
___________________________________________________________________________
8
Un plateau articulé appelé autosampler supporte les plaques 96 puits contenant les réactions
de séquence purifiées, les réservoirs de tampon et d’eau nécessaires respectivement à la
migration électrophorétique, au rinçage et à l’évacuation des déchets. Le plateau se déplace
dans deux dimensions (x,y) et assure ainsi le transfert des seize capillaires entre les différents
constituants (fig3) :
-
(1) et (2) Rejet de l’ancien polymère
Le polymère est stocké dans deux seringues, l’une sert de réserve, l’autre permet le
remplissage des capillaires.
L’injection de polymère neuf sous pression (50-60µl de pop6 par run) dans les capillaires est
effectuée au début de chaque run. Le polymère de la migration précédente est chassé dans la
cuve servant de poubelle.
Lors du remplissage le polymère va venir effectuer un coating dynamique. Il va neutraliser les
charges positives de la silice dont sont composés les capillaires pour empêcher, par la suite, la
fixation de l’ADN monobrin (chargé négativement) aux parois des capillaires.
-
(3) Placement des plaques de dépôt
Après évacuation des déchets dans la poubelle, l’autosampler présente aux capillaires la
plaque de 96 puits pour l’électroinjection des échantillons.
-
(4) Injection électrocinétique
Les capillaires descendent dans la plaque 96 puits contenant les produits de la réaction de
séquence. Une ddp d’injection (1,5kv) est appliqué pendant quelques secondes (de 20 à 40
sec), elle permet aux molécules chargées de migrer dans les capillaires.
-
(5) Rinçage des capillaires
L’autosampler vient placer les capillaires dans de l’eau pour les rincer.
-
(6) Electrophorèse
L’autosampler vient placer les capillaires dans le tampon de migration. Une différence de
potentiel de 12 kv est appliquée entre l’anode et la cathode et va permettre au molécules
d’ADN de migrer vers l’anode.
___________________________________________________________________________
9
II2c.
Collection des données par le logiciel DATA COLLECTION (ABI).
Les données de fluorescences sont récupérées au niveau d’une cellule de détection et
transmises vers une caméra CCD pour être analysées.
Excitation par le
faisceau laser
Ré-émission de la
fluorescence
perpendiculairement
Set de 16 capillaires
Excitation par le
faisceau laser
Fig 4 : Cellule de détection permettant la récupération de la fluorescence et la
détection par une caméra CCD
La cellule de détection est située à distance variable (selon la taille des capillaires) de la zone
de dépôt. Un faisceau laser à argon vient exciter les fluorochromes de part et d’autre de la
cellule de détection (fig4).
Les fluorochromes excités vont ré-émettre une fluorescence spécifique perpendiculairement
(cf.I2). Elle passe à travers un filtre qui va sélectionner uniquement la fluorescence provenant
des capillaires et éliminer la lumière directe provenant du laser. Une lentille concave appelée
spectrographe va décomposer pour chacun des capillaires la fluorescence entre 500 et 700 nm
et diriger chaque faisceau en direction de la caméra CCD (cf.schéma p23).
La caméra CCD est une puce en silicone en deux dimensions composée de milliers de cellules
photoélectriques (pixels). Chacun de ces pixels va accumuler une charge électrique
proportionnelle a l’intensité de la fluorescence émise.
La caméra CCD collecte simultanément les fluorescences des 16 capillaires (fig5). Les
données brutes vont être extraites et vont subir une correction spectrale. Les calibrations
spectrales et spatiales de la caméra CCD sont nécessaires pour une collection correcte et
précise des données.
___________________________________________________________________________
10
Dimention spatiale
Dimention spectrale
Fig 5 : Positionnement des 16 capillaires à un instant t sur la caméra
CCD (axe des ordonnées: dimension spatiale) et décomposition spectrale
de la fluorescence émise par chaque capillaire (axe des abscisses:
dimension spectrale).
___________________________________________________________________________
11
___________________________________________________________________________
12
II2d.
Calibration spatiale
La position des seize capillaires sur la caméra CCD varie en fonction de la localisation exacte
des capillaires dans la fenêtre de détection. La calibration spatiale permet de déterminer la
position exacte de chaque capillaire sur la caméra CCD.
On détermine l’endroit sur la caméra CCD où la fluorescence de chaque capillaire est
maximale, le polymère présent dans les capillaires est suffisamment fluorescent pour
effectuer la calibration. La localisation des trois pixels encadrant ce point est enregistrée. Elle
servira « d’empreinte » lors de la collections des données pour l’attribution de la fluorescence
au capillaire qui lui correspond.
A chaque réinstallation des capillaires une calibration spatiale est effectuée et sauvegardée
(Fig6).
Fig 6 : Visualisation de l’emplacement des 16 capillaires au niveau
de la fenêtre de détection lors de la calibration spatiale
II2e.
Calibration spectrale
Les spectres d’émissions des fluorochromes utilisés se superposent en partie. Pour remédier à
ce recouvrement il est nécessaire de faire une calibration spectrale.
La calibration spectrale est effectuée une seule fois par série de fluorochromes, avec des
standards d’ADN marqués (Fig7). La calibration sera spécifique des consommables utilisés
mais aussi de la machine sur laquelle elle est réalisée. En effet les différents composés
optiques tels que le spectrographe sont uniques et il y a de légères variations d’une machine à
l’autre.
13
Pour chaque capillaire la zone de lecture sur la caméra CCD se fait sur 20 bins pour
enregistrer un profil spectral allant de 500 nm (bleu) à 700 nm (rouge). Un bin correspond à
3 pixels dans la dimension spatiale et 14 pixels dans la dimension spectrale.
Les standards d’ADN marqués permettent d’établir une matrice de calcul qui va tenir compte
du recouvrement des spectres des fluorochromes les uns par rapport aux autres. La
décomposition du spectre sur 20 bins permet l’augmentation de la spécificité du signal.
Elle est utilisée au cours de la collection des données lors d’une étape de pré-analyse appelée
multicomponenting.
Fig 7 : Décomposition spectrale (effectuée sur le capillaire 1) des fluorochromes
constituant la technologie Big Dye (ABI)
14
II2f.
Analyse des données brutes par le logiciel DATA ANALYSIS (ABI)
La calibration spatiale sur la caméra CCD et l’identification de la fluorescence émise (après
correction spectrale) permet d’extraire des données brutes pour chaque capillaire.
Au cours des 2h30 de collection, les données brutes sont stockées sur la base Oracle du PC. A
la fin de cette collection, les séquences brutes de 16 fichiers sont automatiquement extraites et
analysées par le logiciel « Data Analysis » au cours d’une étape appelée « Base calling »
(assignation des bases). Le sous-programme Base Caller va permettre cette bonne assignation
après plusieurs étapes.
Ce programme prend d’abord en compte les différences de mobilité des différents
fluorochromes. En effet les fluorochromes utilisés vont entraîner des modifications de
migration qui seront différentes pour chaque fluorochrome et dont il faut tenir compte. La
modification de mobilité dépend du poids moléculaire et de l’encombrement du
fluorochrome. Les mobilités spécifiques de chaque set de fluorochromes sont regroupées dans
des fichiers spécifiques appelés mobility shift.
Ensuite toute la séquence brute est scannée afin de déterminer un espacement moyen entre 2
pics (valeur comprise entre 10-12 points de scan) sur toute la séquence.
La fluorescence va être normalisée en tenant compte des différences d’intensité de
fluorescence de chacun des fluorochromes.
Enfin la position du premier pic de fluorescence est déterminée automatiquement à partir
d’une valeur seuil (start point).
II2g.
Entretien de l’appareil
L’appareil nécessite un nettoyage hebdomadaire complet.
Il est d’abord nécessaire de démonter le set de capillaires et de le stocker transitoirement avant
de le remonter sur la machine.
Ensuite il faut nettoyer à l’eau chaude les blocs qui permettent l’acheminement du polymère
des seringues (pour l’injection) jusqu’aux capillaires.
Après nettoyage les différents constituants sont remontés, les tampons de migration
renouvelés. Le polymère est injecté dans les 2 seringues. Il est nécessaire d’éliminer
soigneusement toute bulle du circuit de remplissage.
Le polymère est stable sur la machine pendant quelques jours seulement. Son coût élevé
nécessite une attention particulière au moment du remplissage. Sa durée de vie limitée oblige
à anticiper de façon optimale son activité.
15