Compte-rendu projet innovant - - Soutenu en 2008

Transcription

Compte-rendu projet innovant - - Soutenu en 2008
Le 21 juillet 2011
Département
Ecologie des Forêts, Prairies et milieux
Aquatiques
- Compte-rendu projet innovant - Soutenu en 2008 Unité :
Responsable (nom et
adresse électronique) :
Titre du projet
UMRGV -Evry
P. Faivre Rampant ([email protected])
Décryptage du chromosome XIX de peuplier
Nature et objectifs du projet :
Outre les gènes contrôlant la résistance qualitative et la résistance quantitative aux rouilles foliaires le chromosome
XIX du peuplier porte des QTL liés à la croissance racinaire et à l’interaction symbiotique mycorhize/peuplier mais
aussi une région liée à la détermination du sexe. Etablir une carte physique, est la condition sine qua non pour
obtenir la séquence du chromosome, référencer les gènes, déterminer leur structure, comprendre le fonctionnement
du génome pour des caractères d’intérêt. Nous avons pour objectif de construire deux cartes physiques une pour
chacun des haplotypes.
Enjeux originaux :
La séquence actuelle du chromosome XIX est incomplète, elle comprend de nombreux trous de séquence, de taille
variable et souvent incorrecte. A ceci s’ajoute un mauvais assemblage du à la présence de séquences dupliquées.
L’enjeu du projet est de mobiliser nos propres ressources génomiques et génétiques pour réaliser une carte
physique complète du chromosome XIX, intégrée à une carte génétique pour pouvoir identifier les BAC allèliques.
Principaux résultats (cette rubrique est évidemment essentielle) :
Les résultats rapportés ici sont les résultats de cartographie physique du chromosome XIX au-delà du super cluster
de gènes de résistance présents au début du chromosome XIX. Nous avons construit pour l’ensemble du cluster la
carte physique de chaque haplotype par marche sur le chromosome. La région couvre environ 2 000 kb. La
projection des cartes physiques sur la séquence du génome révèle qu’une zone est dupliquée inversée chez
Nisqually. La duplication observée est sans doute due à une mauvaise reconnaissance et assemblage des
haplotypes. Le scaffold 117 initialement non assigné à un chromosome est intégré au chromosome XIX. Ce travail
fait partie de la thése d’A. Bresson.
1- Etablissement de contigs in silico
Suite à une collaboration entre le JGI-Oak Ridge National Institute (G. Tuskan) et l’Université de
Stanford (J. Schmutz), nous disposons de la séquence nucléotidique des deux extrémités de 7680 clones
BAC. La première tâche fut d’aligner l’ensemble des extrémités, par multiBLAST sur la séquence du
génome de Nisqually (http://genome.jgi-psf.org/Poptr1_1/Poptr1_1.home.html). Les clones BAC pour
lesquels nous avons obtenu un alignement unique sur le chromosome XIX et pour lesquels les deux
extrémités alignées sont distantes d’une longueur équivalente à un insert (80-200kb) ont été retenus pour
former les premiers contigs. Quatorze contigs et 8 singletons ont été trouvés, en moyenne un contig est
constitué de 3.6 clones BAC et la longueur moyenne est de 266 kb. Le plus grand contig comprend 9
clones BAC et sa taille est estimée à 620 kb. Il est localisé entre 10 760 kb et 11 380 kb. Les alignements
uniques d’une seule des extrémités ont également été sélectionnés dans les cas où la localisation de
A Champenoux, le lundi 21 juillet 2011
Département Écologie des Forêts,
Prairies et milieux Aquatiques
l’insert est proche d’un trou de séquence ou si la séquence de l’une des extrémités est inexploitable. Vingt
cinq extrémités ont été localisées.
2- Développement de marqueurs physiques-définition d’amorces
Vingt neuf couples d’amorces ont été dessinés à partir des séquences d’extrémités des clones BAC en
bordure des contigs pour le développement de marqueurs physiques. Ces marqueurs ont permis de
démarrer une marche chromosomique. D’autres amorces (38), réparties sur l’ensemble de la séquence de
Nisqually ont été dessinées au niveau de modèles de gènes uniques. Les amorces ont été définies dans les
exons. Les amorces ont été obtenues en utilisant le logiciel Primer 3 (Longueur des amorces: 20
nucléotides ±2 ; Tm : 58 °C±2°C, longueur du produit PCR : 800 ±300 paires de bases). L’unicité des
amorces a été vérifiée à la fois par un alignement BLASTn et une PCR électronique (ePCR) sur
l’ensemble du génome.
3- Arrangement d’un sous-ensemble de la banque BAC (5X) en pool 3D
En tenant compte de la taille moyenne des inserts (150 kb), du pourcentage de clones vides et de
contamination par les organelles, 5 équivalents génome sont représentés dans 42 plaques 384 clones
BAC. Ces clones ont été organisés en mélanges à 3 dimensions (pool 3D) : pool plaque, super pool lignes
et super pool colonnes. Un pool plaque est constitué du mélange des 384 clones d’une plaque. Un « super
pool ligne » consiste à regrouper en un puits les 24 clones d’une ligne (A par exemple) de 6 plaques
différentes, donc il regroupe 6 x 24=144 clones. De même un super pool colonne regroupe les 16 clones
d’une colonne de 6 plaques différentes, c’est à dire 6x16=96 clones. Ainsi 7 super pools de 6 plaques sont
réalisés. Le super pool de 6 plaques a été choisi de sorte qu’il y ait une redondance. Les pool plaques
(42), super pool lignes (16 lignes x 7 = 112) et super pool colonnes (24 colonnes x 7 = 168) sont arrangés
dans une plaque PCR 384 puits, pour optimiser le criblage de la banque par PCR avec les amorces
présentées ci-dessus. Pour des coordonnées uniques, en théorie, en 322 réactions PCR, nous sommes en
mesure d’extraire 5 BAC couvrant la zone parmi 16 128 clones BAC.
4- Criblage de la banque-marche sur le chromosome
Après un premier criblage de 5 équivalents génome de la banque BAC, la carte physique est constituée de
10 contigs et de 13 singletons. La longueur moyenne d’un contig est de 400 kb. Le nombre moyen de
clones pour un contig est de 7.4 clones. Les clones BAC en bordure des contigs ont été isolés, les
extrémités sont en cours de séquençage. L’analyse des séquences aboutira au développement de nouveaux
marqueurs physiques par le dessin de nouvelles amorces.
5- Intégration de la carte physique et de la carte génétique
Parmi l’ensemble des marqueurs physiques développés, 20 sont également des marqueurs génétiques. Ils
sont utiles pour construire la carte génétique du chromosome XIX et pour intégrer les cartes physiques et
génétiques. Neuf d’entre eux sont cartographiés, leur localisation génétique confirme l’assemblage
physique obtenu.
Institut National de la Recherche Agronomique
Etablissement public à caractère scientifique et technologique placé sous la tutelle conjointe des ministres chargés de la Recherche et de l’Agriculture
INRA – Département EFPA - Route d’Amance – 54280 CHAMPENOUX
Tél : 03.83.39.41.04 - Fax : 03.83.39.73.19 - Mail : [email protected]
A Champenoux, le lundi 21 juillet 2011
Département Écologie des Forêts,
Prairies et milieux Aquatiques
Conclusions et perspectives :
L’ensemble des contigs et des singletons que nous avons assignés au chromosome XIX couvre environ 9
Mb. Nous avons intégré le scaffold 117 au chromosome XIX, l’intégration d’un autre scaffold, 28, est en
cours de validation. Nous prévoyons de continuer notre démarche pour obtenir une carte physique et une
carte génétique du chromosome XIX entier. De nouveaux marqueurs sont en cours de tests pour allonger
les contigs. L’ordre et l’orientation des contigs seront confirmés par cartographie génétique. Les travaux
de cartographie génétique comparée du réseau EVOLTREE ont abouti à une liste de marqueurs de type
microsatellite sur le XIX, ils seront utilisés pour trouver d’autres BAC. Par ailleurs nous sommes en
contact avec G. Tuskan, qui a mis à notre disposition une deuxième version de l’assemblage effectuée
avec le logiciel Arachne (http://www.broad.mit.edu/wga/, la première était réalisée à l’aide du logiciel
Jazz, DOE Join Genome Institute). Nos résultats seront comparés avec ce nouvel assemblage. Le premier
assemblage est un patchwork des deux haplotypes et le second représente une séquence consensus. Dans
la mesure du possible nous nous attacherons à différencier les haplotypes de façon à construire deux
cartes physiques. L’effort devrait être partagé entre le laboratoire de G. tuskan et le notre.
Publications éventuelles issues du projet : titres et références (avec renvoi éventuel vers le site de la revue ou vers le
numéro s'il est accessible en pdf.).
Institut National de la Recherche Agronomique
Etablissement public à caractère scientifique et technologique placé sous la tutelle conjointe des ministres chargés de la Recherche et de l’Agriculture
INRA – Département EFPA - Route d’Amance – 54280 CHAMPENOUX
Tél : 03.83.39.41.04 - Fax : 03.83.39.73.19 - Mail : [email protected]