Compte-rendu projet innovant - - Soutenu en 2008
Transcription
Compte-rendu projet innovant - - Soutenu en 2008
Le 21 juillet 2011 Département Ecologie des Forêts, Prairies et milieux Aquatiques - Compte-rendu projet innovant - Soutenu en 2008 Unité : Responsable (nom et adresse électronique) : Titre du projet UMRGV -Evry P. Faivre Rampant ([email protected]) Décryptage du chromosome XIX de peuplier Nature et objectifs du projet : Outre les gènes contrôlant la résistance qualitative et la résistance quantitative aux rouilles foliaires le chromosome XIX du peuplier porte des QTL liés à la croissance racinaire et à l’interaction symbiotique mycorhize/peuplier mais aussi une région liée à la détermination du sexe. Etablir une carte physique, est la condition sine qua non pour obtenir la séquence du chromosome, référencer les gènes, déterminer leur structure, comprendre le fonctionnement du génome pour des caractères d’intérêt. Nous avons pour objectif de construire deux cartes physiques une pour chacun des haplotypes. Enjeux originaux : La séquence actuelle du chromosome XIX est incomplète, elle comprend de nombreux trous de séquence, de taille variable et souvent incorrecte. A ceci s’ajoute un mauvais assemblage du à la présence de séquences dupliquées. L’enjeu du projet est de mobiliser nos propres ressources génomiques et génétiques pour réaliser une carte physique complète du chromosome XIX, intégrée à une carte génétique pour pouvoir identifier les BAC allèliques. Principaux résultats (cette rubrique est évidemment essentielle) : Les résultats rapportés ici sont les résultats de cartographie physique du chromosome XIX au-delà du super cluster de gènes de résistance présents au début du chromosome XIX. Nous avons construit pour l’ensemble du cluster la carte physique de chaque haplotype par marche sur le chromosome. La région couvre environ 2 000 kb. La projection des cartes physiques sur la séquence du génome révèle qu’une zone est dupliquée inversée chez Nisqually. La duplication observée est sans doute due à une mauvaise reconnaissance et assemblage des haplotypes. Le scaffold 117 initialement non assigné à un chromosome est intégré au chromosome XIX. Ce travail fait partie de la thése d’A. Bresson. 1- Etablissement de contigs in silico Suite à une collaboration entre le JGI-Oak Ridge National Institute (G. Tuskan) et l’Université de Stanford (J. Schmutz), nous disposons de la séquence nucléotidique des deux extrémités de 7680 clones BAC. La première tâche fut d’aligner l’ensemble des extrémités, par multiBLAST sur la séquence du génome de Nisqually (http://genome.jgi-psf.org/Poptr1_1/Poptr1_1.home.html). Les clones BAC pour lesquels nous avons obtenu un alignement unique sur le chromosome XIX et pour lesquels les deux extrémités alignées sont distantes d’une longueur équivalente à un insert (80-200kb) ont été retenus pour former les premiers contigs. Quatorze contigs et 8 singletons ont été trouvés, en moyenne un contig est constitué de 3.6 clones BAC et la longueur moyenne est de 266 kb. Le plus grand contig comprend 9 clones BAC et sa taille est estimée à 620 kb. Il est localisé entre 10 760 kb et 11 380 kb. Les alignements uniques d’une seule des extrémités ont également été sélectionnés dans les cas où la localisation de A Champenoux, le lundi 21 juillet 2011 Département Écologie des Forêts, Prairies et milieux Aquatiques l’insert est proche d’un trou de séquence ou si la séquence de l’une des extrémités est inexploitable. Vingt cinq extrémités ont été localisées. 2- Développement de marqueurs physiques-définition d’amorces Vingt neuf couples d’amorces ont été dessinés à partir des séquences d’extrémités des clones BAC en bordure des contigs pour le développement de marqueurs physiques. Ces marqueurs ont permis de démarrer une marche chromosomique. D’autres amorces (38), réparties sur l’ensemble de la séquence de Nisqually ont été dessinées au niveau de modèles de gènes uniques. Les amorces ont été définies dans les exons. Les amorces ont été obtenues en utilisant le logiciel Primer 3 (Longueur des amorces: 20 nucléotides ±2 ; Tm : 58 °C±2°C, longueur du produit PCR : 800 ±300 paires de bases). L’unicité des amorces a été vérifiée à la fois par un alignement BLASTn et une PCR électronique (ePCR) sur l’ensemble du génome. 3- Arrangement d’un sous-ensemble de la banque BAC (5X) en pool 3D En tenant compte de la taille moyenne des inserts (150 kb), du pourcentage de clones vides et de contamination par les organelles, 5 équivalents génome sont représentés dans 42 plaques 384 clones BAC. Ces clones ont été organisés en mélanges à 3 dimensions (pool 3D) : pool plaque, super pool lignes et super pool colonnes. Un pool plaque est constitué du mélange des 384 clones d’une plaque. Un « super pool ligne » consiste à regrouper en un puits les 24 clones d’une ligne (A par exemple) de 6 plaques différentes, donc il regroupe 6 x 24=144 clones. De même un super pool colonne regroupe les 16 clones d’une colonne de 6 plaques différentes, c’est à dire 6x16=96 clones. Ainsi 7 super pools de 6 plaques sont réalisés. Le super pool de 6 plaques a été choisi de sorte qu’il y ait une redondance. Les pool plaques (42), super pool lignes (16 lignes x 7 = 112) et super pool colonnes (24 colonnes x 7 = 168) sont arrangés dans une plaque PCR 384 puits, pour optimiser le criblage de la banque par PCR avec les amorces présentées ci-dessus. Pour des coordonnées uniques, en théorie, en 322 réactions PCR, nous sommes en mesure d’extraire 5 BAC couvrant la zone parmi 16 128 clones BAC. 4- Criblage de la banque-marche sur le chromosome Après un premier criblage de 5 équivalents génome de la banque BAC, la carte physique est constituée de 10 contigs et de 13 singletons. La longueur moyenne d’un contig est de 400 kb. Le nombre moyen de clones pour un contig est de 7.4 clones. Les clones BAC en bordure des contigs ont été isolés, les extrémités sont en cours de séquençage. L’analyse des séquences aboutira au développement de nouveaux marqueurs physiques par le dessin de nouvelles amorces. 5- Intégration de la carte physique et de la carte génétique Parmi l’ensemble des marqueurs physiques développés, 20 sont également des marqueurs génétiques. Ils sont utiles pour construire la carte génétique du chromosome XIX et pour intégrer les cartes physiques et génétiques. Neuf d’entre eux sont cartographiés, leur localisation génétique confirme l’assemblage physique obtenu. Institut National de la Recherche Agronomique Etablissement public à caractère scientifique et technologique placé sous la tutelle conjointe des ministres chargés de la Recherche et de l’Agriculture INRA – Département EFPA - Route d’Amance – 54280 CHAMPENOUX Tél : 03.83.39.41.04 - Fax : 03.83.39.73.19 - Mail : [email protected] A Champenoux, le lundi 21 juillet 2011 Département Écologie des Forêts, Prairies et milieux Aquatiques Conclusions et perspectives : L’ensemble des contigs et des singletons que nous avons assignés au chromosome XIX couvre environ 9 Mb. Nous avons intégré le scaffold 117 au chromosome XIX, l’intégration d’un autre scaffold, 28, est en cours de validation. Nous prévoyons de continuer notre démarche pour obtenir une carte physique et une carte génétique du chromosome XIX entier. De nouveaux marqueurs sont en cours de tests pour allonger les contigs. L’ordre et l’orientation des contigs seront confirmés par cartographie génétique. Les travaux de cartographie génétique comparée du réseau EVOLTREE ont abouti à une liste de marqueurs de type microsatellite sur le XIX, ils seront utilisés pour trouver d’autres BAC. Par ailleurs nous sommes en contact avec G. Tuskan, qui a mis à notre disposition une deuxième version de l’assemblage effectuée avec le logiciel Arachne (http://www.broad.mit.edu/wga/, la première était réalisée à l’aide du logiciel Jazz, DOE Join Genome Institute). Nos résultats seront comparés avec ce nouvel assemblage. Le premier assemblage est un patchwork des deux haplotypes et le second représente une séquence consensus. Dans la mesure du possible nous nous attacherons à différencier les haplotypes de façon à construire deux cartes physiques. L’effort devrait être partagé entre le laboratoire de G. tuskan et le notre. Publications éventuelles issues du projet : titres et références (avec renvoi éventuel vers le site de la revue ou vers le numéro s'il est accessible en pdf.). Institut National de la Recherche Agronomique Etablissement public à caractère scientifique et technologique placé sous la tutelle conjointe des ministres chargés de la Recherche et de l’Agriculture INRA – Département EFPA - Route d’Amance – 54280 CHAMPENOUX Tél : 03.83.39.41.04 - Fax : 03.83.39.73.19 - Mail : [email protected]