Cartographie génétique des génomes eucaryotes I. Construction de
Transcription
Cartographie génétique des génomes eucaryotes I. Construction de
Cartographie génétique des génomes eucaryotes I. Construction de cartes génétique 1. Marqueurs génétiques 2. Types de descendances 3. Méthodes d'établissement des cartes génétiques 4. Caractéristiques des cartes génétiques II. Utilisation des cartes génétiques 1. Localisation de gènes à effets majeurs 2. Localisation de locus contrôlant la variation de caractères quantitatifs 3. Clonage positionnel I. Construction de cartés génétique 2. Types de descendances 1. Rappels: méiose et génétique formelle 2. Descendances donnant accès à la phase haploïde 3. Descendances F2 et dérivées de F2 4. Descendances issues de parents hétérozygotes 1. Rappels: méiose et génétique formelle Phase I carte génétique Etablissement des groupes de liaison Tests liaison/indépendance de tous les couples de marqueurs possibles Indépendance génétique entre 2 locus Liaison génétique entre 2 locus Marqueurs assignés à des groupes de liaison différents Marqueurs assignés au même groupe de liaison Estimation de la fréquence de recombinaison Association des allèles portés par les gamètes à l'issue de la méiose Phase II Etablissement de l'ordre des marqueurs au sein des groupes de liaison 2 marqueurs , L et M, présents sur des chromosomes différents Cellule avant la méïose 2n = 4, 2C L1 L1 M2 M1 L2 M2 M1 L1 M2 M1 L2 L2 Génotype: L1L2 M1M2 Phase S: réplication de l'ADN; 2n = 4, 4C 2 chromatides sœurs/ chromosomes Echanges de segments d'ADN entre chromatides non sœurs = crossing-over = Brassages génétiques intra-chromosomiques (pas de conséquences sur la ségrégation des allèles dans ce cas) Prophase I méiose: appariement des chromosomes homologues 2n = 4, 2C ou Plaque équatoriale L2 M2 L2 M1 L1 M1 L1 L1 M1 L1 M2 L2 M2 L2 P = 1/2 P = 1/2 M2 M1 Métaphase I méiose: ségrégation aléatoire des chromosomes Brassages génétiques inter-chromosomiques n, 2C L2 M2 L1 M1 L1 M1 L2 M2 L2 M2 L1 M1 n, 2C Métaphase I méiose (2n, 4C) M1 L2 M2 n, 2C M1 L1 M2 L1 Division I: séparation des chromosomes homologues (réductionnelle) L1 L2 L2 M2 M1 L2 M1 L1 M2 L1 M2 n, 2C L2 M1 Division II: séparation des centromères (équationnelle) n, C L2 M2 n, C L1 M1 n, C L2 M1 n, C L1 M2 n, C L1 M1 n, C L2 M2 n, C L1 M2 n, C L2 M1 L1M1 freq. = 1/4 L2M2 freq. = 1/4 L1M2 freq. = 1/4 L2M1 freq. = 1/4 2 marqueurs, L et M présents sur des chromosomes différents Indépendance génétique entre ces 2 locus L1M1 L2M2 L1M2 L2M1 freq. = 1/4 freq. = 1/4 Gamètes parentaux (γP) freq. = 1/4 freq. = 1/4 Gamètes recombinants (γR) freq (γR) = freq (γP) = 0,5 Définition: r est la fréquence d'apparition des γR = fréquence de recombinaison (%) r = freq (γR) = 0,5 d'où (1-r) = freq (γP) = 0,5 2 marqueurs, L et M, présents sur le même chromosome Prophase I méiose Génotype: L1L2 M1M2 2n =2, 2C L1 Pas de C-O entre chromatides non sœurs M1 Phase S L1 M1 L1 M1 L2 L1M1 L1M1 L2M2 L2M2 P P P P 1-4 2-3 2-4 L1M1 L1M2 L2M2 L2M1 P R P R 1-3 1-4 2-4 L1M1 L1M2 L2M1 L2M2 P R R P Aucune M2 L2 L2 Autres Génotype des Association des possibilités gamètes allèles 1 C-O impliquant 2 chromatides 1 2 M2 M2 1 3 3 4 2n = 2, 4C 2 chromatides sœurs/ chromosomes 2 C-O impliquant 2 chromatides 2 3 2 marqueurs, L et M, présents sur le même chromosome Prophase I méiose Génotype: L1L2 M1M2 2n =2, 2C L1 2 C-O impliquant 3 chromatides M1 1 2 3 M2 L2 Phase S L1 M1 L1 M1 L2 L2 1 2 M2 M2 3 4 2n = 2, 4C 2 chromatides sœurs/ chromosomes 2 C-O impliquant les 4 chromatides Autres Génotype des Association des possibilités gamètes allèles 1-2-4 2-3-4 1-3-4 L1M1 L1M2 L2M1 L2M2 P R R P Aucune L1M2 L1M2 L2M1 L2M1 R R R R Cas général: plusieurs locus présents sur le même chromosome A B C D Liaison physique entre A, B, C et D → locus synténiques Liaison génétique → A-B, B-C, C-D Indépendance génétique → A-C, A-D, B-D 2 marqueurs, L et M présents sur le même chromosome • Cas général Génotype: L1L2 M1M2 L1 M1 L2 M2 γP: freq = (1-r) γR: freq = r L1M1: freq = (1-r)/2 L2M2 : freq = (1-r)/2 L1M2 : freq = r/2 L2M1 : freq = r/2 ! 4 types de gamètes attendus (sauf cas de liaison absolue entre L et M) • Indépendance génétique entre ces 2 locus freq (γR) = freq (γP) = 0,5 = r et, freq (L1M1) = freq (L2M2) = freq (L1M2) = freq (L2M1) = 1/4 • Liaison génétique entre ces 2 locus freq (γR) < freq (γP) freq (γR) < 0,5 ⇒ 0 ≤ r < 0,5 freq (γP) > 0,5 ! freq (γR) et freq (γP) exprimées en fonction de r freq (L1M1) = freq (L2M2) = (1-r) et, freq (L1M2) = freq (L2M1) = r/2 Cas extrême: liaison absolue entre L et M Aucun γR produit ⇔ freq (γR) = 0 ⇔ r=0 ⇒ freq (γP) = 1 Notions de couplage et de répulsion • 2 locus (liés) L et M, allèles dominants/récessifs • 2 modes d'association possibles des allèles dominants/récessifs chez un individu hétérozygote 1. Allèles dominants/récessifs en phase de couplage (conformation en cis) L M l m ! Les 2 allèles dominants/récessifs ont été transmis par le même parent Écriture du génotype: Ll Mm ou LM lm Gamètes produits par l'individu hétérozygote: γP → L M et l m γR → L m et l M Notions de couplage et de répulsion • 2 locus (liés) L et M, allèles dominants/récessifs • 2 modes d'association possibles des allèles dominants/récessifs chez un individu hétérozygote 2. Allèles dominants/récessifs en phase de répulsion (conformation en trans) L m l M ! Les 2 allèles dominants/récessifs ont été transmis par des parents différents Écriture du génotype: Ll mM ou Lm lM Gamètes produits par l'individu hétérozygote: γP → L m et l M γR → L M et l m I. Construction de cartés génétique 2. Types de descendances 1. Rappels: méiose et génétique formelle 2. Descendances donnant accès à la phase haploïde 3. Descendances F2 et dérivées de F2 4. Descendances issues de parents hétérozygotes 2. Descendances donnant accès à la phase haploïde 2.1. Analyse directe des produits de méiose Analyse génétique (extraction d'ADN, génotypage…) Disposer en abondance de tissus ou d'organismes entiers haploïdes Difficile dans le cas des organismes à cycle de vie diplobiontique (animaux, plantes supérieures) La phase haploïde du cycle est limitée aux gamètes plus ou moins étroitement associés à des tissus diploïdes Certaines possibilités: animaux, plantes → Particularités de certains organismes → Avancée des techniques de bioliogie moléculaire, biotechnologies • Organismes à cycle de vie haplobiontique → Phase haploïde du cycle prépondérante (individus haploïdes) → Phase diploïde limitée au zygote qui se divise immédiatement par méiose après la fusion des noyaux reproducteurs - Champignons filamenteux (Neurospora crassa) - Certaines algues • Organismes à cycle de vie haplodiplobiontique → Alternance de génération entre individus haploïdes (gamétophytes) et diploïdes (sporophytes) - Levures (ascomycètes ) - Nombreuses algues unicellulaires (Chlamydomonas) ou pluricellulaires (certaines algues rouges) -Plantes (mousses, fougères) Exemple: cycle de vie de la levure (Saccharomyces cerevisiae) Spores n MATα Reproduction végétative MITOSES Spores n MATa Plasmogamie Conjugaison Caryogamie Zygote 2n MITOSES MEIOSE ½ MATα Tétrade de 4 spores n ½ MATa Matériel de départ pour des analyses génétiques Depuis les années 1960: plus de 1200 marqueurs localisés sur le génome de la levure Analyse directe des produits de méiose chez la levure souche 1 × souche 2 L MATa × • MATα Génotype des souches haploïdes L MATa Génotype du zygote Génotype des spores Effectifs observés • MATα L MATa • MATα L MATα 145 161 35 • MATa 43 MAT: locus de compatibilité sexuel L: marqueur RAPD; L: présence du fragment, •: absence du fragment • Les locus L et MAT sont-ils liés ou indépendants ? (démonstration) • Si ces 2 locus sont liés, estimer la fréquence de recombinaison • Si le locus L est un marqueur de type microsatellite, polymorphe entre les souches 1 et 2, cela change t'il le génotype des spores et les effectifs observés ? • Certaines possibilités pour les organismes à cycle de vie diplobiontique ou assimilés Homme: essais de génotypage à partir de spermatozoïdes individuels (marqueurs issus de PCR) → A suivre … Plantes: 2 exemples Plantes: mégagamétophyte femelle des gymnospermes La graine est composée de l'embryon qui est entouré d'un tissu de réserve haploïde issue de divisions par mitose d'une cellule haploïde (mégaspore fonctionnelle) Cellule œuf (n) ovule MEIOSE Cellule mère des mégasopres (2n) =mégasporocyte MITOSES Mégasopre fonctionnelle (n) Mégagamétophyte (n) … A maturité de la graine Aile membraneuse Mégagamétophyte (n) Embryon (2n) ! Cartes génétiques de plusieurs espèces de pin d'importance forestière Extraction de l'ADN ou des protéines Analyses génétiques des produits de méiose de l'arbre Plantes: lignées haploïdes doublées (Angiospermes) Biotechnologies végétales → culture in vitro Culture d'ovaires immatures = Gynogenèse (betterave, tabac …) Culture d'anthères immatures = Androgenèse (maïs, orge …) Mégaspores (n) Microspores (n) Sacs embryonnaires Milieu d'induction in vitro Grains de pollen Embryogenèse haploïde Régénération d'individus haploïdes fonctionnels Doublement chromosomique spontané ou provoqué (colchicine) Individus "homozygotes parfaits" = lignées haploïdes doublées (HD) MEIOSE Individu hétérozygote à de nombreux locus Échantillon des produits de méiose Androgenèse / Gynogenèse Individus haploïdes Pérennisation de la descendance par autofécondation des lignées Doublement chromosomique Individus diploïdes homozygotes Collection de lignées HD 2.2. Descendances donnant accès à la phase haploïde → Back-cross (croisement en retour) P1 × P2 Hétérozygote à de nombreux locus F1 × P2 BC1 P1 et P2 = lignées P2 = lignée récurrente Étude indirecte des produits de méiose de l'individu F1 → test-cross (croisement test): croisement d'individus F1 par une lignée homozygote récessive (≠ P1 et P2) pour 1 ou quelques locus donnés Types d'organismes pour lesquels on peut étudier des descendances BC1 ou F2 → Disposer de lignées et réaliser des croisements contrôlés → Espèces prolifiques à cycle de vie court Animaux • Notion de lignée: croisements frères-sœurs pendant plusieurs générations → diminution du taux moyen d'hétérozygotie des individus à chaque génération • Espèces modèles de laboratoire: drosophile, souris, rat, nématode • Petits animaux d'élevage: poule, lapin, chien … Plantes • Plantes supérieures: majorité d'espèces hermaphrodites • La plupart des espèces utilisées par l'homme sont capables de s'autoféconder (lignées) → Espèces préférentiellement autogames naturellement (blé, tomate) → Espèces préférentiellement allogames sélectionnée afin d'augmenter l'auto-compatibilité (tournesol, betterave) • De nombreuses espèces d'intérêt économique ont un cycle de vie annuel ou bisannuel • Production de graines / individu souvent élevée • 2 locus, marqueurs codominants P1: L1 M1 L1 M1 × P2: L2 M2 F1: L2 M2 γ F1: L1 M1 (γP) L1 M1 L2 M2 × P2: L2 M2 BC1 L2 M2 L2 M2 (γP) L1 M2 (γR) L2 M1 (γR) L1 M1 L2 M2 L1 M2 L2 M1 Effectifs attendus (1-r) N (1-r) N rN rN 2 2 2 2 Effectifs observés a b c d γ P2: A 2 B2 r= L2 M2 L2 M2 Nb. individus issus de γR Nb. individus total = L2 M2 L2 M2 c+d 1 génotype γF1 N 1 génotype BC1 Rem. : résultat identique si on utilise P1 comme parent récurrent • 2 locus, marqueurs dominants, phase de couplage (1) P1: LM × P2: LM γ F1: γ P2: lm lm lm F1: LM lm × P2: Homozygote récessif ☺ lm lm L M (γP) l m (γP) L m (γR) l M (γR) LM lm Lm lM lm lm lm lm Effectifs attendus (1-r) N (1-r) N rN rN 2 2 2 2 Effectifs observés a b c d r= Nb. individus issus de γR Nb. individus total = c+d 1 génotype γF1 N 1 génotype BC1 • 2 locus, marqueurs dominants, phase de couplage (2) P1: LM LM × P2: γ F1: γ P2: LM Phénotypes lm lm F1: LM lm × P1: LM LM L M (γP) l m (γP) LM lm Lm lM LM LM LM LM 100% [L M] ⇒ Impossible d'estimer r L m (γR) Homozygote dominant # l M (γR) • 2 locus, marqueurs dominants, phase de répulsion P1: Lm Lm × P2: γ F1: γ P2: Lm Phénotypes lM lM F1: Lm lM × P1: Lm Lm L m (γP) l M (γP) L M (γR) l m (γR) Lm lM LM lm Lm Lm Lm Lm [L m] [L M] [L M] [L m] ⇒ Impossible d'estimer r Rem. : résultat identique si on utilise P2 comme parent récurrent • 2 locus, 1 marqueur codominant, 1 marqueur dominant P1: L1 M L1 M × P2: L2 m L2 m F1: L1 M L2 m × P1: L1 M L1 M # → cf. 2 marqueurs dominants, phase de répulsion P1: L1 M L1 M × P2: L2 m L2 m F1: L1 M L2 m × P2: L2 m L2 m ☺ → cf. 2 marqueurs dominants, phase de couplage (1) → cf. 2 marqueurs codominants Conclusions sur l'information obtenue à partir des différents types de descendances donnant accès à la phase haploïde → Accès direct (organismes ou tissus haploïdes, HD) • Il suffit que les individus dont on étudie les produits de méiose soient hétérozygotes pour un maximum de locus • Pas d'effet du type de marqueurs, ni du mode d'association des allèles dans le cas de marqueurs dominants → Accès indirect (back-cross) • Individus F1 hétérozygotes pour de nombreux locus • Marqueurs codominants • Marqueurs dominants, phase de couplage, parent récurrent homozygote récessif pour un maximum de locus I. Construction de cartés génétique 2. Types de descendances 1. Rappels: méiose et génétique formelle 2. Descendances donnant accès à la phase haploïde 3. Descendances F2 et dérivées de F2 4. Descendances issues de parents hétérozygotes 3. Descendances F2 et dérivées de F2 3.1. Descendances F2 P1 × P2 Méiose F1 × F1 F2 P1 et P2 = lignées Méiose Étude indirecte des produits de méiose et F1 × F1 → croisements frères-sœurs (animaux, plantes) → autofécondation (plantes) Etude de la ségrégation de 2 locus • • • • 2 marqueurs codominants 2 marqueurs dominants, phase de couplage 2 marqueurs dominants, phase de répulsion 1 marqueur codominant, 1 marqueur dominant cf. TD → Il est toujours possible d'estimer r (même si le calcul n'est pas toujours évident !) 3.2. Descendances dérivées de F2 chez les plantes: lignées recombinantes (LR) P1 × P2 (P1, P2 = lignées) Autofécondation ! F1 × F1 Individus F2 Générations F2 ! ! ! ! ! ! F3 ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! F4 F5 F8-F10 Lignées recombinantes → Chaque lignée = descendance monograine ou SSD (Single seed Descent) → Pérennisation de la collection de lignées par autofécondation Probabilité qu'un individu soit hétérozygote à un locus donné après n générations d'autofécondation: p = 1/2n AA × aa ! ! ! ! ! ! p = 1/27 ! F1: 100% Aa F2: 25% AA 50% Aa 25% aa F3: 37,5% AA 25% Aa 37,5% aa F4: 43,75% AA 12,5% Aa 43,75% aa F5: 46,88% AA 6,25% Aa 46,88% aa F6: 48,44% AA 3,12% Aa 48,44% aa F7: 49,22% AA 1,56% Aa 49,22% aa F8: 49,61% AA 0,78% Aa 49,61% aa Structure chromosomique des lignées recombinantes MEIOSE Individu F1 hétérozygote à de nombreux locus n méioses n méioses γ γ F2 n! F8-F10 → Probabilité de détecter une liaison entre 2 locus plus élevée que dans le cas des autres types de descendances Estimation de la fréquence de recombinaison entre 2 locus (LR) → Estimation indépendante du type de marqueur P1: Lm Lm × P2: lM lM type: Génotype des lignées F1: P Lm [L m] Lm Lm × F1: lM Lm lM P lM ! R [l M] lM F2 LM R [L M] LM F8, F10 … lm [l m] lm Effectifs attendus (1-R) N (1-R) N RN RN 2 2 2 2 Eff. obs. a b c d R= Nb. lignées recombinantes Nb. lignées total = c+d N R: proportion de lignées recombinantes qui n'est pas une estimation de r → fonction de r R = fréquence de lignées recombinantes → R > r car le nombre de recombinaisons occasionné par les autofécondations successives est supérieur à celui observé à l'issue de la méiose des individus F1 0,5 On peut montrer que: 0,4 R= 0,3 0,2 0,1 R= 2r (1 + 2r) 0 0,1 0,2 0,3 0,4 0,5 r = fréquence de recombinaison 2r (1 + 2r) , d'où r = R 2 (1 –R) Rem. Il est possible d'obtenir des LR chez les animaux (souris, drosophile, nématode) → croisements frèressoeurs I. Construction de cartés génétique 2. Types de descendances 1. Rappels: méiose et génétique formelle 2. Descendances donnant accès à la phase haploïde 3. Descendances F2 et dérivées de F2 4. Descendances issues de parents hétérozygotes 4. Descendances issues de parents hétérozygotes → Organismes pour lesquels on ne dispose pas de lignées P1 × P2 Méiose F1' P1 et P2 ≠ lignées Méiose Étude indirecte des produits de méiose et de P1 et P2 Hétérozygotes ou homozygotes pour chacun des locus considérés • Gros animaux (d'élevage) → Temps de génération qui peut être important → Espace d'élevage élevé → Peu de descendants par génération • Plantes → Espèces auto-incompatibles ou qui subissent une très forte dépression de consanguinité (pomme de terre, chicorée) → Espèces pérennes à cycle de vie long: arbres (peuplier, eucalyptus) → solution à ce problème pour certains gymnospermes: analyse des mégagamétophytes femelles • Homme: espèce très hétérozygote → Pas de croisements contrôlés (?) mais homogamie → Temps de génération élevé → Peu de descendants par génération ! Homme et gros animaux d'élevage: cumul de l'information obtenue à partir de plusieurs fratries Schémas de croisements possibles dans le cas de descendances issues de parents hétérozygotes → Pour un locus donné, il peut y avoir jusqu'à 4 allèles en ségrégation en F1' (marqueur codominant) P1: L1 L2 × P2: L3 L4 F1' → Si on considère un couple de locus et différents cas de figures: - 2, 3 ou 4 allèles / locus - Marqueurs codominants ou dominants (couplage et répulsion ! 27 configurations parentales possibles Cartographie génétique des génomes eucaryotes I. Construction de cartes génétique 1. Marqueurs génétiques 2. Types de descendances 3. Méthodes d'établissement des cartes génétiques 4. Caractéristiques des cartes génétiques II. Utilisation des cartes génétiques 1. Localisation de gènes à effets majeurs 2. Localisation de locus contrôlant la variation de caractères quantitatifs 3. Clonage positionnel 3. Méthodes d'établissement des cartes génétiques • Disposer de descendances en ségrégation pour de nombreux marqueurs • Déterminer le génotypes des individus d'une ou plusieurs descendances pour un maximum de locus marqueurs • Tests des ségrégations monolocus (χ2) → élimination des locus qui présentent de fortes distorsions de ségrégation • Tests 2 points: tests de liaison génétiques en considérant tous les couples de locus possibles Ex: 100 marqueurs → 4900 combinaisons ! Assigner chacun des marqueurs à un groupe de liaison Groupe 1 Groupe 2 Méthode statistique: χ2 d'indépendance Limite: inadapté dans le cas d'effectifs réduits → Homme Méthode probabiliste: LODscore Adapté dans le cas d'effectifs réduits ; additif LODscore (logarithm of the odd ratio) → logarithme décimal du rapport de vraisemblance de 2 hypothèses (Morton, 1955): Hypothèse 1: il y a une liaison génétique entre 2 locus (r = θ < 0.5); la vraisemblance de cette hypothèse est notée eL(r = θ) Hypothèse 2: il n'y a pas de liaison génétique entre ces 2 locus (r = 0.5); la vraisemblance de cette hypothèse est notée eL(r = 0.5). LODscore = log10 eL(r = θ) eL(r = 0.5) LODscore > 0 et à une valeur seuil → Liaison génétique ex: LODscore = 3 → l'hypothèse de liaison est 1000 fois plus vraisemblable que l'hypothèse d'indépendance entre 2 locus ex: LODscore = -1 → l'hypothèse de liaison est 10 fois moins vraisemblable que l'hypothèse d'indépendance entre 2 locus • Tests 3 points et multipoints: détermination de l'ordre relatif des marqueurs au sein des groupes de liaison Tests 3 points: ordre relatif de 3 locus appartenant au même groupe de liaison Ordres possibles: A – B - C ?, A – C - B ?, B – A - C ? Vraisemblance de chacun des ordres possibles: eL(ABC), eL(ACB) et eL(BAC) Calcul et comparaison des valeurs de LODscore LODscore (ABC/ACB) = log10 LODscore (ABC/BAC) = log10 LODscore (ACB/BAC) = log10 Ex: LODscore (ABC/ACB) = 0.5 LODscore (ABC/BAC) = - 3 LODscore (ACB/BAC) = -2 eL(ABC) eL(ACB) eL(ABC) eL(BAC) eL(ABC) eL(BAC) Ordre le plus vraisemblable ? BAC Tests multipoint: ordres relatifs de 4, 5, 6, … locus Complexité croissante des calculs de vraisemblance lorsqu'on augmente le nombre de locus, même avec des ordinateurs très puissants Les logiciels de cartographie utilisent le principe suivant afin de réduire le nombre de calculs à réaliser: Test 3 points ? ? ? • Estimation de la distance génétique entre marqueurs Les fréquences de recombinaison (r) entre marqueurs adjacents ne sont pas additives A B C 100 rBC = 0,30 rAC = 0,38 ⇒ rAC < (rAB + rBC) Sous-estimation de rAC due à la présence de doubles C.O. non détectables entre A et C. ! Définition de fonctions de cartographie additives qui rendent compte du nombre réel de C.O; unité: cM Distance génétique (cM) rAB = 0,13 90 80 70 60 Relation entre r et la distance génétique 50 40 30 20 10 0 0,1 0,2 0,3 0,4 0,5 r = fréquence de recombinaison Fonctions de cartographie • Distance de Haldane → Prend en compte les C.O. multiples dH = -50 ln (1-2r) unité: cM • Distance de Kosambi → Prend en compte les C.O. multiples et l'existence d'interférence dK = 25 ln [ (1+2r) / (1-2r) ] unité: cM Interférence: restriction à ce que 2 C.O. se produisent proches l'un de l'autre. Ce phénomène est d'autant plus marqué que la distance entre 2 marqueurs est faible. Origine probable: contraintes mécaniques lors de la méïose 100 Distance génétique (cM) 90 80 70 Fonction de Haldane Fonction de Kosambi 60 r ≤ 0,1 ⇒ r×100 = dH = dK 50 r > 0,2 ⇒ dK > dH 40 30 20 10 0 0,1 0,2 0,3 0,4 0,5 r = fréquence de recombinaison Cartographie génétique des génomes eucaryotes I. Construction de cartes génétique 1. Marqueurs génétiques 2. Types de descendances 3. Méthodes d'établissement des cartes génétiques 4. Caractéristiques des cartes génétiques II. Utilisation des cartes génétiques 1. Localisation de gènes à effets majeurs 2. Localisation de locus contrôlant la variation de caractères quantitatifs 3. Clonage positionnel 4. Quelques caractéristiques des cartes génétiques 4.1. Saturation des cartes génétiques Carte génétique saturée: $ Liaison génétique de chaque point du génome à au moins un marqueurs $ Nombre de groupes de liaison identique au nombre de chromosomes du génome haploïde; chaque marqueur de la carte est assigné à un groupe de liaison $ Pas d'augmentation de la distance génétique couverte par la carte lors de l'ajout de nouveaux marqueurs Méthodes de saturation des cartes génétiques $ Cartographie d'un maximum de marqueurs (× 100 chez la drosophile ou A. thaliana; × 1000 chez l'homme) $ Localisation des régions télomériques à l'aide de marqueurs RFLP ou PCR spécifiques de ces régions (maïs) 4.2. Variations de longueurs des cartes génétiques A 1 2 B C Carte physique: distances absolues entre A, B et C (bp) Cartes génétiques: ordre A, B, C conservé; distances variables entre A, B et C (cM) → Distances génétique (i.e. fréquence de recombinaison) influencées par certains facteurs Sexe Homme: fréquence de crossing-over plus importante chez les femmes que chez les hommes Drosophile: pas de C.O. chez les mâles Plantes: fréquence de recombinaison plus élevée lors des méioses femelles (tomate, orge) ou lors des méioses mâles (maïs, Arabidopsis thaliana) Eloignement génétique entre les parents de la decendance Réduction de la distance des cartes génétiques construites à partir de descendances issues de croisements interspécifiques Facteurs génétiques et environnementaux Carte génétique du chromosome 12 humain Femme: 168 cM Homme: 78 cM Cartes génétiques d'Arabidopsis thaliana (Alonso-Blanco et al., 1998) A B A A: Ler × Col B: Ler × Cvi A B A B A B B Densité moyenne: 1 marqueur/cM Relation entre cartes génétiques et physiques: génome complet: 1 cM = 280 kb Chr. 1: 1 cM = 240 kb Chr. 2: 1 cM = 280 kb Chr. 3: 1 cM = 310 kb Chr. 4: 1 cM = 215 kb Chr. 5: 1 cM = 250 kb 4.3. Relation entre distance physique et distance génétique Le paradoxe de la valeur C: la quantité d'ADN par génome haploïde n'est pas toujours corrélée au degré d'évolution des espèces Espèce Longueur du génome Distance de carte (cM) Longueur ADN (Mbp) Génome Chromosome (kbp)/cM Phage T4 * 0.16 800 - 0.2 E. Coli * 4.6 1750 - 2.6 Levure * 12 4200 260 2.8 Nématode * 100 320 A. Thaliana * 125 480-630 100-130 200-260 Drosophile * 165 280 70 600 Riz * 430 1575 130 270 haricot 650 830 75 780 Tomate 950 1270 105 750 Colza 1200 1020 55 1180 Soja 1200 2700 135 440 Maïs 2500 1860 190 1340 Souris * 3000 1700 100 1760 Homme * 3300 2800(H)–4780(F) 120(H)-210(F) 690(H)-1180(F) Blé 16 000 3500 170 4570 Pin maritime 24 000 1800 150 13 000 310