Cartographie génétique des génomes eucaryotes I. Construction de

Transcription

Cartographie génétique des génomes eucaryotes I. Construction de
Cartographie génétique des génomes eucaryotes
I. Construction de cartes génétique
1. Marqueurs génétiques
2. Types de descendances
3. Méthodes d'établissement des cartes génétiques
4. Caractéristiques des cartes génétiques
II. Utilisation des cartes génétiques
1. Localisation de gènes à effets majeurs
2. Localisation de locus contrôlant la variation de
caractères quantitatifs
3. Clonage positionnel
I.
Construction de cartés génétique
2. Types de descendances
1. Rappels: méiose et génétique formelle
2. Descendances donnant accès à la phase haploïde
3. Descendances F2 et dérivées de F2
4. Descendances issues de parents hétérozygotes
1. Rappels: méiose et génétique formelle
Phase I carte génétique
Etablissement des groupes de liaison
Tests liaison/indépendance de tous
les couples de marqueurs possibles
Indépendance génétique
entre 2 locus
Liaison génétique
entre 2 locus
Marqueurs
assignés à des
groupes de
liaison
différents
Marqueurs
assignés au
même groupe
de liaison
Estimation de la
fréquence de
recombinaison
Association des
allèles portés par
les gamètes à l'issue
de la méiose
Phase II
Etablissement de l'ordre
des marqueurs au sein des
groupes de liaison
2 marqueurs , L et M, présents sur des chromosomes différents
Cellule avant
la méïose
2n = 4, 2C
L1
L1
M2
M1
L2
M2
M1
L1
M2
M1
L2
L2
Génotype: L1L2 M1M2
Phase S: réplication
de l'ADN; 2n = 4, 4C
2 chromatides
sœurs/ chromosomes
Echanges de segments d'ADN entre
chromatides non sœurs = crossing-over =
Brassages génétiques intra-chromosomiques
(pas de conséquences sur la ségrégation des
allèles dans ce cas)
Prophase I méiose:
appariement des
chromosomes homologues
2n = 4, 2C
ou
Plaque
équatoriale
L2
M2
L2
M1
L1
M1
L1
L1
M1
L1
M2
L2
M2
L2
P = 1/2
P = 1/2
M2
M1
Métaphase I méiose:
ségrégation aléatoire des
chromosomes
Brassages génétiques
inter-chromosomiques
n, 2C
L2
M2
L1
M1
L1
M1
L2
M2
L2
M2
L1
M1
n, 2C
Métaphase I
méiose (2n, 4C)
M1
L2
M2
n, 2C
M1
L1
M2
L1
Division I: séparation des
chromosomes homologues
(réductionnelle)
L1
L2
L2
M2
M1
L2
M1
L1
M2
L1
M2 n, 2C
L2
M1
Division II: séparation des centromères (équationnelle)
n, C
L2
M2
n, C
L1
M1
n, C
L2
M1
n, C
L1
M2
n, C
L1
M1
n, C
L2
M2
n, C
L1
M2
n, C
L2
M1
L1M1 freq. = 1/4
L2M2 freq. = 1/4
L1M2 freq. = 1/4
L2M1 freq. = 1/4
2 marqueurs, L et M présents sur des chromosomes différents
Indépendance génétique entre ces 2 locus
L1M1
L2M2
L1M2
L2M1
freq. = 1/4
freq. = 1/4
Gamètes parentaux (γP)
freq. = 1/4
freq. = 1/4
Gamètes recombinants (γR)
freq (γR) = freq (γP) = 0,5
Définition: r est la fréquence d'apparition des γR = fréquence
de recombinaison (%)
r = freq (γR) = 0,5
d'où
(1-r) = freq (γP) = 0,5
2 marqueurs, L et M, présents sur le même chromosome
Prophase I
méiose
Génotype:
L1L2 M1M2
2n =2, 2C
L1
Pas de C-O
entre chromatides
non sœurs
M1
Phase S
L1
M1
L1
M1
L2
L1M1
L1M1
L2M2
L2M2
P
P
P
P
1-4
2-3
2-4
L1M1
L1M2
L2M2
L2M1
P
R
P
R
1-3
1-4
2-4
L1M1
L1M2
L2M1
L2M2
P
R
R
P
Aucune
M2
L2
L2
Autres
Génotype des Association des
possibilités
gamètes
allèles
1 C-O impliquant
2 chromatides
1
2
M2
M2
1
3
3
4
2n = 2, 4C
2 chromatides
sœurs/
chromosomes
2 C-O impliquant
2 chromatides
2
3
2 marqueurs, L et M, présents sur le même chromosome
Prophase I
méiose
Génotype:
L1L2 M1M2
2n =2, 2C
L1
2 C-O impliquant
3 chromatides
M1
1
2
3
M2
L2
Phase S
L1
M1
L1
M1
L2
L2
1
2
M2
M2
3
4
2n = 2, 4C
2 chromatides
sœurs/
chromosomes
2 C-O
impliquant les 4
chromatides
Autres
Génotype des Association des
possibilités
gamètes
allèles
1-2-4
2-3-4
1-3-4
L1M1
L1M2
L2M1
L2M2
P
R
R
P
Aucune
L1M2
L1M2
L2M1
L2M1
R
R
R
R
Cas général: plusieurs locus présents sur le même chromosome
A
B
C
D
Liaison physique entre A, B, C et D
→ locus synténiques
Liaison génétique → A-B, B-C, C-D
Indépendance génétique → A-C, A-D, B-D
2 marqueurs, L et M présents sur le même chromosome
• Cas général
Génotype:
L1L2 M1M2
L1
M1
L2
M2
γP: freq = (1-r)
γR: freq = r
L1M1: freq = (1-r)/2
L2M2 : freq = (1-r)/2
L1M2 : freq = r/2
L2M1 : freq = r/2
! 4 types de gamètes attendus (sauf cas de liaison absolue entre L et M)
• Indépendance génétique entre ces 2 locus
freq (γR) = freq (γP) = 0,5 = r
et, freq (L1M1) = freq (L2M2) = freq (L1M2) = freq (L2M1) = 1/4
• Liaison génétique entre ces 2 locus
freq (γR) < freq (γP)
freq (γR) < 0,5 ⇒ 0 ≤ r < 0,5
freq (γP) > 0,5
! freq (γR) et freq (γP) exprimées en fonction de r
freq (L1M1) = freq (L2M2) = (1-r)
et, freq (L1M2) = freq (L2M1) = r/2
Cas extrême: liaison absolue entre L et M
Aucun γR produit ⇔ freq (γR) = 0 ⇔ r=0
⇒ freq (γP) = 1
Notions de couplage et de répulsion
• 2 locus (liés) L et M, allèles dominants/récessifs
• 2 modes d'association possibles des allèles dominants/récessifs
chez un individu hétérozygote
1. Allèles dominants/récessifs en phase de couplage
(conformation en cis)
L
M
l
m
! Les 2 allèles dominants/récessifs ont
été transmis par le même parent
Écriture du génotype: Ll Mm ou
LM
lm
Gamètes produits par l'individu hétérozygote:
γP → L M et l m
γR → L m et l M
Notions de couplage et de répulsion
• 2 locus (liés) L et M, allèles dominants/récessifs
• 2 modes d'association possibles des allèles dominants/récessifs
chez un individu hétérozygote
2. Allèles dominants/récessifs en phase de répulsion
(conformation en trans)
L
m
l
M
! Les 2 allèles dominants/récessifs ont
été transmis par des parents différents
Écriture du génotype: Ll mM ou
Lm
lM
Gamètes produits par l'individu hétérozygote:
γP → L m et l M
γR → L M et l m
I.
Construction de cartés génétique
2. Types de descendances
1. Rappels: méiose et génétique formelle
2. Descendances donnant accès à la phase haploïde
3. Descendances F2 et dérivées de F2
4. Descendances issues de parents hétérozygotes
2. Descendances donnant accès à la phase haploïde
2.1. Analyse directe des produits de méiose
Analyse génétique (extraction d'ADN, génotypage…)
Disposer en abondance de tissus ou d'organismes entiers haploïdes
Difficile dans le cas des organismes à cycle de vie
diplobiontique (animaux, plantes supérieures)
La phase haploïde du cycle est limitée aux gamètes plus ou
moins étroitement associés à des tissus diploïdes
Certaines possibilités: animaux, plantes
→ Particularités de certains organismes
→ Avancée des techniques de bioliogie
moléculaire, biotechnologies
• Organismes à cycle de vie haplobiontique
→ Phase haploïde du cycle prépondérante (individus haploïdes)
→ Phase diploïde limitée au zygote qui se divise immédiatement par
méiose après la fusion des noyaux reproducteurs
- Champignons filamenteux (Neurospora crassa)
- Certaines algues
• Organismes à cycle de vie haplodiplobiontique
→ Alternance de génération entre individus haploïdes (gamétophytes)
et diploïdes (sporophytes)
- Levures (ascomycètes )
- Nombreuses algues unicellulaires (Chlamydomonas) ou
pluricellulaires (certaines algues rouges)
-Plantes (mousses, fougères)
Exemple: cycle de vie de la levure (Saccharomyces cerevisiae)
Spores n MATα
Reproduction
végétative
MITOSES
Spores n MATa
Plasmogamie
Conjugaison
Caryogamie
Zygote 2n
MITOSES
MEIOSE
½ MATα
Tétrade de 4 spores n
½ MATa
Matériel de
départ pour
des analyses
génétiques
Depuis les
années 1960:
plus de 1200
marqueurs
localisés sur
le génome de
la levure
Analyse directe des produits de méiose chez la levure
souche 1 × souche 2
L MATa × • MATα
Génotype des
souches haploïdes
L MATa
Génotype du zygote
Génotype des spores
Effectifs observés
• MATα
L MATa
• MATα
L MATα
145
161
35
• MATa
43
MAT: locus de compatibilité sexuel
L: marqueur RAPD; L: présence du fragment, •: absence du fragment
• Les locus L et MAT sont-ils liés ou indépendants ? (démonstration)
• Si ces 2 locus sont liés, estimer la fréquence de recombinaison
• Si le locus L est un marqueur de type microsatellite, polymorphe
entre les souches 1 et 2, cela change t'il le génotype des spores et
les effectifs observés ?
• Certaines possibilités pour les organismes à cycle de vie
diplobiontique ou assimilés
Homme: essais de génotypage à partir de spermatozoïdes
individuels (marqueurs issus de PCR) → A suivre …
Plantes: 2 exemples
Plantes: mégagamétophyte femelle des gymnospermes
La graine est composée de l'embryon qui est entouré d'un
tissu de réserve haploïde issue de divisions par mitose d'une
cellule haploïde (mégaspore fonctionnelle)
Cellule œuf (n)
ovule
MEIOSE
Cellule mère des
mégasopres (2n)
=mégasporocyte
MITOSES
Mégasopre
fonctionnelle (n)
Mégagamétophyte (n)
… A maturité de
la graine
Aile membraneuse
Mégagamétophyte (n)
Embryon (2n)
! Cartes génétiques de plusieurs espèces
de pin d'importance forestière
Extraction de l'ADN
ou des protéines
Analyses génétiques
des produits de
méiose de l'arbre
Plantes: lignées haploïdes doublées (Angiospermes)
Biotechnologies végétales → culture in vitro
Culture d'ovaires
immatures = Gynogenèse
(betterave, tabac …)
Culture d'anthères
immatures = Androgenèse
(maïs, orge …)
Mégaspores (n)
Microspores (n)
Sacs
embryonnaires
Milieu d'induction in vitro
Grains de
pollen
Embryogenèse haploïde
Régénération d'individus haploïdes fonctionnels
Doublement chromosomique spontané ou provoqué (colchicine)
Individus "homozygotes parfaits" = lignées haploïdes doublées (HD)
MEIOSE
Individu hétérozygote
à de nombreux locus
Échantillon des
produits de méiose
Androgenèse / Gynogenèse
Individus
haploïdes
Pérennisation de la
descendance par
autofécondation des
lignées
Doublement chromosomique
Individus
diploïdes
homozygotes
Collection de lignées HD
2.2. Descendances donnant accès à la phase haploïde
→ Back-cross (croisement en retour)
P1 × P2
Hétérozygote à de
nombreux locus
F1 × P2
BC1
P1 et P2 = lignées
P2 = lignée récurrente
Étude indirecte des produits
de méiose de l'individu F1
→ test-cross (croisement test): croisement d'individus F1
par une lignée homozygote récessive (≠ P1 et P2) pour 1 ou
quelques locus donnés
Types d'organismes pour lesquels on peut étudier des
descendances BC1 ou F2
→ Disposer de lignées et réaliser des croisements contrôlés
→ Espèces prolifiques à cycle de vie court
Animaux
• Notion de lignée: croisements frères-sœurs pendant
plusieurs générations → diminution du taux moyen
d'hétérozygotie des individus à chaque génération
• Espèces modèles de laboratoire: drosophile, souris, rat,
nématode
• Petits animaux d'élevage: poule, lapin, chien …
Plantes
• Plantes supérieures: majorité d'espèces hermaphrodites
• La plupart des espèces utilisées par l'homme sont capables
de s'autoféconder (lignées)
→ Espèces préférentiellement autogames naturellement (blé,
tomate)
→ Espèces préférentiellement allogames sélectionnée afin
d'augmenter l'auto-compatibilité (tournesol, betterave)
• De nombreuses espèces d'intérêt économique ont un cycle
de vie annuel ou bisannuel
• Production de graines / individu souvent élevée
• 2 locus, marqueurs codominants
P1:
L1 M1
L1 M1
× P2:
L2 M2
F1:
L2 M2
γ F1: L1 M1 (γP)
L1 M1
L2 M2
× P2:
L2 M2
BC1
L2 M2
L2 M2 (γP)
L1 M2 (γR)
L2 M1 (γR)
L1 M1
L2 M2
L1 M2
L2 M1
Effectifs
attendus
(1-r) N
(1-r) N
rN
rN
2
2
2
2
Effectifs
observés
a
b
c
d
γ P2:
A 2 B2
r=
L2 M2
L2 M2
Nb. individus issus de γR
Nb. individus total
=
L2 M2
L2 M2
c+d
1 génotype γF1
N
1 génotype BC1
Rem. : résultat identique si on utilise P1 comme parent récurrent
• 2 locus, marqueurs dominants, phase de couplage (1)
P1:
LM
× P2:
LM
γ F1:
γ P2:
lm
lm
lm
F1:
LM
lm
× P2:
Homozygote
récessif ☺
lm
lm
L M (γP)
l m (γP)
L m (γR)
l M (γR)
LM
lm
Lm
lM
lm
lm
lm
lm
Effectifs
attendus
(1-r) N
(1-r) N
rN
rN
2
2
2
2
Effectifs
observés
a
b
c
d
r=
Nb. individus issus de γR
Nb. individus total
=
c+d
1 génotype γF1
N
1 génotype BC1
• 2 locus, marqueurs dominants, phase de couplage (2)
P1:
LM
LM
× P2:
γ F1:
γ P2:
LM
Phénotypes
lm
lm
F1:
LM
lm
× P1:
LM
LM
L M (γP)
l m (γP)
LM
lm
Lm
lM
LM
LM
LM
LM
100% [L M]
⇒ Impossible d'estimer r
L m (γR)
Homozygote
dominant #
l M (γR)
• 2 locus, marqueurs dominants, phase de répulsion
P1:
Lm
Lm
× P2:
γ F1:
γ P2:
Lm
Phénotypes
lM
lM
F1:
Lm
lM
× P1:
Lm
Lm
L m (γP)
l M (γP)
L M (γR)
l m (γR)
Lm
lM
LM
lm
Lm
Lm
Lm
Lm
[L m]
[L M]
[L M]
[L m]
⇒ Impossible d'estimer r
Rem. : résultat identique si on utilise P2 comme parent récurrent
• 2 locus, 1 marqueur codominant, 1 marqueur dominant
P1:
L1 M
L1 M
× P2:
L2 m
L2 m
F1:
L1 M
L2 m
× P1:
L1 M
L1 M
# → cf. 2 marqueurs dominants, phase de répulsion
P1:
L1 M
L1 M
× P2:
L2 m
L2 m
F1:
L1 M
L2 m
× P2:
L2 m
L2 m
☺ → cf. 2 marqueurs dominants, phase de couplage (1)
→ cf. 2 marqueurs codominants
Conclusions sur l'information obtenue à partir des différents
types de descendances donnant accès à la phase haploïde
→ Accès direct (organismes ou tissus haploïdes, HD)
• Il suffit que les individus dont on étudie les produits de
méiose soient hétérozygotes pour un maximum de locus
• Pas d'effet du type de marqueurs, ni du mode d'association des
allèles dans le cas de marqueurs dominants
→ Accès indirect (back-cross)
• Individus F1 hétérozygotes pour de nombreux locus
• Marqueurs codominants
• Marqueurs dominants, phase de couplage, parent récurrent
homozygote récessif pour un maximum de locus
I.
Construction de cartés génétique
2. Types de descendances
1. Rappels: méiose et génétique formelle
2. Descendances donnant accès à la phase haploïde
3. Descendances F2 et dérivées de F2
4. Descendances issues de parents hétérozygotes
3. Descendances F2 et dérivées de F2
3.1. Descendances F2
P1 × P2
Méiose
F1 × F1
F2
P1 et P2 = lignées
Méiose
Étude indirecte des produits
de méiose
et
F1 × F1 → croisements frères-sœurs (animaux, plantes)
→ autofécondation (plantes)
Etude de la ségrégation de 2 locus
•
•
•
•
2 marqueurs codominants
2 marqueurs dominants, phase de couplage
2 marqueurs dominants, phase de répulsion
1 marqueur codominant, 1 marqueur dominant
cf. TD
→ Il est toujours possible d'estimer r (même si le calcul
n'est pas toujours évident !)
3.2. Descendances dérivées de F2 chez les plantes: lignées
recombinantes (LR)
P1 × P2
(P1, P2 = lignées)
Autofécondation !
F1 × F1
Individus F2
Générations
F2
!
!
!
!
!
!
F3
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
F4
F5
F8-F10
Lignées
recombinantes
→ Chaque lignée = descendance monograine ou SSD (Single seed Descent)
→ Pérennisation de la collection de lignées par autofécondation
Probabilité qu'un individu soit hétérozygote à un locus donné après n
générations d'autofécondation: p = 1/2n
AA × aa
!
!
!
!
!
!
p = 1/27
!
F1:
100% Aa
F2:
25% AA
50% Aa
25% aa
F3:
37,5% AA
25% Aa
37,5% aa
F4:
43,75% AA
12,5% Aa
43,75% aa
F5:
46,88% AA
6,25% Aa
46,88% aa
F6:
48,44% AA
3,12% Aa
48,44% aa
F7:
49,22% AA
1,56% Aa
49,22% aa
F8:
49,61% AA
0,78% Aa
49,61% aa
Structure chromosomique des lignées recombinantes
MEIOSE
Individu F1
hétérozygote
à de nombreux
locus
n méioses
n méioses
γ
γ
F2
n!
F8-F10
→ Probabilité de détecter une liaison entre 2 locus plus élevée
que dans le cas des autres types de descendances
Estimation de la fréquence de recombinaison entre 2 locus (LR)
→ Estimation indépendante du type de marqueur
P1:
Lm
Lm
× P2:
lM
lM
type:
Génotype
des lignées
F1:
P
Lm
[L m]
Lm
Lm
× F1:
lM
Lm
lM
P
lM
!
R
[l M]
lM
F2
LM
R
[L M]
LM
F8, F10 …
lm
[l m]
lm
Effectifs
attendus
(1-R) N
(1-R) N
RN
RN
2
2
2
2
Eff. obs.
a
b
c
d
R=
Nb. lignées recombinantes
Nb. lignées total
=
c+d
N
R: proportion de lignées recombinantes qui n'est pas une estimation de r
→ fonction de r
R = fréquence de lignées
recombinantes
→ R > r car le nombre de recombinaisons occasionné par les
autofécondations successives est supérieur à celui observé à l'issue
de la méiose des individus F1
0,5
On peut montrer que:
0,4
R=
0,3
0,2
0,1
R=
2r
(1 + 2r)
0 0,1 0,2 0,3 0,4 0,5
r = fréquence de recombinaison
2r
(1 + 2r)
, d'où r =
R
2 (1 –R)
Rem. Il est possible d'obtenir des LR
chez les animaux (souris, drosophile,
nématode) → croisements frèressoeurs
I.
Construction de cartés génétique
2. Types de descendances
1. Rappels: méiose et génétique formelle
2. Descendances donnant accès à la phase haploïde
3. Descendances F2 et dérivées de F2
4. Descendances issues de parents hétérozygotes
4. Descendances issues de parents hétérozygotes
→ Organismes pour lesquels on ne dispose pas de lignées
P1 × P2
Méiose
F1'
P1 et P2 ≠ lignées
Méiose
Étude indirecte des produits
de méiose
et
de P1 et
P2
Hétérozygotes ou
homozygotes pour chacun
des locus considérés
• Gros animaux (d'élevage)
→ Temps de génération qui peut être important
→ Espace d'élevage élevé
→ Peu de descendants par génération
• Plantes
→ Espèces auto-incompatibles ou qui subissent une très
forte dépression de consanguinité (pomme de terre,
chicorée)
→ Espèces pérennes à cycle de vie long: arbres (peuplier,
eucalyptus)
→ solution à ce problème pour certains gymnospermes:
analyse des mégagamétophytes femelles
• Homme: espèce très hétérozygote
→ Pas de croisements contrôlés (?) mais homogamie
→ Temps de génération élevé
→ Peu de descendants par génération
! Homme et gros animaux d'élevage: cumul de
l'information obtenue à partir de plusieurs fratries
Schémas de croisements possibles dans le cas de descendances
issues de parents hétérozygotes
→ Pour un locus donné, il peut y avoir jusqu'à 4 allèles en
ségrégation en F1' (marqueur codominant)
P1:
L1
L2
× P2:
L3
L4
F1'
→ Si on considère un couple de locus et différents cas de
figures:
- 2, 3 ou 4 allèles / locus
- Marqueurs codominants ou dominants (couplage et
répulsion
! 27 configurations parentales possibles
Cartographie génétique des génomes eucaryotes
I. Construction de cartes génétique
1. Marqueurs génétiques
2. Types de descendances
3. Méthodes d'établissement des cartes génétiques
4. Caractéristiques des cartes génétiques
II. Utilisation des cartes génétiques
1. Localisation de gènes à effets majeurs
2. Localisation de locus contrôlant la variation de
caractères quantitatifs
3. Clonage positionnel
3. Méthodes d'établissement des cartes génétiques
• Disposer de descendances en ségrégation pour de nombreux
marqueurs
• Déterminer le génotypes des individus d'une ou plusieurs
descendances pour un maximum de locus marqueurs
• Tests des ségrégations monolocus (χ2) → élimination des locus
qui présentent de fortes distorsions de ségrégation
• Tests 2 points: tests de liaison génétiques en considérant tous
les couples de locus possibles
Ex: 100 marqueurs → 4900 combinaisons
! Assigner chacun des marqueurs à un groupe de liaison
Groupe 1
Groupe 2
Méthode statistique: χ2 d'indépendance
Limite: inadapté dans le cas d'effectifs réduits → Homme
Méthode probabiliste: LODscore
Adapté dans le cas d'effectifs réduits ; additif
LODscore (logarithm of the odd ratio) → logarithme décimal
du rapport de vraisemblance de 2 hypothèses (Morton, 1955):
Hypothèse 1: il y a une liaison génétique entre 2 locus
(r = θ < 0.5); la vraisemblance de cette hypothèse est notée
eL(r = θ)
Hypothèse 2: il n'y a pas de liaison génétique entre ces 2 locus
(r = 0.5); la vraisemblance de cette hypothèse est notée
eL(r = 0.5).
LODscore = log10
eL(r = θ)
eL(r = 0.5)
LODscore > 0 et à une valeur seuil
→ Liaison génétique
ex: LODscore = 3 → l'hypothèse de liaison est 1000 fois plus
vraisemblable que l'hypothèse d'indépendance entre 2 locus
ex: LODscore = -1 → l'hypothèse de liaison est 10 fois moins
vraisemblable que l'hypothèse d'indépendance entre 2 locus
• Tests 3 points et multipoints: détermination de l'ordre
relatif des marqueurs au sein des groupes de liaison
Tests 3 points: ordre relatif de 3 locus appartenant au même
groupe de liaison
Ordres possibles: A – B - C ?, A – C - B ?, B – A - C ?
Vraisemblance de chacun des ordres possibles:
eL(ABC), eL(ACB) et eL(BAC)
Calcul et comparaison des valeurs de LODscore
LODscore (ABC/ACB) = log10
LODscore (ABC/BAC) = log10
LODscore (ACB/BAC) = log10
Ex: LODscore (ABC/ACB) = 0.5
LODscore (ABC/BAC) = - 3
LODscore (ACB/BAC) = -2
eL(ABC)
eL(ACB)
eL(ABC)
eL(BAC)
eL(ABC)
eL(BAC)
Ordre le plus vraisemblable ?
BAC
Tests multipoint: ordres relatifs de 4, 5, 6, … locus
Complexité croissante des calculs de vraisemblance lorsqu'on
augmente le nombre de locus, même avec des ordinateurs très
puissants
Les logiciels de cartographie utilisent le principe suivant afin de
réduire le nombre de calculs à réaliser:
Test 3 points
?
?
?
• Estimation de la distance génétique entre marqueurs
Les fréquences de recombinaison (r) entre marqueurs adjacents ne
sont pas additives
A B
C
100
rBC = 0,30
rAC = 0,38
⇒ rAC < (rAB + rBC)
Sous-estimation de rAC due à la
présence de doubles C.O. non
détectables entre A et C.
! Définition de fonctions de
cartographie additives qui
rendent compte du nombre réel
de C.O; unité: cM
Distance génétique (cM)
rAB = 0,13
90
80
70
60
Relation
entre r et la
distance
génétique
50
40
30
20
10
0 0,1 0,2 0,3 0,4 0,5
r = fréquence de recombinaison
Fonctions de cartographie
• Distance de Haldane
→ Prend en compte les C.O. multiples
dH = -50 ln (1-2r)
unité: cM
• Distance de Kosambi
→ Prend en compte les C.O. multiples et l'existence
d'interférence
dK = 25 ln [ (1+2r) / (1-2r) ]
unité: cM
Interférence: restriction à ce que 2 C.O. se produisent proches l'un
de l'autre. Ce phénomène est d'autant plus marqué que la distance
entre 2 marqueurs est faible.
Origine probable: contraintes mécaniques lors de la méïose
100
Distance génétique (cM)
90
80
70
Fonction de Haldane
Fonction de Kosambi
60
r ≤ 0,1 ⇒ r×100 = dH = dK
50
r > 0,2 ⇒ dK > dH
40
30
20
10
0 0,1 0,2 0,3 0,4 0,5
r = fréquence de recombinaison
Cartographie génétique des génomes eucaryotes
I. Construction de cartes génétique
1. Marqueurs génétiques
2. Types de descendances
3. Méthodes d'établissement des cartes génétiques
4. Caractéristiques des cartes génétiques
II. Utilisation des cartes génétiques
1. Localisation de gènes à effets majeurs
2. Localisation de locus contrôlant la variation de
caractères quantitatifs
3. Clonage positionnel
4. Quelques caractéristiques des cartes génétiques
4.1. Saturation des cartes génétiques
Carte génétique saturée:
$ Liaison génétique de chaque point du génome à au moins un
marqueurs
$ Nombre de groupes de liaison identique au nombre de
chromosomes du génome haploïde; chaque marqueur de la
carte est assigné à un groupe de liaison
$ Pas d'augmentation de la distance génétique couverte par
la carte lors de l'ajout de nouveaux marqueurs
Méthodes de saturation des cartes génétiques
$ Cartographie d'un maximum de marqueurs (× 100 chez la
drosophile ou A. thaliana; × 1000 chez l'homme)
$ Localisation des régions télomériques à l'aide de
marqueurs RFLP ou PCR spécifiques de ces régions (maïs)
4.2. Variations de longueurs des cartes génétiques
A
1
2
B
C
Carte
physique:
distances
absolues entre A, B et C (bp)
Cartes génétiques: ordre A, B,
C conservé; distances variables
entre A, B et C (cM)
→ Distances génétique (i.e. fréquence de recombinaison)
influencées par certains facteurs
Sexe
Homme: fréquence de crossing-over plus importante chez les
femmes que chez les hommes
Drosophile: pas de C.O. chez les mâles
Plantes: fréquence de recombinaison plus élevée lors des
méioses femelles (tomate, orge) ou lors des méioses mâles
(maïs, Arabidopsis thaliana)
Eloignement génétique entre les parents de la decendance
Réduction de la distance des cartes génétiques construites à
partir de descendances issues de croisements interspécifiques
Facteurs génétiques et environnementaux
Carte génétique du
chromosome 12 humain
Femme: 168 cM
Homme: 78 cM
Cartes génétiques d'Arabidopsis thaliana (Alonso-Blanco et al., 1998)
A
B
A
A: Ler × Col
B: Ler × Cvi
A
B
A
B
A
B
B
Densité moyenne: 1 marqueur/cM
Relation entre cartes génétiques et physiques: génome complet: 1 cM = 280 kb
Chr. 1: 1 cM = 240 kb
Chr. 2: 1 cM = 280 kb
Chr. 3: 1 cM = 310 kb
Chr. 4: 1 cM = 215 kb
Chr. 5: 1 cM = 250 kb
4.3. Relation entre distance physique et distance génétique
Le paradoxe de la valeur C: la quantité d'ADN par génome haploïde
n'est pas toujours corrélée au degré d'évolution des espèces
Espèce
Longueur du
génome
Distance de carte
(cM)
Longueur ADN
(Mbp)
Génome
Chromosome
(kbp)/cM
Phage T4 *
0.16
800
-
0.2
E. Coli *
4.6
1750
-
2.6
Levure *
12
4200
260
2.8
Nématode *
100
320
A. Thaliana *
125
480-630
100-130
200-260
Drosophile *
165
280
70
600
Riz *
430
1575
130
270
haricot
650
830
75
780
Tomate
950
1270
105
750
Colza
1200
1020
55
1180
Soja
1200
2700
135
440
Maïs
2500
1860
190
1340
Souris *
3000
1700
100
1760
Homme *
3300
2800(H)–4780(F)
120(H)-210(F)
690(H)-1180(F)
Blé
16 000
3500
170
4570
Pin maritime
24 000
1800
150
13 000
310