memoire le diplome de magister - Thèses et Mémoires

Transcription

memoire le diplome de magister - Thèses et Mémoires
REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE
MINISTERE DE L’ENSEIGNEMENT SUPERIEUR
ET DE LA RECHERCHE SCIENTIFIQUE
UNIVERSITE D’ORAN ES-SENIA
FACULTE DES SCIENCES
DEPARTENT DE PHYSIQUE
MEMOIRE
présenté par
Monsieur Mohamed Réda CHELLALI
pour obtenir
LE DIPLOME DE MAGISTER
Spécialité : Physique
Option : BioPhysique Mathématique & Simulations
intilué :
Sur les Modélisations Mathématiques
du Code Génétique
soutenu le :…...……………..à la salle de conférences de la Faculté des Sciences
devant le jury composé des membres suivants :
GHAMNIA Mustapha
:
Professeur à l’Univ. d’Oran Es-sénia, Algérie
(Président)
DJEMAÏ Abed-El-Farid : Professeur à l’Univ. d’Oran Es-sénia, Algérie
(Rapporteur)
TAHIRI Mohamed
: Professeur à l’Univ. d’Oran Es-sénia, Algérie
(Examinateur)
HAMMOU B. Amine : Maître de Conférences à l’USTO-MB, Oran, Algérie
(Examinateur)
MESREF Lahouari : Maître de Conférences à l’USTO-MB, Oran, Algérie
(Examinateur)
Je dédie ce modeste travail à
Ma mère,
Sans qui je ne serais pas où j’en suis aujourd’hui.
Remerciements
Mes remerciements vont premièrement au grand créateur de l'univers,
Dieu tout puissant pour la volonté, la santé et la patience, qu’il ma donné
jusqu’à la finalisation de ce travail.
Ainsi je remercie vivement mon directeur de mémoire Monsieur AbedEl-Farid DJEMAÏ, Professeur à l’Université d’Oran Es-sénia, pour sa
gentillesse, sa patience, sa disponibilité, son aide et la compréhension dont il
a fait preuve pour l'approbation de mon sujet de mémoire. De plus, les
conseils qu’il m’a divulgué tout au long de la rédaction, ont toujours été
clairs et succincts, me facilitant grandement la tâche et me permettant
d’aboutir à la production de ce mémoire.
Je suis très honoré que Monsieur Mustapha GHAMNIA, Professeur
à l’Université d’Oran Es-senia, ait consenti à juger ce travail et présider ce
jury de mémoire. Qu’il trouve ici l’expression de ma profonde reconnaissance.
Mes sincères remerciements s’adressent à Monsieur Amine Bouziane
HAMMOU, Maître de conférence à l’Université des Sciences et de la
Technologie d’Oran– Mohamed Boudiaf (USTO-MB), ainsi que Monsieur
Lahouari MESREF, Maître de conférence à l’Université des Sciences et de
la Technologie d’Oran– Mohamed Boudiaf (USTO-MB), qui ont accepté de
juger ce travail et d'en être les examinateurs.
1
Je remercie également Monsieur Mohamed TAHIRI, Professeur à
l’Université d’Oran Es-senia, du Laboratoire de Physique Théorique, pour
l’honneur qu’il m’a fait en acceptant d’examiner ce travail et de participer à
ce jury.
Je remercie tous ceux qui m’ont aidé, de prés ou de loin, à réaliser ce
travail, plus particulièrement Monsieur Djamel BOUKERDIMI, Maître
de conférence à l’Université à l’Université d’Oran Es-senia, pour m'avoir
prêté son imprimante laser.
Enfin, j'adresse mes plus sincères remerciements à tous mes proches et
amis qui m'ont toujours soutenue et encouragée au cours de la réalisation de
ce mémoire.
2
SOMMAIRE
INTRODUCTION GENERALE……………………………………………………………5
CHAPITRE 1. Eléments de Biologie Moléculaire
1.1.
Introduction………………………………………………………………………...10
1.2.
Les nucléotides …………………………………………………………………...10
1.3.
La structure de l’ADN ……………………………………………………………11
1.3.1. Quelques dates ……………………………………………………………11
1.3.2. La double hélice d’ADN…………………………………………………..12
1.4.
La structure de l’ARN…………………………………………………………….14
1.5.
Réplication de l’ADN……………………………………………………………...15
1.6.
Transcription……………………………………………………………………….17
1.7.
Traduction…………………………………………………………………………..17
1.8.
Codon ……………………………………………………………………………….18
1.9.
Code génétique……………………………………………………………………19
1.10. Dégénérescence du code génétique………………………………………….20
1.11. Universalité du code……………………………………………………………...20
Références………………………………………………………………………………....21
CHAPITRE 2. Groupes et Algèbres
2.1.
Introduction………………………………………………………………………...23
2.2.
Elément de la théorie des groupes…………………………………………….23
2.2.1. Définition d’un groupe……………......................................................23
2.2.2. Propriétés…………………………………………………………………..23
2.3.
Algèbre, algèbre de Lie, algèbre universelle enveloppante………………26
2.4.
Représentations des groupes…………………………………………………..32
2.5.
Groupe quantique et algèbre quantique………………………………………36
2.6.
La base cristalline………………………………………………………………...40
2.7.
Quelques exemples de groupes et algèbres de Lie……………………...…41
2.8.
Algèbre quantique suq(2)…………………………………………………...…...49
Références………………………………………………………………………………….52
3
CHAPITRE 3. Différentes Modélisations
3.1.
Introduction………………………………………………………………………...56
3.2.
Modèle de Gamow (1954)………………………………………………………..57
3.3.
Modèle de Wittmann (1963)……………………………………………………...60
3.4.
Modèle de Rumer (1966)…………………………………………………………61
3.5.
Modèle de Finkley (1982)………………………………………………………...61
3.6.
Modèle de Hornos et al (1993-2004)…………………………………………..67
3.7.
Modèle de Sorba et al (1998-2004)…………………………………………….67
3.8.
Modèle de Duplij (2000)…………………………………………………………..67
3.9.
Modèle du Québécium (2000)…………………………………………………...71
3.10. Modèle de Cristea (2001-2002)………………………………………………….73
3.11. Modèle de Jiménez (2002)……………………………………………………….74
3.12. Modèle de Négadi (2003)…………………………………………………………75
3.13. Modèle de Yang (2003)……………………………………………...…………….77
3.14. Modèle Rako evi (2004)………………………………………………………...81
3.15. Modèle de Wilhelm-Nikolajewa (2004)…………………………………………82
3.16. Modèle de Sánchez (2004)……………………………………………………….83
3.17. Modèle de Dragovich (2006)…………………………………………………….85
3.18. Modèle de White (2007)…………………………………………………………..87
Références…………………………………………………………………………………88
CHAPITRE 4. Modélisations Algébriques
4.1.
Introduction………………………………………………………………………...94
4.2.
La symétrie…………………………………………………………………………94
4.3.
Les symétries dans le code génétique………………………………………..96
4.4.
La brisure de symétrie dans le code génétique …………………………….98
4.5.
Algèbre de Lie quantique du code génétique………………………………111
4.5.1. Opérateur de lecture (R)……………………………………………….116
4.5.2. Les différents codes génétiques……………………………………...118
Références………………………………………………………………………………..124
CONCLUSION GENERALE……………………………………………………………..126
Références………………………………………………………………………………..127
4
INTRODUCTION GENERALE
INTRODUCTION GENERALE
La biologie est tout d’abord une discipline empirique. En effet, elle s’appuie
essentiellement sur l’observation, la constatation et l’expérimentation. Elle n’est donc
pas une science théorique. Les concepts et principes y sont vraiment rares, et sont
souvent empruntés à la Physique ou à la Chimie. De plus, la biologie n’est pas une
étude du statique mais plutôt l’étude du dynamique.
Le 20ème siècle a coïncidé avec la naissance de la génétique. En effet, après
la redécouverte des travaux de Mendel en 1900, il y a eu l’élaboration de la théorie
chromosomique de l’hérédité au début du siècle, ensuite la découverte de l’ADN
comme support biochimique de l’information génétique, l’élucidation de sa structure
(années 50-60) et l’explosion de la biologie moléculaire à partir des années 70. Les
dernières décennies du 20ème siècle et l’aube du 21ème siècle a connu une
effervescence assez particulière, notamment l’étude des propriétés mécaniques et
électroniques de l’ADN sur les plans théorique, expérimental et de modélisation, ainsi
que l’étude de la modélisation du code génétique, et enfin le décryptage du
patrimoine génétique (génome) de certaines espèces animales et celle de l’humain.
Parmi les molécules dites de la vie, on peut citer les protéines qui
représentent à peu près la moitié du poids sec de la plupart des cellules vivantes et
qui sont caractérisées chacune par une séquence d’acides aminés sous forme
d’une chaîne polymérique. Chaque cellule est capable de fabriquer ses propres
protéines dont elle a besoin et pour cela, il faut disposer d’acides aminés, dont le
nombre de types différents a été recensé et est égal à 20, et de « recettes » qui
permettent de fixer quels acides aminés faut-il assembler et de quelle manière. Ces
« recettes » sont contenues dans le noyau des cellules, plus précisément dans la
chromatine (mélange de protéines appelées histones et d’Acides DésoxyriboNucléiques communément appelés ADN). Ce sont ces dernières molécules (ADN)
qui forment ces fameuses recettes. L’ADN, tout comme l’ARN (Acide RiboNucléique), sont des acides nucléiques dont la structure polymérique est formée de 4
nucléotides (appelés aussi bases). En général, un nucléotide est une base azotée
augmentée d’un groupement phosphate et d’un sucre. Le sucre est un pentose
cyclique qui peut être soit du type Désoxyribose (cas de l’ADN) ou Ribose (cas de
l’ARN). Le groupement phosphate est représenté quant à lui par l’acide
phosphorique. Quant aux bases azotées (nucléotides), elles peuvent être, dans le
5
INTRODUCTION GENERALE
cas de l’ADN, soit de type purine (Adénine et Guanine) soit de type pyrimidine
(Thymine et Cytosine). Dans le cas de l’ARN, la Thymine est remplacée par l’Uracile.
Si on sépare une molécule d’ADN en nucléotides, on obtiendra toujours des paires
de bases de type soit A = T ou G ≡ C , où les liaisons sont de type Hydrogène (H).
Etant donné que l’ADN ne sert pas physiquement de support à la synthèse
des protéines, il existe un flux d’information génétique dans la cellule. En réalité, ce
flux d’information se fait en deux étapes. En effet, il existe un intermédiaire entre la
séquence d’ADN (unité d’information) et la protéine spécifiée : l’ARN messager
(mARN). Dans la première étape, dite de transcription, la séquence d’ADN est
reproduite dans une séquence d’ARN (mARN). La seconde étape est la traduction,
c'est-à-dire la réalisation d’une protéine spécifiée par l’ARN messager avec passage
d’un alphabet à 4 lettres (les bases) à un alphabet à 20 lettres (les acides aminés).
Ce flux d’information génétique représente l’aspect métabolisme. Quant à l’aspect
reproduction cellulaire, il est représenté par un autre flux d’information génétique
généré par un autre phénomène dit de réplication de l’ADN, (Voir Figure cidessous).
La molécule d’ADN possède une structure de double hélice dont les deux
brins sont antiparallèles, complémentaires et aussi donc hélicoïdaux. Elle constitue le
lieu de stockage de l’information génétique sous forme codée. En effet, chaque
protéine est codée par un gène, ou par plusieurs si la protéine est polymérique.
L’unité de base des protéines étant l’acide aminé, celui-ci est codé par un codon
(triplet de nucléotides).
Ce code, c'est-à-dire la manière dont les 20 acides aminés se lient aux
différents codons, est appelé code génétique et a été déchiffré entre 1960 et 1965.
Puisqu’on dispose de 4 nucléotides différents dans l’ADN (A, T, G et C), il existe
6
INTRODUCTION GENERALE
donc 43=64 codons possibles dont trois, dits codons-STOP (ou de terminaison),
signifient la fin du message génétique. D’où ce code génétique est redondant
(dégénéré), puisque plusieurs codons peuvent coder pour le même acide aminé.
Ainsi, un acide aminé est bien spécifié par un système à trois nucléotides (codons).
Par la suite, grâce à des expériences reposant sur des systèmes de synthèse
protéique in vitro, la signification des 64 codons a donc pu être élucidée. Les
résultats sont compilés dans le tableau suivant.
-Code génétiqueCe code génétique est aussi universel, dans le sens où il est identique pour
tous les êtres vivants (à quelques exceptions près). Il est aussi non-chevauchant,
dans le sens où les codons sont lus en série depuis un point de départ de la
séquence jusqu’au condon-STOP. Le segment d’ADN portant toute l’information
génétique nécessaire pour la synthèse d’une protéine est communément appelé
gène.
Le Jeudi 06 Avril 2000, Craig Venter, patron de la firme privée Celera
Genomics, annonce à la chaîne de télévision CNN que son Laboratoire vient de
terminer le séquençage du génome humain. C’est un vrai exploit, sachant que ce
génome, véritable livre de la vie, comporte 23 chapitres (Paires de chromosomes),
au moins 50 milles phrases (gènes) et plus de 3 milliards de mots (paires de
nucléotides) écrits à l’aide d’un alphabet de 4 lettres (nucléotides). Chaque phrase
7
INTRODUCTION GENERALE
du livre spécifie la structure d’une protéine. Fait remarquable, les mots et l’alphabet
sont les mêmes chez la quasi-totalité des êtres vivants (Universalité)!
D’autre part, la synthèse d’une protéine, déterminée par un gène, revient
donc à la traduction d’une séquence de nucléotides en une séquence d’acides
aminés. C’est équivalent à la traduction d’une phrase écrite à l’aide d’un alphabet à 4
lettres en une phrase écrite à l’aide d’un alphabet à 20 lettres. Ceci est réalisé grâce
à un code de traduction (code génétique standard) qui a été finalement cracké au
cours des années 60.
Plusieurs tentatives ont été opérées pour élucider ce code génétique. Les
outils mathématiques utilisés pour modéliser ce code sont divers. On peut citer entre
autres, la théorie des ensembles et des applications, la théorie des groupes discrets,
la théorie de représentation des groupes continus issus de la classification de
Cartan, algèbres de Lie, algèbres de Lie supersymétriques, brisure de symétrie, la
théorie des algèbres quantiques, la géométrie différentielle, la géométrie descriptive,
etc….
Le but de ce mémoire est de relater l’état de l’art dans la modélisation
mathématique du code génétique. En particulier, nous nous intéresserons à la
théorie des groupes et de ses représentations (travaux de Hornos and al) et des
algèbres quantiques (travaux de Sorba and al).
Notre mémoire est organisé comme suit. Dans le premier chapitre, on
présente quelques éléments de la biologie moléculaire moderne et en particulier le
code génétique. Dans le deuxième chapitre, nous présentons d’abord les notions de
base concernant la théorie des groupes et de ses représentations. Notre attention se
dirige par la suite aux groupes quantiques et les algèbres quantiques. Ainsi, nous en
donnons les différentes définitions et caractéristiques. Dans le troisième chapitre, on
présente les différentes modélisations mathématiques proposées dans la littérature
pour expliquer ce code génétique, en omettant les approches algébriques (Hornos et
Sorba). Le dernier chapitre est consacré à l’étude de toutes les symétries présentes
dans ce code génétique. Ainsi, nous utiliserons la théorie des groupes (Voir §4.4) et
l’algèbre quantique (Voir §4.5) pour mieux décrire ces symétries. Enfin, nous
concluons par des remarques et les perspectives de recherche dans ce domaine.
8
CHAPITRE 1 :
Eléments de Biologie Moléculaire
9
Chapitre 1
Eléments de Biologie Moléculaire
1.1. Introduction
Dans ce chapitre, on présente quelques notions de base de la biologie
moléculaire moderne, [1], [2]. On s’intéresse en particulier aux relations entre les
codons et les différents acides aminés, communément appelé le code génétique.
1.2. Les nucléotides
L’ADN est un Polymère. C’est une longue chaîne de monomères appelés
nucléotides (Figure 1.1). La molécule d’ADN est ainsi qualifiée de poly-nucléotides,
Base azotée
Groupement
phosphate
5’
1’
4’
3’
Sucre
2’
Figure 1.1 : Structure du Nucléotide
Chaque nucléotide se composant de trois parties :
•
Ose : est un sucre à cinq atomes de carbone numérotés de 1′,2′,...,5′ appelés
Désoxyribose (Figure 1.2).
5’
HOH2C
OH
4’
1’
3’
2’
O
Figure 1.2 : Structure du désoxyribose
•
L’acide phosphorique : c’est un groupement de phosphate (Figure 1.3).
O
O
H
O
H
Figure 1.3 : Phosphate
H
O
P
10
Chapitre 1
•
Eléments de Biologie Moléculaire
une base azotée : Les bases azotées sont des molécules organiques
formées d'un ou deux cycles où alternent des atomes de carbone et d'azote.
Il y a donc quatre sortes de nucléotides : les bases azotées Adénine (A) et
Guanine (G), appartiennent au groupe des purines, alors que les bases
Thymine (T) et Cytosine (C) appartiennent au groupe des pyrimidines.
Figure 1.4 : Structure des bases azotées (puriques et pyrimidiques)
Remarque : Les purines sont formées de deux cycles, alors qu'il n'y en a qu'un pour
les pyrimidines, (Figure 1.4).
1.3. La structure de l’ADN
L’ADN (acide désoxyribonucléique) est composé de séquence de
nucléotides reliés entre eux par des fonctions esters et que l'on retrouve dans toutes
les cellules vivantes. L’ADN est le support de l'hérédité ou de l'information génétique,
car il constitue le génome des êtres vivants et se transmet en totalité ou en partie lors
des processus de reproduction cellulaire c’est-à-dire la synthèse des protéines.
1.3.1.
-
Quelques dates
1953 : Découverte de la double hélice (Watson et Crick) : Analyse de clichés
de diffraction de rayon X par des cristaux d’ADN.
-
1953 : un modèle du code génétique (Gamow)
-
1956: l’ARN est découvert.
-
1958 : La démonstration du modèle semi-conservatif de la réplication de
l’ADN (Meselson et Stahl).
-
1960 : Découverte de l’ARN messager (Monod).1961-1966 : le décryptage du
code génétique (Nirenberg et Matthaei) grâce à la synthèse de protéines in
vitro à partir d’un ARN poly-U.
-
1965 : L’opéron lactose (Jacob et Monod)
11
Chapitre 1
1.3.2.
Eléments de Biologie Moléculaire
La double hélice d’ADN :
La première structure tridimensionnelle essentiellement correcte de la
molécule d’ADN est proposée en 1953 par James Watson et Francis Crick, [3]-[4],
à l’université de Cambridge. Elle est obtenue non seulement à partir de
l’interprétation des clichés de diffraction des rayons X réalisées par Franklin et
Wilkins qui avaient déterminé en 1950 que l'ADN devait avoir une forme régulière
hélicoïdale en forme d'hélice (Figure 1.5), mais aussi des travaux d’Erwin Chargaff
qui avaient montré en 1950, que peu importe de quelle espèce on extrait l'ADN, la
quantité d'adénine est toujours égale à la quantité de thymine. De même, la quantité
de cytosine est toujours égale à la quantité de guanine, c’est-à-dire le rapport A+T /
C+G peut varier d'une espèce à l'autre, mais on a toujours A = T et C = G. et enfin
des analyse au microscope électronique avaient permis de montré que le diamètre
de la molécule d’ADN était d'environ 2 nm.
Figure 1.5 : Image par diffraction des rayons X d’un cristal d’ADN.
Watson et Crick émirent l'hypothèse qu'il pouvait se former des liaisons
hydrogène entre les bases azotées A et T (Figure 1.6.1) et les bases C et G (Figure
1.6.2), [5].
Figure 1.6.1 : Liaisons hydrogène entre la thymine et l’adénine.
12
Chapitre 1
Eléments de Biologie Moléculaire
Figure 1.6.2 : Liaisons hydrogène entre la cytosine et la guanine.
Remarque
Les liaisons d hydrogène peuvent être détruites par la chaleur ou par certain produits
chimiques une telle destruction conduit à séparer les deux brins de la double hélice,
Il existe dans les cellules des enzymes capables de séparer les deux brins de la
double hélice dans le but de copier l ADN ou d exprimer l information génétique.
Chaque molécule d’ADN est composée de deux longues chaînes de sousunités enroulées l’une autour de l’autre pour former une hélice à double brin
s’enroulant dans le sens des aiguilles d’une montre (Figure 1.7.1). Ces deux brins
ont trois propriétés essentielles :
i) Antiparallèles : l’un est constitué d’un enchaînement dans le sens 5 ' → 3' et
l’autre dans le sens 3' → 5 ' (Figure 1.7.2).
ii) Complémentaires : chaque adénine (A) d’un des deux brins est liée par deux
liaisons hydrogène avec une thymine (T) de l’autre brin, et chaque guanine
(G) d’un brin est liée par trois liaisons hydrogène avec une cytosine (C) de
l’autre brin.
La double hélice effectue un tour toutes les 10 paires de base environs, le pas
de l’hélice est donc de 34 Angström et la distance moyenne entre deux base est
d’environ 3,4 Angström ; l’hélice d’ADN à un diamètre de 20 Angström, on distingue
lorsqu’on la regarde depuis l’extérieur un sillon majeur et un sillon mineur (Figure
1.7.1), ces éléments jouent un rôle très important pour l’ADN au niveau de ses
interactions avec les protéines.
13
Chapitre 1
Eléments de Biologie Moléculaire
Sillon mineur
Sillon majeur
Figure 1.7.1 La double hélice.
Figure 1.7.2 Structure antiparallèle
1.4. La structure de l’ARN
La structure de l’ARN est similaire, mais pas identique, à celle de l’ADN. Il
existe une différence dans l’ARN, le sucre ribose (Figure 1.8.1) remplace le désoxyribose de l’ADN et la thymine (T) présente dans l’ADN est remplacée par une autre
base complémentaire appelé uracile (Figure 1.8.2), mais contrairement à l’ADN,
l’ARN sont des molécules constituées d'un seul brin : il est dit monocaténaire. A
l'exception de l'ARN messager qui possède une structure linéaire, les ARNr et ARNt
sont fait d'un brin fréquemment replié sur lui-même par appariement local des bases.
Ils adoptent ainsi une conformation faite de boucles et de tiges (dite en épingles à
cheveux ou bourrelets) et sont souvent associés à des protéines spécifiques.
5
O
HOH2
4
1
3
O
2
O
Figure 1.8.1 : Ribose
Figure 1.8.2 : Uracile
14
Chapitre 1
Eléments de Biologie Moléculaire
1.5. Réplication de l’ADN
Le mécanisme de réplication a était expliqué par Watson et Crick (Figure 1.9).
C’est le processus par lequel une cellule copie son ADN c’est-à-dire les brins
originaux (parent) se séparent et chaque brin individuel sert de matrice, pour la
synthèse d’un nouveau brin (brin répliqué). La réplication est nécessaire pour que
l’information génétique présente dans la cellule puisse être transmise aux cellules
filles après la division cellulaire, l’ADN est copié par des enzymes appelés ADN
polymérase qui agit sur l’ADN monobrin en synthétisant un nouveau brin
complémentaire du brin original, [1], la synthèse se fait toujours dans la direction
5′ → 3′ , chaque molécule copie de l’ADN contient un brin de la molécule mère et un
brin néosynthétisé et la réplication est dite semi-conservative (Figure 1.9).
Le mécanisme de la réplication est semblable chez la plupart des organes
vivants, les seules différences concernent les enzymes et les protéines impliquées.
La réplication doit être précise car un petit taux d’erreur conduirait à une perte de
l’information génétique, cette dernière est assurée par l’ADN polymérase à vérifier
que les bonnes bases ont été insérées dans le brin néosynthétisé. On estime qu’une
base sur cinq milliards est mal insérée.
Molécules d’ADN
parentales
Molécules d'ADN parentales
5'-CTGACGTA-3'
3'-GACTGCAT-5'
Brins
fils
[
5'-CTGACGTA-3'
3'-GACTGCAT-5'
]
5'-CTGACGTA-3'
3'-GACTGCAT-5'
^
Z
Molécules d'ADN filles
Molécules d’ADN
filles
Figure 1.9 : La réplication d’une séquence d’ADN : processus semi-conservatif
Dans ce cas, les bases des brins nouvellement synthétisés sont montrées en
rouge. Dans le duplex à gauche, le brin supérieur est la matrice provenant de la
molécule parentale (montrées en bleu) et celui du bas est le brin nouvellement
15
Chapitre 1
Eléments de Biologie Moléculaire
synthétisé ; dans le duplex à droite, le brin du bas est la matrice provenant de la
molécule parentale et celui du haut est nouvellement synthétisé (Figure 1.10).
Figure 1.10 : Réplication d’une longue molécule d’ADN duplex
Proposée par Watson et Crick.
Durant la réplication, la double hélice de l’ADN est progressivement déroulée
ce qui produit des segments d’ADN simples brins qui peuvent être copiés par l’ADN
polymérase, le déroulement de la double hélice commence à une position précise
appelé origine de réplication (Figure 1.11) qui progresse le long de la molécule
généralement de façon bidirectionnelle, la région où la double hélice est déroulé est
appelé fourche de réplication, [1].
Figure 1.11 : Origine et fourche de réplication
16
Chapitre 1
Eléments de Biologie Moléculaire
1.6. Transcription
Le transfert de l'information contenu dans un gène sous forme d'une séquence
d'ADN, vers une séquence d'ARN est appelé Transcription. Ce processus fait
intervenir une activité enzymatique nommée ARN polymérase qui utilise la double
hélice de l’ADN comme matrice appelées brins matrice et non matrice. L’ARN est
synthétisé à partir du brin matrice et a donc la même séquence que le brin non
matrice (Figure 1.12). On exprime généralement la séquence des gènes en terme de
brin non matrice et l’ARN synthétisé s’appelle un transcrit et peut ensuite être
traduit en protéine ou utilisé comme ARN ribosomal ou comme ARN transfert. Ce
processus se caractérise par :
•
La transcription n’est pas fixe : seules des petites portions du génome sont
transcrites à une époque donnée de la vie de la cellule.
•
La transcription commence en un point précis de l’ADN pour se terminer en un
point également précis, l’espace entre les deux (initiation-terminaison)
constitue une unité de transcription.
Brin matrice
3′
A A T G C C G T C A C T
5′
ADN
5′
T T A C G G C A G T G A 3′
Brin non matrice
↓ TRANSCRIPTION
ARN
5′
U U A C G G C A G U G U
3′
Figure 1.12 : la transcription du brin d’ADN
1.7. Traduction
C’est le mécanisme par lequel le flux d’information va passer de la forme
acide nucléique (alphabet à 4 lettres) à la forme protéine (alphabet à 20 lettres) selon
un code universel ou presque. Sur le plan génétique les éléments essentiels de la
traduction sont :
i)
ARN messager : l'ARNm véhicule l'information génétique, du lieu de stockage
(hélice d'ADN) vers le lieu d'expression, où il sert de matrice à la synthèse du
polypeptide.
17
Chapitre 1
ii)
Eléments de Biologie Moléculaire
ARN ribosomal : Les ribosomes sont des structures macromoléculaires
composé d’ARN ribosomal (ARNr) et de protéine, on les trouve en grande
quantité dans le cytoplasme où ils jouent un rôle important dans la traduction
des ARN messager en protéine. Chacun est constitué de deux sous unités
ribonucléoprotéiques petite et grande sous unité généralement exprimées en
terme d’unités de segmentation (S), [7].
Petite sous unité
Grande sous unité
Taille
30 S
50 S
ARN
16 S
5-23 S
Protéines (Nbr/mol)
21
34
Tableau 1.1 les caractéristiques des sous unités
iii)
ARN de transfert : les ARN de transfert (ARNt) sont des petites molécules qui
permettent l’assemblage des acides aminés dans le cadre de la synthèse
protéique, suivant un ordre spécifier par la séquence d’un ARNm. Les cellules
déposent de nombreux ARNt différents, chacun liant spécifiquement un acide
aminé. Ces petites molécules (environ 70 nucléotides) possèdent deux
fonctions essentielles :
Ø la possibilité pour chacune d’entre elles de se lier à un acide aminé spécifique.
Ø reconnaître un codon précis grâce à un anticodon (un triplet complémentaire
du codon).
iv)
L’aminoacyl-ARNt synthétases : les enzymes capables de catalyser (charger)
des ARN de transfert, c’est-à-dire de relier le bon acide aminé à l’ARNt porteur
du bon anticodon sont appelées aminoacyl-ARNt synthétases, [7]. Il en existe
autant que d’acides aminés et chacune est capable de reconnaître les différents
ARNt synonymes. L’énergie nécessaire à la traduction est fournie par
l’Adénosine triphosphate (ATP) et la guanosine triphosphate (GTP).
1.8. Codon
C’est un ensemble composé de trois nucléotides consécutifs porté par l'ARNm
correspondant à un acide aminé qui lui est spécifique, ou correspondant à un nonsens, [10]. La liaison de l’ARNt avec l’ARNm porteur de l’information se fait par
complémentarité entre 3 nucléotides de chacun de ces deux ARN. Les 3 nucléotides
du ARNm constituent un codon et les 3 nucléotides du ARNt un anticodon. Au cours
de la traduction l’anticodon et le codon se lient de manière antiparallèle et l’acide
aminé porté par le ARNt est incorporé à la protéine en cours de synthèse, et la
18
Chapitre 1
Eléments de Biologie Moléculaire
séquence primaire du ARNm est donc traduite par groupes de 3 nucléotides
(codons).
1.9. Code génétique
Le code génétique représente l’ensemble des règles de correspondance
permettant de traduire une séquence d’acide nucléique en protéine. En effet,
l'enchaînement des quatre nucléotides A, C, U, G, doit coder l'enchaînement des 20
acides aminés dans les protéines. Le codage d'un acide aminé nécessite donc au
minimum une suite de 3 bases.
De plus, si une base code un acide aminé, seules 4 acides aminés peuvent
être codés de façon non ambiguë, avec un codage à deux bases, on peut définir
42 = 16 acides aminés, ce qui n'est toujours pas suffisant, mais avec une
combinaison de 3 parmi 4 possibilités on a 43 = 64 codons pour 20 acides aminés
(Tableau 1.2). Tous les acides aminés à l’exception de la méthionine (Met) et du
tryptophane (Trp) sont codés par plusieurs codons. Certains de ces 64 codons
UAG, UGA et UAA ne codent avec aucun acide aminé. Ces triplets «non-sens»
indiquent à la machinerie cellulaire la fin de la lecture de l’information contenue dans
les gènes, et provoquent l’arrêt de fabrication des protéines. On les appelle codons
STOP ou codons de terminaison, [11], [12]. Le codon de la méthionine AUG est
le signal qui lance la synthèse protéique (traduction) on l’appelle aussi codon
d’initiation.
AAA
AAG
AAT
AAC
GAA
GAG
GAT
GAC
TAA
TAT
TAG
TAC
CAA
CAT
CAG
CAC
Phénylalanine
Phénylalanine
Leucine
Leucine
Leucine
Leucine
Leucine
Leucine
Isoleucine
Isoleucine
Isoleucine
Méthionine
Valine
Valine
Valine
Valine
AGA
AGG
AGT
AGC
GCA
GCG
GCT
GCC
TGA
TGG
TGT
TGC
CGA
CGG
CGT
CGC
Sérine
Sérine
Sérine
Sérine
Proline
Proline
Proline
Proline
Thréonine
Thréonine
Thréonine
Thréonine
Alanine
Alanine
Alanine
Alanine
ATA
ATG
ATT
ATC
GTA
GTG
GTT
GTC
TTA
TTG
TTT
TTC
CTA
CTG
CTT
CTC
Tyrosine
Tyrosine
STOP
STOP
Histidine
Histidine
Glutamine
Glutamine
Asparagine
Asparagine
Lysine
Lysine
Asparagine
Asparagine
Ac. glutamique
Ac. glutamique
ACA
ACG
ACT
ACC
GCA
GCG
GCT
GCC
TCA
TCG
TCT
TCC
CCA
CCG
CCT
CCC
Cystéine
Cystéine
STOP
Tryptophane
Arginine
Arginine
Arginine
Arginine
Sérine
Sérine
Arginine
Arginine
Glycine
Glycine
Glycine
Glycine
Tableau 1.2 : le code génétique.
1.10. Dégénérescence du code génétique
Il existe vingt acides aminés dans les protéines et 64 codons possible pour
les définir. En conséquence, la plupart des acides aminés sont représentés par plus
19
Chapitre 1
Eléments de Biologie Moléculaire
d’un codon, une caractéristique que l’on appelle dégénérescence ou la
redondance du code génétique. Le nombre de codons synonymes va de 1 à 6 (la
redondance 5 est absente), par exemple : la leucine est définie par six triples
différents qui sont : UUA, UUG, CUU, CUC, CUA et CUG (Tableau 1.3). En effet, si le
codon n’était pas dégénéré dans environ deux cas sur trois le changement d’une
base d’un codon conduirait à un codon qui ne définirait aucun acide aminé et par
conséquent à l’arrêt de la synthèse de la chaîne peptidique au niveau de ce codon,
[13], [14]. Par contre, si le code était dégénéré la modification d’une base conduit à
un codon qui définit en général un autre acide amine et s’oppose ainsi à l’arrêt de la
synthèse peptidique.
De plus, le déchiffrage des codons se fait par les ARNt qui porte chacun un
triplets complémentaire de l’un de ces codons. Pour gérer cette dégénérescence,
chaque ARNt peut reconnaître plus d’un codon (triplet) pour son acide aminé. De
nombreuses analyses directes de ARNm et de ARNt ont apporté des preuves de la
dégénérescence du code génétique.
Ala
Arg
Asn
Asp
Cys
Gln
Glu
Gly
His
Ile
4
6
2
2
2
2
2
4
2
3
Leu
Lys
Met
Phe
Pro
Ser
Thr
Trp
Tyr
Val
6
2
1
2
4
6
4
1
2
4
Tableau 1.3 : Code génétique dégénérée
1.11. Universalité du code
Au début on pensait que le même triplet (codon) définit le même acide aminé
pour tous les êtres vivants c’est-à-dire que le code est universel. Cependant on a pu
montrer qu’il existait une certaine exception telles que les mitochondries qui possède
le codon UGA qui correspond normalement à un signal de terminaison (stop code)
est traduit en tryptophane tandis qu’ AGA et AGG qui codent normalement l’arginine
sont des codons stop, [15]. Le fait que les mêmes codons définissent les mêmes
acides aminés chez tous les organismes vivants montre que l’origine du code leur est
commune et qu’ils doivent en conséquence dériver d’un même système cellulaire.
20
Chapitre 1
Eléments de Biologie Moléculaire
Références
[1] P. C. Winter, G. I. Hickey et H. L. Fletcher, L’Essentiel en Génétique, Berti
Editions, 2002, 2006 Paris.
[2] N. Karam, Cours de Biologie moléculaire, laboratoire de Biophysique
Mathématique, Université d’Oran Es-senia, Algérie.
[3] J. D. Watson and F. H. C. Crick, Nature 171, 737 (1953).
[4] J. D. Watson and F. H. C. Crick, Nature 171, 964 (1953).
[5] F. H. C. Crick, J. Mol. Biol. 19, 548 (1966).
[6] A. L. Lehninger, D. L. Nelson and M. M. Cox, Principles of Biochemistry, 2nd
edn. (Worth Publ., New York, 1993).
[7] L. Stryer, Biochemistry, 4th edn. (Freeman, New York, 1995).
[8] B. Lewin, Genes V (Oxford University Press, Oxford, 1994).
[9] W. S. Klug and M. R. Cummings, Concepts of Genetics, 3rd edn. (MacMillan,
New York, 1991).
[10] F. H. C. Crick, L. Barnett, S. Brenner and R. J. Watts-Tobin, Nature 192,
1227 (1961).
[11] S. Ozawa, T. H. Jukes, K. Watanabe and A. Muto, Microbiol. Rev. 56, 229
(1992).
[12] H. Tim, Biologie Moléculaire de La Cellule, DECITRE libraire 2004.
[13] F. H. C. Crick, J. Mol. Biol. 38, 367 (1968).
[14] R. Grantham, Science 185, 862 (1974).
[15] M. Eigen, B. F. Lindemann, M. Tietze, R. Winkler-Oswatitsch, A. Dress and
A. von Haeseler, Science 244, 673 (1989).
21
CHAPITRE 2 :
Groupes et Algèbres
22
Chapitre 2
Groupes et Algèbres
2.1. Introduction
Dans ce chapitre, on résume les différentes définitions de base concernant les
outils mathématiques (algébriques et géométriques), dont on aura besoin dans le
chapitre 3 et 4 qui traite les multiples modélisations de code génétique. On utilise
pour cela les références : [1]- [37].
2.2. Elément de la théorie des groupes
2.2.1. Définition d’un groupe
Un ensemble G est appelé un groupe s’il est muni d’une loi de composition
notée ( o ), telle qu’elle satisfasse à :
i)
La loi interne ; ∀a ∈ G et ∀b ∈ G, alors a o b ∈ G.
ii)
La loi est associative : ( a o b ) o c = a o ( b o c ) .
iii)
Il existe un élément neutre e , tel que : e o a = a o e = a,
iv)
Tout élément a possède un inverse a −1 dans G , tel que : a o a −1 = e
∀a ∈ G.
De plus si cette loi est commutative ( a o b ) = ( b o a ) .
Si la multiplication est commutative, i.e, (ab = ba) , On peut citer les
(
)
exemples suivants : (Z ,+ ) et ℜ ∗ ,× . »
2.2.2. Propriétés
–
Ordre d'un groupe : On appelle ordre d’un groupe, le nombre d’éléments qu’il
contient G , on le note g .
–
Groupes finis et infinis : Un groupe est dit fini ou infini s'il possède un ordre g
fini ou infini.
–
Groupe discret et continu : Un groupe est dit discret si ses éléments sont
clairement sépares, plus précisément s'ils
sont dénombrables (Exemple
{1, j, j } Groupe fini d’ordre g = 3 , {¢, +} Groupe infini décret). Un groupe est dit
2
continue si ces éléments sont fonction d’un ou de plusieurs paramètres variant
continuellement dans ce cas l’ordre du groupe est le nombre des paramètres
indépendant dont dépendent les éléments de groupe (Exemple pour le groupe
des rotations d’axe OZ et d’angle θ ∈ [ 0, 2π ] ).
23
Chapitre 2
–
Groupes et Algèbres
Groupe de Lie : Un groupe de Lie est une structure répondant au critère d'un
groupe comme défini en algèbre (opération interne, élément neutre et inverse)
dont les opérations sur ce groupe sont continues. Par exemple, une rotation sur
un cercle est continue. Un groupe de Lie est dit matriciel, si ses différents
éléments sont représentés par des matrices. Les groupes de Lie se classent en
différentes variétés ou en groupe. On compte 4 groupes de groupes de Lie :
réels, complexes, quaternioniques et exceptionnels.
–
Classification de Cartan : Dans se qui suit on classifie les différents groupes
de Lie matriciels selon :
•
Le groupe général linéaire d’ordre n, GL(n,C) : C’est l’ensemble des matrices
carrées, régulières (inversibles), de rang n , à coefficients dans £ , muni de la
multiplication matricielle, chaque élément est caractérisé par le domaine de
n2 éléments des matrices (complexe) soit aux total 2n 2 paramètres réels,ce qui
implique que la dimension du groupe GL(n, £) est 2n 2 . Pour passé du groupe
GL(n, £) au sous-groupe GL(n, ¡ ) , on doit limiter l’espace des paramètres à
¡ n ce qui va donné un groupe de dimension n 2 .
•
Le groupe spécial linéaire d’ordre n, SL(n,C) : c’est un sous-groupe de
GL(n, £) , restreint par les matrices de dim M = 1 . Ce qui impose que le nombre
de paramètres (dimension) est réduit à 2n 2 − 2 . Pour passé du groupe
SL(n, £) au sous-groupe SL(n, ¡ ) , on doit
limiter l’espace des paramètres à
¡ n ce qui va donné un groupe de dimension n 2 − 1 .
•
Le groupe unitaire d’ordre n, U(n,C) : c’est l’ensemble des matrices complexes
unitaires de rang n menu de la condition de l’unitarité UU † = U †U = 1 , où U † est
la transposée conjuguée de U . Le nombre de paramètres nécessaires pour
1
spécifier une matrice complexe est 2n 2 , l’unitarité UU † = 1 impose n + n(n − 1)
2
conditions supplémentaires, ce qui réduit le nombre de paramètres (dim) à n 2 .
•
Le groupe spécial unitaire d’ordre n, SU(n,C) : c’est un sous groupe de
U (n, £) , restreint par les matrices de dim U = 1 . Ce qui réduit sa dimension à
2n 2 − 2 .
24
Chapitre 2
•
Groupes et Algèbres
Le groupe orthogonal d’ordre n, O(n, C) : forme l’ensemble des matrices
complexe orthogonales, telles que : OO t = O t O = 1 , où O t désigne la transposé
de O . La dimension du groupe O(n, £) est donc n(n − 1) . Pour passé au groupe
des matrices réel orthogonales O(n, ¡) , on limite l’espace des paramètres à ¡ n .
Le nombre de paramètres est n 2 moins le nombre des contraintes indépendantes
imposées par l’orthogonalité
•
1
1
n(n + 1) donne une dimension de n(n − 1) .
2
2
Le groupe spécial orthogonal d’ordre n, SO(n,R) : forme l’ensemble des
matrices orthogonales n × n de déterminant 1. Le groupe O (n, £) admet
comme sous-groupe SO(n, £) . Cette condition ne change pas la dimension du
groupe n(n − 1) , et le groupe O(n, ¡) admet comme sous-groupe SO (n, ¡) de
dimension
•
1
n(n − 1) .
2
Le groupe symplectique Sp(2n) : forme l’ensemble des matrices M 2 n×2 n à
coefficients réels ¡ de dimension n(2n+1) ou complexes £ de dimension
2n(2n+1), muni de la multiplication, tel que :
MA + AT M = 0
(
où, AT est le transposé de A et M est la matrice antisymétrique t M = − M
 0n×n
M =
 − I n×n
•
)
I n×n 

0n×n 
Le groupe exceptionnel E8 : C’est un groupe de Lie complexe. Il est composé
de vecteurs à huit composantes, 8 pour les 8 composantes formant ses vecteurs.
Il a 248 dimensions complexes. E8 est le plus grand et le plus compliqué. Il est
utilisé dans certaines théories d'unification. Il a l'avantage d'intégrer des sousgroupes de Lie sur lesquels est basé la théorie standard.
•
Le groupe exceptionnel G2 : C’est le plus petit des groupes de Lie complexes de
type exceptionnel de rang 2 et de dimension 14. Son groupe d'automorphismes
est le groupe trivial.
•
Le groupe exceptionnel F4 : C’est un groupe de Lie exceptionnel de type
complexe. F4 est de rang 4 et de dimension 52 son groupe d'automorphismes est
le groupe trivial.
25
Chapitre 2
Groupes et Algèbres
– Sous groupe : un sous-ensemble H de G est appelé sous-groupe de G ,
noté G ⊃ H , s'il est lui même un groupe avec la même loi interne, que celle de G.
Ø Sous groupe invariant : un sous-groupe est dit sous-groupe invariant, si pour
tout élément h ∈ H et g ∈ G alors ghg −1 ∈ H , c’est-à-dire que la transformation de
l’élément de H par G donne H .
Ø Groupe simple et semi-simple : un groupe G est dit simple si il ne contient
aucun sous groupe invariant (à l’exception
de lui-même), et il est dit semi-
simple, s’il ne contient aucun sous groupe invariant abélien.
Ø Groupe quotient : Soit H un sous-groupe d’un groupe G , on appelle coset à
droite de H , l’ensemble des éléments de la forme Ha = {ha} = {h1a, h2a2 ,...} , et on
appelle coset à gauche de H , l’ensemble des éléments aH = {ah} = {ah1, ah2 ,...} ,
∀h ∈ H et ∀a ∈ G . Dans le cas, où H est un sous groupe invariant on a Ha = aH .
Ainsi,
nous
définissons
( a1H ) .( a2 H ) = ( a1a2 ). H .
une
multiplication
sur
les
classes
par :
Cela donne à l'ensemble des classes une structure de
groupe ; ce groupe est appelé groupe quotient noté
G/H. L'application
f : G → G / H , a → aH est alors un homomorphisme de groupe.
2.3.
Algèbre, algèbre de Lie, algèbre universelle enveloppante
ü Produit direct de groupes
Soient G et H deux groupes. L’ensemble produit G × H , c'est-à-dire l'ensemble
des couples d’éléments de G et H est muni d'une structure de groupe
( a, b ) × ( a′, b′ ) = ( a × a′, b × b′ )
( G × H , ×)
∀ a, a ′ ∈ G , b , b ′ ∈ H
(2.1)
est alors un groupe, appelé le produit direct de G et H. Un exemple est
fourni dans l'espace euclidien à 4 dimensions par les paires de rotations
indépendantes de deux plans orthogonaux qui forment le groupe SO (2) × SO(2) ,
sous-groupe de SO(4) .
ü Définition d’un espace vectoriel : un espace vectoriel sur un corps K (kespace vectoriel) est un groupe abélien V, noté additivement, muni d’une
loi k × V → V , produit externe, noté multiplicativement, vérifiant les propretés
suivantes : pour tous α et β dans K et pour tous v et w dans V, on a :
26
Chapitre 2
i).
Groupes et Algèbres
Associativité : (α β )v = α ( β v ),
ii). Distributivité : (α + β )v = α v + β v et α (v + w) = α v + α w.
iii). 1 v = v,
1 étant l’unité du corps k
Les éléments de V sont nommés vecteurs et les éléments de K sont nommés
scalaires. Exemple : un groupe V, réduit à son élément neutre {0} , est un
espace vectoriel sur tout corps commutatif K.
ü Algèbre : On appelle une algèbre tout triplet ( A, µ , η ) , où A est un espace
vectoriel sur un corps K , muni des applications linéaires suivantes :
a. Le produit
µ :A⊗A → A
µ ( a ⊗ b ) = a.b
∀ a,b ∈ A
La propriété d’associativité de l’opération du produit µ
(2.2)
(2.3)
est garantie par la
commutativité du diagramme suivant :
µ o ( µ ⊗ id ) = µ o ( id ⊗ µ )
Où, id est l’opérateur identité sur A
b. L’unité
De même, l’existence d’un élément neutre 1A ∈ A pour le produit se traduit par
l’existence de l’application linéaire "unité" définit comme suit :
η :k →A
η (k ) = k 1A ,
∀k ∈ K
(2.4)
(2.5)
Cette application satisfait la propriété suivante :
µ o (η ⊗ id ) = µ o ( id ⊗η )
L’algèbre ( A, µ , η ) est dite commutative si le diagramme suivant est commutatif :
id o µ = µ o τ
Où τ est l’application "permutation" :
τ : A⊗A → A⊗A
τ (a ⊗ b) = b ⊗ a
27
(2.6)
(2.7)
Chapitre 2
Groupes et Algèbres
ü Co-algèbre
On appelle co-algèbre tout triplet ( A, ∆ , ε ) , où A est un espace vectoriel, muni
des applications linéaires suivantes :
a. Le co-produit
∆:A → A⊗A
∆ (a . b) = ∆ ( a ) . ∆ ( b )
(2.8)
(2.9)
∆(1A ) = 1A ⊗ 1A
(2.10)
La propriété de co-associativité du co-produit ∆ est garantie par la commutativité
A⊗A⊗A
du diagramme suivant :
( ∆ ⊗ id ) o ∆ = ( id ⊗ ∆ ) o ∆
A⊗A
A⊗A
A
b. La co-unité
ε :A → k
ε ( a.b ) = ε ( a ) ε ( b ) ,
∀a, b ∈ A
ε (1A ) = 1
(2.11)
(2.12)
(2.13)
En fait, cette application est définie par :
(ε ⊗ id ) ∆ ( a ) = ( id ⊗ ε ) ∆ ( a ) = id
∀a ∈ A
(3.14)
c
Ce qui se traduit par
ε ⊗id
id⊗ε
k ⊗ A ←
 A ⊗ A 
→A ⊗ k
∆
≅
≅
A
La co-algèbre ( A, ∆ , ε ) est dite co-commutative si :
∆ o id = τ o ∆
τ
A ⊗ A ←
A⊗A
id d
AA ←
 AA
ü Bi-algèbre
Une bi-algèbre est un quintuplé ( A, µ , η , ∆, ε ) , qui possède à la fois une
structure d’algèbre ( A, µ , η ) et une structure de co-algèbre ( A, ∆ , ε ) , telles que les
propriétés (2.12), (2.13), (2.14) et (2.15) soient satisfaites.
28
Chapitre 2
Groupes et Algèbres
ü Structure d’algèbre de Hopf :
Une algèbre de Hopf est une bi-algèbre ( A, µ , η , ∆, ε ) muni d’un antipode S. Ce
dernier, est représenté par un endomorphisme de A définit comme suit :
S :A → A
S (1A ) = 1A
(3.15)
(3.16)
et vérifiant la propriété suivante :
µ ( id ⊗ S ) ∆ ( a ) = µ ( S ⊗ id ) ∆ ( a ) = η o ε
tel que
S ( µ ( a ⊗ b)) = S (b) S ( a )
∀a ∈ A
∀a, b ∈ A
(3.17)
(3.18)
où, en terme de commutativité de diagramme on a :
En général, une bi-algèbre ne possède pas toujours d'antipode, mais s’il existe, alors
il est unique.
ü Algèbre de Lie
Pour des valeurs suffisamment petites des paramètres on peut représenté un
élément du groupe g (α ) = g (α1 ,..., α n ) d’un groupe de lie d’ordre n , sous la forme
n
g (α ) = g (o) + ∑ α i
i =1
∂g (α )
+ 0(α 2 )
∂α i α =0
i
n
= 1 + ∑ α i xi
(2.19)
i =1
n
= 1 − i ∑ α iGi = e
−i
n
∑α iGi
i =1
i =1
avec
xi =
∂g (α )
= −iGi
∂α i α =0
(2.20)
i
Les opérateurs xi ou bien Gi sont appelées les générateurs de l’algèbre de
Lie, associés au groupe de Lie considéré.
En général ; on appelle algèbre de Lie de A tout espace vectoriel généré par
une base { xi }(1 ≤ i ≤ n ) , muni d’une opération [ ,] "crochet de Lie" et satisfaisant les
propriétés suivantes :
29
Chapitre 2
Groupes et Algèbres
∀x, y , z ∈ A et ∀α , β ∈ ¡ , (algèbre de Lie réelle), ou £ (algèbre de Lie complexe).
•
Linéarité : [ x, α y + β z ] = α [ x, y ] + β [ x, z ]
•
Antisymétrie : [ x, y ] = − [ y, x ]
•
Identité de Jacobi :  x, [ y, z ] +  y, [ z, x ] +  z , [ x, y ] = 0
•
Une algèbre de Lie est dit abélienne si [ x, y ] = 0
et les générateurs xi satisfont à la relation fondamentale suivante :
 xi , x j  = Cijk xk
(2.21)
où, les coefficients Cijk sont appelées constantes de structure de A par rapport a
cette base.
À partir des propriétés du crochet de Lie, on déduit que ces constantes de
structure vérifient :
i. Antisymétrie : Cijk + C kji = 0
k
Cilj = 0
ii. Identité de Jacobi : Cijk Clmj + Cljk Cmij + Cmi
D’autre part, un sous ensemble A′ d’une algèbre de Lie A munie de la loi [ ,] est
dit sous algèbre de Lie de l’algèbre A si on a :
[ x; y ] ∈ A′
∀x, y ∈ A′
(2.22)
En plus cette sous algèbre est dite abélienne si
[ x; y ] = 0
∀x, y ∈ A′
(2.23)
Si A est une algèbre de Lie associée à un groupe de Lie alors la sousalgebre A′ de A est associer au sous-groupe de Lie G′ ⊂ G .
ü Somme directe d'algèbres de Lie
Soit G le groupe de Lie issu d’un produit direct de deux groupes de Lie G1 et G2,
et soit g l’algèbre de Lie associée au groupe G. Alors, on montre que g est une
somme directe des deux algèbres de Lie g1 et g 2 des groupes de Lie G1 et G2
respectivement.
Si g1 généré
{ yi }(1 ≤ i ≤ n ) , on obtient
par
la
base { xi }(1 ≤ i ≤ n ) et g 2 par
base
:
[ x1 ⊕ y1 , x2 ⊕ y2 ] = [ x1 ⊕ x2 ]1 ⊕ [ y1 ⊕ y2 ]2
on peut donc noter
la
g = g1 ⊕ g 2 = ⊕ g i
∀x ∈ g1 et y ∈ g 2 .
i =1
30
(2.24)
(2.25)
Chapitre 2
Groupes et Algèbres
Remarque :
- si on identifie naturellement g1 et g 2 à des sous-algebre de g1 ⊕ g 2 , alors [ g1, g 2 ] = 0
- une somme d’algèbre de lie g1 ⊕ g 2 correspond au produit direct des groupes de lie
g1 ⊗ g 2
ü Somme semi directe d'algèbres de Lie
Si g admet deux sous algèbre g1 et g 2 , tels que :
[ g1, g1 ] = g1
[ g2 , g2 ] = g2
[ g1, g 2 ] ∈ g
(2.26)
alors, dans ce cas la g est La somme semi-directe de g1 et g 2 , et on note
g = g1 ⊕ s g 2 .Par exemple l’algèbre de Poincaré est la somme semi-directe de sousalgèbre de translation et de la rotation).
ü Forme de Killing et Casimir
On définit le Tenseur symétrique qu’on l’appelle aussi Tenseur métrique ou
Forme de Killing associé à un groupe de Lie comme suit :
gij = g ji = CikmC kjm
(2.27)
Une algèbre de lie est semi-simple si le : det g ≠ 0
On appel casimir d’une algèbre de lie g toute opérateur qui commute avec tout
les éléments de g on dit d’un tell opérateur que c’est un opérateur invariant car il
reste constant sous l’effet d’une transformation de groupe de Lie associer à l’algèbre
de lie g et on note cette opérateur {Ci } , ∀i = 1,..., n , et il vérifient :
[Ci , gi ] = 0
avec gi générateurs de g
Ci , C j  = 0
∀Ci , C j
(2.28)
ü Algèbres enveloppantes Universelle
Soient g une algèbre de Lie et I l’idéal de l’algèbre tensorielle T ( g ) au dessus
de g généré par les éléments de la forme X ⊗ Y − Y ⊗ X − [ X , Y ] , tels que x, y ∈ g .
Alors
l’algèbre
quotient U ( g ) = T ( g ) I
est
appelée
universelle classique (AEUC) de l’algèbre de Lie g .
31
algèbre
enveloppante
Chapitre 2
Groupes et Algèbres
2.4. Représentations des groupes
Soient G un groupe et E un espace vectoriel ( ¡, ou £ ) ≠ {0} . On appelle
représentation du groupe G dans l'espace E toute homomorphisme D du groupe
G dans le groupe des transformations linéaires GL( E ) , tels que
D : G → GL( E )
g → D( g )
D ( g .g ′ ) = D ( g ) . D ( g ′)
D (e) = I
(2.29)
∀g , g ′ ∈ G
(2.30)
(2.31)
où, e est l’élément neutre de G et I l'opérateur identité de E , l'espace E est appelé
l'espace de la représentation D , la dimension de D est la dimension de la
représentation et les opérateurs D ( g ) sont les opérateurs de la représentation.
•
La représentation est dite fidèle si le groupe admet comme sous groupe le
noyau c’est-à-dire :
KerD = { g ∈ G / D ( g ) = I } ,
(2.32)
et l’application doit être injective
∀g , g ′ ∈ G
D ( g ) = D( g ′) ⇒ g = g ′
(2.33)
• Une représentation est dite fondamentale si la dimension de la matrice de la
représentation est égale à la dimension de l’algèbre de Lie associée.
• Représentation adjointe
Mis à part la représentation fondamentale, une autre représentation joue un
rôle particulier : la représentation adjointe, définie de la manière suivante. La
relation de commutation [ J i ; J j ] = if ijk J k peut être vue comme définissant l'action
d'un générateur J i sur un élément J j d'un espace vectoriel de dimension d qui
n'est autre que l'algèbre de Lie elle-même, produisant un autre élément de G, la
combinaison linéaire ifijk J k . On pourrait noter cette action de la manière suivante
: ad i J j = if ijk J k . Cette action de J i définit une représentation de G, comme on peut
le vérifier explicitement en calculant le commutateur de cette action:
[ad i , ad j ] J n = [ J i , [ J j , J n ]] − [ J j , [ J i , J n ]]
= [ J i , [ J j , J n ]] + [ J j , [ J n , J i ]]
= − [ J n , [ J i , J j ]]
= if ijk [ J k , J n ]
= if ijk ad k J n
32
(2.34)
Chapitre 2
•
Groupes et Algèbres
Représentation Identique (équivalente) : deux représentations d’un groupe
D et D′ sont dites équivalentes (noté D : D′ ) si elles ont même dimension et
si chaque matrice D′ ( g ) se déduit par un certain opérateur linaire T (dit
opérateur d’entrelacement) de la matrice D ( g ) C'est-à-dire elle satisfait la
condition suivante :
T D ( g ) = D′ ( g ) T
∀g , g ′ ∈ G
(2.35)
et que l’opérateur d’entrelacement T doit être inversible
D′ ( g ) =T D ( g ) T −1
•
∀g , g ′ ∈ G
(2.36)
Caractère : On appelle caractère xD de la représentation D , la trace de la
représentation D ( g ) , c’est-à-dire :
xD ( g ) = Tr ( D( g ) ) = ∑ D ( g )
i
(2.37)
ii
Par conséquences :
1. si D et D′ sont équivalentes ⇒ xD = xD′
2. si g et g ′ sont conjugués ∃h ∈ G / g ′ = hgh −1 ⇒ xD ( g ) = xD ( g ′)
( )
3. si la représentation D est unitaire ⇒ xD g −1 = ( xD ( g ) )
∗
4. Le caractère de l’élément d’identité du groupe fourni la dimension de la
représentation xD ( e ) = n.
•
Sous-espaces invariants : On dit qu'un sous-espace Em ⊂ En ( dim Em = m <n ) ,
est invariant par la représentation D s'il est invariant à tous les opérateurs
D ( g ) c’est-à-dire
D ( g ) Em ⊂ Em ∀g ∈ G
(2.38)
Remarque : Le sous-espace trivial {0} est toujours invariant.
•
Une représentation est dite irréductible, si elle ne possède pas de sousespace invariant non trivial.
•
si une représentation de G dans un espace En laisse invariant un sousespace Em de En , elle est dite réductible.
Remarques :
Toute représentation de dimension 1 est irréductible.
La représentation triviale est toujours réductible, sauf en dimension 1.
33
Chapitre 2
•
Groupes et Algèbres
1ère Lemme de Schur : Soient D et D′ deux représentations irréductibles du
groupe G dans les espaces respectifs E1 et E2 Soit A un opérateur linéaire
de E1 → E2 qui satisfait à la condition :
AD ( g ) = D′ ( g ) A
∀g ∈ G
(2.39)
alors, A est identiquement nul.
•
2ème Lemme Schur : Soit D une représentation irréductible de dimension
finie du groupe G dans l'espace E . Alors, tout opérateur linéaire A : E → E
qui commute avec tous les opérateurs D ( g ) de la représentation est multiple
de l'identité :
AD ( g ) = D ( g ) A ⇒ A = λ I
•
∀g ∈ G
(2.40)
Représentations complètement réductibles : on dit que la représentation
D dans l’espace En est complètement réductible si D est la somme direct
des représentationnels irréductibles :
D = D1 ⊕ D2 ⊕ ... ⊕ Dn
(2.41)
Si la représentation Di apparaît plusieurs fois en peuvent écrire
D = m1 D1 ⊕ m2 D2 ⊕ ... ⊕ mi Di
(2.42)
où, mi est la multiplicité de Di
•
Produit tensoriel des représentations : Soient deux systèmes décrits
respectivement par les états i
{i = 1,..., m}
et
j
{ j = 1,..., n} ,
le système
composé est décrit par les états { i j } , ces états forme le produit tensoriel
des espaces vectoriel E1 et E2 décrivent les systèmes 1 et 2, En mathématique
on utilise la notion ei ⊗ e j pour i j ( avec ei = i et e j = j , on note aussi
que le produit tensoriel E1 ⊗ E2 est un espace vectoriel de dimension mn , on
pose :
y1 = ∑ ai ei ,∈ E1 et y2 = ∑ a j e j ,∈ E2
i
(2.43)
j
Donc le produit tensoriel donne :
y1 ⊗ y2 = ∑ ai a j ei ⊗ e j
i, j
34
(2.44)
Chapitre 2
Groupes et Algèbres
Si Z1 st un opérateur linéaire agissant dans E1 et Z 2 un opérateur
linéaire agissant dans E2 , l'opérateur linéaire Z1 ⊗ Z 2 agit sur le système
composé comme suit :
( Z1 ⊗ Z 2 )( y1 ⊗ y2 ) = Z1 ( y1 ) ⊗ Z 2 ( y2 ) y1 ∈ E1 , y2 ∈ E2
(2.45)
Soit A une matrice m × m et B une matrice n × n définit comme suit :
A = ( Aij ) avec (i, j = 1,..., m)
B = ( Blk ) avec (l , k = 1,..., n)
(2.46)
(2.47)
On appelle produit tensoriel A ⊗ B la matrice mn × mn définit par
( A ⊗ B )il , jk = Aij Blk
•
(2.48)
Propriétés élémentaires
( A ⊗ B )( A′ ⊗ B′) = ( AA′) ⊗ ( BB′ )
Tr ( A ⊗ B ) = ( TrA )( TrB )
†
( A ⊗ B ) = A† ⊗ B†
A ⊗ (B ⊕ C) = ( A ⊗ B) ⊕ ( A ⊗C )
( A ⊕ B) ⊗ C = ( A ⊗ C ) ⊕ ( B ⊗ C )
•
(2.49)
(2.50)
(2.51)
(2.52)
(2.53)
Représentation d’un Produit tensoriel : Soient D1 et D2 deux représentations
d'un même groupe G , On appelle représentation d’un produit tensoriel
D1 ⊗ D2 la représentation donnée par les matrices
( D1 ⊗ D2 )( g ) = D1 ( g ) ⊗ D2 ( g )
(2.54)
Remarques :
1.
Si D1 et D2 sont unitaires, alors D1 ⊗ D2 est unitaire.
2.
En général, la représentation d’un produit tensoriel D1 ⊗ D2 n'est pas
irréductible même si D1 et D2 le sont. Un problème important en théorie
des représentations est de déterminer les représentations irréductibles
qui apparaissent dans la décomposition du produit tensoriel de deux
représentations irréductibles quelconques. Il existe cependant des cas
ou D1 ⊗ D2 est irréductible.
35
Chapitre 2
•
Groupes et Algèbres
Représentation d’un Produit direct : Soit D1 une représentation du groupe
G1 et D2 une représentation du groupe G2 , alors D définie par
D ( g1 , g 2 ) = D1 ( g1 ) ⊗ D2 ( g 2 )
(2.55)
est une représentation du produit directe G1 × G2 .
Remarques :
1) Toute représentation D1 de G1 dans l’espace E1 est automatiquement une
représentation de G1 × G2 définie par D1 ( g1, g 2 ) = D1 ( g1 ).
2)
Toute représentation D2 de G2 dans l’espace E2 définit une représentation
de G1 × G2 exprimé par D2 ( g1 , g 2 ) = D2 ( g 2 ).
2.5. Groupe quantique et algèbre quantique
Un groupe quantique
est la q-déformation de l’algèbre enveloppante
universelle U(g). Cette déformation est effectuée à l’aide d’un paramètre de
déformation q ∈ K (£ ou ¡ ) sans dimension de telle sorte que sa présence dans les
différentes expressions définissant cette nouvelle structure algébrique rend celle-ci
non-commutative, et d’un autre coté, cette structure quantique est plus générale et
contient la structure classique correspondante comme une limite quand q tend vers
une valeur particulière q0 . De plus, cette déformation peu être un paramètre ou multiparamétrique. Par ailleurs, la notion de groupe quantique n’est pas aussi forcément
issue d’une déformation, i. e. qu’elle peut existé sans avoir d’analogue classique.
Pour cela, on retiendra la définition de Drinfel’d qui dit un groupe quantique est en,
général, une algèbre de Hopf non commutative et non co-commutative.
~ q-nombres
On définit le q-nombre correspond au nombre ordinaire x , comme suit :
q x − q−x
[ x]q = q − q −1
(2.56)
où q est un paramètre. La même définition est donné si x est un opérateur, On
remarque que le q-nombre demeure invariant lorsque q → q −1
i.
Si q est réel, le q-nombre prend la forme suivante :
[ x]q =
q x − q − x sinh ( xτ )
=
q − q −1
sinh (τ )
avec q = eτ / τ ∈ ¡
36
(2.57)
Chapitre 2
ii.
Groupes et Algèbres
Si q est une phase, le q-nombre peut être écrit comme :
q x − q − x sin ( xτ )
[ x]q = q − q−1 = sin τ
( )
avec q = eiτ / τ ∈ ¡
(2.58)
Il est clair que si q → 1 ⇒ τ → 0 , le q-nombre tend vers le nombre ordinaire x à la
limite classique :
lim [ x ]q = lim [ x ]q = x
q→1
(2.59)
τ →0
quelques exemples de q-nombre sont donnés ici :
[ 0]q = 0, [1]q = 1, [ 2]q = q + q −1 , [3]q = q 2 + 1 + q −2 , [ 4]q = q3 + q + q −1 + q−3
(2.60)
le q-nombre obéit à la relation :
[ a ]q [b + 1]q − [b]q [ a + 1]q = [ a − b]q
(2.61)
un q-factoriel d’un nombre entier n est définit par la relation
[ n]q ! = [ n]q [ n − 1]q ...[ 2]q [1]q
(2.62)
et Les q-coefficients binomiaux par
[ m ]q !
m 
k  = m − k ! k !
]q [ ]q
 q [
(2.63)
Où l’expansion des q-coefficients binomiaux sont donné par
[ a ± b ]q
m
=
m 
k
m −k
(±b )
 a
k =0 
q
m
∑ k
(2.64)
Il est évident que si la limite de q → 1 , nous avons
[ n]q ! → n!
m
où,   et n!
k 
 m
 m
k  →  k 
 q  
et
sont les coefficients binomiaux
(2.65)
et factoriels standard
respectivement.
Ces définitions peuvent être généralisées pour deux paramètres de déformation,
tels que :
[ x]q ≡ [ x ]qp =
Propriétés
qx − px
q− p
[ x]qp = [ x] pq
[ − x]qp = − ( qp ) [ x]qp
−x
37
(2.66)
(2.67)
(2.68)
Chapitre 2
Groupes et Algèbres
De plus, ∀ a, b, c , on a :
[ a + b ]qp = [ a ]qp qb + p a [b ]qp
[ a + b + 1]qp = [ a + 1]qp [b + 1]qp − qp [ a ]qp [b]qp
[ a ][b + c]qp = [ a + c]qp [b]qp + ( qp ) [ a − b ]qp [c ]qp
b
a −b
2
2
[ a − b]qp [ a + b]qp = [ a ]qp − ( qp ) [b]qp
( 2.69 )
( 2.70 )
( 2.71)
( 2.72 )
Dans le cas où x est un entier positif, nous avons
[ x]qp = q x−1 + q x−2 p + q x−3 p 2 + ... + qp x−2 + p x−1
x ∈ ¥ − {0}
(2.73)
Quelques exemples de qp-nombres sont donnés ici :
[ 0]qp = 0, [1]qp = 1[ 2] = q + p, [3]qp = q 2 + qp + p 2 , [ 4]qp = q3 + q2 p + qp 2 + p3
(2.74)
Le nombre complexe [ x ]qp définit en (2.26) peut prendre les formes suivantes :
iii. Si qp sont réel, nous avons
 τ −t 
sinh  x

 2  exp ( x − 1) τ + t 
[ x]qp =

τ − t 
2 
sinh 

 2 
Où
q = eτ
∀τ et t ∈ ¡
p = et
(2.75)
(2.76)
iv. Si qp sont des phases, nous avons
[ x]qp
 τ −t 
sin  x

 2  exp i ( x − 1) τ + t 
=

τ − t 
2 
sin 

 2 
(2.77)
où
q = ei.τ
∀τ et t ∈ ¡
p = ei.t
(2.78)
~ Fonctions élémentaires des q-nombres déformés
Les q-fonctions peuvent être définies en utilisant les q-nombres introduites
précédemment, par exemple :
• la fonction q-exponentielle
∞
an n
eq ( ax ) = ∑
x
n= 0 [ n ]q !
• La fonction q-trigonométrique
38
(2.79)
Chapitre 2
Groupes et Algèbres
∞
sin q ( x ) = ∑ (−1)n
n= 0
x 2 n+1
[ 2n + 1]q !
∞
cosq ( x ) = ∑ (−1)n
n= 0
x 2 n+1
n= 0 [ 2 n + 1]q !
∞
x2n
[ 2n]q !
(2.80)
∞
x 2n
n= 0 [ 2 n ]q !
sinh q ( x ) = ∑
cosh q ( x ) = ∑
(2.81)
Les fonctions en haut ne sont pas uniques, d’autres fonctions sont utilisées
dans l’étude des déformations quantiques, mais dans le contexte de notre
recherche nous allons s’abstenir juste pour les fonctions exponentielles et
trigonométriques.
~ q-dérivées
Dans cette section nous allons construire un nouveau calcule différentiel basé
sur les q-nombres déformés. En effet, la q-dérivée est définit par :
Dxq f ( x) =
f (qx) − f (q −1x )
q − q −1 x
(
(2.82)
)
Par conséquent, on a :
( )
Dxq ax n = a [ n ]q x n−1Dxq f ( x) =
(q − q ) x
=a
(q − q ) x
−n
n
n
−1
−1
eqax − e q ax
=
D e ( ax ) =
q − q −1 x
q
x q
(
)
=
aqx n − aq − n x n
q − q −1 x
(
)
(2.83)
= a [ n ]q x n−1
q n a n x n − q − na n x n
[ n]q !
(q − q ) x
−1
 qn − q −n
=
 q − q −1

(
)
 an xn

 x [ n]q !

(2.84)
[ n]q n n−1  an−1x n−1 
 = aeq ( ax )
a x = a
 [ n − 1] ! 
[ n]q !
q 

la q-dérivée d’une somme de fonction peut être définit par
Dxq ( f ( x ) + g ( x ) ) = Dxq f ( x ) + Dxq g ( x )
(2.85)
Dxq [ ax1 ± bx2 ]q = ± [ m ]q [ ax1 ± bx2 ]q
(2.86)
m
m −1
où a et b sont des constantes et l’expansion du q-binomial [ ax1 ± bx2 ] est donné
m
par l’équation (2.64). On peut aussi définir la q-dérivée d’un produit de deux
fonction par
(
)
( f ( x ) g ( x ) ) = ( D g ( x ) ) f (q
(
)
x) + g (qx) ( D f ( x ) )
Dxq ( f ( x ) g ( x ) ) = Dxq f ( x ) g (q −1 x) + f (qx) Dxq g ( x )
Dxq
q
x
−1
39
q
x
(2.87)
(2.88)
Chapitre 2
Propriétés
Groupes et Algèbres
Dxq f ( qx ) = qDxq f ( qx )
(2.89)
x = qx
1 q
Dx f ( x )
a
n
= [ n ] x n−1Dxq n f x n
Daxq f ( x ) =
( )
Dxq f x n
~
avec a = cst
(2.90)
( )
(2.91)
Algèbre enveloppante universelle quantique
On appelle généralement une algèbre enveloppante universelle quantique
Uq(g) d’une algèbre de Lie g, la q-déformation de l’algèbre enveloppante
classique U(g), telle que la limite classique est garantie par lim q → 1 .
2.6. La base cristalline
Dans la lim h → 0 , ( q = e h ) on peut trouver une bonne base dite base
cristalline des représentations de l'algèbre enveloppante quantique U q ( g ) d'une
algèbre de Lie semi-simple g . Une action modifiée des vecteurs racines envoie la
base cristalline sur elle-même, lui conférant une structure combinatoire riche. On
peut ainsi réduire de nombreuses propriétés des représentations à la combinatoire
des bases cristallines. En effet, l'action du générateur J ± n'est pas définie dans la
limite h → 0 . De ce fait un nouveau opérateur J%± , peut être définit comme suit :
J%± = C -1 2 J ±
avec
(2.92)
C j, m = [ j ]q [ j + 1]q j , m
(2.93)
Par conséquent, une base cristalline est définit par l’action de ces opérateurs dans
la limite h → 0 , tels que :
J%+ j m = j, m + 1
J%− j m = j , m − 1
J% j j = J% j -j = 0
+
pour
− j≤m <j
(2.94)
pour
− j≤m <j
(2.95)
(2.96)
−
J%3 j , m = J 3 j , m
(2.97)
De plus, l’opérateur casimir dans la base cristalline est définit comme suit :
( ) ( )( )
n −k
n
1
2
C% = ( J 3 ) + ∑ ∑ J%−
J%+ J%−
2 n∈Z + k =0
C% j m = j ( j + 1) j m
n
k
(2.98)
(2.99)
où, j m est le vecteur de base de représentation irréductible, muni des valeurs
propres ( j , m ), (Voir §2.7).
40
Chapitre 2
Groupes et Algèbres
Par ailleurs, le produit tensoriel de deux représentations dans une base
cristalline est définit par le théorème suivant :
Théorème de Kashiwara
Soient B1 et B2 deux bases cristalline de U h→0 ( sl (2)) tel que u ∈ B1 et v ∈ B2
 J u ⊗ v, ∃n ≥ 0 / J −nu ≠ 0 et J +v = 0
J − (u ⊗ v ) =  −
u ⊗ J −v autres
(2.100)
u ⊗ J + v, ∃n ≥ 0 / J +n v ≠ 0 et J −u = 0
J + (u ⊗ v ) = 
 J +u ⊗ v autres
(2.101)
Remarque
Le produit tensoriel de deux représentations dans une base cristalline n’est pas
commutatif.
2.7. Quelques exemples de groupes et algèbres de Lie
Rotation de R3 et le groupe SO(3)
On considère l’espace euclidien à trois dimensions ¡ 3 , ces rotations laisse
invariant l’origine, c’est-à-dire la norme carrée du rayon vecteur
OM 2 = x 2 + y 2 + z 2
(2.102)
Toute rotation est caractérisé est une rotation d’un angle θ autour d’un
axe de vecteur directeur unitaire u , et les rotations associées à ( u , R ) et ( −u , − R )
sont identiques, On notera R ( u , θ ) , le produit de deux rotation satisfait les axiomes
de groupe.
i.
Associativité
ii.
élément d’identité
iii.
élément inverse
R ( u ,θ ) = I
R −1 ( u, θ ) = R ( u, −θ ) = R ( −u, θ )
Pour une rotation d’axe u colinéaire à l’axe Rz on a la matrice
 cosθ

Rz (θ ) =  sin θ
 0

et pour les axes Rx et R y On a :
0
1

Rx (θ ) =  0 cosθ
 0 sin θ

− sin θ
cos θ
0
0

0
1 
 cos θ

Ry (θ ) =  0
 − sin θ



− sin θ 
cos θ 
0
41
(2.103)
0 sin θ 

1
0 
0 cos θ 
(2.104)
Chapitre 2
Groupes et Algèbres
Ces rotation forme Le groupe des transformations réelles à 3 dimension
noté O ( 3 ) , la matrice Λ d’une transformation orthogonal doit satisfaire à
ΛΛt = Λt Λ = I
(2.105)
Où, Λt est la matrice transposée. A noter que O(3) est aussi un sous-groupe
{
}
de U (3) puisque toute matrice réelle orthogonale est unitaire Λ = Λ ∗ ⇒ Λ t = Λ † , de
(2.103) on tire :
( det Λ )
2
= 1 ⇔ det Λ = ±1
(2.106)
det Λ = +1 est un sous-groupe O ( 3) appelé SO ( 3) qui contient les
transformations orthogonales préservant l'orientation d'espace.
Seul
Algèbre de Lie so(3)
La structure d'un groupe de Lie peut être déduite de ce qui se produit au
voisinage de l'identité du groupe. On considère alors des transformations
infinitésimales très proches de l'identité. Un élément proche de l'identité peut être
écrit comme
R ( u, θ ) = I + ε i X i
(2.107)
Où ε i sont les paramètres infinitésimaux et les opérateurs X i sont les générateurs
infinitésimaux de l’algèbre de Lie so ( 3) donnée par la formule
X i = lim
θ →0
d
Ri (θ ) i = 1, 2, 3
dθ
(2.108)
On trouve
0 0 0 
 0 0 1


X 1 =  0 0 −1
X 2 =  0 0 0
 0 1 0 
 −1 0 0
0 −1 0
X 3 = 1 0 0
0 0 0
(2.109)
ces derniers vérifient les relations de commutation suivantes :
[ X1, X 2 ] = X 3 , [ X 2 , X 3 ] = X1, [ X 3 , X1 ] = X 2
(2.110)
Ou sa forme compacte est donnée par :
i ≠ j ≠ k = 1, 2,3
(2.111)
 X i , X j  = ε ijk X k
avec ε ijk est le tenseur totalement antisymétrique d’ordre 3 , sachant que ε123 = 1
42
Chapitre 2
Groupes et Algèbres
De plus, si on pose
J i = iX i
i = 1, 2, 3
(2.112)
La relation de commutation devient
 J i , J j  = iε ijk J k
i ≠ j ≠ k = 1, 2,3
(2.113)
La forme standard de l’algèbre de lie se déduit à partir trois combinaisons suivantes
J z = J3 ,
J + = J1 + iJ 2 ,
J − = J1 − iJ 2
(2.114)
J ±† = J m
(2.115)
les générateurs J i i = 1, 2,3 sont hermétiques
i = 1, 2,3
J i† = J i ,
Les relations fondamentales de l’algèbre de Lie s’écrit comme suit :
[ J3, J ± ] = ± J±
[ J + , J − ] = 2 J3
(2.117)
J − J + = J − J − J3
(2.118)
J + J− = J − J + J3
(2.119)
2
2
(2.116)
2
3
2
3
L’opérateur de casimir J 2 s’écrit
C = J 2 = J12 + J 22 + J 32
1
C = J 2 = [ J + J − + J − J + ] + J 32
2
(2.120)
(2.121)
L’opérateur de casimir commute avec tous les générateurs J i de l’algèbre de Lie
 J 2 , J i  = 0
i = 1, 2,3
(2.122)
Le groupe SU(2)
SU (2) est le groupe des matrices complexe 2 × 2 qui satisfait aux condition
suivantes :
∀U ∈ SU (2) / UU † = 1
(2.123)
(2.124)
det U = 1
Soit la matrice
z
U = 1
 z3
z2 
z4 
 z1
U =
 z 3
z2 

z 4 
†
avec zi ∈ £
(2.125)
Après l’utilisation des conditions (2.123) et (2.124), On trouve
 Z1 = Z 4

⇒  et

 Z1 = Z 4
43
(2.126)
Chapitre 2
Groupes et Algèbres
On a, alors :
 z1
U =
− z 2
z2 

z1 
(2.127)
avec
2
2
det U = Z1 + Z 2 = 1
(2.128)
une paramétrisation possible de U est
Z1 = 1 −
x12 + x22 + x32 i
+ x3
4
2

x 2 + x22 + x32 i
 1− 1
+ x3
4
2

U=

x − ix2

i 1
2

x2 + ix1
2
(2.129)




2
2
2
x + x2 + x3 i 
1− 1
− x3 
4
2 
(2.130)
Z2 =
x2 + ix1
2
Algèbre de Lie su(2)
Considérons
une
transformation
infinitésimale
très
proche
de
l’identité U = 1 + ε J , ou ε est un nombre réel infinitésimal don nous négligerons les
puissances et J est une matrice (générateurs). Par conséquence, La condition
U tU = UU t = 1 devient, au premier ordre en ε :
(
)
UU † = (1 + ε J ) 1 + ε J † = 1 ⇒ J † = − J
(2.131)
Propriétés
n
n
n
i =1
i =1
i =1
det U = ∏ λi = ∏ exp(ln λi ) = exp( ∑ ln λi ) = exp(Tr ln U )
(2.132)
Le développement de Taylor du LnU au voisinage de 0 donne :
LnU = Ln(1 + ε J ) = ε J + O (ε 2 )
(2.133)
On remplace dans l’équation
det U = exp ε TrJ = 1 ⇒ TrJ = 0
(2.134)
Soit
J = J1 + iJ 2
(2.135)
J † = J1t − iJ 2t
D’après l’équation (2.131), on aura :
J † = − J = − ( J1 + iJ 2 ) = − J1 − iJ 2
(2.136)
Par identification on trouve :
⇒
J1t = − J1
J 2t = J 2
44
(2.137)
Chapitre 2
Groupes et Algèbres
 a1 b1 
 a1 c1 
t
J1 = 
 ⇒ J1 = 

 c1 d1 
 b1 d1 
 a2 b2 
 a2 c2 
t
J2 = 
 ⇒ J2 = 

 c2 d 2 
 b2 d 2 
(2.138)
(2.139)
de (2.138) on aura :
a1 = − a1
a1 = 0
b1 = −c1
 0 b1 
⇒ c1 = −b1 ⇒ J1 = 

c1 = −b1
 −b1 0 
d1 = 0
d1 = −d1
de (2.139) on aura :
(2.140)
a2 = a2
b2 = c2
 a2
⇒ J2 = 
c2 = b2
 c2
d2 = d2
l’utilisation de la propriété TrJ 2 = 0 implique que
c2 
d 2 
(2.141)
 a2 c2 
J2 = 

 c2 − a2 
on remplace J1 et J 2 dans (2.135), on aura :
(2.142)
 0 1   1 0 
0
J = J1 + iJ 2 = b 
+ i  a2 
+ c2 


 −1 0  0 −1
1
 0 1 
0 −i 
1
= i  c2 
+ b1 
+ a2 


i 0 
0
 1 0 
1 

0  
0 

−1 
(2.143)
on pose, c2 = c1, b1 = c2 et a2 = c3
 0 1
0 −i 
1 0  
+ c2 
+ c3 
J = i  c1 



i 0 
0 −1 
 1 0 
(2.144)
3
J = i ∑ c jσ j
(2.145)
j =1
avec, σ j sont les trois matrices de Pauli
0 1
σ1 = 
,
1 0
 0 −i 
σ2 = 
,
i 0 
1 0 
σ3 = 

 0 −1
[ J a ; J b ] = iε abc J c
si on pose c1 = c2 = c3 =
(2.146)
(2.147)
1
la relation de commutation prend la forme suivante :
2
σc
σ a σ b 
(2.148)
a ≠ b ≠ c = 1, 2,3
 2 , 2  = iε abc 2


avec ε abc est le tenseur antisymétrique sachant que ε123 = 1 .
45
Chapitre 2
Groupes et Algèbres
L’espace vectoriel des générateurs de
SU (2) muni de la relation de
commutation forme l’algèbre de lie de su (2) . Ces générateurs infinitésimaux et les
constantes de structure sont analogues aux ceux trouver pour le groupe des
rotations ce qui implique les mêmes relations fondamentales que SO (3) avec une
correspondance J =
σ
. Dans ce cas l’opérateur de casimir J 2 s’écrit :
2
C = J2 =
(
1 2
σ 1 + σ 22 + σ 32
4
)
(2.149)
le carrée d’une matrice de Pauli donne une matrice identité [ 2 × 2]
σ 2j = I
j = 1, 2,3
(2.150)
Ce qui implique
C = J2 =
3
I
4
(2.151)
Représentation irréductible de l’algèbre de Lie SU(2) et SO(3)
Procédons à la construction classique des représentations de l’algèbre su(2).
Comme précédemment J m et J Z désignent les représentations des générateurs
infinitésimaux dans une certaine représentation. Ils satisfont aux relations de
commutation (2.147) et d’herméticité, la commutation des opérateurs J Z et J 2
garantit qu’on peut en chercher des vecteurs propres communs. les valeurs propres
de ces opérateurs hermétiques étant réelles et J 2 étant semi-fini positif, On peut
toujours écrire ses valeurs propres sous la forme j(j+1),j réel positifs ou nul et on
considère donc un vecteur propre commun jm
J 2 j , m = j ( j + 1) j, m
(2.152)
J z j, m = m j , m
(2.153)
Avec m un réel arbitraire. Par abus de langage, on dira j , m est un vecteur propre
de valeurs propres ( j, m ) agissons avec J + et J − = J +† sur
jm
utilisant la relation
J ± J m = J 2 − J Z2 ± J z On calcule la norme carrée de J ± jm :
j , m J − J + j, m = ( j ( j + 1) − m ( m + 1) ) j, m j , m
= ( j − m) ( j + m + 1) ) j , m j , m
j , m J + J − j, m = ( j ( j + 1) − m ( m − 1) ) j , m j , m
= ( j + m) ( j − m + 1) ) j , m j , m
46
(2.154)
Chapitre 2
Groupes et Algèbres
Ces normes carrées ne peuvent être négatives donc
( j − m) ( j + m + 1) ) ≥ 0
avec − j − 1 ≤ m ≤ j
( j + m) ( j − m + 1) ) ≥ 0
avec
qui impliquent
− j ≤ m ≤ j +1
−j≤m≤ j
(2.155)
(2.156)
(2.157)
En outre, J ± jm = 0 si et seulement si
m = ± j ⇒ J ± j, ± j = 0
(2.158)
i. Si m ≠ j est un vecteur non nul, vecteur propre de valeurs propres ( j , m + 1)
En effet,
J 2 J + j , m = J + J 2 j, m = j ( j + 1) J + j, m
(2.159)
J z J + j , m = J + ( J z + 1) j , m = ( m + 1) J + j , m
(2.160)
De même, si m ≠ − j , J − jm est un vecteur propre non nul de valeurs propres (j, m-1)
ii. Considérons la suite des vecteurs
j , m , J − j , m , J −2 j, m ,..., J −p j , m ,...
(2.161)
S’ils sont non nuls ils constituent des vecteurs propres de J z de valeurs
propres m, m + 1, m + 2,..., m + p,... Les valeurs propres autorisées de J z étant bornées
par − j ≤ m ≤ j cette suite doit s’arrêter au bout d’un nombre fini d’étapes.
Soit p l’entier tel que
J +p jm ≠ 0
(2.162)
J +p jm ≠ 0 est un vecteur propre de valeurs propres (j,-j) donc m + p = j , c’est-à-dire
p = ( j − m)
est entier
(2.163)
Opérant de même avec J − , J −2 ,..., J −q ,... sur jm , On est mené à la conclusion que
q = ( j + m)
On a alors,
est entier
p+q = 2j
(2.164)
(2.165)
Par conséquence, les représentation irréductibles de su (2) sont caractérisé par j et
m entiers ou demi-entiers, tel que :
1 3
j = 0, ,1, , 2,...
2 2
De plus, pour une valeur fixe de j , m peut prendre les 2 j + 1 valeurs
47
(2.166)
Chapitre 2
Groupes et Algèbres
m = − j, − j + 1,..., j − 1, j
(2.167)
Partant du vecteur j , m = j (“vecteur de plus haut poids”) associer aux différents
poids m = j, j − 1,...., − j choisi de norme 1, on construit la base orthonormée j, m
J z j, m = m j , m
J ± j, m =
(2.168)
j ( j + 1) − m(m ± 1) j, m ± 1
(2.169)
On note D j la représentation de dimension finie la plus général de su (2) est
une somme direct des représentations ⊕ D j .
Les algèbres de Lie so(3) et su (2) sont isomorphe et tout deux de dimension
3, mais leurs groupes SO (3) et SU (2) ne le sont pas. Les représentations de SO (3) ne
différent de celles de SU (2) que du spin de la représentation. Pour SO(3) , j est entier,
alors que pour SU (2) , j est entier ou demi entier.
La correspondance entre les deux groupes est obtenue par la représentation
r
1
exponentielle de la rotation R U ,θ , pour un spin , (matrices de Pauli), tels que :
2
ur r
r
r σr
R U ,θ = exp  −iθ J .u 
et
J=
(2.170)
2
(
(
)
)
Par conséquent, la représentation spinorielle de la rotation, prend la forme suivante:
n
2
r
 θ ur r  ∞  θ  (σ .u )
R U ,θ = exp  −i σ .u  = ∑  −i 
n!
 2
 0  2
(
De plus, on a :
)
r
u2 = 1
(σ .u )
2p
(σ .u )
=I
2 p +1
= σ .u
(2.171)
(2.172)
Il en résulte donc que :
r
θ
θ
 θ ur r 
R U ,θ = exp  −i σ .u  = cos I − i sin σ .u
2
2
 2

(
)
(2.173)
Produit tensoriel des représentations de SU(2)
La construction d’une représentation irréductible d’un groupe donné consiste à
construire le produit tensoriel de représentations connues et à le décomposer en
représentations irréductibles. Le produit tensoriel D j ⊗ D j ′ de dimension (2j+1) (2j’+1)
se décompose en somme directe de D j . Soit la représentation exponentielle notée :
j
∑e
− iJ zθ
m =− j
48
(2.174)
Chapitre 2
Groupes et Algèbres
Qui s’écrit dans une base j , m
j
∑e
− imθ
(2.175)
m =− j
En effet, le produit tensoriel des exponentielles donne
 j
 j′

D j ⊗ D j′ =  ∑ e −imθ  ∑ e −im′θ 
 m=− j
 m′=− j′

i ( j + j′ )θ
i ( j + j′−1)θ
D j ⊗ D j′ = e
+e
+ ... + ei ( j − j′)θ + ... + e −i ( j − j′ )θ + e −i ( j − j′+1)θ + ... + e −i ( j + j′ )θ
(2.176)
Par conséquent
D j ⊗ D j′ =
j + j′
⊕D
k = j − j′
(2.177)
k
1
Exemple : Le produit tensoriel de deux moments cinétiques donne :
2
1
D1 ⊗ D1 = ⊕Dk = D0 ⊕ D1
2
2.8.
2
(2.178)
k =0
Algèbre quantique suq(2)
Les algèbres quantiques c’est une version généralisée des algèbres de Lie,
lorsque le paramètre de déformation q tend ver l’unité, un exemple simple d’une
algèbre quantique est l’algèbre su q (2) , généré par les opérateurs
J+ , J− , J
Satisfaisant les relations de commutations suivantes :
[ J 3 , J ± ]q = ± J ±
[ J + , J − ]q = [ 2 J 3 ]q
avec
(2.179)
(2.180)
J 0† = J 0 , ( J + ) = J −
†
(2.181)
On remarque que l’équation (2.179) prend la même forme que dans le cas de
l’algèbre de Lie ordinaire su(2) , cependant l’équation (2.180) diffère du cas usuel
su(2) qui s’écrit :
[ J+ , J− ] =
(2.182)
2 J3
Cette déférence est due au q-opérateur [ 2 J 3 ] introduit dans le cadre des
algèbres quantiques étudie précédemment (Voir §2.5),
c’est-à-dire que après
l’utilisation des équations (2.57) et (2.58), l’équation (2.180) prend la forme
[ J + , J − ]q = [ 2 J3 ]q
3
5

sinh(2 J 3τ )
1  2 τ J3 ( 2 τ J3 ) ( 2 τ J3 )
=
=

+
+
+ ... 

sinh(τ )
sinh(τ )  1!
3!
5!

49
(2.183)
Chapitre 2
[ J + , J − ]q = [ 2 J3 ]q
Groupes et Algèbres
3
5

sin(2 J 3τ )
1  2 τ J 3 ( 2 τ J 3 ) ( 2 τ J3 )
=
=

−
+
− ... 

sin(τ )
sinh(τ )  1!
3!
5!

(2.184)
Les représentations irréductibles (irreps) D j du groupe su q (2) de dimension
2 J + 1 associer aux différents poids J ≤ M ≤ − J avec
1 3
J , M = 0, ,1, ,2,...
2 2
la base orthonormée J , M
est
(2.185)
liée au vecteur de
plus haut poids J , M = J
comme suit :
J,M =
[ J + M ]q !
( J − ) J −M
2
J
!
J
−
M
!
[ ]q [
]q
J,J
(2.186)
avec
J+ J , J = 0
(2.187)
J,J J, J =1
(2.188)
J3 J , M = M J , M
(2.189)
J± J , M =
[ J m M ]q [ J ± M + 1] q
J , M ±1
(2.190)
v L’opérateur q-bosonique déformé
L’algèbre q-bosonique est définit par l’ensemble des opérateurs de création a† ,
d’annihilation a et l’opérateur nombre N , qui obéit aux relations de commutation
suivantes :
 N , a †  = a † , [ N , a ] = −a
aa† − q m1a †a = q ± N
(2.191)
(2.192)
l’opérateur q-déformé a est l’hermétique conjugué de a + , et on note :
(a )
+ †
(a)
= a,
†
= a+
(2.193)
et l’opérateur nombre N est hermétique
(N)
†
=N
(2.194)
lorsque q → 1 , l’équation (2.192) tend ver :
 a, a †  = 1
(2.195)
Par conséquent, on a :
aa† = [ N ]q ,
a†a = [ N + 1]q
50
(2.196)
Chapitre 2
Groupes et Algèbres
On défini l’espace de Fock
f = { n : n ∈ ¥}
(2.197)
où n est la base de Fock, définit par l’action répété de l’opérateur de création a† sur
l’état vide, qui s’annule par simple application de l’opérateur a
(a )
†
a 0 = 0,
n =
n
[ n]q !
(2.198)
0
L’action des opérateurs a† , a et N sur la base de Fock est donné par
N n =n n
(2.199)
[ n + 1]q
a† n =
[ n]q
an =
n +1
(2.200)
n −1
(2.201)
L’importance des opérateurs q-bosoniques se situe de leurs simplifications de
construire des représentations des algèbres quantiques, plus précisément dans
l’étude des algèbres de unitaire déformés.
v Réalisation de suq(2) en termes de q-bosons déformés
La réalisation des algèbres de Lie en termes de bosons (ordinaire) sont utile non
seulement comme outil mathématique mais également en raison de leurs
applications dans la physique. Dans le cas des algèbres quantiques il s'avère que les
réalisations de boson sont possibles en termes d'opérateur de boson q-déformé.
Dans le cas de su q (2) on introduit deux opérateurs de création a1† , a2† et d’annihilation
a1 , a2 qui vérifient les relations de commutation :
a1a1† − q m1a1†a1 = q ± N1
m1 †
2 2
a a −q a a =q
†
2 2
(2.202)
± N2
(2.203)
[ a1 , a1 ] = a , a2  = a1 , a
†
1
†
2
 = 0
(2.204)
Les générateurs de l’algèbre su q (2) peuvent être écrit en fonction des
opérateurs q-déformés comme suit :
1
(2.205)
( N1 − N 2 )
2
En peut facilement prouvé que les relations de commutation de suq (2) en termes de
J + = a1†a2 ,
J − = a2†a1,
J3 =
q-bosons vérifies les équations (2.182) et (2.183) tel que :
51
Chapitre 2
Groupes et Algèbres
[ J + , J − ] = J + J − − J − J + = a1+ a2a2+a1 − a2+a1a1+a2
= [ N1 ][ N 2 + 1] − [ N1 + 1][ N 2 ]
(2.206)
d’après la propriété (2.61), la relation (2.206) , prend la forme suivante :
[ J + , J − ]q = [ N1 − N 2 ]q = [ 2 J 3 ]q
(2.207)
le vecteur de plus haut poids en termes de q-bosons prend la forme
J,J =
(a )
†
1
2J
[ 2 J ]q !
(2.208)
0
et le vecteur général prend la forme
J,M =
(a ) (a )
†
1
J +M
†
2
J −M
[ J + M ]q ! [ J − M ]q !
52
0
(3.209)
Chapitre 2
Groupes et Algèbres
Références
[1] A. Kostrikin, Introduction à l’algèbre, éditions Mir, Moscou, 1981.
[2] T. Kahan, Théorie des Groupes en Physique Classique et Quantique, édition
Dunod, Paris, 1960.
[3] Haldik, « la théorie des groupes en physique et chimie quantique », Edition
Masson, Paris, 1995.
[4] E. B. Dynkin, « Semisimple Subalgebras of Semisimple Lie Algebras », Mat. Sb.
(NS),30,349 (1952).
[5] M. Hammermesh, Group Theory, Addison-Wesley (1964).
[6] N. Jacobson, Lie Algebras, Willey, New york, 1962.
[7] M. Gourdin, Basics of Lie Groups, Editions Frontières Gif sur Yvette, France,
1982.
[8] B. G. Wybourne, Classical Groups fo Physicists, A Wiley-Interscience
publication, New York.
[9] B. Acharya, Course on Group Theory, ICTP Diploma Programme, Ref : 2004-05
HEP-L&L.
[10] M. Kibler, Elément de la théorie de groupes, Note de cours de D.E.A, U.E.R, de
Physique de l’université Claude Bernard de Lyon. (1982-1983).
[11] J. B. Zuber, Introduction a la Théorie des Groupes et de leurs Représentations
Cours donner au Magistère Inter universitaire de Physique, Printemps, 1994. Service
de Physique Théorique de Saclay, France, 1994.
[12] B. Delamotte, Un soupçon de théorie des groupes : groupe des rotations et
groupe de Poincaré,D.E.A. « Champs, Particules, Matières », 1997, LPTHE,
Université Paris 6-Pierre et Marie Curie, , France.
[13] D. Hannachi, L’algèbre u 1q( 2 ) ⊕ u 2q( 2)et son application sur vibrations de
stretching des molécules X-Y-X, Mémoire de Magister, spécialité Chimie, Option :
Chimie-Physique, Université El-Hadj Lakhdar Batna, Algérie, (2007).
[14] H. Boerner, Representation of Groups, North-Holland, Amsterdam,1963.
[15] F. D. Murnaghan, The Theory of Groupe Representaion, Johns Hopkins press,
Baltimore, 1938.
[16] E. B. Vinberg, Linear Representations of Groups, Birkh auser, Basel, 1989.
[17] R. Deheuvels, Tenseurs et spineurs, Presses Universitaires de France - PUF (1
avril 1993).
53
Chapitre 2
Groupes et Algèbres
[18] V. Chari and A. Pressley, a Guide to Quantum Groups, Cambridge University
Press, (1994).
[19] W. G. Ritter, Inroduction to Quantum Group Theory, math/0201080v1.
[20] G. Schieber, L’algèbre des symétries quantiques d’Ocneanu et la classification
des systèmes conformes à 2d, Thèse de doctorat, spécialité physique des particules,
physique mathématique et modélisation, Université de Provence, (2004).
[21] D. Bonatsos, C. Daskaloyannis, P. Kolokotronis and D. Lennis, Quantum
Algebras in Nuclear Structure , ETC/DEC/ 1995-06.
[22] M. R. Kibler, Inroduction to Quantum Algebras, hep-th/9409012v1.
[23] E. P. Borges, J. Phys. A 31 (1998) 5281.
[24] R. W. Gray and C. A. Nelson, J. Phys. A 23 (1990) L945.
[25] A. J. Bracken, D. S. McAnally, R. B. Zhang and M. D. Gould, J. Phys. A 24
(1991) 1379.
[26] A. E. F. Djemaï, ‘’Groupes Quantiques, Fibrés Quantiques, Calcul Différentiel
Non-Commutatif et Applications en Physique’’, Préprint interne.
[27] L. C. Biedenharn, « the quantum group Suq(2) and a q-analogue of the boson
operators »,
J.Phys.A:Math.Gen 22 (1989) L873-L878,
[28] A. J. Macfarlane, “on q-analogues of the quantum harmonic oscillator and the
quantum group SUq(2) ”, J.Phys.A.Math. Gen 22 (1989) 4581-4588.
[29] L. C. Kwek et C. H. Oh, “on q-analogues of the quantum harmonic oscillator and
q-deformed su(2) algebra” , q-alg/9707024 18 Jul 1997.
[30] T. L. Curtright and C. K. Zachos, Phys. Lett. B 243 (1990) 237.
[31] T. L. Curtright, G. I. Ghandour and C. K. Zachos, J. Math. Phys. 32 (1991)
676.
[32] A. Klein and E. R. Marshalek, Rev. Mod. Phys. 63 (1991) 375.
[33] A. J. Macfarlane, J. Phys. Lett. 22 (1989) 4581 .
[34] X.C. Song, J.P hys. Lett 23 (1990) L821.
[35] L. C. Biedenharn, J. Phys. A 22 (1989) L873.
[36] A. J. Macfarlane, J. Phys. A 22 (1989) 4581.
[37] M. Kashiwara, Crystallizing the q-analogue of universal enveloping algebras,
Commun. Math. Phys. 133 (1990) 249.
54
CHAPITRE 3 :
Différentes Modélisations
55
Chapitre 3
Différentes Modélisations
3.1. Introduction
Le code génétique constitue un dictionnaire pour la synthèse des protéines
qui à chaque codon (triplet de bases nucléiques dans l’ADN ou l’ARN) associe un
des vingt acides aminés ou le signal de terminaison. Il résume, dans une forme
condensée, les règles gouvernant le processus complexe de translation qui apparaît
dans le ribosome, contenant les trois formes de l’ARN (mARN, tARN et rARN)
ensemble avec les diverses protéines et autres molécules auxiliaires.
Ainsi, la première étape importante fût la découverte par Crick and al en 1961,
[1], que le code génétique est un code de triplets, ou encore que l’unité élémentaire
d’information génétique, communément appelée codon, est une séquence de trois
bases nucléiques, chacune représentant uniquement un acide aminé (ou un signal
de terminaison). D’autres travaux expérimentaux s’en suivirent, [2]-[6], et menèrent à
une classification de cette correspondance entre codons et acides aminés,
totalement accomplie en 1966 et assemblée dans une table standard qu’on peut
maintenant retrouver dans tout livre de biochimie ou de génétique.
Cette table de code génétique est à la Biologie ce que le tableau
périodique de Mendeleïev est à la Chimie. En effet, on relève plusieurs similarités
entre ces deux tables. Par exemple, les deux exhibent des régularités frappantes,
telles que l’apparition de groupes d’éléments avec des propriétés chimiques
similaires, assemblés dans des colonnes de la table périodique, ou l’apparition de
groupes de codons représentant le même acide aminé, assemblés dans ce qu’on
appelle couramment les boxes de familles dans la table du code génétique.
La dégénérescence de ce code, résultant simplement du fait que le nombre
d’acides aminés (20) est beaucoup plus petit que le nombre de codons (64), suggère
immédiatement une analyse basée sur des principes d’invariance, donc de
concept de symétries.
Plusieurs modèles ont été ainsi proposés pour expliquer pourquoi ce code estil ce qu’il est. Tous ces modèles reposent sur le concept de symétrie. Le premier
modèle proposé, le code en diamant, fût présenté en 1954, [7], non pas par un
Biologiste ou un Chimiste mais par un Physicien, George Gamow, un des
précurseurs de la théorie du Big-Bang en cosmologie. Cette approche a été ensuite
délaissée jusqu’à ce que le code génétique fût cracké en 1966.
56
Chapitre 3
Différentes Modélisations
Depuis, une multitude de modèles ont été présentés reposant sur des
concepts de symétries différents. Certains ont fait usage des symétries inhérentes à
la théorie des ensembles, d’autres ont fait appel à la théorie des groupes discrets, ou
encore à la théorie des groupes de Lie et leurs représentations. D’autres ont décrit
ces symétries dans le cadre des algèbres quantiques. D’autres ont essayé de les
décrire dans le cadre de la géométrie descriptive (hypercube, tétraèdre, polyèdre,
sphère, boule). Enfin, d’autres ont utilisé le jeu de lumière (les couleurs) pour
exprimer ces symétries (Québecquim). Certains ont même fait usage de
l’arithmétique pour relever quelques nombres magiques qui ressort des symétries de
ce code génétique.
Dans ce chapitre, on a tenté de relater les différentes approches pour décrire
le code génétique standard, avec plus ou moins de détails.
3.2. Modèle de Gamow (1954) :
Grâce aux travaux de James Watson et Francis Crick (1953) la structure de
l'ADN est connue. Toutefois, les moyens techniques de l'époque ne permettaient pas
de connaître de façon expérimentale le code utilisé par la nature. Diverses
propositions de codes ont alors été faites (un historique est présenté dans [8]).
Gamow émit l'hypothèse que la double hélice d'ADN formait une paire de rails
à l'intérieur desquels se placent les acides aminés, [7], chaque acide aminé se
positionne entre les 2 bases d'une même paire. L'hypothèse était intéressante car
l'espacement entre les bases était le même que l'espacement entre les acides
aminés. L'acide aminé capable de se placer dépendait de la forme du site créé par
les 4 bases : les 2 bases de la paire en question, une base de la paire "précédente"
et une base de la paire "suivante" (voir Figure 3.1).
Figure 3.1 : Placement des acides aminés selon le diamond code
(1, 2, 3 et 4 représentent les bases C, G, C et T respectivement)
La paire de bases obéissant à la règle de complémentarité qui relient A avec T
ou C avec G. De plus, sous l'hypothèse que l'acide aminé était le même si l'on
57
Chapitre 3
Différentes Modélisations
échangeait les places des bases "précédente" et "suivante", 20 combinaisons sont
possibles (voir Tableau 3.1), et correspondent exactement au nombre d'acides
aminés.
Tableau 3.1 : Le diamond code
Le diamond code fût le premier code à être envisagé comme étant une
solution possible au problème du décodage de l'information génétique contenue
dans l'ADN. Un de ces avantages est que la lecture se fait avec un décalage d'une
base à la fois, hormis aux extrémités de l'hélice, chaque base appartient donc
simultanément à 3 triplets (voir Tableau 3.2). Il n'y a donc pas de phase de lecture à
identifier. Ce type de code est dit chevauchant. Ce code était donc très efficace
puisque le ratio bases/acides aminés tend vers 1 quand le nombre, de bases tend
vers N.
Toutefois, s'il peut coder chaque acide aminé, ce code n'est pas capable de coder
chaque suite de 2 acides aminés (dipeptides). En effet, pour 20 acides aminés, il
existe 202 = 400 dipeptides. Sur le diamond code, un dipeptide est codé par 4
paramètres (une base sur le premier brin d'ADN, 2 paires de bases appariées et une
seconde base sur le second brin). Le diamond code ne peut donc coder que pour
44 = 256 dipeptides. Il ne peut donc générer qu'une variété réduite de séquences
58
Chapitre 3
d'acides
Différentes Modélisations
aminés.
Il
fût
définitivement
abandonné
lorsque
Crick
identifia
expérimentalement dans les protéines des suites d'acides aminés ne pouvant être
générées par le diamond Code.
Tableau 3.2 : Symétries du code diamant trié en 20 classes, indiqué ici
par 20 couleurs. Chaque classe Spécifie un acide aminé
Gamow proposa alors encore deux codes possibles, [9], [10], ayant la
propriété de chevauchement, mais le fait que le chevauchement soit utilisé dans la
nature fut remis en question (notamment par le fait que la mutation d'une base aurait
transformé 3 acides aminés), puis les travaux de Sydney Brenner [11] ont
définitivement exclus la possibilité d'un code de chevauchement. En effet, Brenner a
fait décoder une séquence, puis l'a à nouveau fait décoder après avoir muté un
unique nucléotide. Comme les 2 protéines synthétisées ne différaient que d'un acide
aminé, le code génétique ne pouvait pas avoir la propriété de chevauchement. Sans
chevauchement, il se pose le problème de la phase de lecture. En partant du
principe que chaque acide aminé est codé par un trinucléotide, il y a trois phases de
lecture possibles, et une seule est valide. L'ARNt, devant se fixer sur l'ARNm pour
obtenir l'acide aminé, devait donc être capable de trouver la bonne phase de lecture.
Pour éviter se problème, en 1957 Crick soumit l'hypothèse que, comme il y avait 20
acides aminés, seuls 20 triplets étaient valides, les autres n'étant pas porteurs
d'informations pour l'ARNt. Il fallait donc trouver un code tel que :
•
Il contienne 20 triplets (ou codons).
•
En plaçant 2 codons quelconques l'un derrière l'autre, les codons lisibles en
phases décalées n'appartiennent pas au code.
59
Chapitre 3
Différentes Modélisations
3.3. Modèle de Wittmann (1963) :
En étudiant le code génétique du virus mosaïque du Tabac, [12], Wittmann a
déduit son modèle d’octets dans lequel les 64 codons possibles sont répartis en
huit octets de huit triplets chacun.
En effet, dans cette construction, Wittmann a considéré le phénomène de
déamination induit par l’acide nitrique et formula les conversions de bases suivantes :
U →U , C →U
, G → (X ) → G
, A → (H ) → G
(3.1)
où X : Xantine et H : Hypoxantine sont deux bases mineures de propriétés de
liaisons H très similaires à celles de G.
En partant de là, on pourrait commencer avec des sous-ensembles contenant
seulement A et/ou C, c'est-à-dire seulement les bases qui produisent une mutation
lors de la déamination, et ensuite pour chaque membre de ces sous-ensembles,
construire les autres co-membres en utilisant ces règles.
Par exemple, dans le cas de l’ensemble des 4 bases (k=1), le sous-ensemble
est celui constitué des 2=21 bases C et A. En effet, C mute en U et A en G, tels que
les deux doublets de Wittmann sont :
WD1 : C → U
et
WD2 : A → G
(3.2)
2
Dans le cas k=2, le sous-ensemble contient les 4=2 doublets contenant C
et/ou A : CC, CA, AC et AA. Les autres (12) doublets sont obtenus simplement par
l’entremise des règles de mutation précédentes. Ce processus nous permet d’obtenir
les quatre quartets de Wittmann Qi, i=1-4 :
Enfin, dans le cas k=3, le sous-ensemble de départ est celui contenant les
3
8=2 combinaisons de C et A : AAA, AAC, ACA, CAA, ACC, CAC, CCA et CCC.
Chacun de ces triplets sera le membre générateur d’une série de 7 triplets par le
biais des règles de mutation de Wittmann. On obtient finalement les huit octets de
Wittmann
i,
i=1-8, qui renferment en eux la totalité des 64 codons du code
génétique standard selon une classification particulière reposant sur une propriété
60
Chapitre 3
Différentes Modélisations
physico-chimique : la mutation des bases lors de la déamination. Ici bas, on
donne comme exemple l’octet
2
:
3.4. Modèle de Rumer (1966) :
Dans son modèle, [13], Rumer considère la transformation suivante :
UCAG ↔ GACU
(3.3)
qui lui permet de partager l’ensemble des 64 codons en deux sous-ensembles M1 et
M2 formés de 32 codons chacun, se transformant l’un dans l’autre par le biais de
cette transformation et brisant de ce fait le nombre de dégénérescence six.
Cette symétrie a été plus tard étendue, [14]-[16], et une étude de la théorie
des groupes sous-jacente a été élaborée par d’autres auteurs (Voir par exemple
§3.12).
3.5. Modèle de Finkley (1982) :
L’approche de Findley, [17], à la description de la dégénérescence repose sur
des arguments empiriques traités dans le cadre de la théorie de groupe. En effet, soit
l’ensemble des bases ribonucléiques définit comme suit :
chaque triplet de
constitue un sous ensemble de
relation qui existe entre
et
= {U, C, G, A} , où,
(64 codons). Toutefois, la
peut être réalisé par le produit cartésien, tel que :
= × ×
(3.4)
De plus, la correspondance entre l’ensemble des triplets
acides
aminés A= {20 acides aminés + codon stop} est
réalisé
et l’ensemble des
par
l’application
surjective f :
f : →A
(3.5)
Cette correspondance est représentée explicitement dans le tableau 3.3, ce
dernier est appelé le code génétique Standard (CGS). La nature surjective de cette
application délimite la dégénérescence du CGS, c'est-à-dire, un acide aminé peut
être indiqué par plus d'un codon, ou une image (un élément de A ) peut avoir plus
d'un pré-image (éléments de ζ ).
61
Chapitre 3
Différentes Modélisations
Sous certaines conditions, [18], le code génétique peut être vue comme une
relation plutôt qu’une application, c'est-à-dire, un codon spécifie plus d'un acide
aminé. Gatlin, [19], a suggéré que la nature ambiguë intrinsèque d’une relation peut
être projetée via l’introduction d’un contexte biologique spécifique (CBS) dans lequel
l’interprétation du code génétique s’opère. De plus, le code génétique doit être
caractérisé par une relation R , tel que :
R ⊂ζ ×A
(3.6)
R étant un sous-ensemble propre de ζ × A
Table 3.3:
DECOMPOSITION D0
pour formaliser la dégénérescences du CGS, il est nécessaire de introduire une
décomposition D0 de ζ , tels que :
D0 = {ζ k , k ∈ β }
et
k
= {( ijk ) ∈
i, j et k ∈
}
(3.7)
i, j et k désignent la première, la deuxième et la troisième base du codon ( ijk )
respectivement.
La décomposition D0 partitionne ζ en quatre sous ensembles disjoint (16 éléments),
chaque sous-ensemble contient seulement les codons ayant la même troisième base
(tableau 3.3). On remarque que :
f (ζ U ) = f (ζ C ),
f (ζ A ) ≠ f (ζ G ).
(3.8)
L’analyse de la dégénérescence du CGS (décomposition D0 ) se fait par :
F1 = {(α , β ) ∈ ζ × ζ f (α ) ∈ f (ζ U ), f (β ) ∈ f (ζ C )}
(3.9)
F2 = {(α , β ) ∈ ζ × ζ f (α ) ∈ f (ζ A ), f ( β ) ∈ f (ζ G )}
(3.10)
62
Chapitre 3
Différentes Modélisations
F1 et F2 sont deux sous ensembles mutuellement exclusives pour une paire de
codons
doublement
dégénérer.
En
d'autres
termes,
ils
définissent
une
correspondance un à un, d’un membre d’une paire de codons doublement dégénéré
à l’autre membre. En effet, une caractérisation analogue peut être fait pour les
dégénérescences de l’ordre 2, 4 et 6, c’est-à-dire pour chaque paire en a une
correspondance 1 à 1. En résumé,
les dégénérescences paires (2, 4 et 6) des
codons obéissent aux conditions nécessaire (mais pas suffisantes) suivantes :
-
Ordre 2 : deux codons sont doublement dégénérés, s’ils forment une paire qui
est un élément soit de F1 ou F2 .
-
Ordre 4 : quatre codons sont quatre fois dégénérés, si deux codons forment une
paire qui est un élément de F1 et les deux autre forment une paire qui est élément
de F2 .
-
Ordre 6 : six codons sont six fois dégénérés, si deux codons forment une paire,
qui est un élément de F1 et deux autre forment une paire qui est élément de F2 et
les deux restant forment une paire qui est un élément soit de F1 ou F2 .
Enfin, si le SGC est supposé exacte, les dégénérescences d’ordre impair (1 et 3)
suggèrent qu'un changement évolutionnaire du code génétique a produit de légère
déviation de la symétrie décrite précédemment.
-
Ordre 3 : Soient, Ile = ( AUU, AUC, AUA ) et TC = ( UAA, UAG, UGA ) l’ensembles
des codons triplement dégénérés, chaque sous ensembles de deux paire de
codon peuvent être caractérisé comme étant doublement dégénérés, tels que :
Se décompose
Ile 
→ ( AUU, AUC ) ∈ F1
Soit (UAA, UAG) ∈ F2
Se décompose
→
TC 
Ou (UGA, UAG) ∈ F2
(3.11)
Cependant, les deux codons restant AUA et UGA, peuvent être considérés
comme deux singlets non dégénérés, notés :
f ( AUA ) = Ile∗
-
et
f (UGA) = TC∗
Ordre 1 : Les deux singles restant Met = AUG et Trp = UGC Sont associés aux Ile* et
le TC* , pour donné une paire de codon doublement dégénéré, tels que :
( AUG, Ile )
∗
(
et UGG, TC∗
63
) }∈F
2
(3.12)
Chapitre 3
Différentes Modélisations
Dans ce qui suit nous allons construire d'autres décompositions de ζ qui
peuvent avoir des symétries caractéristiques semblables à D0 toute en supposons
que le code génétique standard non exacte et les symétries impaire exacte, d’où
l’apparition du code génétique généralisé. Ceci nous mène à postuler des relations
spécifiques qui obéissent à des conditions nécessaires (mais pas suffisantes) pour la
dégénérescence de codon, [20], tels que :
R1 = {(α , β ) ∈ ζ × ζ | α ∈ f (ζ U ) et β ∈ f (ζ C )}
(3.13)
R 2 = {(α , β ) ∈ ζ × ζ | α ∈ f (ζ A ) et β ∈ f (ζ G )}
(3.14)
Il est bien clair, que R1 et R2 sont dérivés F1 et F2 respectivement, On peut
maintenant traiter la dégénérescence du CGG de la même manière que le CGS, on
remplaçons F1 et F2 par R 1 et R 2 , avec :
F1 ⊂ R1 et F2 ⊂ R 2
(3.15)
Remarque
D0 c est une partition adéquate à l étude des dégénérescences du code génétique
standard, d autre codage alternatifs nécessitent d autres partions Di de ζ qui ont des
symétries caractéristiques semblables à D0 sous l application f et qui permettent la
construction des ensembles F1 et F2 .
Considérons maintenant un groupe B muni d’une loi de composition interne
noté multiplication, tel que B = B × B × B . Le nombre d'éléments de ζ qui s’applique à
travers une application ( ζ ,B, f
)
surjective, est donnée par le cardinal de ζ diviser
par l'ordre du groupe B, (i.e, 64 4 = 16 ). Étant donné que B doit être un groupe d'ordre
4, il existe seulement deux types de groupe abélien d’ordre 4, [21] :
•
Le groupe de Klein d’ordre 4 représentée par :
V : a, b, a 2 , b 2 , ab = ba ,
•
V : 1, a, b, c = ab
(3.16)
Le groupe de Cyclique d’ordre 4 représentée par:
Z4 : d , d 4 ,
Z4 : 1, d , e = d 2 , f = d 3
(3.17)
Pour trouver la décomposition de ζ , on doit définir un ordre d’isomorphisme
entre l’ensemble B et V ou Z 4 . En général, il y a 4! = 24 isomorphismes pour chaque
groupe, ce qui fait un total de 48. Cependant, on constate qu'il y a 12 isomorphismes
64
Chapitre 3
distincts
Différentes Modélisations
pour Z 4 et seulement 4 pour V (Tableau 3.4), d’où ils résultent sept
partitions possibles.
Tableau 3.4 : Ordre d’isomorphismes entre B
V, Z4
Nous sommes maintenant en mesure pour étudier la nature des partitions
D1 ,..., D7
sous l’application f (Tableau 3.5). Par
analogie avec l’élude faite ci-
dessus, on constate l’existence de trois correspondances possibles L1, L2 , L3 pour les
décompositions D1 ,..., D7 , tels que :
Soit f ( d1 ) = f (ζ U ) ⇔ f ( d 2 ) = f (ζ C )
L1 applicable à D1 , D2 et D3 ⇒ 
Ou f ( d1 ) = f (ζ A ) ⇔ f (d 2 ) = f (ζ G )
Soit

Ou
L2 applicable à D4 et D5 ⇒ 
Ou
Ou
Soit

Ou
L3 applicable à D6 et D7 ⇒ 
Ou
Ou
(3.18)
f ( d1 ) = f (ζ U ) ⇔ f (d 2 ) = f (ζ C )
f ( d1 ) = f (ζ A ) ⇔ f (d 2 ) = f (ζ G )
f ( d1 ) = f (ζ U ) ⇔ f (d 2 ) = f (ζ A )
(3.19)
f ( d1 ) = f (ζ C ) ⇔ f (d 2 ) = f (ζ G )
f ( d1 ) = f (ζ U ) ⇔ f (d 2 ) = f (ζ C )
f ( d1 ) = f (ζ A ) ⇔ f (d 2 ) = f (ζ G )
f ( d1 ) = f (ζ U ) ⇔ f (d 2 ) = f (ζ G )
f ( d1 ) = f (ζ C ) ⇔ f (d 2 ) = f (ζ A )
65
(3.20)
Chapitre 3
Différentes Modélisations
Label
Order
Isomorphism
D1
V-1 , V-2 ,
V-3 , V-4
D2
Z4-1 , Z4-2
D3
Z4-3 , Z 4-4
D4
Z4-5 , Z 4-6
D5
Z4-7, Z4-8
D6
Z4-9, Z4-10
D7
Z4-11, Z4-12
U
CAG
UCC
UAA
UGG
UUU
UAG
UCC
UAA
CAA
UUU
CAG
CGG
UAA
UGG
CCC
AUC
GAA
GCC
UGG
UUU
CAG
UCC
UAA
GUU
GGG
GUC
AGG
UAA
ACC
UUU
CAG
UCC
AUU
UGG
AAA
C
UAG
CUU
CGG
CAA
CCC
CAG
CUU
UAA
UGG
CCC
UAG
UCC
CGG
CAA
UUU
UAG
CUU
CGG
ACC
AAA
GUC
AGG
AUU
CAA
CCC
UAG
CUU
GCC
CAA
GGG
CAU
GAA
CGG
GUU
CCC
A
GUC
AGG
AUU
ACC
AAA
GUC
GAA
AUU
ACC
GGG
AUC
AGG
GCC
GUU
AAA
GUC
AGG
AUU
CAA
CCC
UAG
CUU
ACC
ACC
AAA
CAG
UCC
AUU
UGG
AAA
GUC
AGG
UAA
ACC
UUU
G
AUC
GAA
GCC
GUU
GGG
AUC
AGG
GCC
GUU
AAA
GUC
GAA
AUU
ACC
GGC
CAG
UCC
UAA
GUU
GGG
AUC
GAA
GCC
UGG
UUU
AUC
GAA
CGG
GUU
CCC
UAG
CUU
GCC
CAA
GGG
Tableau 3.5 : CODE GÉNÉTIQUE GÉNÉRALISÉ
Remarque
Chaque codon représente toutes les permutations possibles de ses trois bases. Par
exemple, CAG représente CAG, AGC, GCA, ACG et GAC.
Par conséquent, L1 implique une correspondance un à un, similaire à celle vue
dans le cadre du code génétique standard (CGS). Ainsi, les mêmes discutions et les
mêmes résultats de la partition D0 sont valables pour les décompositions D1 , D2 et D3 .
D’où L1 est plus faible que L2 ( L1 ⊂ L2 ) ou L3 ( L1 ⊂ L3 ) .Cependant, l’étude
de la
symétrie de L2 et L3 impliques des contraintes de dégénérescence d'ordre 4 et 6. Il
suit alors que la dégénérescence de l'ordre 4 est indiquée uniquement en admettant
66
Chapitre 3
que
Différentes Modélisations
deux des implications L2 ou
L3 exacts simultanément. De même, la
dégénérescence de l'ordre 6 est indiquée uniquement en admettant que les trois des
implications L2 ou L3 exacts simultanément.
3.6. Modèle de Hornos et al (1993-2004) : voire chapitre 4
3.7. Modèle de Sorba et al (1998-2004) : voire chapitre 4
3.8. Modèle de Duplij (2000) :
L’approche de S. Duplij, [22]-[24], repose sur l’étude les symétries existant
entre les purines et les pyrimidines. Considérons d’abord, un doublet de nucléotide
noté XY, où: X ,Y ∈{C , G,U , A}, il en résulté alors 16 familles de doublets, [25]. Ces
derniers sont répartis en 2 octets (Figure 3.2) comme suit : 8 doublets CC, AC, GC,
CU, GU, UC, CG, GG détermines l'acide aminé indépendamment de la troisième
base (partie supérieure dans le code rhombique), appelés doublets forts et les 8
doublets
AA, AU, UU, CA, GA, UG, AG, UA (partie inférieure dans le code
rhombique), appelés doublets faibles.
Figure 3.2 : Code Rhombique
On remarque qu'il y a seulement un A dans l'octet fort, et un C dans l'octet
faible, et que chacun des 4 doublets avec Y=C détermine complètement l'acide
aminé, mais seulement 2 doublets avec Y=G le déterminent complètement, alors que
les doublets avec Y=A ne déterminent jamais l'acide aminé. Généralement la
transition de l'octet « puissant » à l'octet « faible » peut être obtenue par l'échange
∗
[25], [26], C ←
→ A,
∗
G ←
→ T , appelé inversion purine-pyrimidine. Ainsi, les
quatre nucléotides peuvent être organisé dans l'ordre décroissant suivant :
Pyrimidine
C
très "fort"
Purine
G
Pyrimidine
T
"fort"
"faible"
67
Purine
A
très "faible"
Chapitre 3
Différentes Modélisations
En effet, les quatre nucléotides sont représentés par deux vecteurs (matrice
ligne / colonne) notées V et VT, respectivement, [22], tels que :
(4)
 V1   C 
 
3
V
 G( ) 
,
V = 2=
 V3  T ( 2) 

  
 V4   A(1) 
(
V T = C ( 4)
G (3) T ( 2 )
A(1)
)
(3.21)
où, l'index supérieur du nucléotide correspond au degré déterminatif. Par suit, le
produit extérieur V ×V T , donne la matrice des doublets, définit comme suit, [23] :
 C (4)C (4) C (4)G (3) C (4)U (2) C (4) A(1) 
 (3) (4)

G (3)G (3) G (3)U (2) G (3) A(1) 
G C
T
M = V × V =  (2) (4)
U (2)G (3) U (2)U (2) U (2) A(1) 
U C
 A(1)C (4) A(1)G (3) A(1)U (2) A(1) A(1)



(3.22)
Cette dernière, coïncide entièrement avec la matrice canonique correspondant au
code rhombique
(Figure 3.2), si et seulement si le vecteur V prend l’ordre
déterminatif C, G, U, A. De même, un modèle analogue pour le code génétique peut
être construit par le biais du triple produit extérieur, on a alors : K = V × M . De ce fait,
nous obtenons l'ensemble des matrices tridimensionnel de tous les triplets, ainsi
chaque codon (excepté les trois codons stop) correspond à un acide aminé. On
définit, le degré déterminatif du triplet XYZ, comme suit :
d XYZ = d codon = d X + dY + d Z ⇒ 3 ≤ d XYZ ≤ 12
(3.23)
Nous pouvons également définir le degré déterminatif de l’acide aminé en tant
que valeur arithmétique moyenne d AA = ∑ d codon ndeg , ou ndeg, correspond à sa
dégénérescence (Tableau 3.6).
Tableau 3.6 : les valeurs moyennes
des acides aminés.
68
Chapitre 3
Différentes Modélisations
Les acides aminés peuvent se divise en deux classes, [27], selon leur énergie
d'interaction : le premier groupe Pro, Ala, Gly, Arg, Cys, Trp, Ser, Thr correspond au
niveau énergique supérieur 150-170 kJ/mole par codon (en moyenne), et le
deuxième groupe Lys, Asn, Ile, Glu,Met, Tyr, Phe, Asp, Gln, Val, Leu, His correspond
au niveau énergique bas 88-92 kJ/mole par codon en moyenne. En comparant avec
le tableau 1 nous observons que le premier groupe a le d AA ≥ 8 , alors que le
deuxième groupe a le d AA < 8 (His et Thr sont des cas exceptionnels).
Dans ce qui suit, nous allons considéré une description numérique des
séquences d'ADN. Chaque brin de cette séquence est décrit par quatre nombres (nC,
nG, nT, nA) et (mC, mG, mT, mA), où nX est le nombre de nucléotide x dans un brin.
Ces derniers vérifient les conditions de complémentarité suivantes :
nC = mG , mC = nG , nT = mA , mT = nA
(3.24)
Les règles du Chargaff [28], dans une double hélice d’ADN, sont définit comme
suit :
1) N A + N G = N C + NT ,
3) N A = NT et NC = N G
2) N A + NC = NT + N G
4) Le coefficient de spécificité : v = N A + NT N C + N G
où, N A , N G , N C et NT , sont les quantités total des nucléotides A, G , C et T
respectivement, tel que : N X = nX + mX .
Par conséquent,
v=
nA + mA + nT + mT nA + nT mA + mT
=
=
nC + mC + nG + mG nC + nG mC + mG
(3.25)
On défini, un autre coefficient important K (le rapport des purines, par les
pyrimidines) :
n + nA
m + mA
Kn = G
, Km = G
(3.26)
nC + nT
mC + mT
ce qui satisfait a l’équation de complémentarité K n K m = 1 . Le degré déterminatif dans
chaque brin, est définit par :
d n = 4 . nC + 3 . nG + 2 . nT + 1 . nA
(3.27)
d m = 4 . mC +3 . mG + 2 . mT + 1 . m A
(3.28)
En effet, l’addition et la différence entre les deux brins est donné par :
7
3
d + = d n + d m = . N C +G + . N A+T
(3.29)
2
2
d − = d n − d m = nC + nT − nG − n A
(3.30)
Le sens biologique du degré déterminatif d est contenu dans les relations entre
purine pyrimidine suivantes :
69
Chapitre 3
Différentes Modélisations
1) La somme des degrés déterminatifs entre le brin matrice et le brin
complémentaire
dans
les
séquences
d’ADN,
est
exactement
7
3
égale : d + = . N C +G + . N A+T .
2
2
2) La différence des degrés déterminatifs entre le brin matrice et le brin
complémentaire dans les séquences d’ADN, est exactement égale, à la différence
entre les pyrimidines et les purines dans un seul brin :
d − = n pyrimidines − n purines ,
avec, n pyrimidines = nC + nT et n purines = nG + nA .
Dans ce qui suit, nous considérons le degré déterminatif des séquences d’ADN
dans les divers cas. Nous appelons une séquence d’ADN une mononucléotide, un
dinucléotide,
un trinucléotide, si un, deux ou trois nombres nX, sont distinct
respectivement du zéro. Les propriétés des séquences
mononucléotide sont
classifiées dans le Tableau 3.7.
Tableau 3.7 : l’ADN mononucléotide
Les séquences de mononucléotide qui codent la plupart des acides aminés Gly et
Lys ont d+ négatif, et les séquences de mononucléotide qui codent les acides aminés
Pro et Phe de type chimique semblable ont le d positif. De même, les séquences de
dinucléotide de la double hélice sont décrites dans le Tableau 3.8.
Tableau 3.8 : l’ADN dinucléotide
De même, les trinucléotides peuvent être classifiés de la même manière.
L'introduction du degré déterminatif nous permet de choisir des séquences d'ADN qui
ont une symétrie additionnelle. La séquence purine-pyrimidine est dit symétrique, si
et seulement si : d − = 0 ⇒ nc + nT = nG + nA ⇔ n pyrimidines = n purines , ceci implique que :
nc + nT = nG + n A ⇔ n pyrimidines = n purines
70
(3.31)
Chapitre 3
Différentes Modélisations
Par conséquent, la symétrie purine-pyrimidine a comme cas particuliers :
nC = nT
2) Antisymmetric DNA 
nT = nG
nC = nG
1) Symmetric DNA 
,
nT = nA
On remarque que l’ADN symétrique correspond à la troisième règle du Chargaff
appliquée à un seul brin simple, [29], [30]. Ainsi, il serait intéressant de comparer les
propriétés de transcription et d'expression des séquences d’ADN symétriques et
antisymétriques.
Un autre traitement peut être considéré dans l’étude de la symétrie purinepyrimidine, c’est-à-dire : en utilise la différence entre les nucléotides dans les deux
brins M x = nx − mx , ayant comme propriétés :
M C = −M G ,
Il en résulte que :
M T = −M A ,
d− = M C − M A = M T − M G
(3.32)
(3.33)
En effet, si on utilise la condition de la symétrie ( d − = 0 ), on obtient :
M C = M A,
MT = M G
(3.34)
À partir de laquelle, en peut donné une autre définition:
Une séquence d'ADN est dite une symétrie purine-pyrimidine, si la différence
du cytosine MC dans les deux brins égales à la différence de l'adénine MA (ou à
la différence du thymine MT dans les deux brins égales à la différence du
guanine MG).
3.9. Modèle du Québécium (2000) :
L’approche de P. Demers à la description du code génétique repose sur la
l'analyse et la symétrie, [31]. En mettant côte à côte le tableau des acides aminés et
celui des codons, nous obtenons le tableau (A et B) de ces 84 molécules biologiques
(biomolécules) en 3 strates avec les couleurs usuelles. Figure 3.3.
Les 3 tableaux que nous avons obtenus, de 20, 64 et 84 cases, répètent la
géométrie des strates 1, 2, 4 et de leur réunion. Quoique les objets classés soient
différents, les uns inertes, les autres biologiques, il y a des analogies et des affinités
d'ordre mathématique, outre les nombres d'objets. Dans le dernier tableau, le côté
des cases suit la progression 2, 4, 8, alors qu'une progression arithmétique suggère
2, 4, 6, 8. Pour que l'analogie soit complète, il faut intercaler, par interpolation, une
grille 6x6 de 36 cases, correspondant à la strate 3. Cette grille est vide. Figure 3.4.
71
Chapitre 3
Différentes Modélisations
Figure 3.3 : Acides aminés et codons réunis dans un tableau de 84 biomolécules en 3
strates. Les côtés des strates suivent une progression 2, 4, 8,
Figure 3.4 : Tableau des 84 molécules biologiques avec 36 cases vides
de la strate 3 intercalées. Total 120 cases dont 36 vides.
Nous proposons la conjecture que les 36 cases de la dernière figure
correspondent à autant de molécules d'importance biologique (biomolécules) restant
à découvrir. On peut voir dans le système du Québécium un modèle mathématique
unitaire de classification applicable aux entités fondamentales du monde minéral et
du monde biologique. Alors que la classification minérale est chose acceptée en
principe depuis longtemps, une classification biologique comparable est une
innovation. Mendeleïev et Seaborg ont pu fonder des prévisions sur la classification
existante, dont la classification biologique nouvelle est un prolongement. Il reste à
identifier quelles seraient ces molécules d'importance vitale et formant une catégorie
de 36.
72
Chapitre 3
Différentes Modélisations
3.10. Modèle de Cristea (2001-2002) :
Dans son modèle, [32]-[34], P. D. Cristea à considérer une représentation
tétraédrique des nucléotides Figure 3.5. Chaque base définit une direction dans
l'espace des représentations correspondant aux quatre vecteurs de bases
symétriquement placés l'un par rapport à l'autre, orienté vers l’un des coins du
tétraèdre. Dans le système de référence Figure 3.5, les vecteurs de bases normaux
sont :
r v
a=k
r
2 2r
6 r 1r
c=−
i+
j− k
3
3
3
ur
2 2r
6 r 1r
g=−
i−
j− k
3
3
3
r 2 2r 1r
t=
i− k
3
3
(3.35)
Le procédé est répété pour chacune des trois bases dans chaque codon, [35],
traitant chacune des trois bases comme des nombres de trois chiffres écrit dans la
deuxième base : le vecteur correspondant à la première , deuxième et la troisième
base sont
multipliées par 4, 2
et 1 respectivement. Par exemple, le vecteur
v v uv
représentant le codon ATG qui code la méthionine est donné par : 4a + 2t + g
Figure 2: Représentation tétraédrique du code génétique
Cette représentation respecte l’ordre de la dégénérescence du code génétique.
73
Chapitre 3
Différentes Modélisations
3.11. Modèle de Jiménez (2002) :
Dans ce modèle, [36], [37], le code génétique est
représenté par un
hypercube booléen à six dimensions dans lequel les codons (vecteur à 6 binaire)
occupent les sommets (noeuds) voire Tableau 3.9. Cette structure est le résultat de
l'ordre hiérarchique des énergies d'interaction des bases dans l'identification de
codon-anticodon, [38]. De plus, chaque base est spécifiée par deux catégorisations
indépendantes Figure 3.6 :
ü selon son type chimique C:{R, Y}, où R:(A, G) sont les purines et le Y:(C, U) sont
les pyrimidines.
ü selon ses liaisons d’hydrogène, H:{W, S}, où W:(A, U) sont faibles et S:(C, G)
bases fortes.
Figure 3.6 : Catégorisations des bases
où, α , β et
sont les transformations des bases, [39], [40].
Les bases sont représentées par des noeuds de 2-cubes Figure 3.6. La
première attribution décrit le caractère chimique et la seconde les liaisons
d'hydrogène. On prolongeant cette association aux triplets de bases Tableau 3.9, on
constate que chaque codon est associé d'une manière unique à un code-mot
(composé de six valeurs), tels que, les deux premiers chiffres correspondent à la
première base, les deux suivants à la deuxième base et les deux derniers à la
dernière base, selon la codification binaire des bases Figure 3.6.
Remarque : Dans ce qui suit, les 20 acides aminés sont représentées par : A(Ala),
P(Pro), V(Val), G(Gly), T(Thr), S(Ser), L(Leu), R(Arg), D(Asp), E(Glu), M(Met),
I(Ile), F(Phe), C(Cys), W(Trp), H(His), Q(Gln), N(Asn), K(Lys) et Y(Tyr).
74
Chapitre 3
Différentes Modélisations
Tableau 3.9 : Représentation binaire du code génétique
Par conséquence, ces valeurs peuvent être schématisées comme suit :
Figure 3.7 : La représentation hypercubique du code génétique
Les différentes bords de l’hypercube se relient entre eux par :
AGG ↔ AGC, AGC ↔ ACC, AGC ↔ AAC, UCC ↔ ACC, ACC ↔ GCC, GCC ↔ CCC,
CGC ↔ CAC, CAC ↔ CAG, CAC ↔ CUC, CAC ↔ GAC
3.12. Modèle de Négadi (2003) :
L’approche de T. Négadi à la description du code génétique repose sur le
principe de considérer une représentation en ensembles de k-plets en partant des
différents ensembles formés de singlets (k=1), de doublets (k=2) et de triplets (k=3),
75
Chapitre 3
Différentes Modélisations
de bases azotées {U/T, C, A, G} formant les séquences d’ARN/d’ADN. Ces
ensembles sont représentés par des matrices 2kx2k d’entrées les bases elles-mêmes
(k=1), les doublets de bases (k=2) ou les triplets de bases (k=3) respectivement.
En effet, dans son approche présentée dans, [41]-[44], T. Négadi a défini une
matrice 2x2, notée B, qui représente la brique de construction en bloc de l’ARN :
U C 
 ,
(3.36)
B = 
 A G
où les 4 bases possèdent une structure moléculaire générale du type : Cα N β H δ Oγ ,
tels que, Uracile :C4N5H50, Cytosine : C4N3H50
, Adénine : C5N5H5 , Guanine :
C5N5H5O aux quelles il leur a associé un nombre caractéristique :
nbase = Z Cα × Z Nβ × Z Hδ × Z Oγ
(3.37)
où ZC=6, ZN=7, ZH=1 et ZO=8 sont les numéros atomiques des atomes de carbone,
nitrogène, hydrogène et oxygène respectivement, telles que :
nU

 nC

n A
nG
= 4064256
= 3556224
(3.38)
= 130691232
= 1045529856
On remarque tout d’abord que les 4 valeurs obtenues sont toutes différentes,
ensuite que les 2 lignes de la matrice B représentent précisément les 2 doublets de
Wittmann (WD1, WD2), (Voir §3.3) et enfin que les base de la même colonne
possèdent le même nombre de liaisons H. En effet, on rappelle que U et A ont deux
liaisons H tandis que C et G ont en trois.
Concernant les 16 doublets de bases possibles XY, il en déduit une
représentation matricielle 4x4 du type :
 UU UC CU

 UA UG CA
D = B B =
AU AC GU

 AA AG GU

CC 

CG 
GC 

GG 
(3.39)
où le produit introduit, dit de concaténation, [42], est défini comme suit :
(M N )
ij ,kl
= (M )ik ( N ) jl = (M )ik ( N ) jl
(3.40)
Pour deux matrices M et N quelconques. Par concaténation, il s’agit juste de
juxtaposer les éléments de matrices. Le nombre caractéristique de chaque doublet
XY est obtenu en concaténant les nombres caractéristiques des bases
76
X et Y
Chapitre 3
Différentes Modélisations
respectivement. Ici aussi, on remarque d’abord que les 16 valeurs obtenues sont
toutes différentes, ensuite que les 4 lignes de la matrice D représentent précisément
les 4 quartets de Wittmann (Qi, i=1,2,3,4), (Voir §3.3) et enfin que les doublets de la
même colonne possèdent le même nombre de liaisons H.
Enfin, Pour obtenir la représentation matricielle des 64 (triplets) codons du
code génétique standard, il suffit de répéter l’opération précédente sur la matrice des
doublets de base. Dans ce cas, on obtient :
 UUU UUC UCU UCC CUU CUC CCU CCC 


 UUA UUG UCA UCG CUA CUG CCA CAG 
 UAU UAC UGU UGC CAU CAC CGU CGC 


 UAA UAG UGA UGG CAA CAG CGA CGG 
T = D B = B B B =
AUU AUC ACU ACC GUU GUC GCU GCC 


 AUA AUG ACA AGC GUA GUG GCA GCG 
 AAU AAC AGU AGG GAU GAC GGU GGC 


GAA
GAG
GGA
GGG
AAA
AAG
AGA
AGG


(3.41)
Ici aussi, à chaque codon XYZ on associe un nombre caractéristique obtenu
en concaténant les nombres caractéristiques des trois bases. De même, on
remarque que ces nombres sont tous différents, que les codons appartenant à la
même colonne ont le même nombre de liaisons H et que les 8 lignes de la matrice T
correspondent aux huit octets de Wittmann ( j, j=1-8) (Voir §3.3).
En voulant construire la séquence de groupes de symétrie décrivant cette
classification, T. Négadi utilisa la symétrie de Rumer et de Rumer-Konopel’chenko
(Voir §3.4). En effet, en étudiant les matrices d’adjacence des graphes
correspondant aux transformations de Rumer et de Rumer-Konopel’chenko des
différents éléments de Wittmann, Il déduise la chaîne de groupes de symétrie
suivante :
D8 ⊃ V ⊃ C 2
(3.42)
où C2 est le groupe cyclique d’ordre 2, V est le groupe de Klein (d’ordre 4) et D8 est
le groupe dihédral à huit éléments.
3.13. Modèle de Yang (2003) :
L’approche de C. M. Yang, [45], à la description du code génétique repose sur
la régularité chimique des quatre nucleobases (nucléotides) dans l’ARN. Par ailleurs,
l’état d’hybridation sp2 de l’atome d’azote dans les nucleobases (A, G, C, U) sont :
77
Chapitre 3
Différentes Modélisations
3, 2, 1 et 0, respectivement (Figure 3.8). Basé sur cette numérotation un nouveau
code réarranger est obtenue Tableau 3.10 et Figure 3.9.
Figure 3.8 : Les structures chimiques des nucleobases dan l’ARN
Tableau 3.10 : Le code génétique réarrangé
De plus, pour distinguer les symétries cachées dans le code génétique, une
série d'approches topologiques est effectuée. D'abord, en utilisant un sens
topologique simple et commun, le planisphère à trois dimensions dans la figure 2a
peut être représentée par un graphique Hamiltonien figure 2b. Dans ce graphique, la
relation interne entre les 16 doublets, [46], sont illustrées (chacun des 16 doublets
étant reliés à quatre autres doublets) cette connexité correspondant à un
78
Chapitre 3
Différentes Modélisations
changement d’une seul base (lettre) entre deux doublets voisins dans le code
génétique réarrangé.
Figure 3.9 : L’affichage des 16 doublets et leurs acides aminés
appropriés dans un graphe de type Hamiltonien.
Chaque sommet est relié à quatre autres sommets et chaque sommé
représente un doublet correspondant à ses acides aminés appropriés :
a) Les 16 doublets du code génétique réarrangé dans un espace tridimensionnel, où,
les quatre nucleobases sont placés dans la succession UCGA.
b) Un affichage tridimensionnel des 20 acides aminés correspondant aux 16
doublets. Quatre flèches noires illustrent le noyau formé à une certaine étape de
l’évolution, par cinq groupes de doublets (les acides aminés sont « A, P, V, G et T »)
(Yang, 2003). Des acides aminés dans la couleur bleue et bleu clair sont produits à
partir de l'expérience de Miller (Weber et Miller, 1981). « o » dénote des codons de
« arrêt ».
Remarque: Un cycle de Hamilton est un cycle qui inclut chaque sommet exactement
une fois (en d'autres termes, c'est un cycle d enjambement). Puisque, si une carte a
un cycle de Hamilton, alors il peut être quatre coloré (ou 4 colorable) (Figure 3.10).
Pour atteindre un graphique sphérique fermé, les 16 doubles illustrés dans la
Figure 3.9, sont réarrangés topologiquement par le biais de la rotation dans la
Figure 3.10. Cette forme sphérique montre non seulement la symétrie de la rotation
et le dispositif sphérique du code génétique, mais elle explique aussi dans un sens
79
Chapitre 3
Différentes Modélisations
visuel (graphiquement), pourquoi le code génétique a la possibilité individuelle pour
maintenir son intégrité.
Figure 3.10 : L’affichage Sphérique du Code Génétique.
On considérons à la fois le dispositif sphérique fermé avec le dispositif
symétrique de la rotation nouvellement identifié Figure 3.10, le code génétique dans
cet arrangement, peut être aisément repris par un modèle de polyèdre (quasi-28gon), Figure 3.11, [47]. Par conséquent, l’attribution et la distribution des acides
aminés autour d'un quasi-28-gon sont conformes à la contrainte générale de la
dégénérescence de même ordre, qui est la symétrie de base comme définie pour les
codons doublement dégénérés. En plus des codons dégénérés d’ordre 4 et 6, il y a,
deux ensembles de codons triplement dégénérés (Ile et Stop), et les deux codons
non dégénéré sont Met et Trp.
Figure 3.11 : polyèdre (quasi-28-gon)
80
Chapitre 3
Différentes Modélisations
Un quasi-28-gon indique clairement que des légères déviations de la symétrie,
se sont produites dans les positions des doublets Y/o, de C/W/o et M/I. En dépit des
codons dégénérés d’ordre impair, néanmoins, tout le nombre d'acides aminés à ces
positions demeure C-symétrique (Tableau 3.11). Notamment, les codons stop « o »,
ne sont pas totalement non-sens, mais permettent un compensateur pour la
distribution numérique des acides aminé et de la chaîne latérale C-atome le long d'un
axe évolutionnaire présumé du A à Y et de S à I/M, dans un quasi-28-gon model.
Tableau 3.11 : La symétrie dans la dégénérescence (distribution numérique)
3.14. Modèle Rako evi (2004) :
Dans cette approche, [48]-[53], M. M. Rako evi à étudier les acides aminés
dans un système 4x5 (quatre quintets et cinq quartets en même temps), de plusieurs
manières différentes c’est-à-dire par : le nombre de nucléons Tableau 3.12, la masse
moléculaire Tableau 3.13, par la règle de codon de (troisième- lettre, premiertroisième-lettre et premier-deuxième-lettre), [54], et par la polarité et le nombre
d'atome Tableau 3.14, [55]. Enfin, par le biais de nucléotides et les régularités et
l’équilibre des codons Tableau 3.15 et 3.16, [56].
Tableau 3.12 : la distribution harmonique des acides aminés
avec, a, b, c et d sont le nombre de nucléons dans 20 chaînes latérales d’acide
aminés, avec des isotopes différents : (H-1, C-12, N-14, O-16, S-32) pour a et b, (H-
81
Chapitre 3
Différentes Modélisations
2, C-13, N-15, O-17, S-36) pour c ; (H-2, C-13, N-15, O-18, S-36) pour d, et enfin M
est la masse moléculaire des acides aminés
Tableau 3.13 : La distribution de la masse
moléculaire
Tableau 3.14 : Les acides aminés
polaires et non polaires
Tableau 315 : la distribution du nombre de nucléotides
Tableau 3.16 : la distribution du nombre de codon
Cette étude met en évidence la structure harmonique caché du code
génétique, c’est-à-dire (il existe une état d’ordre entre ces différentes acides aminés),
mais avec des distinctions fonctionnelles logiques.
3.15. Modèle de Wilhelm-Nikolajewa (2004) :
Le modèle de T. Wilhelm et S. Nikolajewa, [57], se base sur une classification
binaire des purines et des pyrimidines, dénotés 1 et 0 respectivement, [58], [59]. Ce
qui implique
23 = 8 combinaisons possibles de trois chiffres binaires pour les
82
Chapitre 3
Différentes Modélisations
différents codons. Chaque combinaison (case) contient encore 8 possibilités, par
exemple le codon 000 (trois pyrimidines) représente les 8 codons : CCC, CCU, ...,
UUU, Tableau 3.17. Ainsi, les huit rangées et quatre colonnes sont suffisantes pour
placer 20 acides aminés.
Tableau 3.17 : Classification binaire du code génétique
Cette représentation illustre très bien l’importance de la troisième base dans le
codon (triplet), c’est-à-dire : dans la première colonne la complémentarité entre les
deux première bases garanties toujours 6 liaisons d’hydrogène (3 + 3 = 6 H) appelés
codon forts, [60], la troisième base n'a pas d'importance pour la détermination de
l'acide aminé correspondant. De même, dans la deuxième et la troisième colonne,
les deux premières bases garanties exactement 5 liaisons d’hydrogène (codons
mixtes), la troisième base est importante exactement pour la moitié des cas (s'il y a
une purine dans la deuxième position - moitié inférieure du tableau). Enfin, dans la
quatrième colonne les deux premières bases (A, U), impliquent seulement 4 liaisons
d’hydrogène (codons faibles), la troisième base est toujours nécessaire pour la
détermination du bon acide aminé.
3.16. Modèle de Sánchez (2004) :
Dans cette approche R. Sánchez, [61], à suggéré une représentation booléen
(binaire) duelle du code génétique en utilisant les nombres de liaison d'hydrogène, et
les types chimiques de bases : purines {A, G} et pyrimidines {U, C}. En effet,
83
Chapitre 3
Différentes Modélisations
l’algèbre de Boole ou le treillis booléen, des quatre bases est construit en
supposant que
les bases complémentaires dans le treillis sont les bases
complémentaires dans la molécule d'ADN (G C et A=U) Figure 3.12.
Figure 3.12 : Les diagrammes de Hasse des treillis booléen (A : Primal et B : dual)
La correspondance entre l'ordre du codon et les propriétés physico-chimiques
des acides aminés sont reflétées dans le diagramme de Hasse du code génétique
Figure 3.13. Cette structure, est équivalente à un hypercube booléen à six
dimension avec des sommets représentant les codons.
Figure 3.13 : Le diagramme de Hasse associé
au code génétique booléen.
Remarque : Les différents codons sont dénotés selon leur deuxième base. Les
noeuds sont : noir quand la deuxième base est U (acides aminés hydrophobes), et
gris foncé quand la deuxième base est G. gris quand la deuxième base est C, gris
clair quand la deuxième base est A comme deuxième base (acides aminés
hydrophiles), et les triplets UAA, UAG et UGA sont les codons stops.
84
Chapitre 3
Différentes Modélisations
Les treillis booléens obtenus reflètent un raccordement fort entre l'ordre du
code génétique et les propriétés physico-chimiques des acides aminés. Par ailleurs,
l'image symétrique d'un codon avec U comme deuxième base codant les acides
aminés hydrophobes est toujours un codon avec A comme deuxième base codant
les acides aminés hydrophiles. Par exemple, l'image symétrique de l'anti-chaîne
{GUG, UGG, GGU, GGA, AGG, GAG} dans le diagramme de Hasse Figure 3.13 est
l'anti-chaîne {CAC, ACC, CCA, CCU, UCC, CUC} en prenant les éléments un par un
comme image.
3.17. Modèle de Dragovich (2006) :
Dans cette approche, A. Dragovich, [62], à utilisé les propriétés de base des
nombres p-adic, [63], [64], pour décrire les aspects principaux de l’information dans
l'ADN et par conséquence dans le code génétique. Out d’abord, on commence par la
formulation d’un nouvel espace appelé l'espace de l'information génétique padic (espace muni d’une distance p-adique). En d’autres termes, un modèle 5adique est approprié pour l'ADN, où ses éléments de base sont les nucléotides (C, A,
T/U, G), liées aux chiffres (1, 2, 3, 4), respectivement. Par ailleurs, les séquences de
nucléotides de l’ADN peuvent s’écrire dans la représentation 5-adique, comme suit :
xi ≠ 0, N = 0 , n ∈ ¥
x = 5 N ( x0 + x1 5 + x2 52 + ... + xn 5n ),
(3.43)
Par exemple : la chaîne d’ADN a = ATGCAAGTGA, (n = 10), correspond au nombre
5-adique :
a = 2 + 3 · 5 + 4· 52 + 1 · 53 + 2 · 54 + 2 · 55 + 4 · 56 + 3 · 57 + 4 · 58 + 2 · 59
(3.44)
De même, Les codons peuvent être classifié dans des quadruplés et des doublets,
(Tableau 3.18 et 3.19), et ils sont décrits par la formule suivante :
x = x0 + x1 5 + x2 52
x0 , x1 , x2 ∈{1 , 2 , 3 , 4}
(3.45)
On remarque que :
ü
Les Codons avec les mêmes deux premiers chiffres ont des distances 5-adique
égaux 5-2. Explicitement, deux codons quelconques a0a1a2 et a0 a1b2 , ont comme
distance 5-adique :
d5 (a, b) = a0 + a15 + a2 52 − (a0 + a15 + b2 52 )
= (a2 − b2 ) 5
2
5
=5
5
−2
∀ a0 , a1, a2 , b2 ∈{1 , 2 ,3 ,4}, avec a2 ≠ b2 .
Ce qui mène à grouper les 64 codons dans 16 quadruplés.
85
(3.46)
Chapitre 3
Différentes Modélisations
ü Les groupes ci-dessus peuvent être considérés comme composés de deux
doublets : le premiers doublet b = a0a13 et le second d = a0a14. La distance 2adique entre les codons dans chacun de ces doublets est 1/2
1
1
, d 2 (c, d ) = | (4 − 2) 52 |2 =
(3.47)
2
2
ü Les quadruplés qui ont à la deuxième position le chiffre 1, ne se décomposent
d 2 (a, b) = | (3 − 1) 52 |2 =
pas en deux doublets. Chacun de ces quatre quadruplés correspond à celui de
quatre acides aminés différents.
ü Les quadruplés qui ont à la deuxième position du chiffre 2 se décomposent en
deux doublets. Chacun de ces huit doublets correspond à l'un des huit nouveaux
acides aminés différents.
ü Les doublets qui constitué les quadruplés, qui ont à la deuxième position le chiffre
3 ou 4 devient de plus en plus complexes et dépendent aussi des chiffres à la
première position. Les quadruplés avec les chiffres 13i, 43i, 14i et 44i, où i
(1,
2, 3, 4), sont stables et Ils n'ont pas de sous structure. Cependant, pour les
quatre autres combinaisons, les deux premiers chiffres dépendent de la nature du
codage (mitochondriale ou eucaryotiques), c’est-à-dire pour le code vertébrale
mitochondriale : les quadruplés avec les chiffres 23i, 33i, 24i et 44i, où i
(1, 2, 3
et 4), ne sont pas stables et ils se décomposent en doublets. Dans le cas du code
eucaryotiques : le quadruplet avec des chiffres 23i se désintègre en un seul Ile
triplets (231, 232, 233) et un Met-singlet 234, tandis que le quadruplet 34i se
décompose en un double et deux singlets différents.
Tableau 3.18 : Le code mitochondrial vertébral
86
Chapitre 3
Différentes Modélisations
Tableau 3.19 : Le code eucaryotiques
3.18. Modèle de White (2007) :
L’approche de M. White, [65], à la description du code génétique repose sur
une configuration géométrique des nucléotides dotés d’une symétrie maximale
(Rafiki map). Par ailleurs, les données attribuées au code génétique sont basées sur
la permutation des nucléotides, ce qui signifie qu’ils doivent être traité comme
indépendamment de la position. En effet, cette construction peut être réalisé en
adoptant les douze visages d'un dodécaèdre, une structure qui produit comme par
magie tous les 64 codons possibles, où le modèle de base de ce dernier est un
tétraèdre simple avec une base différente (U, C, G, A) à chaque sommet. (Figure
3.14)
Figure 1 : modèle de Rafiki
En résumé, le modèle de White est un outil général utile pour étudier
l’ensemble des données connu sous le nom de code génétique, parce qu'elle
apporte la symétrie maximum à sa structure. La préservation de l'ensemble de ces
éléments de symétrie dans la structure globale des données est instructive à une
vue appropriée du code génétique.
87
Chapitre 3
Différentes Modélisations
Références
[1] F.H.C. Crick and al: Nature 192, (1961)1227,
[2] M.W. Nirenberg and J.H. Matthaei, Proc. Nat. Acad. Sci. USA 47, (1961)1588,
[3] P. Lengyel and al, Proc. Nat. Acad. Sci. USA 47, (1961)1936,
[4] M.W. Nirenberg, Sci. Am. 208, (1963)80,
[5] M.W. Nirenberg and P. Leder: Science 145, (1964)1399,
[6] H.P. Ghosh and al, J. Mol. Biol. 25, (1967)275,
[7] G. Gamow, Possible relation between deoxyribonucleic acid and protein
structures , Nature 173, (1954)318.
[8] B. Hayes, (1998). The invention of the genetic code. American Scientist 86(1) 814.
[9] G. Gamow, (1954). Possible mathematical relation between deoxyribonucleic
acid and proteins. Det Klongelige Danske Videnskabernes Selskab, Biologiske
Meddelser 22, 1-13.
[10] G. Gamow, A. Rich and M. Ycas. (1956). The problem of
information transfer from nucleic acids to proteins. Advances in Biological and
Medical Physics, Vol.4, pp.23-68.New-York Academic Press.
[11] S. Brenner, (1957). On the impossibility of all overlapping triplet codes in
information transfer from nucleic acid to proteins. Proceedings of the National
Academy of Sciences of the U.S.A. 43, 687-694.
[12] H.G. Wittmann, Studies on the genetic code in Tobacco Mosaic Virus , in:
Informational macromolecules, A symposium, Eds H.J. Vogel, V. Bryson and J.O.
Lampen, Academic Press N.Y. and London, (1963)177,
[13] Yu. B. Rumer , About systemization of the codons of the genetic code , Dokl.
Acad. Nauk. SSSR, 167 (1966)1393-1394.
[14] B.G. Konopel’chenko and Yu. B. Rumer : The codon classification inside the
genetic code , Dokl. Acad. Nauk. SSSR, 223 (1975)471-474.
[15] V.I. Shcherbak, « Rumer s rule and transformation in the context of co-operative
symmetry of the genetic code », J. Theor. Biol., 139 (1989)271-276,
[16] V.I. Shcherbak, « Arithmetic inside the universal genetic code », Biosystems, 70
(2003)187-209.
[17] G. L. Findley, A. M. Findley, AND S. P. McGlynn, Symmetry characteristics of
the genetic code. Proc. Natl Acad. Sci. USA, Vol. 79, pp. 7061-7065, November 1982
[18] M. Yeas, (1969).The Biological Code (North-Holland, Amsterdam),
88
Chapitre 3
Différentes Modélisations
[19] L. L. Gatlin, (1972) Information Theory and the Living System. (Columbia Univ.
Press, New York), Ch. 6.
[20] G. L. Findley & S. P. McGlynn, (1979) Int. J. Quantum Chem, Quantum Biol.
Symp. 6, 313-327.
[21] W. Magnus, A. Karrass, & D. Solitar, (1976) Combinational Group Theory
(Dover, New York), 2nd Revised Ed.
[22] D. Duplij, S. Duplij: Symmetry analysis of genetic code and determinative
degree // Biophysical Bull. Kharkov Univ. -2000. - V. 488. 1(6). - P. 60–70.
[23] D. Duplij, S. Duplij, N. Chashchin , 2000. Symmetric properties of genetic
code. Biopolymers and Cell, 16:449-454.
[24] D. Duplij, S. Duplij, symmetry, determinative degree and DNA physics /
physics/0008231v1.
[25] U. B. Rumer, Sistematics of codons in the genetic codå // DAN SSSR. - 1968. V. 183. - N°1. - P. 225–226.
[26] U. B. Rumer, On codon sistematics in the genetic code // DAN SSSR. - 1966. V. 167. - N°6. - P. 1393–1394.
[27] Y. K. Nikolsky, Tricarboxylic acid cycle and genetic code // Biophysika. - 1983. V. 28. - N°1. - P. 133–134.
[28] M. Singer, P. Berg, Genes and genomes. - Mill Valley: University Science
Books, 1991. - 373 p.
[29] D. R. Forsdyke, Different biological species broadcast their DNAs at different
(C + G)
Wavelengths // J. Theor. Biol. - 1996. - V. 178. - P. 405–417.
[30] D. R. Forsdyke, Relative roles of primary sequence and (C + G)% in
determining the hierarchy of frequencies of complementary trinucleotide pairs in
DNAs of different species // J. Mol. Biol.- 1995. - V. 41. - P. 573–581.
[31] P. Demers, http://www.er.uqam.ca/nobel/c3410/quebecium.html
[32] P. Cristea, Genetic signals: An emerging concept, Proceedings of IWSSIP 2001
pp. 17-22, 2001
[33] P. Cristea, Genetic signal analysis, Proceedings of ISSPA 2001
The Sixth
International Symposium on Signal Processing and its Applications, Invited Paper,
Kuala Lumpur, Malaysia, August 13 – 16, 2001, pp. 703–706
[34] P. Cristea, Genetic signal representation and analysis, SPIE Conference BiOS
2002 -International Biomedical Optics Symposium, Functional Monitoring and DrugTissue Interaction, San Jose, USA, 19-25 January 2002, Conference 4623
89
Chapitre 3
Différentes Modélisations
[35] H. Gee, Junk Science, Draft of a journey into the genome: What’s there,
Nature, http://www.nature.com
[36] M. A. Jiménez-Montano,.(1994). On the syntactic structure and redundancy
distribution of the genetic code. BioSystems, 32: 11–23.
[37] M. A. Jiménez-Montano, C. R. de la Mora-Basanez, and T. Pöschel, On the
Hypercube Structure of the genetic Code preprint (1994).
[38] M. Eigen, Selforganization of matter and the evolution of biological
macromolecules, Naturwiss., 58, 465–523 (1971).
[39] J. Wong, The evolution of a universal genetic code, Proc. Nat. Acad. Sci. USA,
73, 2336–2340 (1976).
[40] M. Guéron, E. Charretier, M. Kochoyan, and J. L. Leroy, Applications of imino
proton exchange to nucleic acid kinetics and structures, in: Frontiers of NMR in
Molecular Biology., 225–238 (Alan R. liss Inc., 1990).
[41] T. Négadi, « Cracking the genetic code(s) with a modular degree : An algebraic
approach », Int. J. Quantum Chem. 91, (2003) 651-662,
[42] T. Négadi, « Rumer s transformation, in biology, as the negation, on classical
logic », Int. J. Quantum Chem. 94, (2003)65-74,
[43] T. Négadi, « On the symmetries of the 16 genetic code-doublets », Proceedings
of the XXIV International Colloquium on Group Theoretical methods in Physics, Paris,
15-20 July (2002), IOP Conference Series, GROUP 24 Physical and Mathematical
Aspects of Symmetries, Eds J.P. Gazeau, J.P. Antoine, S. Métens and J.Y. Thibon,
(2003)687-690,
[44] T. Négadi, « Symmetry groups for the Rumer-Konopel chenko-Shcherbak
Bisections of the genetic code and applications », Internet Electron J. Mol. Des. 3,
(2004)247-270 (http://www.biochempress.com),
[45] C. M. Yang, The naturally designed spherical symmetry in the genetic code, qbio/0309014
[46] M.O. Bertman, J.R. Jungck, 1979. Group graph of the genetic code. The
Journal of Heredity 70, 379-384.
[47] C. M. Yang, In a previous paper, http://preprint.chemweb.com/biochem/0306001
(Date/Time of upload: 8 June 2003/09:21:3
[48] M. M. Rako evi , 2004. A harmonic structure of the genetic code. J. Theor. Biol.
229, 463 – 465.
90
Chapitre 3
Différentes Modélisations
[49] M. M. Rako evi , 1997. Two classes of the amino acyl-tRNA synthetases in
correspondence with the codon path cube. Bull. Math. Biol. 59, 645–648.
[50] M. M. Rako evi , 1998a. The genetic code as a Golden mean determined
system. Biosystems 46, 283–291.
[51] M. M. Rako evi , 1998b. Whole-number relations between protein amino acids
and their biosynthetic precursors. J. Theor. Biol. 191, 463–465.
[52] M. M. Rako evi , 2002. Genetic Code: Alphanumerical Regularities Within a
Codon Determined Amino Acid Order. Glasnik of the Section of Natural Sciences of
Montenegrin Academy of Sciences and art (CANU) 14, 183-197.
[53] M. M. Rako evi , A. Joki , 1996. Four stereochemical types of protein amino
acids: synchronic determination with chemical characteristics, atom and nucleon
number. J. Theor. Biol. 183, 345–349.
[54] I. Z. Siemion, P. J. Siemion, 1994. The informational context of the third base in
amino acid codons. Biosystems 33, 139–148.
[55] O.V. Davydov, 1998. Amino acid contribution to the genetic code structure: endatom chemical rules of doublet composition. J. Theor. Biol. 193, 679–690.
[56] S. Marcus, 1989. Symmetry in the simplest case: the real line. Comput.
Math. Appl. 17, 103–115.
[57] T. Wilhelm, S. Nikolajewa, A New Classification Scheme of the Genetic Code,
J Mol Evol (2004) 59:598–605.
[58] W. M. Fitch, K. Upper, (1987) The phylogeny of tRNA sequences provides
evidence for ambiguity reduction in the origin of the genetic code. Cold Spring Harbor
Symposia on Quantitative Biology 52:759-767
[59] F. J. R Taylor, D. Coates (1989) The code within the codons. BioSystems
22:177-187.
[60] U. Lagerkvist, (1978) “Two out of three”: An alternative method for codon
reading. Proc. Natl. Acad. Sci. USA 75:1759-1762.
[61] R. Sánchez, E. Morgado, R. Grau, The Genetic Code Boolean Lattice, MATCH
Commun. Math. Comput. Chem 52, 29-46. (2004).
[62] B. Dragovich, A. Dragovich, A p-Adic Model of DNA Sequence and Genetic
Code, q-bio.GN/0607018 v1.
[63] F.Q. Gouvea, p-Adic numbers: An introduction, (Universitext), Springer, Berlin,
1993.
91
Chapitre 3
Différentes Modélisations
[64] V.S. Vladimirov, I.V. Volovich and E.I. Zelenov, p-Adic Analysis and
Mathematical Physics, World Scientific, Singapore, 1994.
[65] M. White, Maximum Symmetry in the Genetic Code: The Rafiki Map, Copyright
Rafiki, Inc. 2007.
92
CHAPITRE 4 :
Modélisations Algébriques
93
Chapitre 4
Modélisations Algébriques
4.1. Introduction
Ce chapitre, est consacré à l’étude des symétries présentes dans ce code
génétique. Ainsi, nous présentons deux modélisations algébriques (algèbres de Lie,
[7]-[10], et algèbre quantique, [25]-[32]) pour mieux décrire ces symétries.
4.2. La symétrie
Dans le langage courant, le mot symétrie signifie une correspondance
exacte en forme, taille et position de parties opposées. On parlera ainsi de la
symétrie entre un objet et son image dans un miroir. En géométrie, le terme symétrie
prend un sens plus général qui peut se définir comme suit : transformation qui ne
change ni la forme, ni les dimensions d'une figure, [1]. On peut remarquer que
le sens courant du mot symétrie correspond à un cas particulier de symétrie au sens
géométrique du terme, qui consiste à inverser les objets par rapport à un plan. En
physique, la définition d'une symétrie est semblable à sa consoeur géométrique mais
s'applique aux lois de la nature et non plus aux figures géométriques. Ainsi une
symétrie en physique est une transformation des variables du système - qui
peuvent être des variables géométrique ou plus abstraites - qui ne changent
pas la formulation des lois physiques. Une fois de plus, la symétrie selon le sens
commun est encore une fois le cas particulier d'une transformation qui consisterait à
remplacer les positions des différentes composantes d'un système physique par leur
opposé (transformation de x en -x). A noter que ce type très particulier de symétrie
porte un nom spécifique en physique : il s'agit d'une transformation de parité. On
distinguer différentes familles de symétries en physique (et en géométrie) :
•
Les symétries globales : La même transformation s'applique partout. Par
exemples : symétrie par rapport aux translations dans l'espace : la formulation des
lois physiques est indépendante de la position de l'observateur.
•
Les symétries locales : La transformation dépend de la valeur de la variable à
transformer, notamment, s'il
s'agit d'une transformation géométrique, cette
transformation va dépendre de la position. Si la nature est intrinsèquement invariante
ou symétrique pour certaines transformations globales ce n'est en général pas le cas
vis-à-vis des symétries locales. Par exemple : la translation locale du temps et de la
position. Cette transformation consiste à modifier, en chaque point de l'espace
temps, le point et l'instant de référence. Il peut paraître étonnant que les lois de la
physique restent invariantes après ce genre de transformation car elle met
94
Chapitre 4
Modélisations Algébriques
violemment à mal la notion même d'espace et de temps. Une symétrie locale est
également nommée une symétrie de jauge et les théories bâties sur de telles
symétries sont appelées des théories de jauge. Les travaux de H. Weyl ont donc
montré que la théorie de la relativité générale était une théorie de jauge. On appelle
champ de jauge un champ qui prend son origine dans les propriétés de symétrie de
jauge ou locale. Pour qu'une symétrie locale soit parfaite ou "exacte" il est
nécessaire qu'elle puisse être appliquée partout. Ceci implique que si l'on considère
deux points arbitraires dans l'espace, le respect de la symétrie locale va résulter en
la création d'un champ entre ces deux points. Comme ces deux points peuvent être a
priori n'importe quel point de l'espace, ils peuvent notamment être choisis aussi
éloignés que l'on souhaite l'un de l'autre.
Par conséquent, notre utilisation du terme « symétrie » en ce mémoire se
rapportera toujours à des symétries globales, (pas local).
•
Symétrie discrète et continue : Une symétrie est dite discrète lorsque
l'ensemble des opérations de transformation autorisées constitue un ensemble fini.
Par exemple les cristaux possèdent le plus souvent un groupe de symétrie discret
appelé groupe cristallographique. D'autres symétries discrètes sont importantes en
mécanique quantique: il s'agit des symétries de conjugaison de charge, de parité et
d'inversion du temps qui permettent d'exprimer le théorème CPT affirmant que toute
théorie quantique doit être invariante sous le produit de ces trois symétries. Par
contre, une symétrie est dite continue lorsque les paramètres qui la déterminent
varient de façon continue. C'est le cas de la symétrie de rotation qui est associée au
groupe de rotations dans l'espace par exemple. La structure mathématique qui décrit
le mieux les symétries continues est la théorie des groupes de Lie dont le groupe des
rotations est un exemple.
•
Symétrie exacte et brisée : On parle une symétrie brisée, [2], si elle est
seulement approximative, c'est-à-dire, il y a une déviation de la symétrie exacte, qui
est cependant suffisamment petite pour qu'elle demeure clairement perceptible. En
physique on dit qu'une symétrie est brisée, si après changement de certaines
caractéristiques du système, ce dernier ou les lois qui régissent son comportement
ne sont plus invariants sous la transformation associée à cette symétrie. En
générale, la brisure de symétrie se produit souvent en plusieurs étapes, plutôt qu’une
seule étape, c’est-à-dire en supposant que G est une séquence décroissante
95
Chapitre 4
Modélisations Algébriques
de sous-groupes G1 ,..., Gk , tel que :
G ⊃ G1 ⊃ ... ⊃ Gk
(4.1)
Cela nous conduit à un ensemble de séquences successives, où à chaque
étape une représentation irréductible du groupe précédent, se décompose en
plusieurs représentations irréductibles du groupe suivant de la chaîne. Enfin, nous
pouvons dire que les symétries sont associées à des dégénérescences, tandis que
la brisure de la symétrie conduit à la levée des dégénérescences.
Une symétrie est explicitement brisée lorsque la loi qui régit son
comportement est modifiée et n'est plus invariante. Une symétrie est brisée
spontanément lorsque les lois sous-jacentes sont invariantes sous la symétrie mais
que la réalisation particulière du système observé ne l'est pas.
4.3. Les symétries dans le code génétique
Il existe aussi des formes asymétriques. Un exemple classique d’asymétrie est
la structure de la molécule d’ADN qui contient le code génétique des êtres vivants.
•
La symétrie de la molécule d’ADN : La configuration de la molécule d’ADN peut
être vue comme une symétrie topologique, [3], c'est-à-dire le surenroulement de
cette molécule d’ADN se fait uniquement dans le sens inverse des aiguilles d’une
montre (sens lévogyre). Il est rare dans la nature de trouver des molécules qui
s’enroule dans le sens des aiguilles d’une montre (sens dextrogyre). Dans son état
habituel, les brins de la double hélice moléculaire décrivent un certain nombre de
tours autour de l’axe de l’hélice, où chaque tour (constitué de 10 nucléotides) à un
pas de 3,4 nm. Certaines enzymes peuvent augmenter ou réduire cet entortillement,
un peu comme on peut surenrouler ou sous-enrouler un fil de téléphone, ce qui
modifie sa forme. Qui plus est, dans un ADN circulaire, le nombre de tours de la
double hélice est une propriété topologique invariante : il ne peut être changé par
aucune modification de la forme de la structure, [4]. Ainsi, une question
fondamentale reste à posé est-ce que on peu simuler tous ces mécanismes
enzymatiques en utilisant les opérations de base introduites pour les n uds
mathématiques ? une autre question voisine, dans quelle mesure une classification
topologique des noeuds permet de remonter aux mécanismes enzymatiques.
•
La symétrie codon-anticodon : Les codons et leurs anticodons sont
symétriques par rapport à l’axe horizontal Rouge, [5], avec (G
C et A
exemple, le codon GGG est symétrique à l’anticodon CCC (voir Tableau 4.1).
96
U). Par
Chapitre 4
•
Modélisations Algébriques
Symétrie Purine-Pyrimidine : Les purines et les pyrimidines sont symétriques,
[6], par rapport à l’axe vertical rouge, avec (G
A, U
C). Par exemple, GGG est
symétrique avec AAA.
•
Symétrie codon-condon inverse : Soit ZYX un codon inverse du codon XYZ .
Les flèches rouges sur le tableau 1 indiquent de la symétrie entre les codons et
codons inverses. Par exemple, le CCU est inverse à UCC. Dans les lignes 1, 4, 5 et
8 des codons sont inversé directement par rapport à l’axe vertical.
•
Symétrie sens-antisens : Soit XYZ un codon sens et Z′Y′X ′ son anti-sens, ou,
les bases X′,Y′,Z′ sont les bases complémentaires des bases X,Y,Z , suivant la règle
de Watson et Crick (C-G et A-C) Par exemple, la CGU est un antisens du codon
d'ACG (tableau 4.1).
•
Point de symétrie de Halitsky : L'étoile dans le centre indique un point de
symétrie qui décompose le code génétique en deux familles symétriques l’une par
rapport à l’autre. Halitsky a constaté que par l’échange des bases (A C) et (G
U)
On obtient une cartographie de deux familles. Par exemple, la famille des codons GG
(A / G) de Gly dans le coin inférieur à gauche sont symétriques non à la famille des
codons UU (C / U) de Phe dans le coin supérieur à droit
Tableau 4.1 : Les Symétries dans le code génétique
On distingue aussi d’autres symétries :
-
Le code génétique établit toujours une correspondance entre les codons et
les acides aminés. On a 4.4.4 = 64 codons.
97
Chapitre 4
-
Modélisations Algébriques
La dégénérescence est toujours de l’ordre : 1, 2, 3, 4 ou 6, associés à 20
acides aminés.
-
Pour les codons XYZ formant un quartet, XY ne varie pas et c’est celui en
troisième place qui prendra la valeur A, C, G, T dans l'ADN, ou : A, C, G, U
dans l'ARN.
4.4. La brisure de symétrie dans le code génétique
Ce modèle fût un long projet de recherche d’algèbres de Lie et de
représentations pouvant servir à décrire le code génétique standard.
En effet, les auteurs ont proposé une approche algébrique au code génétique,
dont le but était d’expliquer les dégénérescences rencontrées dans le code
génétique comme étant le résultat d’une séquence de brisures de symétrie qui se
sont produites lors de son évolution, [7]-[14].
La première étape dans la recherche des symétries dans le code génétique
consiste à sélectionner une algèbre de Lie simple g et une représentation
irréductible de g sur un espace vectoriel de dimension 64. Une telle
représentation sera dorénavant appelée : représentation de codon.
La raison pour laquelle il a été exigé à cette représentation d’être irréductible
est qu’une représentation réductible est un objet composé et peut être exprimé en
une somme de composantes irréductibles. L’usage d’une représentation réductible
ne peut correspondre à un point de départ d’un processus de brisure de symétrie
mais plutôt à une étape postérieure dans laquelle un type de brisure aurait été déjà
opéré.
De même, seulement les algèbres de Lie simples sont considérées parce
qu’elles sont les blocs de construction d’algèbres de Lie semi-simples. En effet, une
algèbre de Lie semi-simple est la somme directe d’algèbres de Lie simples et pourrait
ainsi correspondre à une symétrie composée.
Par ailleurs, on sait qu’une algèbre de Lie générale se décompose en une
somme semi-directe d’une algèbre de Lie semi-simple et de son radical. De plus,
toute représentation irréductible d’une telle algèbre de Lie peut, sous cette
décomposition, s’écrire comme le produit tensoriel d’une représentation irréductible
de sa sous-algèbre semi-simple par une représentation unidimensionnelle de son
radical, [15]. Comme cette dernière ne contribue pas aux dimensions et aux
98
Chapitre 4
Modélisations Algébriques
multiplicités quand on calcule les règles de branchement, on peut supposer au
départ, sans aucune perte de généralité, que l’algèbre originale est semi-simple.
La détermination de toutes les représentations de codons est basée sur la
classification de Cartan (Tableau 4.2), à partir de laquelle, quatre séries d’algèbres
de Lie classiques différentes forment la classe des algèbres de Lie simples :
An = su(n+1) , Bn = so(2n+1) , Cn = sp(2n) , Dn = so(2n) ,
(4.2)
en plus des 5 algèbres de Lie exceptionnelles :
G2, F4, E6 , E7 , E8.
(4.3)
Le résultat obtenu montre que seulement les algèbres de Lie simples
suivantes admettent une représentation de codon :
su(2) , su(3) , su(4) , sp(4) , sp(6) , so(13) , so(14) , G2 , su(64) , so(64) , sp(64).
L’existence d’un nombre fini de représentations de codons s’explique par le
fait de la croissance monotone des dimensions des représentations irréductibles des
algèbres de Lie simples en fonction de leur rang. En effet, les algèbres de Lie de
rang supérieure à 64 ne sont pas prises en compte puisque la dimension de la
représentation de codons est bornée par cette limite supérieure, [16].
Tableau 4.2 : Classification de Cartan des algèbres de Lie simples
Après étude détaillée, la liste complète des représentations de codons est
résumée dans le Tableau 4.3 ci-dessous :
99
Chapitre 4
Modélisations Algébriques
Table 4.3 : Représentations de codons des algèbres de Lie simples
Les auteurs de cette approche algébrique se sont convenus d’éliminer les trois
dernières algèbres de Lie, i.e. C32 , D32 et A63, puisqu’elles possèdent un grand
nombre de générateurs et un nombre énorme de chaines possibles de sous-algèbres
maximales.
En partant d’une des représentations de codons des autres algèbres de Lie
de la Tableau 4.3, la première étape de l’analyse consiste à établir les règles de
branchement lors de la réduction de l’algèbre de Lie originale à une de ces sousalgèbres maximales. Pour cela, il est suffisant de considérer les sous-algèbres semisimples maximales, puisque, comme on l’a déjà cité plus haut, un centre non-trivial
possible ne contribue pas aux dimensions ou aux règles de branchement.
En utilisant la classification des sous-algèbres semi-simples maximales des
différentes algèbres de Lie simples, [17], [18], on obtient ce qui suit pour les algèbres
de Lie d’intérêt (Voir Tableau 4.4):
100
Chapitre 4
Modélisations Algébriques
Tableau 4.4 : Les sous-algèbres semi-simples maximales
de certaines algèbres de Lie
Notons ici que :
su (2) ≅ so (3) ≅ sp (2) ,
su (2) ⊕ su (2) ≅ so(4) ,
sp (4) ≅ so(5) ,
su (4) ≅ so(6) , et que la dernière colonne indique l’espace symétrique (ou
Grassmannienne) associé, [19] :
Séries A I : Espaces symétriques SU(n)/SO(n) associés à su (n) ⊃ so(n) ,
Séries A II : Espaces symétriques SU(2n)/Sp(2n) associés à su (2n) ⊃ sp (2n) ,
Séries A III : Grassmaniennes complexes SU(p+q)/SU(p)xSU(q) associées à
su ( p + q) ⊃ su ( p ) ⊕ su (q ) ,
Séries
BD
I:
Grassmaniennes réelles SO(p+q)/SO(p)xSO(q)
associées
à
so ( p + q ) ⊃ so ( p) ⊕ so (q) ,
Séries C I : Espaces symétriques Sp(2n)/U(n) associés à sp (2n) ⊃ su (n) ,
Séries C II : Grassmaniennes quaternioniques Sp(p+q)/Sp(p)xSp(q) associées à
sp ( p + q) ⊃ sp ( p ) ⊕ sp (q ) ,
101
Chapitre 4
Modélisations Algébriques
Séries D III : Espaces symétriques SO(2n)/U(n) associés à so (2n) ⊃ su (n) .
Les règles de branchement des représentations irréductibles sous de telles
réductions sont connues, [16].
Ce procédé de réduction de symétrie aux sous-algèbres maximales peut être
répété et mène à des chaines de sous-algèbres descendantes, chacune d’entre elles
est la sous-algèbre maximale de celle qui la précède.
Le problème rencontré à ce niveau est qu’il va falloir classifier les sousalgèbres semi-simples maximales des algèbres de Lie semi-simples et pas
seulement des algèbres de Lie simples. Pour cela, on utilise un théorème de Dynkin,
[17], qui dit que :
Les sous-algèbres semi-simples maximales g’ d’une algèbre de Lie semi-simple g
sont de deux types :
Ø Type simple : A un isomorphisme près, en incluant une permutation
appropriée des idéaux simples qui constituent g, on a g=g0 ⊕ g1 et g =g 0 ⊕ g1,
où g0 est un des idéaux simples de g, g1 est la somme directe des autres
idéaux simples de g et
0
est une sous-algèbre semi-simple maximale de g0 .
Ø Type diagonal : A un isomorphisme près, en incluant une permutation
appropriée des idéaux simples qui constituent g, on a g=g0 ⊕ g0 ⊕ g1 et g =g0 ⊕
g1, où g0 est un des idéaux simples de g qui apparait (au moins) deux fois dans
g, g1 est la somme directe des autres idéaux simples de g et l’inclusion de g0
dans g0 ⊕ g0 est diagonale, i.e. associant à tout X0 ∈ g0 l’élément (X0, X0) ∈
g0 ⊕ g0.
De ce fait, les chaines peuvent être classées dans soit des :
Ø chaines simples, Les chaines qui n’inclut pas une brisure à une sous-algèbre
de type diagonale à aucune étape,
Ø chaines diagonales : Les chaines qui inclut une brisure à une sous-algèbre de
type diagonale au moins au niveau d’une étape.
Dans leur approche originale, [7], [8], les auteurs se sont restreints aux
chaines simples, bien que l’inclusion des chaines diagonales qui a été accomplie
plus tard, [20], [21], ne change pas l’image finale obtenue.
Pour toute chaine, la distribution des multiplets obtenus doit être comparée à celle
observée dans le code génétique standard, résumée dans la Tableau 4.5. Plus
précisément, la stratégie adoptée est de procéder le long de chaque chaine
102
Chapitre 4
Modélisations Algébriques
étape par étape et de prendre le soin d’analyser, après chaque étape, si les
dégénérescences obtenues sont toujours compatibles à celles du code
génétique.
Tableau 4.5 : Dimensions et multiplicités dans le code génétique standard
Après avoir défini des règles de sélection qui permettent d’éliminer les chaines
qui ne vérifient pas la condition précédente à une certaine étape, et après une étude
détaillée des algèbres de Lie simples retenues (Voir partie supérieure de la Tableau
4.3), seules les huit chaines suivantes demeurent :
•
Chaine 1 : su(2)
•
Chaine 2 : sp(4) ⊃ su(2)
•
Chaine 3 : sp(4) ⊃ su(2) ⊕ su(2)
•
Chaine 4 : G2 ⊃ su(2) ⊕ su(2)
•
•
Chaine 5 : sp(6) ⊃ su(2)
Chaine 6 : sp(6) ⊃ su(2) x su(2)
•
Chaine 7 : sp(6) ⊃ sp(4) ⊕ su(2) ⊃ su(2) ⊕ su(2)
•
Chaine 8 : sp(6) ⊃ sp(4) ⊕ su(2) ⊃ su(2) ⊕ su(2) ⊕ su(2)
Il est maintenant facile de voir ce qui se passe quand le procédé de brisure de
symétrie continue au-delà de su(2) dans le sens d’une brisure d’une ou de plusieurs
des sous-algèbres su(2) à des sous-algèbres Abéliennes U(1). D’abord, il faut
vérifier qu’au moins une des sous-algèbres su(2) reste non brisée, sinon on va à
la fin obtenir 64 singlets. Ceci exclut immédiatement les chaines 1, 2 et 5. La chaine
3 est aussi exclue puisque le fait de briser une des deux sous-algèbres su(2) sans
briser l’autre va produire 24 multiplets (2 quintets, 4 quartets, 6 triplets, 8 doublets et
4 singlets). Quant aux chaines 4, 6 et 7, elles sont aussi exclues puisque :
ü Chaine 4 : Briser la première sous-algèbre su(2) sans briser la
deuxième va produire 18 multiplets (2 sextets, 4 quintets, 2 quartets, 4
103
Chapitre 4
Modélisations Algébriques
triplets et 6 doublets). Briser la deuxième sous-algèbre su(2) sans
briser la première va produire 30 multiplets (2 quartets, 8 triplets, 12
doublets et 8 singlets).
ü Chaine 6 : Briser la première sous-algèbre su(2) sans briser la
deuxième va produire 16 multiplets (2 septets, 6 quintets, 6 triplets et 2
singlets). Briser la deuxième sous-algèbre su(2) sans briser la première
va produire 24 multiplets (8 quartets, 16 doublets).
ü Chaine 7 : Briser la première sous-algèbre su(2) sans briser la
deuxième va produire 40 multiplets (4 triplets, 16 doublets et 20
singlets). Briser la deuxième sous-algèbre su(2) sans briser la première
va produire 15 multiplets (1 octet, 2 septets, 1 sextet, 2 quintets, 4
quartets, 2 triplets, 1 doublet et 2 singlets).
Enfin la chaine 8 est aussi exclue puisque la brisure d’une sous-algèbre su(2)
sans briser les deux autres va produire 24 multiplets (2 sextets, 4 quartets, 4 triplets,
10 doublets et 4 singlets).
D’où, en résumé, on conclut que : Il n’y a aucun genre de brisure de
symétrie à travers les chaines de sous-algèbres capable de reproduire
exactement les dégénérescences du code génétique.
Notons ici, que ce résultat est aussi valable même pour le cas des algèbres de
Lie simples de rang moyen so(13) et so(14), et même si on inclut les chaines
diagonales.
A ce niveau, et pour résoudre ce problème épineux, les auteurs se sont
inspirés d’une constatation biologique, qui était et qui demeure encore une énigme
non encore correctement élucidée à ce jour. En effet, durant la première décade
après la découverte du code génétique standard, il fût considéré comme universel,
bien qu’on sait maintenant qu’il ne l’est pas. Les déviations découvertes dans la
forme de codes génétiques non-standards sont minimes. Dans chaque cas, la
modification concerne seulement un petit nombre de relation codon-acide aminé et
ne s’applique que pour une classe restreinte d’espèces ou à des codes d’organelles
telles que les mitochondries et les chloroplastes, [22]. L’argument utilisé
généralement par les biologistes et les généticiens pour expliquer ce phénomène est
celui avancé par Crick lui-même, [23], quand il formula sa fameuse hypothèse de
« Frozen accident », selon laquelle le code génétique, après être passé par une
104
Chapitre 4
Modélisations Algébriques
phase primordiale d’évolution, fût à une certaine étape « gelé » en sa forme
observée présentement, c'est-à-dire quand la machinerie de synthèse des protéines
arriva à un stade de complexité tel que d’autres changements seraient devenus
létaux. Ainsi, l’universalité du code génétique fût une conséquence de ce « gel »
apparu très tôt lors de son évolution, bien avant la bifurcation des formes de vie en
différents royaumes. L’analyse des codes non-standards et de leurs origines réalisée
par Crick, pourrait alors être interprétée comme une évidence que le gel n’est pas
total, un certain type de fusion (melting) pourrait occasionnellement survenir. Mais
même si l’on accepte ces arguments, le simple fait que le code génétique a été gelé
à un certain stade de son évolution ne nous éclaire pas sur, par exemple, les lois qui
ont gouverné cette évolution avant que ce gel ne se produise. Une étude statistique
simple, [24], a montré que le nombre possible de codes génétiques est de l’ordre de
1071, dont la majorité n’exhibe aucun type de structure régulière. Ceci montre que
l’opération identification des lois qui ont gouverné l’évolution primordiale du
code génétique reste vraiment un défi à relever par les chercheurs.
A la base de cette constatation, les auteurs identifient exactement ce
problème à celui qu’ils ont rencontré dans leur approche algébrique. Ils postulent
alors que la dégénérescence observée du code génétique est une réflexion de
la symétrie primordiale qui, au cours de l’évolution du code génétique, fût
brisée en une séquence d’étapes. Un des principaux avantages de cette approche
est que les conditions de compatibilité avec une certaine symétrie s’abattent de façon
radicale sur le nombre de possibilités mentionnées auparavant, et menant à une
probabilité non négligeable pour que le code génétique standard soit ce qu’il est
maintenant. D’où cette approche algébrique s’apparente à l’hypothèse du gel.
En effet, dans cette approche, la procédure de brisure de symétrie a été généralisée
par l’introduction de certains opérateurs de Casimir associés aux chaines de sousalgèbres, qui permettent d’incorporer, de manière rigoureuse, le phénomène d’un gel
(partiel) du processus de brisure de symétrie durant la dernière étape, en
concordance avec l’hypothèse de Crick concernant l’évolution du code génétique.
Soit une algèbre de Lie semi-simple et une chaine descendante de sousalgèbres semi-simples :
g ⊃ g1 ⊃ g2 ⊃ ….. .
(4.4)
La distribution des multiplets obtenus par la décomposition successive d’une
représentation irréductible de g peut être encodée dans le spectre d’un opérateur H
105
Chapitre 4
Modélisations Algébriques
unique. Il peut être défini comme étant une combinaison linéaire générique
d’opérateurs de Casimir Cj associés aux sous-algèbres simples de g, qui constituent
en fait les sous-algèbres semi-simples g1, g2, …apparaissant dans la chaine :
H=
∑λ
j
Cj .
(4.5)
j
En effet, due à la chaine d’inclusion précédente, les opérateurs de Casimir
commutent entre eux, et pour un choix générique des coefficients
j,
les espaces
propres de l’opérateur H coïncident avec les espaces propres joints de l’ensemble
des opérateurs de Casimir, lesquels sont juste les sous-espaces irréductibles pour la
plus petite (la dernière) sous-algèbre dans la chaine.
En Physique, l’opérateur H n’est autre que l’opérateur Hamiltonien, les
opérateurs Cj représentent eux l’ensemble des invariants reflétant les différentes
sous-symétries présentent dans le système physique étudié, et enfin les coefficients
j
sont déterminés en les ajustant au spectre d’énergie observé expérimentalement.
Rappelons aussi, qu’après la première phase du processus de brisure de
symétrie, la dernière sous-algèbre dans la chaine est une somme directe de sousalgèbres su(2), de telle manière à ce que l’opérateur H associé à ce stade peut
s’écrire sous la forme :
H=
p
∑λ
j
Cj +
∑α
k =1
j
k
L2k ,
(4.6)
où p, le nombre total de sous-algèbres su(2) apparaissant à la fin de la chaine, varie
entre 1 et rang(g), selon la chaine considérée. Les opérateurs
Cj représentent
maintenant les opérateurs de Casimir associés aux sous-algèbres simples
différentes de su(2) qui constituent les sous-algèbres semi-simples g1, g2, …etc
présentes dans la chaine, tandis que l’opérateur L2k = L2k , x + L2k , y + L2k , z est l’opérateur
de Casimir standard de la kième sous-algèbre su(2) (1<k<p).
La seconde phase, qui inclut la brisure d’une ou de plusieurs des sousalgèbres su(2), sera caractérisée par un opérateur H tel que :
H=
∑ λ j Cj +
j
p
∑ α k L2k +
k =1
p
∑β
k =1
p
2
k Lk , z +
∑γ
k =1
k
Lk , z .
(4.7)
Pour bien comprendre l’effet des nouveaux termes, considérons le cas d’une seule
copie de su(2). En prenant en compte le fait que les représentations irréductibles de
su(2), qui sont caractérisées par leur spin s (correspondant au plus haut poids 2s,
qui peut prendre n’importe quelle valeur entière non négative), forment des espaces
106
Chapitre 4
Modélisations Algébriques
de dimension (2s+1) sur lesquels l’opérateur de Casimir standard L2 de su(2) prend
la valeur s(s+1), alors que Lz possède (2s+1) valeurs propres distinctes : m = -s, s+1, …., s-1, s. On note alors que :
Ø L’opérateur Lz engendre une réduction d’un multiplet de dimension (2s+1) en
(2s+1) singlets,
Ø L’opérateur L2z engendre quant à lui une réduction d’un multiplet de
dimension (2s+1) en s doublets et un singlet si s est entier, ou s doublets si s
est demi-entier.
Seule la première possibilité correspond à une brisure de symétrie au niveau des
algèbres de Lie : de l’algèbre de Lie su(2) à sa sous-algèbre maximale u(1).
Par contre, il a été observé que les deux possibilités peuvent être naturellement
interprétées en termes d’une brisure de symétrie au niveau des groupes de Lie : du
groupe (connexe) SU(2) à :
a)- son sous-groupe maximal connexe U (1) ≅ SO (2) , ou à
b)- son sous-groupe maximal (non connexe) Z 2 × U (1) ≅ O (2) , qui est un sous-groupe
de SU(2) formé par deux cercles :
 e iα
  0 e iβ 

0 

 β ∈ R .
(4.8)
α
Z 2 × U (1) = 
R
∈
 ∪  −iβ
− iα 
0 
  e
 0 e 

Remarquons que Z 2 × U (1) est généré par U(1) et la seule matrice :
0 1


(4.9)
1 0
qui n’est autre que le générateur du groupe de Weyl de SU(2) et qui, dans une
représentation de spin s, lie les deux états de nombre quantique magnétique (m) et
(-m).
Par abus de notation, les auteurs ont choisi d’appeler ces deux réductions de
la symétrie su(2) comme : la symétrie so(2) et la symétrie o(2) respectivement.
Le dernier ingrédient utilisé par les auteurs dans ce procédé de brisure de
symétrie est le fait d’autoriser les coefficients γ k d’être des polynômes des
opérateurs de Casimir standard L2k des sous-algèbres su(2) plutôt que des
constantes. Ceci va permettre une forme très spécifique d’interruption du processus
de brisure de symétrie à la dernière étape, parce que les multiplets de l’avant
dernière étape qui devraient normalement se subdiviser à la dernière étape vont
rester non brisés si (et seulement si) leurs labels de su(2) sont tels que le coefficient
107
Chapitre 4
γ
Modélisations Algébriques
correspondant s’annule. Une telle interruption partielle à la dernière étape
correspond à l’hypothèse biologique de Crick.
Après ces observations, on peut maintenant reconsidérer la seconde phase
du procédé de brisure de symétrie, au cours de laquelle un ou plusieurs des sousalgèbres su(2) se brisent. La nouveauté principale réside dans le fait que cette
réduction peut se réaliser suivant deux voies possibles :
-
Soit, vers o(2), en utilisant l’opérateur L2z ,
-
Ou, vers so(2), en utilisant l’opérateur Lz .
Dans le second cas, la dégénérescence est complètement liftée, alors que le
premier cas donne un ensemble de doublets pour des représentations de dimension
paire de su(2) (spin demi-entier) et une collection de doublets plus un singlet pour
des représentations de dimension impaire de su(2) (spin entier). Dans ce qui suit, on
va désigner les singlets par 2m (m=-s,…,s) et les doublets par ±2m (m=0,…s avec
m>0).
De plus, l’option de brisure de symétrie vers so(2) peut être réalisée de deux
façons différentes :
-
Soit directement, de su(2) vers so(2),
-
Ou indirectement, de su(2) vers o(2), ensuite en so(2).
Nous allons voir que ces deux possibilités mèneront à des résultats différents,
dû à la possibilité de « gel » à la dernière étape. Dans leurs travaux originaux, [7],
[8], les auteurs ont éliminé la brisure indirecte, puisque l’étape intermédiaire n’a pas
d’interprétation naturelle au niveau des algèbres de Lie. Une telle interprétation
devient possible quand des aspects globaux sont pris en compte, [9].
Préliminairement, notons que la première phase du processus de brisure de
symétrie doit avoir produit des multiplets qui se transforment suivant la
représentation (vectorielle) de spin 1 d’au moins une des sous-algèbres su(2). En
effet, si ce n’est pas le cas, il ne sera pas possible de générer les sextets et les
triplets du code génétique. Notons aussi que, jusqu’à l’avant-dernière étape du
processus, au moins une sous-algèbre su(2) doit rester non brisée, parce que si
toutes les sous-algèbres su(2) sont brisées vers o(2) ou so(2), la multiplicité de tous
les multiplets seront des puissances de 2. En fait, l’argument concernant
l’impossibilité de générer des sextets et des triplets du code génétique peut être
affiné par l’introduction d’un critère supplémentaire qui permettra de réduire
108
Chapitre 4
Modélisations Algébriques
davantage le nombre de chaines à analyser. Ce critère est basé sur l’observation
que, durant sa seconde phase, le processus de brisure de symétrie ne peut générer
des multiplets dont la dimension est multiple de 3 à partir de multiplets dont la
dimension ne l’est pas. Il est donc plus convenable d’introduire un nombre de trialité
d3 défini comme suit :
d3 = somme des dimensions de tous les multiplets
dont la dimension est multiple de 3.
De ce fait, ce nombre de trialité ne peut pas décroitre durant la seconde
phase. En partant du fait que, dans la distribution finale des multiplets dans le code
génétique standard ce nombre est égal à 24, alors on conclut que les chaines de
brisure qui, au début ou à un certain point de la seconde phase du processus jusqu’à
l’avant-dernière étape, violent le critère d3 ≥ 24, ne seront pas aptes à générer les
sextets et les triplets du code génétique et donc seront disqualifiées.
Considérons maintenant les huit chaines retenues précédemment. Toutes ont,
jusqu’à la fin de la première phase, produit moins de 21 multiplets. D’où le processus
de brisure de symétrie doit procéder à la deuxième phase et aucun gel ne s’est
encore produit. Par ailleurs, la chaine 1 (d3 = 0) et les chaines 2, 5 et 6 (d3 = 18) sont
immédiatement éliminées conformément au critère précédent. Pour les autres
chaines, nous procédons de la même façon en éliminant toutes les chaines avec
moins de 21 multiplets et d3 < 24.
Après
traitement,
ils obtinrent
finalement trois
chaines qui
décrivent
correctement les dégénérescences du code génétique standard, la première étant la
chaine sp(6), [7]-[8] :
sp(6) ⊃ sp(4) ⊕ su(2) ⊃ su(2) ⊕ su(2) ⊕ su(2)
⊃ su(2) ⊕ o(2) ⊕ su(2) ⊃ su(2) ⊕ o(2) ⊕ su(2)f
et les deux chaines G2 , [9] :
G2 ⊃ su(2) ⊕ su(2) ⊃ su(2) ⊕ o(2) ⊃ su(2)f ⊕ o(2) ,
G2 ⊃ su(2) ⊕ su(2) ⊃ su(2) ⊕ o(2) ⊃ su(2) ⊕ so(2)f .
L’indice « f » indique ici le fait que la dernière brisure est seulement partielle, due au
phénomène de « gel », qui peut être implémenté par les opérateurs H
respectivement pour les trois chaines :
109
Chapitre 4
Modélisations Algébriques
H = H0 + C2(sp(4)) +
2
1 L1
2
2
+
+
2 L2
2
+
1( L2
2
+
2( L2
H = H0 +
1 L1
2
+
2 L2
2
+
2 L 2, z
H = H0 +
1 L1
2
+
2 L2
2
+
2 L 2, z
3 L3
+
2
2 L 2, z
+
2
2
3( L1 + L2
)( L23 -2) L3, z
2
-2)( L22 -15/4)( L22 -6)( L22 - 35/4) L1, z ,
2
-2)( L22 -6)( L22 - 35/4) L2, z .
Notons ici que les deux premières chaines correspondent à une brisure
directe alors que la troisième correspond à une brisure indirecte.
Enfin, pour le cas du modèle sp(6), on obtient la représentation suivante de
l’évolution du code génétique :
Figure 4.1 : Arbre d’évolution du code génétique dans le modèle sp(6)
110
Chapitre 4
Modélisations Algébriques
4.5. Algèbre de Lie quantique du code génétique
Les quatre nucléotides ( A, C, G, A ) de la chaîne d’ADN sont proposées
comme des états fondamentaux de la représentation (1 2,1 2 )
de l’algèbre
enveloppante quantique U h ( sl (2) ⊕ sl (2) ) dans la limite h → 0 . En effet, les triplets
(codons) de nucléotides seront obtenus par le produit tensoriel des 3 nucléotides,
[25], cette approche peut être comparé a la classification des baryon dans la
physique des particules. Par exemple :
•
•
Codons ≈ 3 nucléotides (A, A, U) → (AAU, AUA, UAA)
Photon ≈ 3 quarks p → uud + udu + duu
Remarque
La différence essentielle réside dans la propriété de la base cristalline à fournir un
ordre naturel des constituants, cet ordre étant crucial dans le codon, ce qui n’est pas
le cas pour les baryons.
La règle de complémentarité de l’ADN-ARNm peut suggéré l’attribution d’un
nombre quantique avec des valeurs opposés pour les couples ( A, T/U ) et ( C, G ) , la
distinction entre les bases puriques ( A, G ) et les bases pyrimidiques ( C, T/U ) peut
être représentée algébriquement dans un sens analogue.
Considérons le groupe SU(2)xSU(2), et plaçons les 4 nucléotides dans la
(1/2,1/2) de cette algèbre, les vecteurs de base correspondant aux valeurs propres
±
1
du générateur J 3 sont définit algébriquement comme suit :
2
1
1
1
1
su (2) H
C ≡ ( + , + ) ←→
U ≡(− , + )
2
2
2
2
su (2)V b
b su (2)V
(4.10)
1
1
1 1
su (2) H
G ≡ ( + , − ) ←→
A ≡ ( − ,− )
2
2
2 2
les indices H (horizontal) et V (vertical) sont ajoutés pour spécifier l’action du groupe
tels que : SU(2)H distingue
purine/pyrimidine, et le SU(2)V la complémentarité
CG/AT par liaison d'hydrogène.
111
Chapitre 4
Modélisations Algébriques
Toutefois, Pour représenter un codon (trois nucléotides), nous devrons
1 1
effectuer le produit tensoriel de trois représentations irréductibles de  ,  . En effet,
2 2
Tableau 1.2 (Chp I) on remarques que Les deux premiers bases constituent le
codon sont les plus descriptifs, c’est-à-dire que les deux nucléotides sont stables
pour la représentation du codon, mais la dégénérescence est plutôt généré par le
troisième nucléotide. Donc Il est préférable d’étudier le codon comme 2 + 1 états
(nucléotides) au lieu d’un simple triplet.
On définit le produit tensoriel des 2 premiers nucléotides de dim = 4 , par
1 1 1 1
 ,  ⊗  ,  = (1,1) ⊕ (1,0 ) ⊕ ( 0,1) ⊕ ( 0,0 )
 2 2  2 2
(4.11)
D’après le théorème de Kashiwara « (2.100 et 2.101) Chp2 », on obtient :
su (2) H
( 0,0)  ←→
(1,0)
su (2)V b
( 0,0) ( −1,0)
 ( 0,1) 
 (1,1)

 su (2)H

 ( 0,0)  ←→  (1,0)
( 0, −1) 
(1, −1)
On a alors,
[CA]
(4.12)
b su(2)V
( 0,1) ( −1,1) 
( 0,0) ( −1,0) 
( 0, −1) ( −1, −1) 
su (2)H
←
→ [ CG UG UA]
su(2)V b
b su(2)V
CU
GU ←
su (2)H
→
 
GA
 CC UC UU
GC AC AU


GG AG AA
Soit en résumé,
Tableau 4.6 : Représentation Irréductibles du dinucléotides
112
(4.13)
Chapitre 4
Modélisations Algébriques
On remarques que :
•
Les deux premiers nucléotides dans un codon peuvent être mit en
correspondance avec le quadruplet ; doublet et le singlet relative au acide
Aminée. de plus, le sextet et le triplet peuvent être vus comme la somme du
quadruplet plus le doublet et comme la somme du doublet plus le singlet
respectivement.
•
Les états du dinucléotide associer au quadruplet (ainsi celles incluses dans
les sextets) vérifies :
J Hd ,3 > 0
•
ou
J Hd ,3 = 0, JVd ,3 ≥ 0, JVd ,3 ≠ 0
(4.14)
Les états du dinucléotide associer au doublet (ainsi celles incluses dans les
triplets) et le singlet vérifies :
J Hd ,3 < 0
ou
J Hd ,3 = 0, JVd ,3 < 0, JVd ,3 = 0
(4.15)
Avec J Hd ,3 et JVd ,3 Sont les troisièmes constituent du spin générateur de l’état du
dinucléotide. Par Exemples :
i. Le quadruplet → Pro = CCX avec ( X=C, U, G et A )
⇒ J Hd ,3 = 1 > 0 et JVd ,3 = 1 > 0
(4.16)
ii. Le doublet → Cys = UGR → ( R=C et A )
⇒ J Hd ,3 = 0 et JVd ,3 = 0
Les valeurs ci-dessous sont déduites à partir des équations (2.94, 2.95)
d
d
Tableau 4.7 : Valeurs J α ,± J α ,m
(α = H ,V ) pour les deux
Premiers nucléotides
113
(4.17)
Chapitre 4
Modélisations Algébriques
1 1
On définit le triple produit tensoriel de représentations irréductibles de  , 
2 2
U h→0 ( sl (2) ⊕ sl (2)) par
1 1 1 1 1 1 3 3
3 1
1 3
1 1
 ,  ⊗  ,  ⊗  ,  =  ,  ⊕ 2 ,  ⊕ 2  ,  ⊕ 4 , 
2 2 2 2 2 2 2 2
2 2
 2 2
2 2
(4.18)
3 3
la structure de représentation irréductible  ,  correspond au :
2 2
  3 3
  2, 2


 3 1
 , 
 3 3   2 2 
 2 , 2  =  3 1


 , − 
 2 2 
 3 3 
 , − 
 2 2 
Qui est équivalent à :
 CCC

 3 3   GCC
,
≡


 2 2   GGC

 GGG
1 3
 , 
2 2
1 1
 , 
2 2
1 1
 ,− 
2 2
1 3
 ,− 
2 2
 1 3
− , 
 2 2
 1 1
− , 
 2 2
 1 1
− ,− 
 2 2
 1 3
− ,− 
 2 2
UCC UUC
ACC AUC
AGC AAC
AGG AAG






 3 1 
 − , − 
 2 2 
 3 3 
 − , − 
 2 2 
 3 3
− , 
 2 2
 3 1
− , 
 2 2
UUU 
AUU 
AAU 

AAA 
(4.19)
(4.20)
De même, La structure des représentations irréductibles peuvent être
généralisé pour les différents états
 3 1   CCG UCG UUG UUA 
 ,  ≡

 2 2   GCG ACG AUG AUA 
(4.21)
 3 1   CGC UGC UAC UAU 
 ,  ≡

 2 2   CGG UGG UAG UAA 
(4.22)
1
2
 CCU

 1 3   GCU
 2 , 2  ≡  GGU



 GGA
1
UCU 
ACU 
AGU 

AGA 
 CUC

 1 3   GAC
 2 , 2  ≡  GAG



 GGA
CUU 
GUU 
GAA 

AGA 
1
 1 1   CCA UCA 
,
 2 2  ≡  GCA ACA 

 

2
 1 1   CGU UGU 
,
 2 2  ≡  CGA UGA 

 

 1 1   CUG CUA 
 ,  ≡  GUG GUA 
2 2 

 1 1   CAC CAU 
 ,  ≡  CAG CAA 
2 2 

(4.23)
(4.24)
3
4
114
Chapitre 4
Modélisations Algébriques
Tableau 4.8 : les valeurs de la Représentation Irréductibles
des acides aminées Sous SU(2) ( = H, V)
On définit la charge Q du dinucléotide, [26], par :
1
1
Q = J 3,H + CV ( J 3,V + 1) −
4
4
(4.25)
Par conséquent, on remarque que les dinucléotide ce devise en deux catégories :
i. Les dinucléotides fortes :
CC, GC, UC, AC, CU, GU, CG et GG → Les quadruplets → Q > 0
ii. Les dinucléotides faibles :
UU, AU, UG, AG, CA, GA, UA et AA → Les doublets → Q < 0
115
Chapitre 4
Modélisations Algébriques
Exemples
i. Pour le quadruplet → Pr o = CCC , on a :
CV =
ce qui implique que
15
3
3
, J H ,3 = et JV ,3 =
4
2
2
(4.26)
Q = 3,59 > 0
(4.27)
ii. Pour le doublet → Asn = AAC , on a :
CV =
15
3
3
, J H ,3 = et JV ,3 =
4
2
2
Ce qui donne
(4.28)
Q = −0.25 < 0
(4.29)
4.5.1. Opérateur de lecture (R)
Un opérateur R peut être définit par le biais de l’algèbre enveloppante
quantique U q→0 ( sl (2) ⊕ sl (2) ) , qui est une fonction des générateurs (Casimirs, ...)
possédant la propriété suivante :
•
Agissant sur les codons de façon diagonale, les valeurs propres seront les
mêmes pour deux codons associés au même acide aminé et différentes pour
deux codons associés à deux acides différents. Cette opérateur sera appelé
Opérateur de lecture (opérateur ribosomique), [27].
C'est un fait remarquable que les différents codes génétiques partagent la même
structure de base, pour reproduire cette structure un prototype de lecture peut être
met en évidence.
La première Partie de l’opérateur R sera responsable de la structure du
quadruplet donné essentiellement par le dinucléotide, définit par :
4
4
c1CH + c2CV − 4c1PH J H ,3 − 4c2 PV JV ,3
3
3
∀ci
(4.30)
Les opérateurs Jα ,3 (α = H , V ) , sont les troisièmes composantes du spin
générateur totale U q→0 ( sl (2) ⊕ sl (2) ) , Cα est l’opérateur casimir définit dans la base
cristalline U q→0 ( sl (2)α ) et PH et PV sont des Projecteurs définit par :
PH = J Hd + J Hd −
et
PV = JVd+ JVd−
(4.31)
La deuxième partie de l’opérateur R engendre la division du quadruplet en
doublets, lie par :
−2 PD c3 JV ,3
116
(4.32)
Chapitre 4
Modélisations Algébriques
où, le projecteur PD est donné par
(
)( J J )( J J ) + (1 − J J )(1 − J
+ (1 − J J )( J J )( J J )
PD = 1 − JVd+ JVd−
d
H+
d
H−
d
H+
d
H−
d
H−
d
H+
d
H+
d
d
V+ V−
d
H−
d
H−
d
d
V+ V−
J
)
(4.33)
d
H+
La troisième partie de l’opérateur R permet de reproduire les sextets vus
comme une fusion des quadruplets avec les doublets, définit par :
−2 PS c4 JV ,3
(4.34)
Où, le projecteur PS est donné par
(
)(
)(
) (
)(
)(
)
Ps = J Hd − J Hd +  J Hd + J Hd − 1 − JVd+ JVd− + JVd+ JVd− JVd− JVd+ 1 − J Hd + J Hd − 
(4.35)
A ce stade, il est très facile d’obtenir les valeurs propres de l'opérateur de
lecture R pour les 64 codons, par exemple
i. Pro = CCC , on a
15
15
et CV =
4
4
PH = 1, PV = 1, PD = 0 et Ps =
CH =
(4.36)
(4.37)
On remplace (4.36) et (4.37) dans les différentes parties responsables de la structure
des acides aminées (4.30, 4.32 et 4.33), on obtient :
R ( CCC ) = −c1 − c2
(4.38)
ii. Cys = UGC , on a :
15
3
et CV =
4
4
PH = 1, PV = 0, PD = 1 et Ps = 1
CH =
(4.39)
(4.40)
d’où on en déduit que :
UGC = 3c1 + c2 − c3 − c4
De même, on obtient avec,
CCN = −c1 − c2
GCN = −c1 + 3c2
UCN = −3c1 − c2
ACN = 3c1 + 3c2
CUN = c1 − c2
GUN = c1 + 3c2
CGN = −c1 + c2
GGN = −c1 + 5c2
UUY = 5c1 − c2 − 3c3
UUR = 5c1 − c2 − c3
AUY = 5c1 + 3c2 − c3 − c4
AUR = 5c1 + 3c2 + c3 + c4
UGY = 3c1 + c2 − c3 − c4
UGR = 3c1 + c2 + c4 + c5
AGY = 3c1 + 5c2 + c3 + c4
AGR = 3c1 + 5c2 + 3c3 + 3c4
CAY = c1 + c2 − c3
CAR = c1 + c2 + c3
GAY = c1 + 5c2 + c3
GAR = c1 + 5c2 + 3c3
117
(4.41)
Chapitre 4
Modélisations Algébriques
UAY = 5c1 + c2 − c3
UAR = 5c1 + c2 + c3
AAY = 5c1 + 5c2 + c3
AAR = 5c1 + 5c2 + 3c3
Y = C, U (Pyrimidines), R = G, A (Purines) et N = C, U, G, A
En effet, les coefficients arbitraires c3 et c4 sont fixés comme suit :
•
Le quadruplet (CUN) et le doublet (UUR) Correspond au même acide aminée
(leu)
CUN ; UUR ⇒ c3 = 4c1
(4.42)
On a donc
R (Leu) = c1 − c2
•
(4.43)
Le quadruplet (UCN) et le doublet (AGY) Correspond au même acide aminée
(Ser)
UCN ; AGY ⇒ c4 = −4c1 − 6c2
Ce qui implique :
(4.44)
R(Ser) = 3c1 − c2
(4.45)
De même on obtient :
CCN = −c1 − c2 → Pro
GCN = −c1 + 3c2 → Ala
UCN = −3c1 − c2 → Ser
ACN = 3c1 + 3c2 → Thr
CUN = c1 − c2
→ Leu
GUN = c1 + 3c2 → Val
CGN = −c1 + c2 → Arg
GGN = −c1 + 5c2 → Gly
UUY = −7c1 − c2 → Phe
UUR = c1 − c2
AUY = 5c1 + 9c2 → Ile
AUR = 5c1 − 3c2 → Met
UGY = 3c1 + 7c2 → Cys
UGR = 3c1 − 5c2 → Trp
AGY = 3c1 − c2 → Ser
AGR = 3c1 − 13c2 → (X)
CAY = −3c1 + c2 → His
CAR = 5c1 + c2
→ Gln
GAY = 5c1 + 5c2 → Gln
GAR = 13c1 + 5c2 → Glu
UAY = c1 + c2
→ Tyr
UAR = 9c1 + c2
AAY = 9c1 + 5c2 → Asn
AAR = 17c1 + 5c2 → Lys
→ Leu
→ Ter
(4.46)
Par conséquent, le prototype de l’opérateur de lecture R prend la forme suivante :
4
4
R = c1C H + c2CV − 4c1PH J H ,3 − 4c2 PV JV ,3
3
3
+ ( −8c1PD + ( 8c1 + 12c2 ) Ps ) J V ,3
(4.47)
4.5.2. Les différents codes génétiques
Dans ce qui suit nous allons déterminer l’opérateur de lecture, [27], pour les
codes génétiques suivants:
Ø The Eukariotic Code (EC)
118
Chapitre 4
Modélisations Algébriques
Ø The Vertebral Mitochondrial Code (VMC)
Ø The Yeast Mitochondrial Code (YMC)
Ø The Invertebrate Mitochondrial Code (IMC)
Ø The Protozoan Mitochondrial and Mycoplasma Code (PMC)
Ne remarquons, que chacun de ces codes est très proche du prototype donné
en (4.47). Les principales différences entre les codes biologiques et le prototype sont
les suivantes :
•
Le doublet AGR correspond au Arg pour les codes (EC, YMC et PMC), Ser
pour les codes (IMC) et Ter pour le code (VMC)
Cette attribution sur l’opérateur de lecture est donnée par le terme suivant :
1

(4.48)
c5 PAG  − JV(3),3 
2

où, l’opérateurs J α(3,3) est le troisième composant du codon correspondant au
troisième nucléotide, définit par
Jα( 3,3) = J α ,3 − J αd ,3
(4.49)
le Projecteur PAG est donné par
(
)(
)(
)(
PAG = J Hd + J Hd − J Hd − J Hd + 1 − JVd+ JVd− JVd− JVd+
)
(4.50)
À partir des relations (4.47 et 4.50), on a :
PAG = 1
(4.51)
3
1
3
JV( ,3) = JV ,3 − JVd ,3 = − + 1 = −
2
2
ce qui implique que
•
(4.52)
R(AGR) = 3c1 − 13c2 + c5
(4.53)
Le quadruplet (CGN) et le doublet (AGR)
Correspond au même acide
aminée (Arg). Tel que,
CGN ≡ AGR ⇔ −c1 + c2 = 3c1 − 13c2 + c5
•
(4.54)
⇒ c5 = −4c1 + 14c2
Le quadruplet (UCN) et le doublet (AGR) Correspond au même acide
aminée (Ser). Tel que,
UCN = AGR ⇔ 3c1 − c2 = 3c1 − 13c2 + c5
⇒ c5 = 12c2
(4.55)
c5 = −4c1 + 18c2
c5 = 6c1 + 14c2
(4.56)
(4.57)
De même, on obtient pour le
Gly
Ter
119
Chapitre 4
•
Modélisations Algébriques
La division de certains doublets en singles (un élément du singlet sera
combinait avec un autre doublet pour donner un triplet) :
se dévise
Met 

→ Met + Ile
Pour les codes (EC et PMC)
se devise
Trp 

→ Trp + Ter
Pour le code (EC)
Cette attribution sur l’opérateur de lecture est donnée par l’expression suivante :
1
 1

c6 p XY  − JV( 3,3)  − J H( 3,3) 
2
 2

(4.58)
Où, nous utilisons le projecteur PAU pour la division du doublet Met et le PUG pour
le doublet Trp. Ces projecteurs sont donnés par
PAU = (1 − J Hd + J Hd − )( J Hd − J Hd + )( JVd+ JVd− )( JVd− JVd+ )
(4.59)
PUG = ( J Hd + J Hd − )( J Hd − J Hd + )(1 − JVd + JVd− )(1 − JVd− JVd+ )
(4.60)
La division du doublet ( Met ) en singles ( Met + Ile ) , peut être interprété par le
calcule suivant :
PAU = 1
3
1
3
J H( ,3) = J H ,3 − J Hd ,3 = − + 1 = −
2
2
1
1
d
J v(3)
+0= −
,3 = J v ,3 − J v ,3 = −
2
2
(4.61)
Ce qui implique que :
Met = R(AUR) = 5c1 − 3c2 + c6
On en déduit que :
AUY = AUR ⇔ 5c1 + 9c2 = 5c1 − 3c2 + c6
⇒ c6 = 12c2
•
(4.62)
(4.63)
Pour la division du Trp → Trp + Ter , on a les valeurs suivantes :
PUG = 1
3
3
+0=
2
2
1
1
= J v,3 − J vd,3 = − + 0 = −
2
2
J H( ,3) = J H ,3 − J Hd ,3 =
3
J v(3)
,3
(4.64)
Ce qui implique que :
Trp = R(UGR) = 3c1 − 5c2 + c6
On a alors,
UGY = UGR ⇔ 3c1 − 5c2 + c6 = 9c1 + c2
⇒ c6 = 6c1 + 6c2
120
(4.65)
(4.66)
Chapitre 4
•
Modélisations Algébriques
Dans le cas du YMC le quadruplet CUN est codé par Thr plutôt que le leu.
Ce changement est obtenue en multipliant le terme responsable de la
structure du quadruplet (4.30) par (1 + 2 PCU ) pour la partie horizontal et par
(1 − 4 PCU ) pour la partie vertical.
v
The Eukariotic code (EC)
Le code Eukariotic est le plus important des codes génétiques et il est souvent
désigné comme le code génétique universel. La différence entre le code Eukariotic
(E.C) et le prototype se situ à :
Partant de (4.48), (4.54), (4.58) et (4.63) l’opérateur de lecture pour le EC prend la
forme suivante :
4
4
c1C H + c2CV − 4c1 PH J H ,3 − 4c2 PV JV ,3 + ( −8c1 PD + ( 8c1 + 12c2 ) PS ) JV ,3
3
3
1

+ ( -4c1 + 14c2 ) PAG  − JV(3),3 
2

1
 1

+ 12c2 PAU + ( 6c1 + 6c2 ) PUG   − J V( 3,3)  − J H( 3,3) 
2
 2

REC =
v
(4.67)
The vertebral Mitochodrial (VMC)
The vertebral Mitochodrial (VMC) est utilisé dans la mitochondrie des
vertébrés. La différence entre le code mitochondrial vertébral et le prototype se situe
au niveau de :
De l’équation (4.48) et (4.57) l’opérateur de lecture pour le VMC prend la forme
suivante :
4
4
RVMC = c1CH + c2CV − 4c1PH J H ,3 − 4c2 PV JV ,3 + ( −8c1 PD + ( 8c1 + 12c2 ) PS ) JV ,3
3
3
(4.68)
1

+ ( 6c1 + 14c2 ) PAG  − JV(3),3 
2

121
Chapitre 4
v
Modélisations Algébriques
The Yeast Mitochodrial code (YMC)
La différence entre le Prototype et le YMC se situ au niveau de
Partant de (4.48) et
(4.54) l’opérateur de lecture pour le YMC prend la forme
suivante :
4

4

RYMC =  c1CH − 4c1 PH J H ,3  (1 + 2 PCU ) +  c2 CV − 4c2 PV JV ,3  (1 − 4 PCU )
3

3

1

+ ( -8c1 PD + (8c1 + 12c2 ) PS ) JV ,3 + ( −4c1 + 14c2 ) PAG  − JV(3),3 
2

v
(4.69)
The Invertebrate Mitochodrial code (IMC)
La différence entre le Prototype et le IMC se situ au niveau de
Partant de (4.48) et (4.55) l’opérateur de lecture pour le IMC prend la forme
suivante :
4
4
RIMC = c1CH + c2CV − 4c1PH J H ,3 − 4c2 PV JV ,3 + ( −8c1PD + ( 8c1 + 12c2 ) PS ) J V ,3
3
3
1

+12c2 PAG  − JV(3),3 
2

v
(4.70)
The Protozoan Mitochodrial and Mycoplasma code (PMC)
La différence entre le Prototype et le IMC se situe au niveau de
Partant de (4.48), (4.54), (4.58) et (4.63) l’opérateur de lecture pour le PMC prend la
forme suivante :
4
4
RPMC = c1CH + c2CV − 4c1PH J H ,3 − 4c2 PV JV ,3 + ( −8c1PD + ( 8c1 + 12c2 ) PS ) JV ,3
3
3
1

1
 1

+ ( −4c1 + 14c2 ) PAG  − JV(3),3  + 12c2 PAU  − JV(3),3   − J H(3),3 
2

2
 2

122
(4.71)
Chapitre 4
Modélisations Algébriques
À partir du code prototype, on vérifie facilement que les différents opérateurs
de lecture donnent la même valeur pour un même acide aminée quel que soit le
code génétique étudier. Par exemple pour le CUC, on à :
PH = 0, PV = 1, PD = 0, PS = 0 et PAG = 0
1
5
3
et JV(3),3 =
J H( ,3) =
2
2
3
15
CH = et CV =
4
4
(4.72)
(4.73)
(4.74)
On remplace (4.72), (4.73) et (4.74) dans l’opérateur de lecture (4.67), (4.68), (4.69)
(4.70) et (4.71), on obtient
R(Leu) = REC = RVMC = RYMC = RIMC = RPMC = c1 − c2
Si on pose c =
(4.75)
c1
, on trouve
c2
R(Leu) = REC = RVMC = RYMC = RIMC = RPMC = c −1
(4.76)
De même, on obtient les valeurs propres des opérateurs de lecture pour les
différents acides aminés
Tableau 4.9 : les valeurs propres associés au différents acides aminés
Remarque
L’opérateur de lecture R(c ) peut être utilisé pour toute valeur real de c , sauf celle qui
donne une même valeur propre par rapport à deux acides aminés différents. Ces
valeurs interdites sont les suivantes :
7
5
3
4
5
4
3
5
−7, − 5, − 4, − 3, − , − 2, − , − , − , − 1, − , − , − , −
3
3
2
3
6
5
4
7
2
3
1
3
2
3
1
1
3
2
1
2
1
− , − , − , − , − , − , − , − , − , − , − , − , − ,
3
5
2
7
5
8
3
3
10
7
4
9
5
1 1
1
1
1 1 1 1 1 2 1 2
4 3
5
, − , − , − , 0, , , , , , , , , 1, , , 2, , 3, 4, 5
6 7
8
9
7 6 5 4 3 5 2 3
3 2
2
123
Chapitre 4
Modélisations Algébriques
Références
[1] E. P. Wigner, « Symmetry Principles in Old and New Physics », Bull. Am. Math.
Soc, 74, 793 (1968).
[2] Brading, Katherine, Castellani, Elena, "Symmetry and Symmetry Breaking", The
Stanford Encyclopedia of Philosophy (Winter 2004 Edition), Edward N. Zalta(ed).
[3] D. W. Sumners, « Lifting the curtain : using topology to prob the hidden action of
enzymes », Notices of the American Mathematical Society, 42 (5), pp. 528-537
(mai 1995).
[4] A. Sossinsky, Noeuds - Genèse d’une théorie mathématique (Seuil, 1999).
[5] T. Wilhelm and S. Nikolajewa (2004) A new classification scheme of the genetic
code J. Mol. Evol., 59, 598–605.
[6] T. Wilhelm and S. Nikolajewa (2004) A purine-Pyrimidine Classification Scheme
of the Genetic Code BIOforum Europe 6, 46-49.
[7] J. E. M. Hornos and Y. M. M. Hornos : Phys. Rev. Lett. 71, (1993) 4401,
[8] J. E. M. Hornos and Y. M. M. Hornos : J. Biol. Phys. 20, (1994) 289,
[9] M. Forger and al, Phys. Rev. E56 (6), (1997)7078,
[10] J.E.M. Hornos and al, Int. J. Mod. Phys. B13 (23), (1999) 2795,
[11] M. Forger and S. Sachse, J. Math. Phys. 41 (8), (2000) 5407-5444,
[12] F. Antoneli Jr and al, Int. J. Mod. Phys. B17 (17), (2003) 3135,
[13] M. Magini and J. E. M. Hornos, Braz. J. Phys. 33 (4), (2003) 825,
[14] F. Antoneli Jr and al : Mod. Phys. Lett. B18 (18), (2004)971,
[15] A. O. Barut and R. Raczka,
“Theory of Group Representations and
Applications”, 2nd Edition, World Scientific, Singapore, (1986),
[16] W. G. McKay and J. Patera, “Tables of Dimensions, Indices and Branching
Rules for Representations of Simple Lie Algebras”, Marcel Dekker, New York, (1981),
[17] E. B. Dynkin : AMS Transl. 6 , (1957)111,245,
[18] A. L. Onishchik and E. B. Vinberg (Eds): “Lie Groups and Lie Algebras III”,
Encyclopedia of Mathematical Sciences, Vol. 41, Springer, Berlin (1994),
[19] S. Helgason, “Differential Geometry, Lie Groups and Symmetric Spaces”,
Academic Press, New York, (1978),
[20] L. Braggion, “Search for Symmetries in the Evolution of the Genetic Code”,
MSc Dissertation, University of São Paulo, São Carlos (1998),
124
Chapitre 4
Modélisations Algébriques
[21] F. Antoneli, “Maximal Subalgebras of Semisimple Lie Algebras, Symmetry
Breaking and the Genetic Code”, MSc Dissertation, University of São Paulo, São
Carlos (1998),
[22] S. Ozawa and al, Microbiol. Rev. 56, (1992) 229,
[23] F.H.C. Crick, J. Mol. Biol. 38, (1968) 367,
[24] M.O. Bertman and J.R. Jungck, “Some Unresolved Mathematical Problems in
Genetic Coding ”, Not. AMS 25, (1978) A-174,
[25] L. Frappat, A. Sciarrino, P. Sorba, A crystal base for the genetic code, Phys.
Lett. A 250 (1998) 214.
[26] L. Frappat, A. Sciarrino, P. Sorba, Predictions of Physical-Chemical Properties
of amino acids from Genetic Code, physics/0007034.
[27] L. Frappat, A. Sciarrino and P. Sorba, 2000. Crystalizing the genetic code
physics/0003037.
[28] L. Frappat, A. Sciarrino, P. Sorba, Symmetry and codon usage correlations in
the genetic code, Phys. Lett. A 259 (1999) 339 and physics/9812041.
[29] L. Frappat, A. Sciarrino, P. Sorba, Theoretical Prevision of Physical-Chemical
Properties of Amino Acids from Genetic Code, physics/0007034 v1.
[30] A. Sciarrino, A Mathematical Model Accounting for the Organisation in
Multiplets of the Genetic Code, math-ph/0102022 v1.
[31] A. Sciarrino, Wigner-Eckart theorem in the crystal basis and the organisation of
the genetic code, math-ph/0111006 v1 5 Nov 2001.
[32] A. Sciarrino, C. Minichini, Quantum spin model fitting the Yule distribution of
oligonucleotides in DNA, quant-ph/0409071v1
125
CONCLUSION GENERALE
CONCLUSION GENERALE
Comprendre pourquoi le code génétique est-il ce qu’l est, a été le sujet de
nombreux modèles proposés dans la littérature et reste encore largement un
challenge pour les chercheurs, [1], [2].
Comme le code génétique est quasi-universel pour tous les organismes
vivants, les modèles devraient être indépendants du temps, bien que certains
modèles dépendant du temps ont été proposés, [2], [3], [4].
Le recensement de toutes les symétries présentes dans le code génétique
sont d’un intérêt particulier puisqu’elles peuvent nous éclairer sur les principes
d’organisation de base du code.
Dans la première décade qui a suivi le décryptage du code génétique, il fût
considéré comme étant universel. Cependant, la découverte que la mitochondrie
mammalienne utilise un code légèrement différent, dans lequel le codon UGA est
modifié de « STOP » à Trp, et l’identification induite de familles entières de codes
non-standards, aussi bien mitochondriaux que nucléaires, relança l’intérêt des
biologistes à la recherche de l’origine du code génétique et de ses propriétés.
En effet, une analyse phylogénique de ces déviations révéla que ces codes
non-standards sont relativement récents (pas plus d’1,5 billion d’années d’âge) et
qu’ils dérivent effectivement du code génétique standard, dont l’origine est estimée à
3,8 billions d’années, par le biais de déviations postérieures, [5], [6].
De plus, comprendre la formation des codes non-standards à partir du code
standard et comprendre l’évolution du code standard lui-même sont deux problèmes
à priori logiquement distincts et indépendants. Le problème de l’évolution du code
génétique standard reste lui intimement lié à la recherche de la compréhension de
l’origine de la vie sur terre.
La suite de notre travail présenté dans ce mémoire s’inscrit dans la recherche
de cette symétrie originale et des sous-symétries qui en découlent par un procédé de
brisure de symétrie spontanée, procédé bien connu chez les Physiciens des
particules élémentaires. Nous nous proposons aussi de traiter ce problème dans le
cadre des groupes de tresses (Braiding groups) et dans le cadre des groupes
quantiques et la théorie des n uds.
126
CONCLUSION GENERALE
Références
[1] S.J. Freeland and al : Early fixation of an optimal genetic code , Mol. Biol. Evol.
17, (2000)511,
[2] G. Sella and D.H. Ardell : « The coevolution of genes and genetic codes : Crick s
frozen accident revisited », J. Mol. Evol. 63, (2006)297,
[3] J.M. Bahi and C.J. Michel: A stochastic gene evolution model with time
dependent mutations , Bull. Math. Biol. 66, (2004)763,
[4] S.N. Rodin and A.S. Rodin: Origin of the genetic code: first aminoacyl-tRNA
synthetases could replace isofunctional ribozymes when only second base of codons
was established , DNA Cell. Biol. 25, (2006)365,
[5] S. Osawa and al : Recent evidence for the evolution of the genetic code ,
Microbiol. Rev. 56, (1992)229,
[6] S. Osawa: Evolution of the genetic code , Oxford Univ. press, (1995)
127