memoire le diplome de magister - Thèses et Mémoires
Transcription
memoire le diplome de magister - Thèses et Mémoires
REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L’ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE D’ORAN ES-SENIA FACULTE DES SCIENCES DEPARTENT DE PHYSIQUE MEMOIRE présenté par Monsieur Mohamed Réda CHELLALI pour obtenir LE DIPLOME DE MAGISTER Spécialité : Physique Option : BioPhysique Mathématique & Simulations intilué : Sur les Modélisations Mathématiques du Code Génétique soutenu le :…...……………..à la salle de conférences de la Faculté des Sciences devant le jury composé des membres suivants : GHAMNIA Mustapha : Professeur à l’Univ. d’Oran Es-sénia, Algérie (Président) DJEMAÏ Abed-El-Farid : Professeur à l’Univ. d’Oran Es-sénia, Algérie (Rapporteur) TAHIRI Mohamed : Professeur à l’Univ. d’Oran Es-sénia, Algérie (Examinateur) HAMMOU B. Amine : Maître de Conférences à l’USTO-MB, Oran, Algérie (Examinateur) MESREF Lahouari : Maître de Conférences à l’USTO-MB, Oran, Algérie (Examinateur) Je dédie ce modeste travail à Ma mère, Sans qui je ne serais pas où j’en suis aujourd’hui. Remerciements Mes remerciements vont premièrement au grand créateur de l'univers, Dieu tout puissant pour la volonté, la santé et la patience, qu’il ma donné jusqu’à la finalisation de ce travail. Ainsi je remercie vivement mon directeur de mémoire Monsieur AbedEl-Farid DJEMAÏ, Professeur à l’Université d’Oran Es-sénia, pour sa gentillesse, sa patience, sa disponibilité, son aide et la compréhension dont il a fait preuve pour l'approbation de mon sujet de mémoire. De plus, les conseils qu’il m’a divulgué tout au long de la rédaction, ont toujours été clairs et succincts, me facilitant grandement la tâche et me permettant d’aboutir à la production de ce mémoire. Je suis très honoré que Monsieur Mustapha GHAMNIA, Professeur à l’Université d’Oran Es-senia, ait consenti à juger ce travail et présider ce jury de mémoire. Qu’il trouve ici l’expression de ma profonde reconnaissance. Mes sincères remerciements s’adressent à Monsieur Amine Bouziane HAMMOU, Maître de conférence à l’Université des Sciences et de la Technologie d’Oran– Mohamed Boudiaf (USTO-MB), ainsi que Monsieur Lahouari MESREF, Maître de conférence à l’Université des Sciences et de la Technologie d’Oran– Mohamed Boudiaf (USTO-MB), qui ont accepté de juger ce travail et d'en être les examinateurs. 1 Je remercie également Monsieur Mohamed TAHIRI, Professeur à l’Université d’Oran Es-senia, du Laboratoire de Physique Théorique, pour l’honneur qu’il m’a fait en acceptant d’examiner ce travail et de participer à ce jury. Je remercie tous ceux qui m’ont aidé, de prés ou de loin, à réaliser ce travail, plus particulièrement Monsieur Djamel BOUKERDIMI, Maître de conférence à l’Université à l’Université d’Oran Es-senia, pour m'avoir prêté son imprimante laser. Enfin, j'adresse mes plus sincères remerciements à tous mes proches et amis qui m'ont toujours soutenue et encouragée au cours de la réalisation de ce mémoire. 2 SOMMAIRE INTRODUCTION GENERALE……………………………………………………………5 CHAPITRE 1. Eléments de Biologie Moléculaire 1.1. Introduction………………………………………………………………………...10 1.2. Les nucléotides …………………………………………………………………...10 1.3. La structure de l’ADN ……………………………………………………………11 1.3.1. Quelques dates ……………………………………………………………11 1.3.2. La double hélice d’ADN…………………………………………………..12 1.4. La structure de l’ARN…………………………………………………………….14 1.5. Réplication de l’ADN……………………………………………………………...15 1.6. Transcription……………………………………………………………………….17 1.7. Traduction…………………………………………………………………………..17 1.8. Codon ……………………………………………………………………………….18 1.9. Code génétique……………………………………………………………………19 1.10. Dégénérescence du code génétique………………………………………….20 1.11. Universalité du code……………………………………………………………...20 Références………………………………………………………………………………....21 CHAPITRE 2. Groupes et Algèbres 2.1. Introduction………………………………………………………………………...23 2.2. Elément de la théorie des groupes…………………………………………….23 2.2.1. Définition d’un groupe……………......................................................23 2.2.2. Propriétés…………………………………………………………………..23 2.3. Algèbre, algèbre de Lie, algèbre universelle enveloppante………………26 2.4. Représentations des groupes…………………………………………………..32 2.5. Groupe quantique et algèbre quantique………………………………………36 2.6. La base cristalline………………………………………………………………...40 2.7. Quelques exemples de groupes et algèbres de Lie……………………...…41 2.8. Algèbre quantique suq(2)…………………………………………………...…...49 Références………………………………………………………………………………….52 3 CHAPITRE 3. Différentes Modélisations 3.1. Introduction………………………………………………………………………...56 3.2. Modèle de Gamow (1954)………………………………………………………..57 3.3. Modèle de Wittmann (1963)……………………………………………………...60 3.4. Modèle de Rumer (1966)…………………………………………………………61 3.5. Modèle de Finkley (1982)………………………………………………………...61 3.6. Modèle de Hornos et al (1993-2004)…………………………………………..67 3.7. Modèle de Sorba et al (1998-2004)…………………………………………….67 3.8. Modèle de Duplij (2000)…………………………………………………………..67 3.9. Modèle du Québécium (2000)…………………………………………………...71 3.10. Modèle de Cristea (2001-2002)………………………………………………….73 3.11. Modèle de Jiménez (2002)……………………………………………………….74 3.12. Modèle de Négadi (2003)…………………………………………………………75 3.13. Modèle de Yang (2003)……………………………………………...…………….77 3.14. Modèle Rako evi (2004)………………………………………………………...81 3.15. Modèle de Wilhelm-Nikolajewa (2004)…………………………………………82 3.16. Modèle de Sánchez (2004)……………………………………………………….83 3.17. Modèle de Dragovich (2006)…………………………………………………….85 3.18. Modèle de White (2007)…………………………………………………………..87 Références…………………………………………………………………………………88 CHAPITRE 4. Modélisations Algébriques 4.1. Introduction………………………………………………………………………...94 4.2. La symétrie…………………………………………………………………………94 4.3. Les symétries dans le code génétique………………………………………..96 4.4. La brisure de symétrie dans le code génétique …………………………….98 4.5. Algèbre de Lie quantique du code génétique………………………………111 4.5.1. Opérateur de lecture (R)……………………………………………….116 4.5.2. Les différents codes génétiques……………………………………...118 Références………………………………………………………………………………..124 CONCLUSION GENERALE……………………………………………………………..126 Références………………………………………………………………………………..127 4 INTRODUCTION GENERALE INTRODUCTION GENERALE La biologie est tout d’abord une discipline empirique. En effet, elle s’appuie essentiellement sur l’observation, la constatation et l’expérimentation. Elle n’est donc pas une science théorique. Les concepts et principes y sont vraiment rares, et sont souvent empruntés à la Physique ou à la Chimie. De plus, la biologie n’est pas une étude du statique mais plutôt l’étude du dynamique. Le 20ème siècle a coïncidé avec la naissance de la génétique. En effet, après la redécouverte des travaux de Mendel en 1900, il y a eu l’élaboration de la théorie chromosomique de l’hérédité au début du siècle, ensuite la découverte de l’ADN comme support biochimique de l’information génétique, l’élucidation de sa structure (années 50-60) et l’explosion de la biologie moléculaire à partir des années 70. Les dernières décennies du 20ème siècle et l’aube du 21ème siècle a connu une effervescence assez particulière, notamment l’étude des propriétés mécaniques et électroniques de l’ADN sur les plans théorique, expérimental et de modélisation, ainsi que l’étude de la modélisation du code génétique, et enfin le décryptage du patrimoine génétique (génome) de certaines espèces animales et celle de l’humain. Parmi les molécules dites de la vie, on peut citer les protéines qui représentent à peu près la moitié du poids sec de la plupart des cellules vivantes et qui sont caractérisées chacune par une séquence d’acides aminés sous forme d’une chaîne polymérique. Chaque cellule est capable de fabriquer ses propres protéines dont elle a besoin et pour cela, il faut disposer d’acides aminés, dont le nombre de types différents a été recensé et est égal à 20, et de « recettes » qui permettent de fixer quels acides aminés faut-il assembler et de quelle manière. Ces « recettes » sont contenues dans le noyau des cellules, plus précisément dans la chromatine (mélange de protéines appelées histones et d’Acides DésoxyriboNucléiques communément appelés ADN). Ce sont ces dernières molécules (ADN) qui forment ces fameuses recettes. L’ADN, tout comme l’ARN (Acide RiboNucléique), sont des acides nucléiques dont la structure polymérique est formée de 4 nucléotides (appelés aussi bases). En général, un nucléotide est une base azotée augmentée d’un groupement phosphate et d’un sucre. Le sucre est un pentose cyclique qui peut être soit du type Désoxyribose (cas de l’ADN) ou Ribose (cas de l’ARN). Le groupement phosphate est représenté quant à lui par l’acide phosphorique. Quant aux bases azotées (nucléotides), elles peuvent être, dans le 5 INTRODUCTION GENERALE cas de l’ADN, soit de type purine (Adénine et Guanine) soit de type pyrimidine (Thymine et Cytosine). Dans le cas de l’ARN, la Thymine est remplacée par l’Uracile. Si on sépare une molécule d’ADN en nucléotides, on obtiendra toujours des paires de bases de type soit A = T ou G ≡ C , où les liaisons sont de type Hydrogène (H). Etant donné que l’ADN ne sert pas physiquement de support à la synthèse des protéines, il existe un flux d’information génétique dans la cellule. En réalité, ce flux d’information se fait en deux étapes. En effet, il existe un intermédiaire entre la séquence d’ADN (unité d’information) et la protéine spécifiée : l’ARN messager (mARN). Dans la première étape, dite de transcription, la séquence d’ADN est reproduite dans une séquence d’ARN (mARN). La seconde étape est la traduction, c'est-à-dire la réalisation d’une protéine spécifiée par l’ARN messager avec passage d’un alphabet à 4 lettres (les bases) à un alphabet à 20 lettres (les acides aminés). Ce flux d’information génétique représente l’aspect métabolisme. Quant à l’aspect reproduction cellulaire, il est représenté par un autre flux d’information génétique généré par un autre phénomène dit de réplication de l’ADN, (Voir Figure cidessous). La molécule d’ADN possède une structure de double hélice dont les deux brins sont antiparallèles, complémentaires et aussi donc hélicoïdaux. Elle constitue le lieu de stockage de l’information génétique sous forme codée. En effet, chaque protéine est codée par un gène, ou par plusieurs si la protéine est polymérique. L’unité de base des protéines étant l’acide aminé, celui-ci est codé par un codon (triplet de nucléotides). Ce code, c'est-à-dire la manière dont les 20 acides aminés se lient aux différents codons, est appelé code génétique et a été déchiffré entre 1960 et 1965. Puisqu’on dispose de 4 nucléotides différents dans l’ADN (A, T, G et C), il existe 6 INTRODUCTION GENERALE donc 43=64 codons possibles dont trois, dits codons-STOP (ou de terminaison), signifient la fin du message génétique. D’où ce code génétique est redondant (dégénéré), puisque plusieurs codons peuvent coder pour le même acide aminé. Ainsi, un acide aminé est bien spécifié par un système à trois nucléotides (codons). Par la suite, grâce à des expériences reposant sur des systèmes de synthèse protéique in vitro, la signification des 64 codons a donc pu être élucidée. Les résultats sont compilés dans le tableau suivant. -Code génétiqueCe code génétique est aussi universel, dans le sens où il est identique pour tous les êtres vivants (à quelques exceptions près). Il est aussi non-chevauchant, dans le sens où les codons sont lus en série depuis un point de départ de la séquence jusqu’au condon-STOP. Le segment d’ADN portant toute l’information génétique nécessaire pour la synthèse d’une protéine est communément appelé gène. Le Jeudi 06 Avril 2000, Craig Venter, patron de la firme privée Celera Genomics, annonce à la chaîne de télévision CNN que son Laboratoire vient de terminer le séquençage du génome humain. C’est un vrai exploit, sachant que ce génome, véritable livre de la vie, comporte 23 chapitres (Paires de chromosomes), au moins 50 milles phrases (gènes) et plus de 3 milliards de mots (paires de nucléotides) écrits à l’aide d’un alphabet de 4 lettres (nucléotides). Chaque phrase 7 INTRODUCTION GENERALE du livre spécifie la structure d’une protéine. Fait remarquable, les mots et l’alphabet sont les mêmes chez la quasi-totalité des êtres vivants (Universalité)! D’autre part, la synthèse d’une protéine, déterminée par un gène, revient donc à la traduction d’une séquence de nucléotides en une séquence d’acides aminés. C’est équivalent à la traduction d’une phrase écrite à l’aide d’un alphabet à 4 lettres en une phrase écrite à l’aide d’un alphabet à 20 lettres. Ceci est réalisé grâce à un code de traduction (code génétique standard) qui a été finalement cracké au cours des années 60. Plusieurs tentatives ont été opérées pour élucider ce code génétique. Les outils mathématiques utilisés pour modéliser ce code sont divers. On peut citer entre autres, la théorie des ensembles et des applications, la théorie des groupes discrets, la théorie de représentation des groupes continus issus de la classification de Cartan, algèbres de Lie, algèbres de Lie supersymétriques, brisure de symétrie, la théorie des algèbres quantiques, la géométrie différentielle, la géométrie descriptive, etc…. Le but de ce mémoire est de relater l’état de l’art dans la modélisation mathématique du code génétique. En particulier, nous nous intéresserons à la théorie des groupes et de ses représentations (travaux de Hornos and al) et des algèbres quantiques (travaux de Sorba and al). Notre mémoire est organisé comme suit. Dans le premier chapitre, on présente quelques éléments de la biologie moléculaire moderne et en particulier le code génétique. Dans le deuxième chapitre, nous présentons d’abord les notions de base concernant la théorie des groupes et de ses représentations. Notre attention se dirige par la suite aux groupes quantiques et les algèbres quantiques. Ainsi, nous en donnons les différentes définitions et caractéristiques. Dans le troisième chapitre, on présente les différentes modélisations mathématiques proposées dans la littérature pour expliquer ce code génétique, en omettant les approches algébriques (Hornos et Sorba). Le dernier chapitre est consacré à l’étude de toutes les symétries présentes dans ce code génétique. Ainsi, nous utiliserons la théorie des groupes (Voir §4.4) et l’algèbre quantique (Voir §4.5) pour mieux décrire ces symétries. Enfin, nous concluons par des remarques et les perspectives de recherche dans ce domaine. 8 CHAPITRE 1 : Eléments de Biologie Moléculaire 9 Chapitre 1 Eléments de Biologie Moléculaire 1.1. Introduction Dans ce chapitre, on présente quelques notions de base de la biologie moléculaire moderne, [1], [2]. On s’intéresse en particulier aux relations entre les codons et les différents acides aminés, communément appelé le code génétique. 1.2. Les nucléotides L’ADN est un Polymère. C’est une longue chaîne de monomères appelés nucléotides (Figure 1.1). La molécule d’ADN est ainsi qualifiée de poly-nucléotides, Base azotée Groupement phosphate 5’ 1’ 4’ 3’ Sucre 2’ Figure 1.1 : Structure du Nucléotide Chaque nucléotide se composant de trois parties : • Ose : est un sucre à cinq atomes de carbone numérotés de 1′,2′,...,5′ appelés Désoxyribose (Figure 1.2). 5’ HOH2C OH 4’ 1’ 3’ 2’ O Figure 1.2 : Structure du désoxyribose • L’acide phosphorique : c’est un groupement de phosphate (Figure 1.3). O O H O H Figure 1.3 : Phosphate H O P 10 Chapitre 1 • Eléments de Biologie Moléculaire une base azotée : Les bases azotées sont des molécules organiques formées d'un ou deux cycles où alternent des atomes de carbone et d'azote. Il y a donc quatre sortes de nucléotides : les bases azotées Adénine (A) et Guanine (G), appartiennent au groupe des purines, alors que les bases Thymine (T) et Cytosine (C) appartiennent au groupe des pyrimidines. Figure 1.4 : Structure des bases azotées (puriques et pyrimidiques) Remarque : Les purines sont formées de deux cycles, alors qu'il n'y en a qu'un pour les pyrimidines, (Figure 1.4). 1.3. La structure de l’ADN L’ADN (acide désoxyribonucléique) est composé de séquence de nucléotides reliés entre eux par des fonctions esters et que l'on retrouve dans toutes les cellules vivantes. L’ADN est le support de l'hérédité ou de l'information génétique, car il constitue le génome des êtres vivants et se transmet en totalité ou en partie lors des processus de reproduction cellulaire c’est-à-dire la synthèse des protéines. 1.3.1. - Quelques dates 1953 : Découverte de la double hélice (Watson et Crick) : Analyse de clichés de diffraction de rayon X par des cristaux d’ADN. - 1953 : un modèle du code génétique (Gamow) - 1956: l’ARN est découvert. - 1958 : La démonstration du modèle semi-conservatif de la réplication de l’ADN (Meselson et Stahl). - 1960 : Découverte de l’ARN messager (Monod).1961-1966 : le décryptage du code génétique (Nirenberg et Matthaei) grâce à la synthèse de protéines in vitro à partir d’un ARN poly-U. - 1965 : L’opéron lactose (Jacob et Monod) 11 Chapitre 1 1.3.2. Eléments de Biologie Moléculaire La double hélice d’ADN : La première structure tridimensionnelle essentiellement correcte de la molécule d’ADN est proposée en 1953 par James Watson et Francis Crick, [3]-[4], à l’université de Cambridge. Elle est obtenue non seulement à partir de l’interprétation des clichés de diffraction des rayons X réalisées par Franklin et Wilkins qui avaient déterminé en 1950 que l'ADN devait avoir une forme régulière hélicoïdale en forme d'hélice (Figure 1.5), mais aussi des travaux d’Erwin Chargaff qui avaient montré en 1950, que peu importe de quelle espèce on extrait l'ADN, la quantité d'adénine est toujours égale à la quantité de thymine. De même, la quantité de cytosine est toujours égale à la quantité de guanine, c’est-à-dire le rapport A+T / C+G peut varier d'une espèce à l'autre, mais on a toujours A = T et C = G. et enfin des analyse au microscope électronique avaient permis de montré que le diamètre de la molécule d’ADN était d'environ 2 nm. Figure 1.5 : Image par diffraction des rayons X d’un cristal d’ADN. Watson et Crick émirent l'hypothèse qu'il pouvait se former des liaisons hydrogène entre les bases azotées A et T (Figure 1.6.1) et les bases C et G (Figure 1.6.2), [5]. Figure 1.6.1 : Liaisons hydrogène entre la thymine et l’adénine. 12 Chapitre 1 Eléments de Biologie Moléculaire Figure 1.6.2 : Liaisons hydrogène entre la cytosine et la guanine. Remarque Les liaisons d hydrogène peuvent être détruites par la chaleur ou par certain produits chimiques une telle destruction conduit à séparer les deux brins de la double hélice, Il existe dans les cellules des enzymes capables de séparer les deux brins de la double hélice dans le but de copier l ADN ou d exprimer l information génétique. Chaque molécule d’ADN est composée de deux longues chaînes de sousunités enroulées l’une autour de l’autre pour former une hélice à double brin s’enroulant dans le sens des aiguilles d’une montre (Figure 1.7.1). Ces deux brins ont trois propriétés essentielles : i) Antiparallèles : l’un est constitué d’un enchaînement dans le sens 5 ' → 3' et l’autre dans le sens 3' → 5 ' (Figure 1.7.2). ii) Complémentaires : chaque adénine (A) d’un des deux brins est liée par deux liaisons hydrogène avec une thymine (T) de l’autre brin, et chaque guanine (G) d’un brin est liée par trois liaisons hydrogène avec une cytosine (C) de l’autre brin. La double hélice effectue un tour toutes les 10 paires de base environs, le pas de l’hélice est donc de 34 Angström et la distance moyenne entre deux base est d’environ 3,4 Angström ; l’hélice d’ADN à un diamètre de 20 Angström, on distingue lorsqu’on la regarde depuis l’extérieur un sillon majeur et un sillon mineur (Figure 1.7.1), ces éléments jouent un rôle très important pour l’ADN au niveau de ses interactions avec les protéines. 13 Chapitre 1 Eléments de Biologie Moléculaire Sillon mineur Sillon majeur Figure 1.7.1 La double hélice. Figure 1.7.2 Structure antiparallèle 1.4. La structure de l’ARN La structure de l’ARN est similaire, mais pas identique, à celle de l’ADN. Il existe une différence dans l’ARN, le sucre ribose (Figure 1.8.1) remplace le désoxyribose de l’ADN et la thymine (T) présente dans l’ADN est remplacée par une autre base complémentaire appelé uracile (Figure 1.8.2), mais contrairement à l’ADN, l’ARN sont des molécules constituées d'un seul brin : il est dit monocaténaire. A l'exception de l'ARN messager qui possède une structure linéaire, les ARNr et ARNt sont fait d'un brin fréquemment replié sur lui-même par appariement local des bases. Ils adoptent ainsi une conformation faite de boucles et de tiges (dite en épingles à cheveux ou bourrelets) et sont souvent associés à des protéines spécifiques. 5 O HOH2 4 1 3 O 2 O Figure 1.8.1 : Ribose Figure 1.8.2 : Uracile 14 Chapitre 1 Eléments de Biologie Moléculaire 1.5. Réplication de l’ADN Le mécanisme de réplication a était expliqué par Watson et Crick (Figure 1.9). C’est le processus par lequel une cellule copie son ADN c’est-à-dire les brins originaux (parent) se séparent et chaque brin individuel sert de matrice, pour la synthèse d’un nouveau brin (brin répliqué). La réplication est nécessaire pour que l’information génétique présente dans la cellule puisse être transmise aux cellules filles après la division cellulaire, l’ADN est copié par des enzymes appelés ADN polymérase qui agit sur l’ADN monobrin en synthétisant un nouveau brin complémentaire du brin original, [1], la synthèse se fait toujours dans la direction 5′ → 3′ , chaque molécule copie de l’ADN contient un brin de la molécule mère et un brin néosynthétisé et la réplication est dite semi-conservative (Figure 1.9). Le mécanisme de la réplication est semblable chez la plupart des organes vivants, les seules différences concernent les enzymes et les protéines impliquées. La réplication doit être précise car un petit taux d’erreur conduirait à une perte de l’information génétique, cette dernière est assurée par l’ADN polymérase à vérifier que les bonnes bases ont été insérées dans le brin néosynthétisé. On estime qu’une base sur cinq milliards est mal insérée. Molécules d’ADN parentales Molécules d'ADN parentales 5'-CTGACGTA-3' 3'-GACTGCAT-5' Brins fils [ 5'-CTGACGTA-3' 3'-GACTGCAT-5' ] 5'-CTGACGTA-3' 3'-GACTGCAT-5' ^ Z Molécules d'ADN filles Molécules d’ADN filles Figure 1.9 : La réplication d’une séquence d’ADN : processus semi-conservatif Dans ce cas, les bases des brins nouvellement synthétisés sont montrées en rouge. Dans le duplex à gauche, le brin supérieur est la matrice provenant de la molécule parentale (montrées en bleu) et celui du bas est le brin nouvellement 15 Chapitre 1 Eléments de Biologie Moléculaire synthétisé ; dans le duplex à droite, le brin du bas est la matrice provenant de la molécule parentale et celui du haut est nouvellement synthétisé (Figure 1.10). Figure 1.10 : Réplication d’une longue molécule d’ADN duplex Proposée par Watson et Crick. Durant la réplication, la double hélice de l’ADN est progressivement déroulée ce qui produit des segments d’ADN simples brins qui peuvent être copiés par l’ADN polymérase, le déroulement de la double hélice commence à une position précise appelé origine de réplication (Figure 1.11) qui progresse le long de la molécule généralement de façon bidirectionnelle, la région où la double hélice est déroulé est appelé fourche de réplication, [1]. Figure 1.11 : Origine et fourche de réplication 16 Chapitre 1 Eléments de Biologie Moléculaire 1.6. Transcription Le transfert de l'information contenu dans un gène sous forme d'une séquence d'ADN, vers une séquence d'ARN est appelé Transcription. Ce processus fait intervenir une activité enzymatique nommée ARN polymérase qui utilise la double hélice de l’ADN comme matrice appelées brins matrice et non matrice. L’ARN est synthétisé à partir du brin matrice et a donc la même séquence que le brin non matrice (Figure 1.12). On exprime généralement la séquence des gènes en terme de brin non matrice et l’ARN synthétisé s’appelle un transcrit et peut ensuite être traduit en protéine ou utilisé comme ARN ribosomal ou comme ARN transfert. Ce processus se caractérise par : • La transcription n’est pas fixe : seules des petites portions du génome sont transcrites à une époque donnée de la vie de la cellule. • La transcription commence en un point précis de l’ADN pour se terminer en un point également précis, l’espace entre les deux (initiation-terminaison) constitue une unité de transcription. Brin matrice 3′ A A T G C C G T C A C T 5′ ADN 5′ T T A C G G C A G T G A 3′ Brin non matrice ↓ TRANSCRIPTION ARN 5′ U U A C G G C A G U G U 3′ Figure 1.12 : la transcription du brin d’ADN 1.7. Traduction C’est le mécanisme par lequel le flux d’information va passer de la forme acide nucléique (alphabet à 4 lettres) à la forme protéine (alphabet à 20 lettres) selon un code universel ou presque. Sur le plan génétique les éléments essentiels de la traduction sont : i) ARN messager : l'ARNm véhicule l'information génétique, du lieu de stockage (hélice d'ADN) vers le lieu d'expression, où il sert de matrice à la synthèse du polypeptide. 17 Chapitre 1 ii) Eléments de Biologie Moléculaire ARN ribosomal : Les ribosomes sont des structures macromoléculaires composé d’ARN ribosomal (ARNr) et de protéine, on les trouve en grande quantité dans le cytoplasme où ils jouent un rôle important dans la traduction des ARN messager en protéine. Chacun est constitué de deux sous unités ribonucléoprotéiques petite et grande sous unité généralement exprimées en terme d’unités de segmentation (S), [7]. Petite sous unité Grande sous unité Taille 30 S 50 S ARN 16 S 5-23 S Protéines (Nbr/mol) 21 34 Tableau 1.1 les caractéristiques des sous unités iii) ARN de transfert : les ARN de transfert (ARNt) sont des petites molécules qui permettent l’assemblage des acides aminés dans le cadre de la synthèse protéique, suivant un ordre spécifier par la séquence d’un ARNm. Les cellules déposent de nombreux ARNt différents, chacun liant spécifiquement un acide aminé. Ces petites molécules (environ 70 nucléotides) possèdent deux fonctions essentielles : Ø la possibilité pour chacune d’entre elles de se lier à un acide aminé spécifique. Ø reconnaître un codon précis grâce à un anticodon (un triplet complémentaire du codon). iv) L’aminoacyl-ARNt synthétases : les enzymes capables de catalyser (charger) des ARN de transfert, c’est-à-dire de relier le bon acide aminé à l’ARNt porteur du bon anticodon sont appelées aminoacyl-ARNt synthétases, [7]. Il en existe autant que d’acides aminés et chacune est capable de reconnaître les différents ARNt synonymes. L’énergie nécessaire à la traduction est fournie par l’Adénosine triphosphate (ATP) et la guanosine triphosphate (GTP). 1.8. Codon C’est un ensemble composé de trois nucléotides consécutifs porté par l'ARNm correspondant à un acide aminé qui lui est spécifique, ou correspondant à un nonsens, [10]. La liaison de l’ARNt avec l’ARNm porteur de l’information se fait par complémentarité entre 3 nucléotides de chacun de ces deux ARN. Les 3 nucléotides du ARNm constituent un codon et les 3 nucléotides du ARNt un anticodon. Au cours de la traduction l’anticodon et le codon se lient de manière antiparallèle et l’acide aminé porté par le ARNt est incorporé à la protéine en cours de synthèse, et la 18 Chapitre 1 Eléments de Biologie Moléculaire séquence primaire du ARNm est donc traduite par groupes de 3 nucléotides (codons). 1.9. Code génétique Le code génétique représente l’ensemble des règles de correspondance permettant de traduire une séquence d’acide nucléique en protéine. En effet, l'enchaînement des quatre nucléotides A, C, U, G, doit coder l'enchaînement des 20 acides aminés dans les protéines. Le codage d'un acide aminé nécessite donc au minimum une suite de 3 bases. De plus, si une base code un acide aminé, seules 4 acides aminés peuvent être codés de façon non ambiguë, avec un codage à deux bases, on peut définir 42 = 16 acides aminés, ce qui n'est toujours pas suffisant, mais avec une combinaison de 3 parmi 4 possibilités on a 43 = 64 codons pour 20 acides aminés (Tableau 1.2). Tous les acides aminés à l’exception de la méthionine (Met) et du tryptophane (Trp) sont codés par plusieurs codons. Certains de ces 64 codons UAG, UGA et UAA ne codent avec aucun acide aminé. Ces triplets «non-sens» indiquent à la machinerie cellulaire la fin de la lecture de l’information contenue dans les gènes, et provoquent l’arrêt de fabrication des protéines. On les appelle codons STOP ou codons de terminaison, [11], [12]. Le codon de la méthionine AUG est le signal qui lance la synthèse protéique (traduction) on l’appelle aussi codon d’initiation. AAA AAG AAT AAC GAA GAG GAT GAC TAA TAT TAG TAC CAA CAT CAG CAC Phénylalanine Phénylalanine Leucine Leucine Leucine Leucine Leucine Leucine Isoleucine Isoleucine Isoleucine Méthionine Valine Valine Valine Valine AGA AGG AGT AGC GCA GCG GCT GCC TGA TGG TGT TGC CGA CGG CGT CGC Sérine Sérine Sérine Sérine Proline Proline Proline Proline Thréonine Thréonine Thréonine Thréonine Alanine Alanine Alanine Alanine ATA ATG ATT ATC GTA GTG GTT GTC TTA TTG TTT TTC CTA CTG CTT CTC Tyrosine Tyrosine STOP STOP Histidine Histidine Glutamine Glutamine Asparagine Asparagine Lysine Lysine Asparagine Asparagine Ac. glutamique Ac. glutamique ACA ACG ACT ACC GCA GCG GCT GCC TCA TCG TCT TCC CCA CCG CCT CCC Cystéine Cystéine STOP Tryptophane Arginine Arginine Arginine Arginine Sérine Sérine Arginine Arginine Glycine Glycine Glycine Glycine Tableau 1.2 : le code génétique. 1.10. Dégénérescence du code génétique Il existe vingt acides aminés dans les protéines et 64 codons possible pour les définir. En conséquence, la plupart des acides aminés sont représentés par plus 19 Chapitre 1 Eléments de Biologie Moléculaire d’un codon, une caractéristique que l’on appelle dégénérescence ou la redondance du code génétique. Le nombre de codons synonymes va de 1 à 6 (la redondance 5 est absente), par exemple : la leucine est définie par six triples différents qui sont : UUA, UUG, CUU, CUC, CUA et CUG (Tableau 1.3). En effet, si le codon n’était pas dégénéré dans environ deux cas sur trois le changement d’une base d’un codon conduirait à un codon qui ne définirait aucun acide aminé et par conséquent à l’arrêt de la synthèse de la chaîne peptidique au niveau de ce codon, [13], [14]. Par contre, si le code était dégénéré la modification d’une base conduit à un codon qui définit en général un autre acide amine et s’oppose ainsi à l’arrêt de la synthèse peptidique. De plus, le déchiffrage des codons se fait par les ARNt qui porte chacun un triplets complémentaire de l’un de ces codons. Pour gérer cette dégénérescence, chaque ARNt peut reconnaître plus d’un codon (triplet) pour son acide aminé. De nombreuses analyses directes de ARNm et de ARNt ont apporté des preuves de la dégénérescence du code génétique. Ala Arg Asn Asp Cys Gln Glu Gly His Ile 4 6 2 2 2 2 2 4 2 3 Leu Lys Met Phe Pro Ser Thr Trp Tyr Val 6 2 1 2 4 6 4 1 2 4 Tableau 1.3 : Code génétique dégénérée 1.11. Universalité du code Au début on pensait que le même triplet (codon) définit le même acide aminé pour tous les êtres vivants c’est-à-dire que le code est universel. Cependant on a pu montrer qu’il existait une certaine exception telles que les mitochondries qui possède le codon UGA qui correspond normalement à un signal de terminaison (stop code) est traduit en tryptophane tandis qu’ AGA et AGG qui codent normalement l’arginine sont des codons stop, [15]. Le fait que les mêmes codons définissent les mêmes acides aminés chez tous les organismes vivants montre que l’origine du code leur est commune et qu’ils doivent en conséquence dériver d’un même système cellulaire. 20 Chapitre 1 Eléments de Biologie Moléculaire Références [1] P. C. Winter, G. I. Hickey et H. L. Fletcher, L’Essentiel en Génétique, Berti Editions, 2002, 2006 Paris. [2] N. Karam, Cours de Biologie moléculaire, laboratoire de Biophysique Mathématique, Université d’Oran Es-senia, Algérie. [3] J. D. Watson and F. H. C. Crick, Nature 171, 737 (1953). [4] J. D. Watson and F. H. C. Crick, Nature 171, 964 (1953). [5] F. H. C. Crick, J. Mol. Biol. 19, 548 (1966). [6] A. L. Lehninger, D. L. Nelson and M. M. Cox, Principles of Biochemistry, 2nd edn. (Worth Publ., New York, 1993). [7] L. Stryer, Biochemistry, 4th edn. (Freeman, New York, 1995). [8] B. Lewin, Genes V (Oxford University Press, Oxford, 1994). [9] W. S. Klug and M. R. Cummings, Concepts of Genetics, 3rd edn. (MacMillan, New York, 1991). [10] F. H. C. Crick, L. Barnett, S. Brenner and R. J. Watts-Tobin, Nature 192, 1227 (1961). [11] S. Ozawa, T. H. Jukes, K. Watanabe and A. Muto, Microbiol. Rev. 56, 229 (1992). [12] H. Tim, Biologie Moléculaire de La Cellule, DECITRE libraire 2004. [13] F. H. C. Crick, J. Mol. Biol. 38, 367 (1968). [14] R. Grantham, Science 185, 862 (1974). [15] M. Eigen, B. F. Lindemann, M. Tietze, R. Winkler-Oswatitsch, A. Dress and A. von Haeseler, Science 244, 673 (1989). 21 CHAPITRE 2 : Groupes et Algèbres 22 Chapitre 2 Groupes et Algèbres 2.1. Introduction Dans ce chapitre, on résume les différentes définitions de base concernant les outils mathématiques (algébriques et géométriques), dont on aura besoin dans le chapitre 3 et 4 qui traite les multiples modélisations de code génétique. On utilise pour cela les références : [1]- [37]. 2.2. Elément de la théorie des groupes 2.2.1. Définition d’un groupe Un ensemble G est appelé un groupe s’il est muni d’une loi de composition notée ( o ), telle qu’elle satisfasse à : i) La loi interne ; ∀a ∈ G et ∀b ∈ G, alors a o b ∈ G. ii) La loi est associative : ( a o b ) o c = a o ( b o c ) . iii) Il existe un élément neutre e , tel que : e o a = a o e = a, iv) Tout élément a possède un inverse a −1 dans G , tel que : a o a −1 = e ∀a ∈ G. De plus si cette loi est commutative ( a o b ) = ( b o a ) . Si la multiplication est commutative, i.e, (ab = ba) , On peut citer les ( ) exemples suivants : (Z ,+ ) et ℜ ∗ ,× . » 2.2.2. Propriétés – Ordre d'un groupe : On appelle ordre d’un groupe, le nombre d’éléments qu’il contient G , on le note g . – Groupes finis et infinis : Un groupe est dit fini ou infini s'il possède un ordre g fini ou infini. – Groupe discret et continu : Un groupe est dit discret si ses éléments sont clairement sépares, plus précisément s'ils sont dénombrables (Exemple {1, j, j } Groupe fini d’ordre g = 3 , {¢, +} Groupe infini décret). Un groupe est dit 2 continue si ces éléments sont fonction d’un ou de plusieurs paramètres variant continuellement dans ce cas l’ordre du groupe est le nombre des paramètres indépendant dont dépendent les éléments de groupe (Exemple pour le groupe des rotations d’axe OZ et d’angle θ ∈ [ 0, 2π ] ). 23 Chapitre 2 – Groupes et Algèbres Groupe de Lie : Un groupe de Lie est une structure répondant au critère d'un groupe comme défini en algèbre (opération interne, élément neutre et inverse) dont les opérations sur ce groupe sont continues. Par exemple, une rotation sur un cercle est continue. Un groupe de Lie est dit matriciel, si ses différents éléments sont représentés par des matrices. Les groupes de Lie se classent en différentes variétés ou en groupe. On compte 4 groupes de groupes de Lie : réels, complexes, quaternioniques et exceptionnels. – Classification de Cartan : Dans se qui suit on classifie les différents groupes de Lie matriciels selon : • Le groupe général linéaire d’ordre n, GL(n,C) : C’est l’ensemble des matrices carrées, régulières (inversibles), de rang n , à coefficients dans £ , muni de la multiplication matricielle, chaque élément est caractérisé par le domaine de n2 éléments des matrices (complexe) soit aux total 2n 2 paramètres réels,ce qui implique que la dimension du groupe GL(n, £) est 2n 2 . Pour passé du groupe GL(n, £) au sous-groupe GL(n, ¡ ) , on doit limiter l’espace des paramètres à ¡ n ce qui va donné un groupe de dimension n 2 . • Le groupe spécial linéaire d’ordre n, SL(n,C) : c’est un sous-groupe de GL(n, £) , restreint par les matrices de dim M = 1 . Ce qui impose que le nombre de paramètres (dimension) est réduit à 2n 2 − 2 . Pour passé du groupe SL(n, £) au sous-groupe SL(n, ¡ ) , on doit limiter l’espace des paramètres à ¡ n ce qui va donné un groupe de dimension n 2 − 1 . • Le groupe unitaire d’ordre n, U(n,C) : c’est l’ensemble des matrices complexes unitaires de rang n menu de la condition de l’unitarité UU † = U †U = 1 , où U † est la transposée conjuguée de U . Le nombre de paramètres nécessaires pour 1 spécifier une matrice complexe est 2n 2 , l’unitarité UU † = 1 impose n + n(n − 1) 2 conditions supplémentaires, ce qui réduit le nombre de paramètres (dim) à n 2 . • Le groupe spécial unitaire d’ordre n, SU(n,C) : c’est un sous groupe de U (n, £) , restreint par les matrices de dim U = 1 . Ce qui réduit sa dimension à 2n 2 − 2 . 24 Chapitre 2 • Groupes et Algèbres Le groupe orthogonal d’ordre n, O(n, C) : forme l’ensemble des matrices complexe orthogonales, telles que : OO t = O t O = 1 , où O t désigne la transposé de O . La dimension du groupe O(n, £) est donc n(n − 1) . Pour passé au groupe des matrices réel orthogonales O(n, ¡) , on limite l’espace des paramètres à ¡ n . Le nombre de paramètres est n 2 moins le nombre des contraintes indépendantes imposées par l’orthogonalité • 1 1 n(n + 1) donne une dimension de n(n − 1) . 2 2 Le groupe spécial orthogonal d’ordre n, SO(n,R) : forme l’ensemble des matrices orthogonales n × n de déterminant 1. Le groupe O (n, £) admet comme sous-groupe SO(n, £) . Cette condition ne change pas la dimension du groupe n(n − 1) , et le groupe O(n, ¡) admet comme sous-groupe SO (n, ¡) de dimension • 1 n(n − 1) . 2 Le groupe symplectique Sp(2n) : forme l’ensemble des matrices M 2 n×2 n à coefficients réels ¡ de dimension n(2n+1) ou complexes £ de dimension 2n(2n+1), muni de la multiplication, tel que : MA + AT M = 0 ( où, AT est le transposé de A et M est la matrice antisymétrique t M = − M 0n×n M = − I n×n • ) I n×n 0n×n Le groupe exceptionnel E8 : C’est un groupe de Lie complexe. Il est composé de vecteurs à huit composantes, 8 pour les 8 composantes formant ses vecteurs. Il a 248 dimensions complexes. E8 est le plus grand et le plus compliqué. Il est utilisé dans certaines théories d'unification. Il a l'avantage d'intégrer des sousgroupes de Lie sur lesquels est basé la théorie standard. • Le groupe exceptionnel G2 : C’est le plus petit des groupes de Lie complexes de type exceptionnel de rang 2 et de dimension 14. Son groupe d'automorphismes est le groupe trivial. • Le groupe exceptionnel F4 : C’est un groupe de Lie exceptionnel de type complexe. F4 est de rang 4 et de dimension 52 son groupe d'automorphismes est le groupe trivial. 25 Chapitre 2 Groupes et Algèbres – Sous groupe : un sous-ensemble H de G est appelé sous-groupe de G , noté G ⊃ H , s'il est lui même un groupe avec la même loi interne, que celle de G. Ø Sous groupe invariant : un sous-groupe est dit sous-groupe invariant, si pour tout élément h ∈ H et g ∈ G alors ghg −1 ∈ H , c’est-à-dire que la transformation de l’élément de H par G donne H . Ø Groupe simple et semi-simple : un groupe G est dit simple si il ne contient aucun sous groupe invariant (à l’exception de lui-même), et il est dit semi- simple, s’il ne contient aucun sous groupe invariant abélien. Ø Groupe quotient : Soit H un sous-groupe d’un groupe G , on appelle coset à droite de H , l’ensemble des éléments de la forme Ha = {ha} = {h1a, h2a2 ,...} , et on appelle coset à gauche de H , l’ensemble des éléments aH = {ah} = {ah1, ah2 ,...} , ∀h ∈ H et ∀a ∈ G . Dans le cas, où H est un sous groupe invariant on a Ha = aH . Ainsi, nous définissons ( a1H ) .( a2 H ) = ( a1a2 ). H . une multiplication sur les classes par : Cela donne à l'ensemble des classes une structure de groupe ; ce groupe est appelé groupe quotient noté G/H. L'application f : G → G / H , a → aH est alors un homomorphisme de groupe. 2.3. Algèbre, algèbre de Lie, algèbre universelle enveloppante ü Produit direct de groupes Soient G et H deux groupes. L’ensemble produit G × H , c'est-à-dire l'ensemble des couples d’éléments de G et H est muni d'une structure de groupe ( a, b ) × ( a′, b′ ) = ( a × a′, b × b′ ) ( G × H , ×) ∀ a, a ′ ∈ G , b , b ′ ∈ H (2.1) est alors un groupe, appelé le produit direct de G et H. Un exemple est fourni dans l'espace euclidien à 4 dimensions par les paires de rotations indépendantes de deux plans orthogonaux qui forment le groupe SO (2) × SO(2) , sous-groupe de SO(4) . ü Définition d’un espace vectoriel : un espace vectoriel sur un corps K (kespace vectoriel) est un groupe abélien V, noté additivement, muni d’une loi k × V → V , produit externe, noté multiplicativement, vérifiant les propretés suivantes : pour tous α et β dans K et pour tous v et w dans V, on a : 26 Chapitre 2 i). Groupes et Algèbres Associativité : (α β )v = α ( β v ), ii). Distributivité : (α + β )v = α v + β v et α (v + w) = α v + α w. iii). 1 v = v, 1 étant l’unité du corps k Les éléments de V sont nommés vecteurs et les éléments de K sont nommés scalaires. Exemple : un groupe V, réduit à son élément neutre {0} , est un espace vectoriel sur tout corps commutatif K. ü Algèbre : On appelle une algèbre tout triplet ( A, µ , η ) , où A est un espace vectoriel sur un corps K , muni des applications linéaires suivantes : a. Le produit µ :A⊗A → A µ ( a ⊗ b ) = a.b ∀ a,b ∈ A La propriété d’associativité de l’opération du produit µ (2.2) (2.3) est garantie par la commutativité du diagramme suivant : µ o ( µ ⊗ id ) = µ o ( id ⊗ µ ) Où, id est l’opérateur identité sur A b. L’unité De même, l’existence d’un élément neutre 1A ∈ A pour le produit se traduit par l’existence de l’application linéaire "unité" définit comme suit : η :k →A η (k ) = k 1A , ∀k ∈ K (2.4) (2.5) Cette application satisfait la propriété suivante : µ o (η ⊗ id ) = µ o ( id ⊗η ) L’algèbre ( A, µ , η ) est dite commutative si le diagramme suivant est commutatif : id o µ = µ o τ Où τ est l’application "permutation" : τ : A⊗A → A⊗A τ (a ⊗ b) = b ⊗ a 27 (2.6) (2.7) Chapitre 2 Groupes et Algèbres ü Co-algèbre On appelle co-algèbre tout triplet ( A, ∆ , ε ) , où A est un espace vectoriel, muni des applications linéaires suivantes : a. Le co-produit ∆:A → A⊗A ∆ (a . b) = ∆ ( a ) . ∆ ( b ) (2.8) (2.9) ∆(1A ) = 1A ⊗ 1A (2.10) La propriété de co-associativité du co-produit ∆ est garantie par la commutativité A⊗A⊗A du diagramme suivant : ( ∆ ⊗ id ) o ∆ = ( id ⊗ ∆ ) o ∆ A⊗A A⊗A A b. La co-unité ε :A → k ε ( a.b ) = ε ( a ) ε ( b ) , ∀a, b ∈ A ε (1A ) = 1 (2.11) (2.12) (2.13) En fait, cette application est définie par : (ε ⊗ id ) ∆ ( a ) = ( id ⊗ ε ) ∆ ( a ) = id ∀a ∈ A (3.14) c Ce qui se traduit par ε ⊗id id⊗ε k ⊗ A ← A ⊗ A →A ⊗ k ∆ ≅ ≅ A La co-algèbre ( A, ∆ , ε ) est dite co-commutative si : ∆ o id = τ o ∆ τ A ⊗ A ← A⊗A id d AA ← AA ü Bi-algèbre Une bi-algèbre est un quintuplé ( A, µ , η , ∆, ε ) , qui possède à la fois une structure d’algèbre ( A, µ , η ) et une structure de co-algèbre ( A, ∆ , ε ) , telles que les propriétés (2.12), (2.13), (2.14) et (2.15) soient satisfaites. 28 Chapitre 2 Groupes et Algèbres ü Structure d’algèbre de Hopf : Une algèbre de Hopf est une bi-algèbre ( A, µ , η , ∆, ε ) muni d’un antipode S. Ce dernier, est représenté par un endomorphisme de A définit comme suit : S :A → A S (1A ) = 1A (3.15) (3.16) et vérifiant la propriété suivante : µ ( id ⊗ S ) ∆ ( a ) = µ ( S ⊗ id ) ∆ ( a ) = η o ε tel que S ( µ ( a ⊗ b)) = S (b) S ( a ) ∀a ∈ A ∀a, b ∈ A (3.17) (3.18) où, en terme de commutativité de diagramme on a : En général, une bi-algèbre ne possède pas toujours d'antipode, mais s’il existe, alors il est unique. ü Algèbre de Lie Pour des valeurs suffisamment petites des paramètres on peut représenté un élément du groupe g (α ) = g (α1 ,..., α n ) d’un groupe de lie d’ordre n , sous la forme n g (α ) = g (o) + ∑ α i i =1 ∂g (α ) + 0(α 2 ) ∂α i α =0 i n = 1 + ∑ α i xi (2.19) i =1 n = 1 − i ∑ α iGi = e −i n ∑α iGi i =1 i =1 avec xi = ∂g (α ) = −iGi ∂α i α =0 (2.20) i Les opérateurs xi ou bien Gi sont appelées les générateurs de l’algèbre de Lie, associés au groupe de Lie considéré. En général ; on appelle algèbre de Lie de A tout espace vectoriel généré par une base { xi }(1 ≤ i ≤ n ) , muni d’une opération [ ,] "crochet de Lie" et satisfaisant les propriétés suivantes : 29 Chapitre 2 Groupes et Algèbres ∀x, y , z ∈ A et ∀α , β ∈ ¡ , (algèbre de Lie réelle), ou £ (algèbre de Lie complexe). • Linéarité : [ x, α y + β z ] = α [ x, y ] + β [ x, z ] • Antisymétrie : [ x, y ] = − [ y, x ] • Identité de Jacobi : x, [ y, z ] + y, [ z, x ] + z , [ x, y ] = 0 • Une algèbre de Lie est dit abélienne si [ x, y ] = 0 et les générateurs xi satisfont à la relation fondamentale suivante : xi , x j = Cijk xk (2.21) où, les coefficients Cijk sont appelées constantes de structure de A par rapport a cette base. À partir des propriétés du crochet de Lie, on déduit que ces constantes de structure vérifient : i. Antisymétrie : Cijk + C kji = 0 k Cilj = 0 ii. Identité de Jacobi : Cijk Clmj + Cljk Cmij + Cmi D’autre part, un sous ensemble A′ d’une algèbre de Lie A munie de la loi [ ,] est dit sous algèbre de Lie de l’algèbre A si on a : [ x; y ] ∈ A′ ∀x, y ∈ A′ (2.22) En plus cette sous algèbre est dite abélienne si [ x; y ] = 0 ∀x, y ∈ A′ (2.23) Si A est une algèbre de Lie associée à un groupe de Lie alors la sousalgebre A′ de A est associer au sous-groupe de Lie G′ ⊂ G . ü Somme directe d'algèbres de Lie Soit G le groupe de Lie issu d’un produit direct de deux groupes de Lie G1 et G2, et soit g l’algèbre de Lie associée au groupe G. Alors, on montre que g est une somme directe des deux algèbres de Lie g1 et g 2 des groupes de Lie G1 et G2 respectivement. Si g1 généré { yi }(1 ≤ i ≤ n ) , on obtient par la base { xi }(1 ≤ i ≤ n ) et g 2 par base : [ x1 ⊕ y1 , x2 ⊕ y2 ] = [ x1 ⊕ x2 ]1 ⊕ [ y1 ⊕ y2 ]2 on peut donc noter la g = g1 ⊕ g 2 = ⊕ g i ∀x ∈ g1 et y ∈ g 2 . i =1 30 (2.24) (2.25) Chapitre 2 Groupes et Algèbres Remarque : - si on identifie naturellement g1 et g 2 à des sous-algebre de g1 ⊕ g 2 , alors [ g1, g 2 ] = 0 - une somme d’algèbre de lie g1 ⊕ g 2 correspond au produit direct des groupes de lie g1 ⊗ g 2 ü Somme semi directe d'algèbres de Lie Si g admet deux sous algèbre g1 et g 2 , tels que : [ g1, g1 ] = g1 [ g2 , g2 ] = g2 [ g1, g 2 ] ∈ g (2.26) alors, dans ce cas la g est La somme semi-directe de g1 et g 2 , et on note g = g1 ⊕ s g 2 .Par exemple l’algèbre de Poincaré est la somme semi-directe de sousalgèbre de translation et de la rotation). ü Forme de Killing et Casimir On définit le Tenseur symétrique qu’on l’appelle aussi Tenseur métrique ou Forme de Killing associé à un groupe de Lie comme suit : gij = g ji = CikmC kjm (2.27) Une algèbre de lie est semi-simple si le : det g ≠ 0 On appel casimir d’une algèbre de lie g toute opérateur qui commute avec tout les éléments de g on dit d’un tell opérateur que c’est un opérateur invariant car il reste constant sous l’effet d’une transformation de groupe de Lie associer à l’algèbre de lie g et on note cette opérateur {Ci } , ∀i = 1,..., n , et il vérifient : [Ci , gi ] = 0 avec gi générateurs de g Ci , C j = 0 ∀Ci , C j (2.28) ü Algèbres enveloppantes Universelle Soient g une algèbre de Lie et I l’idéal de l’algèbre tensorielle T ( g ) au dessus de g généré par les éléments de la forme X ⊗ Y − Y ⊗ X − [ X , Y ] , tels que x, y ∈ g . Alors l’algèbre quotient U ( g ) = T ( g ) I est appelée universelle classique (AEUC) de l’algèbre de Lie g . 31 algèbre enveloppante Chapitre 2 Groupes et Algèbres 2.4. Représentations des groupes Soient G un groupe et E un espace vectoriel ( ¡, ou £ ) ≠ {0} . On appelle représentation du groupe G dans l'espace E toute homomorphisme D du groupe G dans le groupe des transformations linéaires GL( E ) , tels que D : G → GL( E ) g → D( g ) D ( g .g ′ ) = D ( g ) . D ( g ′) D (e) = I (2.29) ∀g , g ′ ∈ G (2.30) (2.31) où, e est l’élément neutre de G et I l'opérateur identité de E , l'espace E est appelé l'espace de la représentation D , la dimension de D est la dimension de la représentation et les opérateurs D ( g ) sont les opérateurs de la représentation. • La représentation est dite fidèle si le groupe admet comme sous groupe le noyau c’est-à-dire : KerD = { g ∈ G / D ( g ) = I } , (2.32) et l’application doit être injective ∀g , g ′ ∈ G D ( g ) = D( g ′) ⇒ g = g ′ (2.33) • Une représentation est dite fondamentale si la dimension de la matrice de la représentation est égale à la dimension de l’algèbre de Lie associée. • Représentation adjointe Mis à part la représentation fondamentale, une autre représentation joue un rôle particulier : la représentation adjointe, définie de la manière suivante. La relation de commutation [ J i ; J j ] = if ijk J k peut être vue comme définissant l'action d'un générateur J i sur un élément J j d'un espace vectoriel de dimension d qui n'est autre que l'algèbre de Lie elle-même, produisant un autre élément de G, la combinaison linéaire ifijk J k . On pourrait noter cette action de la manière suivante : ad i J j = if ijk J k . Cette action de J i définit une représentation de G, comme on peut le vérifier explicitement en calculant le commutateur de cette action: [ad i , ad j ] J n = [ J i , [ J j , J n ]] − [ J j , [ J i , J n ]] = [ J i , [ J j , J n ]] + [ J j , [ J n , J i ]] = − [ J n , [ J i , J j ]] = if ijk [ J k , J n ] = if ijk ad k J n 32 (2.34) Chapitre 2 • Groupes et Algèbres Représentation Identique (équivalente) : deux représentations d’un groupe D et D′ sont dites équivalentes (noté D : D′ ) si elles ont même dimension et si chaque matrice D′ ( g ) se déduit par un certain opérateur linaire T (dit opérateur d’entrelacement) de la matrice D ( g ) C'est-à-dire elle satisfait la condition suivante : T D ( g ) = D′ ( g ) T ∀g , g ′ ∈ G (2.35) et que l’opérateur d’entrelacement T doit être inversible D′ ( g ) =T D ( g ) T −1 • ∀g , g ′ ∈ G (2.36) Caractère : On appelle caractère xD de la représentation D , la trace de la représentation D ( g ) , c’est-à-dire : xD ( g ) = Tr ( D( g ) ) = ∑ D ( g ) i (2.37) ii Par conséquences : 1. si D et D′ sont équivalentes ⇒ xD = xD′ 2. si g et g ′ sont conjugués ∃h ∈ G / g ′ = hgh −1 ⇒ xD ( g ) = xD ( g ′) ( ) 3. si la représentation D est unitaire ⇒ xD g −1 = ( xD ( g ) ) ∗ 4. Le caractère de l’élément d’identité du groupe fourni la dimension de la représentation xD ( e ) = n. • Sous-espaces invariants : On dit qu'un sous-espace Em ⊂ En ( dim Em = m <n ) , est invariant par la représentation D s'il est invariant à tous les opérateurs D ( g ) c’est-à-dire D ( g ) Em ⊂ Em ∀g ∈ G (2.38) Remarque : Le sous-espace trivial {0} est toujours invariant. • Une représentation est dite irréductible, si elle ne possède pas de sousespace invariant non trivial. • si une représentation de G dans un espace En laisse invariant un sousespace Em de En , elle est dite réductible. Remarques : Toute représentation de dimension 1 est irréductible. La représentation triviale est toujours réductible, sauf en dimension 1. 33 Chapitre 2 • Groupes et Algèbres 1ère Lemme de Schur : Soient D et D′ deux représentations irréductibles du groupe G dans les espaces respectifs E1 et E2 Soit A un opérateur linéaire de E1 → E2 qui satisfait à la condition : AD ( g ) = D′ ( g ) A ∀g ∈ G (2.39) alors, A est identiquement nul. • 2ème Lemme Schur : Soit D une représentation irréductible de dimension finie du groupe G dans l'espace E . Alors, tout opérateur linéaire A : E → E qui commute avec tous les opérateurs D ( g ) de la représentation est multiple de l'identité : AD ( g ) = D ( g ) A ⇒ A = λ I • ∀g ∈ G (2.40) Représentations complètement réductibles : on dit que la représentation D dans l’espace En est complètement réductible si D est la somme direct des représentationnels irréductibles : D = D1 ⊕ D2 ⊕ ... ⊕ Dn (2.41) Si la représentation Di apparaît plusieurs fois en peuvent écrire D = m1 D1 ⊕ m2 D2 ⊕ ... ⊕ mi Di (2.42) où, mi est la multiplicité de Di • Produit tensoriel des représentations : Soient deux systèmes décrits respectivement par les états i {i = 1,..., m} et j { j = 1,..., n} , le système composé est décrit par les états { i j } , ces états forme le produit tensoriel des espaces vectoriel E1 et E2 décrivent les systèmes 1 et 2, En mathématique on utilise la notion ei ⊗ e j pour i j ( avec ei = i et e j = j , on note aussi que le produit tensoriel E1 ⊗ E2 est un espace vectoriel de dimension mn , on pose : y1 = ∑ ai ei ,∈ E1 et y2 = ∑ a j e j ,∈ E2 i (2.43) j Donc le produit tensoriel donne : y1 ⊗ y2 = ∑ ai a j ei ⊗ e j i, j 34 (2.44) Chapitre 2 Groupes et Algèbres Si Z1 st un opérateur linéaire agissant dans E1 et Z 2 un opérateur linéaire agissant dans E2 , l'opérateur linéaire Z1 ⊗ Z 2 agit sur le système composé comme suit : ( Z1 ⊗ Z 2 )( y1 ⊗ y2 ) = Z1 ( y1 ) ⊗ Z 2 ( y2 ) y1 ∈ E1 , y2 ∈ E2 (2.45) Soit A une matrice m × m et B une matrice n × n définit comme suit : A = ( Aij ) avec (i, j = 1,..., m) B = ( Blk ) avec (l , k = 1,..., n) (2.46) (2.47) On appelle produit tensoriel A ⊗ B la matrice mn × mn définit par ( A ⊗ B )il , jk = Aij Blk • (2.48) Propriétés élémentaires ( A ⊗ B )( A′ ⊗ B′) = ( AA′) ⊗ ( BB′ ) Tr ( A ⊗ B ) = ( TrA )( TrB ) † ( A ⊗ B ) = A† ⊗ B† A ⊗ (B ⊕ C) = ( A ⊗ B) ⊕ ( A ⊗C ) ( A ⊕ B) ⊗ C = ( A ⊗ C ) ⊕ ( B ⊗ C ) • (2.49) (2.50) (2.51) (2.52) (2.53) Représentation d’un Produit tensoriel : Soient D1 et D2 deux représentations d'un même groupe G , On appelle représentation d’un produit tensoriel D1 ⊗ D2 la représentation donnée par les matrices ( D1 ⊗ D2 )( g ) = D1 ( g ) ⊗ D2 ( g ) (2.54) Remarques : 1. Si D1 et D2 sont unitaires, alors D1 ⊗ D2 est unitaire. 2. En général, la représentation d’un produit tensoriel D1 ⊗ D2 n'est pas irréductible même si D1 et D2 le sont. Un problème important en théorie des représentations est de déterminer les représentations irréductibles qui apparaissent dans la décomposition du produit tensoriel de deux représentations irréductibles quelconques. Il existe cependant des cas ou D1 ⊗ D2 est irréductible. 35 Chapitre 2 • Groupes et Algèbres Représentation d’un Produit direct : Soit D1 une représentation du groupe G1 et D2 une représentation du groupe G2 , alors D définie par D ( g1 , g 2 ) = D1 ( g1 ) ⊗ D2 ( g 2 ) (2.55) est une représentation du produit directe G1 × G2 . Remarques : 1) Toute représentation D1 de G1 dans l’espace E1 est automatiquement une représentation de G1 × G2 définie par D1 ( g1, g 2 ) = D1 ( g1 ). 2) Toute représentation D2 de G2 dans l’espace E2 définit une représentation de G1 × G2 exprimé par D2 ( g1 , g 2 ) = D2 ( g 2 ). 2.5. Groupe quantique et algèbre quantique Un groupe quantique est la q-déformation de l’algèbre enveloppante universelle U(g). Cette déformation est effectuée à l’aide d’un paramètre de déformation q ∈ K (£ ou ¡ ) sans dimension de telle sorte que sa présence dans les différentes expressions définissant cette nouvelle structure algébrique rend celle-ci non-commutative, et d’un autre coté, cette structure quantique est plus générale et contient la structure classique correspondante comme une limite quand q tend vers une valeur particulière q0 . De plus, cette déformation peu être un paramètre ou multiparamétrique. Par ailleurs, la notion de groupe quantique n’est pas aussi forcément issue d’une déformation, i. e. qu’elle peut existé sans avoir d’analogue classique. Pour cela, on retiendra la définition de Drinfel’d qui dit un groupe quantique est en, général, une algèbre de Hopf non commutative et non co-commutative. ~ q-nombres On définit le q-nombre correspond au nombre ordinaire x , comme suit : q x − q−x [ x]q = q − q −1 (2.56) où q est un paramètre. La même définition est donné si x est un opérateur, On remarque que le q-nombre demeure invariant lorsque q → q −1 i. Si q est réel, le q-nombre prend la forme suivante : [ x]q = q x − q − x sinh ( xτ ) = q − q −1 sinh (τ ) avec q = eτ / τ ∈ ¡ 36 (2.57) Chapitre 2 ii. Groupes et Algèbres Si q est une phase, le q-nombre peut être écrit comme : q x − q − x sin ( xτ ) [ x]q = q − q−1 = sin τ ( ) avec q = eiτ / τ ∈ ¡ (2.58) Il est clair que si q → 1 ⇒ τ → 0 , le q-nombre tend vers le nombre ordinaire x à la limite classique : lim [ x ]q = lim [ x ]q = x q→1 (2.59) τ →0 quelques exemples de q-nombre sont donnés ici : [ 0]q = 0, [1]q = 1, [ 2]q = q + q −1 , [3]q = q 2 + 1 + q −2 , [ 4]q = q3 + q + q −1 + q−3 (2.60) le q-nombre obéit à la relation : [ a ]q [b + 1]q − [b]q [ a + 1]q = [ a − b]q (2.61) un q-factoriel d’un nombre entier n est définit par la relation [ n]q ! = [ n]q [ n − 1]q ...[ 2]q [1]q (2.62) et Les q-coefficients binomiaux par [ m ]q ! m k = m − k ! k ! ]q [ ]q q [ (2.63) Où l’expansion des q-coefficients binomiaux sont donné par [ a ± b ]q m = m k m −k (±b ) a k =0 q m ∑ k (2.64) Il est évident que si la limite de q → 1 , nous avons [ n]q ! → n! m où, et n! k m m k → k q et sont les coefficients binomiaux (2.65) et factoriels standard respectivement. Ces définitions peuvent être généralisées pour deux paramètres de déformation, tels que : [ x]q ≡ [ x ]qp = Propriétés qx − px q− p [ x]qp = [ x] pq [ − x]qp = − ( qp ) [ x]qp −x 37 (2.66) (2.67) (2.68) Chapitre 2 Groupes et Algèbres De plus, ∀ a, b, c , on a : [ a + b ]qp = [ a ]qp qb + p a [b ]qp [ a + b + 1]qp = [ a + 1]qp [b + 1]qp − qp [ a ]qp [b]qp [ a ][b + c]qp = [ a + c]qp [b]qp + ( qp ) [ a − b ]qp [c ]qp b a −b 2 2 [ a − b]qp [ a + b]qp = [ a ]qp − ( qp ) [b]qp ( 2.69 ) ( 2.70 ) ( 2.71) ( 2.72 ) Dans le cas où x est un entier positif, nous avons [ x]qp = q x−1 + q x−2 p + q x−3 p 2 + ... + qp x−2 + p x−1 x ∈ ¥ − {0} (2.73) Quelques exemples de qp-nombres sont donnés ici : [ 0]qp = 0, [1]qp = 1[ 2] = q + p, [3]qp = q 2 + qp + p 2 , [ 4]qp = q3 + q2 p + qp 2 + p3 (2.74) Le nombre complexe [ x ]qp définit en (2.26) peut prendre les formes suivantes : iii. Si qp sont réel, nous avons τ −t sinh x 2 exp ( x − 1) τ + t [ x]qp = τ − t 2 sinh 2 Où q = eτ ∀τ et t ∈ ¡ p = et (2.75) (2.76) iv. Si qp sont des phases, nous avons [ x]qp τ −t sin x 2 exp i ( x − 1) τ + t = τ − t 2 sin 2 (2.77) où q = ei.τ ∀τ et t ∈ ¡ p = ei.t (2.78) ~ Fonctions élémentaires des q-nombres déformés Les q-fonctions peuvent être définies en utilisant les q-nombres introduites précédemment, par exemple : • la fonction q-exponentielle ∞ an n eq ( ax ) = ∑ x n= 0 [ n ]q ! • La fonction q-trigonométrique 38 (2.79) Chapitre 2 Groupes et Algèbres ∞ sin q ( x ) = ∑ (−1)n n= 0 x 2 n+1 [ 2n + 1]q ! ∞ cosq ( x ) = ∑ (−1)n n= 0 x 2 n+1 n= 0 [ 2 n + 1]q ! ∞ x2n [ 2n]q ! (2.80) ∞ x 2n n= 0 [ 2 n ]q ! sinh q ( x ) = ∑ cosh q ( x ) = ∑ (2.81) Les fonctions en haut ne sont pas uniques, d’autres fonctions sont utilisées dans l’étude des déformations quantiques, mais dans le contexte de notre recherche nous allons s’abstenir juste pour les fonctions exponentielles et trigonométriques. ~ q-dérivées Dans cette section nous allons construire un nouveau calcule différentiel basé sur les q-nombres déformés. En effet, la q-dérivée est définit par : Dxq f ( x) = f (qx) − f (q −1x ) q − q −1 x ( (2.82) ) Par conséquent, on a : ( ) Dxq ax n = a [ n ]q x n−1Dxq f ( x) = (q − q ) x =a (q − q ) x −n n n −1 −1 eqax − e q ax = D e ( ax ) = q − q −1 x q x q ( ) = aqx n − aq − n x n q − q −1 x ( ) (2.83) = a [ n ]q x n−1 q n a n x n − q − na n x n [ n]q ! (q − q ) x −1 qn − q −n = q − q −1 ( ) an xn x [ n]q ! (2.84) [ n]q n n−1 an−1x n−1 = aeq ( ax ) a x = a [ n − 1] ! [ n]q ! q la q-dérivée d’une somme de fonction peut être définit par Dxq ( f ( x ) + g ( x ) ) = Dxq f ( x ) + Dxq g ( x ) (2.85) Dxq [ ax1 ± bx2 ]q = ± [ m ]q [ ax1 ± bx2 ]q (2.86) m m −1 où a et b sont des constantes et l’expansion du q-binomial [ ax1 ± bx2 ] est donné m par l’équation (2.64). On peut aussi définir la q-dérivée d’un produit de deux fonction par ( ) ( f ( x ) g ( x ) ) = ( D g ( x ) ) f (q ( ) x) + g (qx) ( D f ( x ) ) Dxq ( f ( x ) g ( x ) ) = Dxq f ( x ) g (q −1 x) + f (qx) Dxq g ( x ) Dxq q x −1 39 q x (2.87) (2.88) Chapitre 2 Propriétés Groupes et Algèbres Dxq f ( qx ) = qDxq f ( qx ) (2.89) x = qx 1 q Dx f ( x ) a n = [ n ] x n−1Dxq n f x n Daxq f ( x ) = ( ) Dxq f x n ~ avec a = cst (2.90) ( ) (2.91) Algèbre enveloppante universelle quantique On appelle généralement une algèbre enveloppante universelle quantique Uq(g) d’une algèbre de Lie g, la q-déformation de l’algèbre enveloppante classique U(g), telle que la limite classique est garantie par lim q → 1 . 2.6. La base cristalline Dans la lim h → 0 , ( q = e h ) on peut trouver une bonne base dite base cristalline des représentations de l'algèbre enveloppante quantique U q ( g ) d'une algèbre de Lie semi-simple g . Une action modifiée des vecteurs racines envoie la base cristalline sur elle-même, lui conférant une structure combinatoire riche. On peut ainsi réduire de nombreuses propriétés des représentations à la combinatoire des bases cristallines. En effet, l'action du générateur J ± n'est pas définie dans la limite h → 0 . De ce fait un nouveau opérateur J%± , peut être définit comme suit : J%± = C -1 2 J ± avec (2.92) C j, m = [ j ]q [ j + 1]q j , m (2.93) Par conséquent, une base cristalline est définit par l’action de ces opérateurs dans la limite h → 0 , tels que : J%+ j m = j, m + 1 J%− j m = j , m − 1 J% j j = J% j -j = 0 + pour − j≤m <j (2.94) pour − j≤m <j (2.95) (2.96) − J%3 j , m = J 3 j , m (2.97) De plus, l’opérateur casimir dans la base cristalline est définit comme suit : ( ) ( )( ) n −k n 1 2 C% = ( J 3 ) + ∑ ∑ J%− J%+ J%− 2 n∈Z + k =0 C% j m = j ( j + 1) j m n k (2.98) (2.99) où, j m est le vecteur de base de représentation irréductible, muni des valeurs propres ( j , m ), (Voir §2.7). 40 Chapitre 2 Groupes et Algèbres Par ailleurs, le produit tensoriel de deux représentations dans une base cristalline est définit par le théorème suivant : Théorème de Kashiwara Soient B1 et B2 deux bases cristalline de U h→0 ( sl (2)) tel que u ∈ B1 et v ∈ B2 J u ⊗ v, ∃n ≥ 0 / J −nu ≠ 0 et J +v = 0 J − (u ⊗ v ) = − u ⊗ J −v autres (2.100) u ⊗ J + v, ∃n ≥ 0 / J +n v ≠ 0 et J −u = 0 J + (u ⊗ v ) = J +u ⊗ v autres (2.101) Remarque Le produit tensoriel de deux représentations dans une base cristalline n’est pas commutatif. 2.7. Quelques exemples de groupes et algèbres de Lie Rotation de R3 et le groupe SO(3) On considère l’espace euclidien à trois dimensions ¡ 3 , ces rotations laisse invariant l’origine, c’est-à-dire la norme carrée du rayon vecteur OM 2 = x 2 + y 2 + z 2 (2.102) Toute rotation est caractérisé est une rotation d’un angle θ autour d’un axe de vecteur directeur unitaire u , et les rotations associées à ( u , R ) et ( −u , − R ) sont identiques, On notera R ( u , θ ) , le produit de deux rotation satisfait les axiomes de groupe. i. Associativité ii. élément d’identité iii. élément inverse R ( u ,θ ) = I R −1 ( u, θ ) = R ( u, −θ ) = R ( −u, θ ) Pour une rotation d’axe u colinéaire à l’axe Rz on a la matrice cosθ Rz (θ ) = sin θ 0 et pour les axes Rx et R y On a : 0 1 Rx (θ ) = 0 cosθ 0 sin θ − sin θ cos θ 0 0 0 1 cos θ Ry (θ ) = 0 − sin θ − sin θ cos θ 0 41 (2.103) 0 sin θ 1 0 0 cos θ (2.104) Chapitre 2 Groupes et Algèbres Ces rotation forme Le groupe des transformations réelles à 3 dimension noté O ( 3 ) , la matrice Λ d’une transformation orthogonal doit satisfaire à ΛΛt = Λt Λ = I (2.105) Où, Λt est la matrice transposée. A noter que O(3) est aussi un sous-groupe { } de U (3) puisque toute matrice réelle orthogonale est unitaire Λ = Λ ∗ ⇒ Λ t = Λ † , de (2.103) on tire : ( det Λ ) 2 = 1 ⇔ det Λ = ±1 (2.106) det Λ = +1 est un sous-groupe O ( 3) appelé SO ( 3) qui contient les transformations orthogonales préservant l'orientation d'espace. Seul Algèbre de Lie so(3) La structure d'un groupe de Lie peut être déduite de ce qui se produit au voisinage de l'identité du groupe. On considère alors des transformations infinitésimales très proches de l'identité. Un élément proche de l'identité peut être écrit comme R ( u, θ ) = I + ε i X i (2.107) Où ε i sont les paramètres infinitésimaux et les opérateurs X i sont les générateurs infinitésimaux de l’algèbre de Lie so ( 3) donnée par la formule X i = lim θ →0 d Ri (θ ) i = 1, 2, 3 dθ (2.108) On trouve 0 0 0 0 0 1 X 1 = 0 0 −1 X 2 = 0 0 0 0 1 0 −1 0 0 0 −1 0 X 3 = 1 0 0 0 0 0 (2.109) ces derniers vérifient les relations de commutation suivantes : [ X1, X 2 ] = X 3 , [ X 2 , X 3 ] = X1, [ X 3 , X1 ] = X 2 (2.110) Ou sa forme compacte est donnée par : i ≠ j ≠ k = 1, 2,3 (2.111) X i , X j = ε ijk X k avec ε ijk est le tenseur totalement antisymétrique d’ordre 3 , sachant que ε123 = 1 42 Chapitre 2 Groupes et Algèbres De plus, si on pose J i = iX i i = 1, 2, 3 (2.112) La relation de commutation devient J i , J j = iε ijk J k i ≠ j ≠ k = 1, 2,3 (2.113) La forme standard de l’algèbre de lie se déduit à partir trois combinaisons suivantes J z = J3 , J + = J1 + iJ 2 , J − = J1 − iJ 2 (2.114) J ±† = J m (2.115) les générateurs J i i = 1, 2,3 sont hermétiques i = 1, 2,3 J i† = J i , Les relations fondamentales de l’algèbre de Lie s’écrit comme suit : [ J3, J ± ] = ± J± [ J + , J − ] = 2 J3 (2.117) J − J + = J − J − J3 (2.118) J + J− = J − J + J3 (2.119) 2 2 (2.116) 2 3 2 3 L’opérateur de casimir J 2 s’écrit C = J 2 = J12 + J 22 + J 32 1 C = J 2 = [ J + J − + J − J + ] + J 32 2 (2.120) (2.121) L’opérateur de casimir commute avec tous les générateurs J i de l’algèbre de Lie J 2 , J i = 0 i = 1, 2,3 (2.122) Le groupe SU(2) SU (2) est le groupe des matrices complexe 2 × 2 qui satisfait aux condition suivantes : ∀U ∈ SU (2) / UU † = 1 (2.123) (2.124) det U = 1 Soit la matrice z U = 1 z3 z2 z4 z1 U = z 3 z2 z 4 † avec zi ∈ £ (2.125) Après l’utilisation des conditions (2.123) et (2.124), On trouve Z1 = Z 4 ⇒ et Z1 = Z 4 43 (2.126) Chapitre 2 Groupes et Algèbres On a, alors : z1 U = − z 2 z2 z1 (2.127) avec 2 2 det U = Z1 + Z 2 = 1 (2.128) une paramétrisation possible de U est Z1 = 1 − x12 + x22 + x32 i + x3 4 2 x 2 + x22 + x32 i 1− 1 + x3 4 2 U= x − ix2 i 1 2 x2 + ix1 2 (2.129) 2 2 2 x + x2 + x3 i 1− 1 − x3 4 2 (2.130) Z2 = x2 + ix1 2 Algèbre de Lie su(2) Considérons une transformation infinitésimale très proche de l’identité U = 1 + ε J , ou ε est un nombre réel infinitésimal don nous négligerons les puissances et J est une matrice (générateurs). Par conséquence, La condition U tU = UU t = 1 devient, au premier ordre en ε : ( ) UU † = (1 + ε J ) 1 + ε J † = 1 ⇒ J † = − J (2.131) Propriétés n n n i =1 i =1 i =1 det U = ∏ λi = ∏ exp(ln λi ) = exp( ∑ ln λi ) = exp(Tr ln U ) (2.132) Le développement de Taylor du LnU au voisinage de 0 donne : LnU = Ln(1 + ε J ) = ε J + O (ε 2 ) (2.133) On remplace dans l’équation det U = exp ε TrJ = 1 ⇒ TrJ = 0 (2.134) Soit J = J1 + iJ 2 (2.135) J † = J1t − iJ 2t D’après l’équation (2.131), on aura : J † = − J = − ( J1 + iJ 2 ) = − J1 − iJ 2 (2.136) Par identification on trouve : ⇒ J1t = − J1 J 2t = J 2 44 (2.137) Chapitre 2 Groupes et Algèbres a1 b1 a1 c1 t J1 = ⇒ J1 = c1 d1 b1 d1 a2 b2 a2 c2 t J2 = ⇒ J2 = c2 d 2 b2 d 2 (2.138) (2.139) de (2.138) on aura : a1 = − a1 a1 = 0 b1 = −c1 0 b1 ⇒ c1 = −b1 ⇒ J1 = c1 = −b1 −b1 0 d1 = 0 d1 = −d1 de (2.139) on aura : (2.140) a2 = a2 b2 = c2 a2 ⇒ J2 = c2 = b2 c2 d2 = d2 l’utilisation de la propriété TrJ 2 = 0 implique que c2 d 2 (2.141) a2 c2 J2 = c2 − a2 on remplace J1 et J 2 dans (2.135), on aura : (2.142) 0 1 1 0 0 J = J1 + iJ 2 = b + i a2 + c2 −1 0 0 −1 1 0 1 0 −i 1 = i c2 + b1 + a2 i 0 0 1 0 1 0 0 −1 (2.143) on pose, c2 = c1, b1 = c2 et a2 = c3 0 1 0 −i 1 0 + c2 + c3 J = i c1 i 0 0 −1 1 0 (2.144) 3 J = i ∑ c jσ j (2.145) j =1 avec, σ j sont les trois matrices de Pauli 0 1 σ1 = , 1 0 0 −i σ2 = , i 0 1 0 σ3 = 0 −1 [ J a ; J b ] = iε abc J c si on pose c1 = c2 = c3 = (2.146) (2.147) 1 la relation de commutation prend la forme suivante : 2 σc σ a σ b (2.148) a ≠ b ≠ c = 1, 2,3 2 , 2 = iε abc 2 avec ε abc est le tenseur antisymétrique sachant que ε123 = 1 . 45 Chapitre 2 Groupes et Algèbres L’espace vectoriel des générateurs de SU (2) muni de la relation de commutation forme l’algèbre de lie de su (2) . Ces générateurs infinitésimaux et les constantes de structure sont analogues aux ceux trouver pour le groupe des rotations ce qui implique les mêmes relations fondamentales que SO (3) avec une correspondance J = σ . Dans ce cas l’opérateur de casimir J 2 s’écrit : 2 C = J2 = ( 1 2 σ 1 + σ 22 + σ 32 4 ) (2.149) le carrée d’une matrice de Pauli donne une matrice identité [ 2 × 2] σ 2j = I j = 1, 2,3 (2.150) Ce qui implique C = J2 = 3 I 4 (2.151) Représentation irréductible de l’algèbre de Lie SU(2) et SO(3) Procédons à la construction classique des représentations de l’algèbre su(2). Comme précédemment J m et J Z désignent les représentations des générateurs infinitésimaux dans une certaine représentation. Ils satisfont aux relations de commutation (2.147) et d’herméticité, la commutation des opérateurs J Z et J 2 garantit qu’on peut en chercher des vecteurs propres communs. les valeurs propres de ces opérateurs hermétiques étant réelles et J 2 étant semi-fini positif, On peut toujours écrire ses valeurs propres sous la forme j(j+1),j réel positifs ou nul et on considère donc un vecteur propre commun jm J 2 j , m = j ( j + 1) j, m (2.152) J z j, m = m j , m (2.153) Avec m un réel arbitraire. Par abus de langage, on dira j , m est un vecteur propre de valeurs propres ( j, m ) agissons avec J + et J − = J +† sur jm utilisant la relation J ± J m = J 2 − J Z2 ± J z On calcule la norme carrée de J ± jm : j , m J − J + j, m = ( j ( j + 1) − m ( m + 1) ) j, m j , m = ( j − m) ( j + m + 1) ) j , m j , m j , m J + J − j, m = ( j ( j + 1) − m ( m − 1) ) j , m j , m = ( j + m) ( j − m + 1) ) j , m j , m 46 (2.154) Chapitre 2 Groupes et Algèbres Ces normes carrées ne peuvent être négatives donc ( j − m) ( j + m + 1) ) ≥ 0 avec − j − 1 ≤ m ≤ j ( j + m) ( j − m + 1) ) ≥ 0 avec qui impliquent − j ≤ m ≤ j +1 −j≤m≤ j (2.155) (2.156) (2.157) En outre, J ± jm = 0 si et seulement si m = ± j ⇒ J ± j, ± j = 0 (2.158) i. Si m ≠ j est un vecteur non nul, vecteur propre de valeurs propres ( j , m + 1) En effet, J 2 J + j , m = J + J 2 j, m = j ( j + 1) J + j, m (2.159) J z J + j , m = J + ( J z + 1) j , m = ( m + 1) J + j , m (2.160) De même, si m ≠ − j , J − jm est un vecteur propre non nul de valeurs propres (j, m-1) ii. Considérons la suite des vecteurs j , m , J − j , m , J −2 j, m ,..., J −p j , m ,... (2.161) S’ils sont non nuls ils constituent des vecteurs propres de J z de valeurs propres m, m + 1, m + 2,..., m + p,... Les valeurs propres autorisées de J z étant bornées par − j ≤ m ≤ j cette suite doit s’arrêter au bout d’un nombre fini d’étapes. Soit p l’entier tel que J +p jm ≠ 0 (2.162) J +p jm ≠ 0 est un vecteur propre de valeurs propres (j,-j) donc m + p = j , c’est-à-dire p = ( j − m) est entier (2.163) Opérant de même avec J − , J −2 ,..., J −q ,... sur jm , On est mené à la conclusion que q = ( j + m) On a alors, est entier p+q = 2j (2.164) (2.165) Par conséquence, les représentation irréductibles de su (2) sont caractérisé par j et m entiers ou demi-entiers, tel que : 1 3 j = 0, ,1, , 2,... 2 2 De plus, pour une valeur fixe de j , m peut prendre les 2 j + 1 valeurs 47 (2.166) Chapitre 2 Groupes et Algèbres m = − j, − j + 1,..., j − 1, j (2.167) Partant du vecteur j , m = j (“vecteur de plus haut poids”) associer aux différents poids m = j, j − 1,...., − j choisi de norme 1, on construit la base orthonormée j, m J z j, m = m j , m J ± j, m = (2.168) j ( j + 1) − m(m ± 1) j, m ± 1 (2.169) On note D j la représentation de dimension finie la plus général de su (2) est une somme direct des représentations ⊕ D j . Les algèbres de Lie so(3) et su (2) sont isomorphe et tout deux de dimension 3, mais leurs groupes SO (3) et SU (2) ne le sont pas. Les représentations de SO (3) ne différent de celles de SU (2) que du spin de la représentation. Pour SO(3) , j est entier, alors que pour SU (2) , j est entier ou demi entier. La correspondance entre les deux groupes est obtenue par la représentation r 1 exponentielle de la rotation R U ,θ , pour un spin , (matrices de Pauli), tels que : 2 ur r r r σr R U ,θ = exp −iθ J .u et J= (2.170) 2 ( ( ) ) Par conséquent, la représentation spinorielle de la rotation, prend la forme suivante: n 2 r θ ur r ∞ θ (σ .u ) R U ,θ = exp −i σ .u = ∑ −i n! 2 0 2 ( De plus, on a : ) r u2 = 1 (σ .u ) 2p (σ .u ) =I 2 p +1 = σ .u (2.171) (2.172) Il en résulte donc que : r θ θ θ ur r R U ,θ = exp −i σ .u = cos I − i sin σ .u 2 2 2 ( ) (2.173) Produit tensoriel des représentations de SU(2) La construction d’une représentation irréductible d’un groupe donné consiste à construire le produit tensoriel de représentations connues et à le décomposer en représentations irréductibles. Le produit tensoriel D j ⊗ D j ′ de dimension (2j+1) (2j’+1) se décompose en somme directe de D j . Soit la représentation exponentielle notée : j ∑e − iJ zθ m =− j 48 (2.174) Chapitre 2 Groupes et Algèbres Qui s’écrit dans une base j , m j ∑e − imθ (2.175) m =− j En effet, le produit tensoriel des exponentielles donne j j′ D j ⊗ D j′ = ∑ e −imθ ∑ e −im′θ m=− j m′=− j′ i ( j + j′ )θ i ( j + j′−1)θ D j ⊗ D j′ = e +e + ... + ei ( j − j′)θ + ... + e −i ( j − j′ )θ + e −i ( j − j′+1)θ + ... + e −i ( j + j′ )θ (2.176) Par conséquent D j ⊗ D j′ = j + j′ ⊕D k = j − j′ (2.177) k 1 Exemple : Le produit tensoriel de deux moments cinétiques donne : 2 1 D1 ⊗ D1 = ⊕Dk = D0 ⊕ D1 2 2.8. 2 (2.178) k =0 Algèbre quantique suq(2) Les algèbres quantiques c’est une version généralisée des algèbres de Lie, lorsque le paramètre de déformation q tend ver l’unité, un exemple simple d’une algèbre quantique est l’algèbre su q (2) , généré par les opérateurs J+ , J− , J Satisfaisant les relations de commutations suivantes : [ J 3 , J ± ]q = ± J ± [ J + , J − ]q = [ 2 J 3 ]q avec (2.179) (2.180) J 0† = J 0 , ( J + ) = J − † (2.181) On remarque que l’équation (2.179) prend la même forme que dans le cas de l’algèbre de Lie ordinaire su(2) , cependant l’équation (2.180) diffère du cas usuel su(2) qui s’écrit : [ J+ , J− ] = (2.182) 2 J3 Cette déférence est due au q-opérateur [ 2 J 3 ] introduit dans le cadre des algèbres quantiques étudie précédemment (Voir §2.5), c’est-à-dire que après l’utilisation des équations (2.57) et (2.58), l’équation (2.180) prend la forme [ J + , J − ]q = [ 2 J3 ]q 3 5 sinh(2 J 3τ ) 1 2 τ J3 ( 2 τ J3 ) ( 2 τ J3 ) = = + + + ... sinh(τ ) sinh(τ ) 1! 3! 5! 49 (2.183) Chapitre 2 [ J + , J − ]q = [ 2 J3 ]q Groupes et Algèbres 3 5 sin(2 J 3τ ) 1 2 τ J 3 ( 2 τ J 3 ) ( 2 τ J3 ) = = − + − ... sin(τ ) sinh(τ ) 1! 3! 5! (2.184) Les représentations irréductibles (irreps) D j du groupe su q (2) de dimension 2 J + 1 associer aux différents poids J ≤ M ≤ − J avec 1 3 J , M = 0, ,1, ,2,... 2 2 la base orthonormée J , M est (2.185) liée au vecteur de plus haut poids J , M = J comme suit : J,M = [ J + M ]q ! ( J − ) J −M 2 J ! J − M ! [ ]q [ ]q J,J (2.186) avec J+ J , J = 0 (2.187) J,J J, J =1 (2.188) J3 J , M = M J , M (2.189) J± J , M = [ J m M ]q [ J ± M + 1] q J , M ±1 (2.190) v L’opérateur q-bosonique déformé L’algèbre q-bosonique est définit par l’ensemble des opérateurs de création a† , d’annihilation a et l’opérateur nombre N , qui obéit aux relations de commutation suivantes : N , a † = a † , [ N , a ] = −a aa† − q m1a †a = q ± N (2.191) (2.192) l’opérateur q-déformé a est l’hermétique conjugué de a + , et on note : (a ) + † (a) = a, † = a+ (2.193) et l’opérateur nombre N est hermétique (N) † =N (2.194) lorsque q → 1 , l’équation (2.192) tend ver : a, a † = 1 (2.195) Par conséquent, on a : aa† = [ N ]q , a†a = [ N + 1]q 50 (2.196) Chapitre 2 Groupes et Algèbres On défini l’espace de Fock f = { n : n ∈ ¥} (2.197) où n est la base de Fock, définit par l’action répété de l’opérateur de création a† sur l’état vide, qui s’annule par simple application de l’opérateur a (a ) † a 0 = 0, n = n [ n]q ! (2.198) 0 L’action des opérateurs a† , a et N sur la base de Fock est donné par N n =n n (2.199) [ n + 1]q a† n = [ n]q an = n +1 (2.200) n −1 (2.201) L’importance des opérateurs q-bosoniques se situe de leurs simplifications de construire des représentations des algèbres quantiques, plus précisément dans l’étude des algèbres de unitaire déformés. v Réalisation de suq(2) en termes de q-bosons déformés La réalisation des algèbres de Lie en termes de bosons (ordinaire) sont utile non seulement comme outil mathématique mais également en raison de leurs applications dans la physique. Dans le cas des algèbres quantiques il s'avère que les réalisations de boson sont possibles en termes d'opérateur de boson q-déformé. Dans le cas de su q (2) on introduit deux opérateurs de création a1† , a2† et d’annihilation a1 , a2 qui vérifient les relations de commutation : a1a1† − q m1a1†a1 = q ± N1 m1 † 2 2 a a −q a a =q † 2 2 (2.202) ± N2 (2.203) [ a1 , a1 ] = a , a2 = a1 , a † 1 † 2 = 0 (2.204) Les générateurs de l’algèbre su q (2) peuvent être écrit en fonction des opérateurs q-déformés comme suit : 1 (2.205) ( N1 − N 2 ) 2 En peut facilement prouvé que les relations de commutation de suq (2) en termes de J + = a1†a2 , J − = a2†a1, J3 = q-bosons vérifies les équations (2.182) et (2.183) tel que : 51 Chapitre 2 Groupes et Algèbres [ J + , J − ] = J + J − − J − J + = a1+ a2a2+a1 − a2+a1a1+a2 = [ N1 ][ N 2 + 1] − [ N1 + 1][ N 2 ] (2.206) d’après la propriété (2.61), la relation (2.206) , prend la forme suivante : [ J + , J − ]q = [ N1 − N 2 ]q = [ 2 J 3 ]q (2.207) le vecteur de plus haut poids en termes de q-bosons prend la forme J,J = (a ) † 1 2J [ 2 J ]q ! (2.208) 0 et le vecteur général prend la forme J,M = (a ) (a ) † 1 J +M † 2 J −M [ J + M ]q ! [ J − M ]q ! 52 0 (3.209) Chapitre 2 Groupes et Algèbres Références [1] A. Kostrikin, Introduction à l’algèbre, éditions Mir, Moscou, 1981. [2] T. Kahan, Théorie des Groupes en Physique Classique et Quantique, édition Dunod, Paris, 1960. [3] Haldik, « la théorie des groupes en physique et chimie quantique », Edition Masson, Paris, 1995. [4] E. B. Dynkin, « Semisimple Subalgebras of Semisimple Lie Algebras », Mat. Sb. (NS),30,349 (1952). [5] M. Hammermesh, Group Theory, Addison-Wesley (1964). [6] N. Jacobson, Lie Algebras, Willey, New york, 1962. [7] M. Gourdin, Basics of Lie Groups, Editions Frontières Gif sur Yvette, France, 1982. [8] B. G. Wybourne, Classical Groups fo Physicists, A Wiley-Interscience publication, New York. [9] B. Acharya, Course on Group Theory, ICTP Diploma Programme, Ref : 2004-05 HEP-L&L. [10] M. Kibler, Elément de la théorie de groupes, Note de cours de D.E.A, U.E.R, de Physique de l’université Claude Bernard de Lyon. (1982-1983). [11] J. B. Zuber, Introduction a la Théorie des Groupes et de leurs Représentations Cours donner au Magistère Inter universitaire de Physique, Printemps, 1994. Service de Physique Théorique de Saclay, France, 1994. [12] B. Delamotte, Un soupçon de théorie des groupes : groupe des rotations et groupe de Poincaré,D.E.A. « Champs, Particules, Matières », 1997, LPTHE, Université Paris 6-Pierre et Marie Curie, , France. [13] D. Hannachi, L’algèbre u 1q( 2 ) ⊕ u 2q( 2)et son application sur vibrations de stretching des molécules X-Y-X, Mémoire de Magister, spécialité Chimie, Option : Chimie-Physique, Université El-Hadj Lakhdar Batna, Algérie, (2007). [14] H. Boerner, Representation of Groups, North-Holland, Amsterdam,1963. [15] F. D. Murnaghan, The Theory of Groupe Representaion, Johns Hopkins press, Baltimore, 1938. [16] E. B. Vinberg, Linear Representations of Groups, Birkh auser, Basel, 1989. [17] R. Deheuvels, Tenseurs et spineurs, Presses Universitaires de France - PUF (1 avril 1993). 53 Chapitre 2 Groupes et Algèbres [18] V. Chari and A. Pressley, a Guide to Quantum Groups, Cambridge University Press, (1994). [19] W. G. Ritter, Inroduction to Quantum Group Theory, math/0201080v1. [20] G. Schieber, L’algèbre des symétries quantiques d’Ocneanu et la classification des systèmes conformes à 2d, Thèse de doctorat, spécialité physique des particules, physique mathématique et modélisation, Université de Provence, (2004). [21] D. Bonatsos, C. Daskaloyannis, P. Kolokotronis and D. Lennis, Quantum Algebras in Nuclear Structure , ETC/DEC/ 1995-06. [22] M. R. Kibler, Inroduction to Quantum Algebras, hep-th/9409012v1. [23] E. P. Borges, J. Phys. A 31 (1998) 5281. [24] R. W. Gray and C. A. Nelson, J. Phys. A 23 (1990) L945. [25] A. J. Bracken, D. S. McAnally, R. B. Zhang and M. D. Gould, J. Phys. A 24 (1991) 1379. [26] A. E. F. Djemaï, ‘’Groupes Quantiques, Fibrés Quantiques, Calcul Différentiel Non-Commutatif et Applications en Physique’’, Préprint interne. [27] L. C. Biedenharn, « the quantum group Suq(2) and a q-analogue of the boson operators », J.Phys.A:Math.Gen 22 (1989) L873-L878, [28] A. J. Macfarlane, “on q-analogues of the quantum harmonic oscillator and the quantum group SUq(2) ”, J.Phys.A.Math. Gen 22 (1989) 4581-4588. [29] L. C. Kwek et C. H. Oh, “on q-analogues of the quantum harmonic oscillator and q-deformed su(2) algebra” , q-alg/9707024 18 Jul 1997. [30] T. L. Curtright and C. K. Zachos, Phys. Lett. B 243 (1990) 237. [31] T. L. Curtright, G. I. Ghandour and C. K. Zachos, J. Math. Phys. 32 (1991) 676. [32] A. Klein and E. R. Marshalek, Rev. Mod. Phys. 63 (1991) 375. [33] A. J. Macfarlane, J. Phys. Lett. 22 (1989) 4581 . [34] X.C. Song, J.P hys. Lett 23 (1990) L821. [35] L. C. Biedenharn, J. Phys. A 22 (1989) L873. [36] A. J. Macfarlane, J. Phys. A 22 (1989) 4581. [37] M. Kashiwara, Crystallizing the q-analogue of universal enveloping algebras, Commun. Math. Phys. 133 (1990) 249. 54 CHAPITRE 3 : Différentes Modélisations 55 Chapitre 3 Différentes Modélisations 3.1. Introduction Le code génétique constitue un dictionnaire pour la synthèse des protéines qui à chaque codon (triplet de bases nucléiques dans l’ADN ou l’ARN) associe un des vingt acides aminés ou le signal de terminaison. Il résume, dans une forme condensée, les règles gouvernant le processus complexe de translation qui apparaît dans le ribosome, contenant les trois formes de l’ARN (mARN, tARN et rARN) ensemble avec les diverses protéines et autres molécules auxiliaires. Ainsi, la première étape importante fût la découverte par Crick and al en 1961, [1], que le code génétique est un code de triplets, ou encore que l’unité élémentaire d’information génétique, communément appelée codon, est une séquence de trois bases nucléiques, chacune représentant uniquement un acide aminé (ou un signal de terminaison). D’autres travaux expérimentaux s’en suivirent, [2]-[6], et menèrent à une classification de cette correspondance entre codons et acides aminés, totalement accomplie en 1966 et assemblée dans une table standard qu’on peut maintenant retrouver dans tout livre de biochimie ou de génétique. Cette table de code génétique est à la Biologie ce que le tableau périodique de Mendeleïev est à la Chimie. En effet, on relève plusieurs similarités entre ces deux tables. Par exemple, les deux exhibent des régularités frappantes, telles que l’apparition de groupes d’éléments avec des propriétés chimiques similaires, assemblés dans des colonnes de la table périodique, ou l’apparition de groupes de codons représentant le même acide aminé, assemblés dans ce qu’on appelle couramment les boxes de familles dans la table du code génétique. La dégénérescence de ce code, résultant simplement du fait que le nombre d’acides aminés (20) est beaucoup plus petit que le nombre de codons (64), suggère immédiatement une analyse basée sur des principes d’invariance, donc de concept de symétries. Plusieurs modèles ont été ainsi proposés pour expliquer pourquoi ce code estil ce qu’il est. Tous ces modèles reposent sur le concept de symétrie. Le premier modèle proposé, le code en diamant, fût présenté en 1954, [7], non pas par un Biologiste ou un Chimiste mais par un Physicien, George Gamow, un des précurseurs de la théorie du Big-Bang en cosmologie. Cette approche a été ensuite délaissée jusqu’à ce que le code génétique fût cracké en 1966. 56 Chapitre 3 Différentes Modélisations Depuis, une multitude de modèles ont été présentés reposant sur des concepts de symétries différents. Certains ont fait usage des symétries inhérentes à la théorie des ensembles, d’autres ont fait appel à la théorie des groupes discrets, ou encore à la théorie des groupes de Lie et leurs représentations. D’autres ont décrit ces symétries dans le cadre des algèbres quantiques. D’autres ont essayé de les décrire dans le cadre de la géométrie descriptive (hypercube, tétraèdre, polyèdre, sphère, boule). Enfin, d’autres ont utilisé le jeu de lumière (les couleurs) pour exprimer ces symétries (Québecquim). Certains ont même fait usage de l’arithmétique pour relever quelques nombres magiques qui ressort des symétries de ce code génétique. Dans ce chapitre, on a tenté de relater les différentes approches pour décrire le code génétique standard, avec plus ou moins de détails. 3.2. Modèle de Gamow (1954) : Grâce aux travaux de James Watson et Francis Crick (1953) la structure de l'ADN est connue. Toutefois, les moyens techniques de l'époque ne permettaient pas de connaître de façon expérimentale le code utilisé par la nature. Diverses propositions de codes ont alors été faites (un historique est présenté dans [8]). Gamow émit l'hypothèse que la double hélice d'ADN formait une paire de rails à l'intérieur desquels se placent les acides aminés, [7], chaque acide aminé se positionne entre les 2 bases d'une même paire. L'hypothèse était intéressante car l'espacement entre les bases était le même que l'espacement entre les acides aminés. L'acide aminé capable de se placer dépendait de la forme du site créé par les 4 bases : les 2 bases de la paire en question, une base de la paire "précédente" et une base de la paire "suivante" (voir Figure 3.1). Figure 3.1 : Placement des acides aminés selon le diamond code (1, 2, 3 et 4 représentent les bases C, G, C et T respectivement) La paire de bases obéissant à la règle de complémentarité qui relient A avec T ou C avec G. De plus, sous l'hypothèse que l'acide aminé était le même si l'on 57 Chapitre 3 Différentes Modélisations échangeait les places des bases "précédente" et "suivante", 20 combinaisons sont possibles (voir Tableau 3.1), et correspondent exactement au nombre d'acides aminés. Tableau 3.1 : Le diamond code Le diamond code fût le premier code à être envisagé comme étant une solution possible au problème du décodage de l'information génétique contenue dans l'ADN. Un de ces avantages est que la lecture se fait avec un décalage d'une base à la fois, hormis aux extrémités de l'hélice, chaque base appartient donc simultanément à 3 triplets (voir Tableau 3.2). Il n'y a donc pas de phase de lecture à identifier. Ce type de code est dit chevauchant. Ce code était donc très efficace puisque le ratio bases/acides aminés tend vers 1 quand le nombre, de bases tend vers N. Toutefois, s'il peut coder chaque acide aminé, ce code n'est pas capable de coder chaque suite de 2 acides aminés (dipeptides). En effet, pour 20 acides aminés, il existe 202 = 400 dipeptides. Sur le diamond code, un dipeptide est codé par 4 paramètres (une base sur le premier brin d'ADN, 2 paires de bases appariées et une seconde base sur le second brin). Le diamond code ne peut donc coder que pour 44 = 256 dipeptides. Il ne peut donc générer qu'une variété réduite de séquences 58 Chapitre 3 d'acides Différentes Modélisations aminés. Il fût définitivement abandonné lorsque Crick identifia expérimentalement dans les protéines des suites d'acides aminés ne pouvant être générées par le diamond Code. Tableau 3.2 : Symétries du code diamant trié en 20 classes, indiqué ici par 20 couleurs. Chaque classe Spécifie un acide aminé Gamow proposa alors encore deux codes possibles, [9], [10], ayant la propriété de chevauchement, mais le fait que le chevauchement soit utilisé dans la nature fut remis en question (notamment par le fait que la mutation d'une base aurait transformé 3 acides aminés), puis les travaux de Sydney Brenner [11] ont définitivement exclus la possibilité d'un code de chevauchement. En effet, Brenner a fait décoder une séquence, puis l'a à nouveau fait décoder après avoir muté un unique nucléotide. Comme les 2 protéines synthétisées ne différaient que d'un acide aminé, le code génétique ne pouvait pas avoir la propriété de chevauchement. Sans chevauchement, il se pose le problème de la phase de lecture. En partant du principe que chaque acide aminé est codé par un trinucléotide, il y a trois phases de lecture possibles, et une seule est valide. L'ARNt, devant se fixer sur l'ARNm pour obtenir l'acide aminé, devait donc être capable de trouver la bonne phase de lecture. Pour éviter se problème, en 1957 Crick soumit l'hypothèse que, comme il y avait 20 acides aminés, seuls 20 triplets étaient valides, les autres n'étant pas porteurs d'informations pour l'ARNt. Il fallait donc trouver un code tel que : • Il contienne 20 triplets (ou codons). • En plaçant 2 codons quelconques l'un derrière l'autre, les codons lisibles en phases décalées n'appartiennent pas au code. 59 Chapitre 3 Différentes Modélisations 3.3. Modèle de Wittmann (1963) : En étudiant le code génétique du virus mosaïque du Tabac, [12], Wittmann a déduit son modèle d’octets dans lequel les 64 codons possibles sont répartis en huit octets de huit triplets chacun. En effet, dans cette construction, Wittmann a considéré le phénomène de déamination induit par l’acide nitrique et formula les conversions de bases suivantes : U →U , C →U , G → (X ) → G , A → (H ) → G (3.1) où X : Xantine et H : Hypoxantine sont deux bases mineures de propriétés de liaisons H très similaires à celles de G. En partant de là, on pourrait commencer avec des sous-ensembles contenant seulement A et/ou C, c'est-à-dire seulement les bases qui produisent une mutation lors de la déamination, et ensuite pour chaque membre de ces sous-ensembles, construire les autres co-membres en utilisant ces règles. Par exemple, dans le cas de l’ensemble des 4 bases (k=1), le sous-ensemble est celui constitué des 2=21 bases C et A. En effet, C mute en U et A en G, tels que les deux doublets de Wittmann sont : WD1 : C → U et WD2 : A → G (3.2) 2 Dans le cas k=2, le sous-ensemble contient les 4=2 doublets contenant C et/ou A : CC, CA, AC et AA. Les autres (12) doublets sont obtenus simplement par l’entremise des règles de mutation précédentes. Ce processus nous permet d’obtenir les quatre quartets de Wittmann Qi, i=1-4 : Enfin, dans le cas k=3, le sous-ensemble de départ est celui contenant les 3 8=2 combinaisons de C et A : AAA, AAC, ACA, CAA, ACC, CAC, CCA et CCC. Chacun de ces triplets sera le membre générateur d’une série de 7 triplets par le biais des règles de mutation de Wittmann. On obtient finalement les huit octets de Wittmann i, i=1-8, qui renferment en eux la totalité des 64 codons du code génétique standard selon une classification particulière reposant sur une propriété 60 Chapitre 3 Différentes Modélisations physico-chimique : la mutation des bases lors de la déamination. Ici bas, on donne comme exemple l’octet 2 : 3.4. Modèle de Rumer (1966) : Dans son modèle, [13], Rumer considère la transformation suivante : UCAG ↔ GACU (3.3) qui lui permet de partager l’ensemble des 64 codons en deux sous-ensembles M1 et M2 formés de 32 codons chacun, se transformant l’un dans l’autre par le biais de cette transformation et brisant de ce fait le nombre de dégénérescence six. Cette symétrie a été plus tard étendue, [14]-[16], et une étude de la théorie des groupes sous-jacente a été élaborée par d’autres auteurs (Voir par exemple §3.12). 3.5. Modèle de Finkley (1982) : L’approche de Findley, [17], à la description de la dégénérescence repose sur des arguments empiriques traités dans le cadre de la théorie de groupe. En effet, soit l’ensemble des bases ribonucléiques définit comme suit : chaque triplet de constitue un sous ensemble de relation qui existe entre et = {U, C, G, A} , où, (64 codons). Toutefois, la peut être réalisé par le produit cartésien, tel que : = × × (3.4) De plus, la correspondance entre l’ensemble des triplets acides aminés A= {20 acides aminés + codon stop} est réalisé et l’ensemble des par l’application surjective f : f : →A (3.5) Cette correspondance est représentée explicitement dans le tableau 3.3, ce dernier est appelé le code génétique Standard (CGS). La nature surjective de cette application délimite la dégénérescence du CGS, c'est-à-dire, un acide aminé peut être indiqué par plus d'un codon, ou une image (un élément de A ) peut avoir plus d'un pré-image (éléments de ζ ). 61 Chapitre 3 Différentes Modélisations Sous certaines conditions, [18], le code génétique peut être vue comme une relation plutôt qu’une application, c'est-à-dire, un codon spécifie plus d'un acide aminé. Gatlin, [19], a suggéré que la nature ambiguë intrinsèque d’une relation peut être projetée via l’introduction d’un contexte biologique spécifique (CBS) dans lequel l’interprétation du code génétique s’opère. De plus, le code génétique doit être caractérisé par une relation R , tel que : R ⊂ζ ×A (3.6) R étant un sous-ensemble propre de ζ × A Table 3.3: DECOMPOSITION D0 pour formaliser la dégénérescences du CGS, il est nécessaire de introduire une décomposition D0 de ζ , tels que : D0 = {ζ k , k ∈ β } et k = {( ijk ) ∈ i, j et k ∈ } (3.7) i, j et k désignent la première, la deuxième et la troisième base du codon ( ijk ) respectivement. La décomposition D0 partitionne ζ en quatre sous ensembles disjoint (16 éléments), chaque sous-ensemble contient seulement les codons ayant la même troisième base (tableau 3.3). On remarque que : f (ζ U ) = f (ζ C ), f (ζ A ) ≠ f (ζ G ). (3.8) L’analyse de la dégénérescence du CGS (décomposition D0 ) se fait par : F1 = {(α , β ) ∈ ζ × ζ f (α ) ∈ f (ζ U ), f (β ) ∈ f (ζ C )} (3.9) F2 = {(α , β ) ∈ ζ × ζ f (α ) ∈ f (ζ A ), f ( β ) ∈ f (ζ G )} (3.10) 62 Chapitre 3 Différentes Modélisations F1 et F2 sont deux sous ensembles mutuellement exclusives pour une paire de codons doublement dégénérer. En d'autres termes, ils définissent une correspondance un à un, d’un membre d’une paire de codons doublement dégénéré à l’autre membre. En effet, une caractérisation analogue peut être fait pour les dégénérescences de l’ordre 2, 4 et 6, c’est-à-dire pour chaque paire en a une correspondance 1 à 1. En résumé, les dégénérescences paires (2, 4 et 6) des codons obéissent aux conditions nécessaire (mais pas suffisantes) suivantes : - Ordre 2 : deux codons sont doublement dégénérés, s’ils forment une paire qui est un élément soit de F1 ou F2 . - Ordre 4 : quatre codons sont quatre fois dégénérés, si deux codons forment une paire qui est un élément de F1 et les deux autre forment une paire qui est élément de F2 . - Ordre 6 : six codons sont six fois dégénérés, si deux codons forment une paire, qui est un élément de F1 et deux autre forment une paire qui est élément de F2 et les deux restant forment une paire qui est un élément soit de F1 ou F2 . Enfin, si le SGC est supposé exacte, les dégénérescences d’ordre impair (1 et 3) suggèrent qu'un changement évolutionnaire du code génétique a produit de légère déviation de la symétrie décrite précédemment. - Ordre 3 : Soient, Ile = ( AUU, AUC, AUA ) et TC = ( UAA, UAG, UGA ) l’ensembles des codons triplement dégénérés, chaque sous ensembles de deux paire de codon peuvent être caractérisé comme étant doublement dégénérés, tels que : Se décompose Ile → ( AUU, AUC ) ∈ F1 Soit (UAA, UAG) ∈ F2 Se décompose → TC Ou (UGA, UAG) ∈ F2 (3.11) Cependant, les deux codons restant AUA et UGA, peuvent être considérés comme deux singlets non dégénérés, notés : f ( AUA ) = Ile∗ - et f (UGA) = TC∗ Ordre 1 : Les deux singles restant Met = AUG et Trp = UGC Sont associés aux Ile* et le TC* , pour donné une paire de codon doublement dégénéré, tels que : ( AUG, Ile ) ∗ ( et UGG, TC∗ 63 ) }∈F 2 (3.12) Chapitre 3 Différentes Modélisations Dans ce qui suit nous allons construire d'autres décompositions de ζ qui peuvent avoir des symétries caractéristiques semblables à D0 toute en supposons que le code génétique standard non exacte et les symétries impaire exacte, d’où l’apparition du code génétique généralisé. Ceci nous mène à postuler des relations spécifiques qui obéissent à des conditions nécessaires (mais pas suffisantes) pour la dégénérescence de codon, [20], tels que : R1 = {(α , β ) ∈ ζ × ζ | α ∈ f (ζ U ) et β ∈ f (ζ C )} (3.13) R 2 = {(α , β ) ∈ ζ × ζ | α ∈ f (ζ A ) et β ∈ f (ζ G )} (3.14) Il est bien clair, que R1 et R2 sont dérivés F1 et F2 respectivement, On peut maintenant traiter la dégénérescence du CGG de la même manière que le CGS, on remplaçons F1 et F2 par R 1 et R 2 , avec : F1 ⊂ R1 et F2 ⊂ R 2 (3.15) Remarque D0 c est une partition adéquate à l étude des dégénérescences du code génétique standard, d autre codage alternatifs nécessitent d autres partions Di de ζ qui ont des symétries caractéristiques semblables à D0 sous l application f et qui permettent la construction des ensembles F1 et F2 . Considérons maintenant un groupe B muni d’une loi de composition interne noté multiplication, tel que B = B × B × B . Le nombre d'éléments de ζ qui s’applique à travers une application ( ζ ,B, f ) surjective, est donnée par le cardinal de ζ diviser par l'ordre du groupe B, (i.e, 64 4 = 16 ). Étant donné que B doit être un groupe d'ordre 4, il existe seulement deux types de groupe abélien d’ordre 4, [21] : • Le groupe de Klein d’ordre 4 représentée par : V : a, b, a 2 , b 2 , ab = ba , • V : 1, a, b, c = ab (3.16) Le groupe de Cyclique d’ordre 4 représentée par: Z4 : d , d 4 , Z4 : 1, d , e = d 2 , f = d 3 (3.17) Pour trouver la décomposition de ζ , on doit définir un ordre d’isomorphisme entre l’ensemble B et V ou Z 4 . En général, il y a 4! = 24 isomorphismes pour chaque groupe, ce qui fait un total de 48. Cependant, on constate qu'il y a 12 isomorphismes 64 Chapitre 3 distincts Différentes Modélisations pour Z 4 et seulement 4 pour V (Tableau 3.4), d’où ils résultent sept partitions possibles. Tableau 3.4 : Ordre d’isomorphismes entre B V, Z4 Nous sommes maintenant en mesure pour étudier la nature des partitions D1 ,..., D7 sous l’application f (Tableau 3.5). Par analogie avec l’élude faite ci- dessus, on constate l’existence de trois correspondances possibles L1, L2 , L3 pour les décompositions D1 ,..., D7 , tels que : Soit f ( d1 ) = f (ζ U ) ⇔ f ( d 2 ) = f (ζ C ) L1 applicable à D1 , D2 et D3 ⇒ Ou f ( d1 ) = f (ζ A ) ⇔ f (d 2 ) = f (ζ G ) Soit Ou L2 applicable à D4 et D5 ⇒ Ou Ou Soit Ou L3 applicable à D6 et D7 ⇒ Ou Ou (3.18) f ( d1 ) = f (ζ U ) ⇔ f (d 2 ) = f (ζ C ) f ( d1 ) = f (ζ A ) ⇔ f (d 2 ) = f (ζ G ) f ( d1 ) = f (ζ U ) ⇔ f (d 2 ) = f (ζ A ) (3.19) f ( d1 ) = f (ζ C ) ⇔ f (d 2 ) = f (ζ G ) f ( d1 ) = f (ζ U ) ⇔ f (d 2 ) = f (ζ C ) f ( d1 ) = f (ζ A ) ⇔ f (d 2 ) = f (ζ G ) f ( d1 ) = f (ζ U ) ⇔ f (d 2 ) = f (ζ G ) f ( d1 ) = f (ζ C ) ⇔ f (d 2 ) = f (ζ A ) 65 (3.20) Chapitre 3 Différentes Modélisations Label Order Isomorphism D1 V-1 , V-2 , V-3 , V-4 D2 Z4-1 , Z4-2 D3 Z4-3 , Z 4-4 D4 Z4-5 , Z 4-6 D5 Z4-7, Z4-8 D6 Z4-9, Z4-10 D7 Z4-11, Z4-12 U CAG UCC UAA UGG UUU UAG UCC UAA CAA UUU CAG CGG UAA UGG CCC AUC GAA GCC UGG UUU CAG UCC UAA GUU GGG GUC AGG UAA ACC UUU CAG UCC AUU UGG AAA C UAG CUU CGG CAA CCC CAG CUU UAA UGG CCC UAG UCC CGG CAA UUU UAG CUU CGG ACC AAA GUC AGG AUU CAA CCC UAG CUU GCC CAA GGG CAU GAA CGG GUU CCC A GUC AGG AUU ACC AAA GUC GAA AUU ACC GGG AUC AGG GCC GUU AAA GUC AGG AUU CAA CCC UAG CUU ACC ACC AAA CAG UCC AUU UGG AAA GUC AGG UAA ACC UUU G AUC GAA GCC GUU GGG AUC AGG GCC GUU AAA GUC GAA AUU ACC GGC CAG UCC UAA GUU GGG AUC GAA GCC UGG UUU AUC GAA CGG GUU CCC UAG CUU GCC CAA GGG Tableau 3.5 : CODE GÉNÉTIQUE GÉNÉRALISÉ Remarque Chaque codon représente toutes les permutations possibles de ses trois bases. Par exemple, CAG représente CAG, AGC, GCA, ACG et GAC. Par conséquent, L1 implique une correspondance un à un, similaire à celle vue dans le cadre du code génétique standard (CGS). Ainsi, les mêmes discutions et les mêmes résultats de la partition D0 sont valables pour les décompositions D1 , D2 et D3 . D’où L1 est plus faible que L2 ( L1 ⊂ L2 ) ou L3 ( L1 ⊂ L3 ) .Cependant, l’étude de la symétrie de L2 et L3 impliques des contraintes de dégénérescence d'ordre 4 et 6. Il suit alors que la dégénérescence de l'ordre 4 est indiquée uniquement en admettant 66 Chapitre 3 que Différentes Modélisations deux des implications L2 ou L3 exacts simultanément. De même, la dégénérescence de l'ordre 6 est indiquée uniquement en admettant que les trois des implications L2 ou L3 exacts simultanément. 3.6. Modèle de Hornos et al (1993-2004) : voire chapitre 4 3.7. Modèle de Sorba et al (1998-2004) : voire chapitre 4 3.8. Modèle de Duplij (2000) : L’approche de S. Duplij, [22]-[24], repose sur l’étude les symétries existant entre les purines et les pyrimidines. Considérons d’abord, un doublet de nucléotide noté XY, où: X ,Y ∈{C , G,U , A}, il en résulté alors 16 familles de doublets, [25]. Ces derniers sont répartis en 2 octets (Figure 3.2) comme suit : 8 doublets CC, AC, GC, CU, GU, UC, CG, GG détermines l'acide aminé indépendamment de la troisième base (partie supérieure dans le code rhombique), appelés doublets forts et les 8 doublets AA, AU, UU, CA, GA, UG, AG, UA (partie inférieure dans le code rhombique), appelés doublets faibles. Figure 3.2 : Code Rhombique On remarque qu'il y a seulement un A dans l'octet fort, et un C dans l'octet faible, et que chacun des 4 doublets avec Y=C détermine complètement l'acide aminé, mais seulement 2 doublets avec Y=G le déterminent complètement, alors que les doublets avec Y=A ne déterminent jamais l'acide aminé. Généralement la transition de l'octet « puissant » à l'octet « faible » peut être obtenue par l'échange ∗ [25], [26], C ← → A, ∗ G ← → T , appelé inversion purine-pyrimidine. Ainsi, les quatre nucléotides peuvent être organisé dans l'ordre décroissant suivant : Pyrimidine C très "fort" Purine G Pyrimidine T "fort" "faible" 67 Purine A très "faible" Chapitre 3 Différentes Modélisations En effet, les quatre nucléotides sont représentés par deux vecteurs (matrice ligne / colonne) notées V et VT, respectivement, [22], tels que : (4) V1 C 3 V G( ) , V = 2= V3 T ( 2) V4 A(1) ( V T = C ( 4) G (3) T ( 2 ) A(1) ) (3.21) où, l'index supérieur du nucléotide correspond au degré déterminatif. Par suit, le produit extérieur V ×V T , donne la matrice des doublets, définit comme suit, [23] : C (4)C (4) C (4)G (3) C (4)U (2) C (4) A(1) (3) (4) G (3)G (3) G (3)U (2) G (3) A(1) G C T M = V × V = (2) (4) U (2)G (3) U (2)U (2) U (2) A(1) U C A(1)C (4) A(1)G (3) A(1)U (2) A(1) A(1) (3.22) Cette dernière, coïncide entièrement avec la matrice canonique correspondant au code rhombique (Figure 3.2), si et seulement si le vecteur V prend l’ordre déterminatif C, G, U, A. De même, un modèle analogue pour le code génétique peut être construit par le biais du triple produit extérieur, on a alors : K = V × M . De ce fait, nous obtenons l'ensemble des matrices tridimensionnel de tous les triplets, ainsi chaque codon (excepté les trois codons stop) correspond à un acide aminé. On définit, le degré déterminatif du triplet XYZ, comme suit : d XYZ = d codon = d X + dY + d Z ⇒ 3 ≤ d XYZ ≤ 12 (3.23) Nous pouvons également définir le degré déterminatif de l’acide aminé en tant que valeur arithmétique moyenne d AA = ∑ d codon ndeg , ou ndeg, correspond à sa dégénérescence (Tableau 3.6). Tableau 3.6 : les valeurs moyennes des acides aminés. 68 Chapitre 3 Différentes Modélisations Les acides aminés peuvent se divise en deux classes, [27], selon leur énergie d'interaction : le premier groupe Pro, Ala, Gly, Arg, Cys, Trp, Ser, Thr correspond au niveau énergique supérieur 150-170 kJ/mole par codon (en moyenne), et le deuxième groupe Lys, Asn, Ile, Glu,Met, Tyr, Phe, Asp, Gln, Val, Leu, His correspond au niveau énergique bas 88-92 kJ/mole par codon en moyenne. En comparant avec le tableau 1 nous observons que le premier groupe a le d AA ≥ 8 , alors que le deuxième groupe a le d AA < 8 (His et Thr sont des cas exceptionnels). Dans ce qui suit, nous allons considéré une description numérique des séquences d'ADN. Chaque brin de cette séquence est décrit par quatre nombres (nC, nG, nT, nA) et (mC, mG, mT, mA), où nX est le nombre de nucléotide x dans un brin. Ces derniers vérifient les conditions de complémentarité suivantes : nC = mG , mC = nG , nT = mA , mT = nA (3.24) Les règles du Chargaff [28], dans une double hélice d’ADN, sont définit comme suit : 1) N A + N G = N C + NT , 3) N A = NT et NC = N G 2) N A + NC = NT + N G 4) Le coefficient de spécificité : v = N A + NT N C + N G où, N A , N G , N C et NT , sont les quantités total des nucléotides A, G , C et T respectivement, tel que : N X = nX + mX . Par conséquent, v= nA + mA + nT + mT nA + nT mA + mT = = nC + mC + nG + mG nC + nG mC + mG (3.25) On défini, un autre coefficient important K (le rapport des purines, par les pyrimidines) : n + nA m + mA Kn = G , Km = G (3.26) nC + nT mC + mT ce qui satisfait a l’équation de complémentarité K n K m = 1 . Le degré déterminatif dans chaque brin, est définit par : d n = 4 . nC + 3 . nG + 2 . nT + 1 . nA (3.27) d m = 4 . mC +3 . mG + 2 . mT + 1 . m A (3.28) En effet, l’addition et la différence entre les deux brins est donné par : 7 3 d + = d n + d m = . N C +G + . N A+T (3.29) 2 2 d − = d n − d m = nC + nT − nG − n A (3.30) Le sens biologique du degré déterminatif d est contenu dans les relations entre purine pyrimidine suivantes : 69 Chapitre 3 Différentes Modélisations 1) La somme des degrés déterminatifs entre le brin matrice et le brin complémentaire dans les séquences d’ADN, est exactement 7 3 égale : d + = . N C +G + . N A+T . 2 2 2) La différence des degrés déterminatifs entre le brin matrice et le brin complémentaire dans les séquences d’ADN, est exactement égale, à la différence entre les pyrimidines et les purines dans un seul brin : d − = n pyrimidines − n purines , avec, n pyrimidines = nC + nT et n purines = nG + nA . Dans ce qui suit, nous considérons le degré déterminatif des séquences d’ADN dans les divers cas. Nous appelons une séquence d’ADN une mononucléotide, un dinucléotide, un trinucléotide, si un, deux ou trois nombres nX, sont distinct respectivement du zéro. Les propriétés des séquences mononucléotide sont classifiées dans le Tableau 3.7. Tableau 3.7 : l’ADN mononucléotide Les séquences de mononucléotide qui codent la plupart des acides aminés Gly et Lys ont d+ négatif, et les séquences de mononucléotide qui codent les acides aminés Pro et Phe de type chimique semblable ont le d positif. De même, les séquences de dinucléotide de la double hélice sont décrites dans le Tableau 3.8. Tableau 3.8 : l’ADN dinucléotide De même, les trinucléotides peuvent être classifiés de la même manière. L'introduction du degré déterminatif nous permet de choisir des séquences d'ADN qui ont une symétrie additionnelle. La séquence purine-pyrimidine est dit symétrique, si et seulement si : d − = 0 ⇒ nc + nT = nG + nA ⇔ n pyrimidines = n purines , ceci implique que : nc + nT = nG + n A ⇔ n pyrimidines = n purines 70 (3.31) Chapitre 3 Différentes Modélisations Par conséquent, la symétrie purine-pyrimidine a comme cas particuliers : nC = nT 2) Antisymmetric DNA nT = nG nC = nG 1) Symmetric DNA , nT = nA On remarque que l’ADN symétrique correspond à la troisième règle du Chargaff appliquée à un seul brin simple, [29], [30]. Ainsi, il serait intéressant de comparer les propriétés de transcription et d'expression des séquences d’ADN symétriques et antisymétriques. Un autre traitement peut être considéré dans l’étude de la symétrie purinepyrimidine, c’est-à-dire : en utilise la différence entre les nucléotides dans les deux brins M x = nx − mx , ayant comme propriétés : M C = −M G , Il en résulte que : M T = −M A , d− = M C − M A = M T − M G (3.32) (3.33) En effet, si on utilise la condition de la symétrie ( d − = 0 ), on obtient : M C = M A, MT = M G (3.34) À partir de laquelle, en peut donné une autre définition: Une séquence d'ADN est dite une symétrie purine-pyrimidine, si la différence du cytosine MC dans les deux brins égales à la différence de l'adénine MA (ou à la différence du thymine MT dans les deux brins égales à la différence du guanine MG). 3.9. Modèle du Québécium (2000) : L’approche de P. Demers à la description du code génétique repose sur la l'analyse et la symétrie, [31]. En mettant côte à côte le tableau des acides aminés et celui des codons, nous obtenons le tableau (A et B) de ces 84 molécules biologiques (biomolécules) en 3 strates avec les couleurs usuelles. Figure 3.3. Les 3 tableaux que nous avons obtenus, de 20, 64 et 84 cases, répètent la géométrie des strates 1, 2, 4 et de leur réunion. Quoique les objets classés soient différents, les uns inertes, les autres biologiques, il y a des analogies et des affinités d'ordre mathématique, outre les nombres d'objets. Dans le dernier tableau, le côté des cases suit la progression 2, 4, 8, alors qu'une progression arithmétique suggère 2, 4, 6, 8. Pour que l'analogie soit complète, il faut intercaler, par interpolation, une grille 6x6 de 36 cases, correspondant à la strate 3. Cette grille est vide. Figure 3.4. 71 Chapitre 3 Différentes Modélisations Figure 3.3 : Acides aminés et codons réunis dans un tableau de 84 biomolécules en 3 strates. Les côtés des strates suivent une progression 2, 4, 8, Figure 3.4 : Tableau des 84 molécules biologiques avec 36 cases vides de la strate 3 intercalées. Total 120 cases dont 36 vides. Nous proposons la conjecture que les 36 cases de la dernière figure correspondent à autant de molécules d'importance biologique (biomolécules) restant à découvrir. On peut voir dans le système du Québécium un modèle mathématique unitaire de classification applicable aux entités fondamentales du monde minéral et du monde biologique. Alors que la classification minérale est chose acceptée en principe depuis longtemps, une classification biologique comparable est une innovation. Mendeleïev et Seaborg ont pu fonder des prévisions sur la classification existante, dont la classification biologique nouvelle est un prolongement. Il reste à identifier quelles seraient ces molécules d'importance vitale et formant une catégorie de 36. 72 Chapitre 3 Différentes Modélisations 3.10. Modèle de Cristea (2001-2002) : Dans son modèle, [32]-[34], P. D. Cristea à considérer une représentation tétraédrique des nucléotides Figure 3.5. Chaque base définit une direction dans l'espace des représentations correspondant aux quatre vecteurs de bases symétriquement placés l'un par rapport à l'autre, orienté vers l’un des coins du tétraèdre. Dans le système de référence Figure 3.5, les vecteurs de bases normaux sont : r v a=k r 2 2r 6 r 1r c=− i+ j− k 3 3 3 ur 2 2r 6 r 1r g=− i− j− k 3 3 3 r 2 2r 1r t= i− k 3 3 (3.35) Le procédé est répété pour chacune des trois bases dans chaque codon, [35], traitant chacune des trois bases comme des nombres de trois chiffres écrit dans la deuxième base : le vecteur correspondant à la première , deuxième et la troisième base sont multipliées par 4, 2 et 1 respectivement. Par exemple, le vecteur v v uv représentant le codon ATG qui code la méthionine est donné par : 4a + 2t + g Figure 2: Représentation tétraédrique du code génétique Cette représentation respecte l’ordre de la dégénérescence du code génétique. 73 Chapitre 3 Différentes Modélisations 3.11. Modèle de Jiménez (2002) : Dans ce modèle, [36], [37], le code génétique est représenté par un hypercube booléen à six dimensions dans lequel les codons (vecteur à 6 binaire) occupent les sommets (noeuds) voire Tableau 3.9. Cette structure est le résultat de l'ordre hiérarchique des énergies d'interaction des bases dans l'identification de codon-anticodon, [38]. De plus, chaque base est spécifiée par deux catégorisations indépendantes Figure 3.6 : ü selon son type chimique C:{R, Y}, où R:(A, G) sont les purines et le Y:(C, U) sont les pyrimidines. ü selon ses liaisons d’hydrogène, H:{W, S}, où W:(A, U) sont faibles et S:(C, G) bases fortes. Figure 3.6 : Catégorisations des bases où, α , β et sont les transformations des bases, [39], [40]. Les bases sont représentées par des noeuds de 2-cubes Figure 3.6. La première attribution décrit le caractère chimique et la seconde les liaisons d'hydrogène. On prolongeant cette association aux triplets de bases Tableau 3.9, on constate que chaque codon est associé d'une manière unique à un code-mot (composé de six valeurs), tels que, les deux premiers chiffres correspondent à la première base, les deux suivants à la deuxième base et les deux derniers à la dernière base, selon la codification binaire des bases Figure 3.6. Remarque : Dans ce qui suit, les 20 acides aminés sont représentées par : A(Ala), P(Pro), V(Val), G(Gly), T(Thr), S(Ser), L(Leu), R(Arg), D(Asp), E(Glu), M(Met), I(Ile), F(Phe), C(Cys), W(Trp), H(His), Q(Gln), N(Asn), K(Lys) et Y(Tyr). 74 Chapitre 3 Différentes Modélisations Tableau 3.9 : Représentation binaire du code génétique Par conséquence, ces valeurs peuvent être schématisées comme suit : Figure 3.7 : La représentation hypercubique du code génétique Les différentes bords de l’hypercube se relient entre eux par : AGG ↔ AGC, AGC ↔ ACC, AGC ↔ AAC, UCC ↔ ACC, ACC ↔ GCC, GCC ↔ CCC, CGC ↔ CAC, CAC ↔ CAG, CAC ↔ CUC, CAC ↔ GAC 3.12. Modèle de Négadi (2003) : L’approche de T. Négadi à la description du code génétique repose sur le principe de considérer une représentation en ensembles de k-plets en partant des différents ensembles formés de singlets (k=1), de doublets (k=2) et de triplets (k=3), 75 Chapitre 3 Différentes Modélisations de bases azotées {U/T, C, A, G} formant les séquences d’ARN/d’ADN. Ces ensembles sont représentés par des matrices 2kx2k d’entrées les bases elles-mêmes (k=1), les doublets de bases (k=2) ou les triplets de bases (k=3) respectivement. En effet, dans son approche présentée dans, [41]-[44], T. Négadi a défini une matrice 2x2, notée B, qui représente la brique de construction en bloc de l’ARN : U C , (3.36) B = A G où les 4 bases possèdent une structure moléculaire générale du type : Cα N β H δ Oγ , tels que, Uracile :C4N5H50, Cytosine : C4N3H50 , Adénine : C5N5H5 , Guanine : C5N5H5O aux quelles il leur a associé un nombre caractéristique : nbase = Z Cα × Z Nβ × Z Hδ × Z Oγ (3.37) où ZC=6, ZN=7, ZH=1 et ZO=8 sont les numéros atomiques des atomes de carbone, nitrogène, hydrogène et oxygène respectivement, telles que : nU nC n A nG = 4064256 = 3556224 (3.38) = 130691232 = 1045529856 On remarque tout d’abord que les 4 valeurs obtenues sont toutes différentes, ensuite que les 2 lignes de la matrice B représentent précisément les 2 doublets de Wittmann (WD1, WD2), (Voir §3.3) et enfin que les base de la même colonne possèdent le même nombre de liaisons H. En effet, on rappelle que U et A ont deux liaisons H tandis que C et G ont en trois. Concernant les 16 doublets de bases possibles XY, il en déduit une représentation matricielle 4x4 du type : UU UC CU UA UG CA D = B B = AU AC GU AA AG GU CC CG GC GG (3.39) où le produit introduit, dit de concaténation, [42], est défini comme suit : (M N ) ij ,kl = (M )ik ( N ) jl = (M )ik ( N ) jl (3.40) Pour deux matrices M et N quelconques. Par concaténation, il s’agit juste de juxtaposer les éléments de matrices. Le nombre caractéristique de chaque doublet XY est obtenu en concaténant les nombres caractéristiques des bases 76 X et Y Chapitre 3 Différentes Modélisations respectivement. Ici aussi, on remarque d’abord que les 16 valeurs obtenues sont toutes différentes, ensuite que les 4 lignes de la matrice D représentent précisément les 4 quartets de Wittmann (Qi, i=1,2,3,4), (Voir §3.3) et enfin que les doublets de la même colonne possèdent le même nombre de liaisons H. Enfin, Pour obtenir la représentation matricielle des 64 (triplets) codons du code génétique standard, il suffit de répéter l’opération précédente sur la matrice des doublets de base. Dans ce cas, on obtient : UUU UUC UCU UCC CUU CUC CCU CCC UUA UUG UCA UCG CUA CUG CCA CAG UAU UAC UGU UGC CAU CAC CGU CGC UAA UAG UGA UGG CAA CAG CGA CGG T = D B = B B B = AUU AUC ACU ACC GUU GUC GCU GCC AUA AUG ACA AGC GUA GUG GCA GCG AAU AAC AGU AGG GAU GAC GGU GGC GAA GAG GGA GGG AAA AAG AGA AGG (3.41) Ici aussi, à chaque codon XYZ on associe un nombre caractéristique obtenu en concaténant les nombres caractéristiques des trois bases. De même, on remarque que ces nombres sont tous différents, que les codons appartenant à la même colonne ont le même nombre de liaisons H et que les 8 lignes de la matrice T correspondent aux huit octets de Wittmann ( j, j=1-8) (Voir §3.3). En voulant construire la séquence de groupes de symétrie décrivant cette classification, T. Négadi utilisa la symétrie de Rumer et de Rumer-Konopel’chenko (Voir §3.4). En effet, en étudiant les matrices d’adjacence des graphes correspondant aux transformations de Rumer et de Rumer-Konopel’chenko des différents éléments de Wittmann, Il déduise la chaîne de groupes de symétrie suivante : D8 ⊃ V ⊃ C 2 (3.42) où C2 est le groupe cyclique d’ordre 2, V est le groupe de Klein (d’ordre 4) et D8 est le groupe dihédral à huit éléments. 3.13. Modèle de Yang (2003) : L’approche de C. M. Yang, [45], à la description du code génétique repose sur la régularité chimique des quatre nucleobases (nucléotides) dans l’ARN. Par ailleurs, l’état d’hybridation sp2 de l’atome d’azote dans les nucleobases (A, G, C, U) sont : 77 Chapitre 3 Différentes Modélisations 3, 2, 1 et 0, respectivement (Figure 3.8). Basé sur cette numérotation un nouveau code réarranger est obtenue Tableau 3.10 et Figure 3.9. Figure 3.8 : Les structures chimiques des nucleobases dan l’ARN Tableau 3.10 : Le code génétique réarrangé De plus, pour distinguer les symétries cachées dans le code génétique, une série d'approches topologiques est effectuée. D'abord, en utilisant un sens topologique simple et commun, le planisphère à trois dimensions dans la figure 2a peut être représentée par un graphique Hamiltonien figure 2b. Dans ce graphique, la relation interne entre les 16 doublets, [46], sont illustrées (chacun des 16 doublets étant reliés à quatre autres doublets) cette connexité correspondant à un 78 Chapitre 3 Différentes Modélisations changement d’une seul base (lettre) entre deux doublets voisins dans le code génétique réarrangé. Figure 3.9 : L’affichage des 16 doublets et leurs acides aminés appropriés dans un graphe de type Hamiltonien. Chaque sommet est relié à quatre autres sommets et chaque sommé représente un doublet correspondant à ses acides aminés appropriés : a) Les 16 doublets du code génétique réarrangé dans un espace tridimensionnel, où, les quatre nucleobases sont placés dans la succession UCGA. b) Un affichage tridimensionnel des 20 acides aminés correspondant aux 16 doublets. Quatre flèches noires illustrent le noyau formé à une certaine étape de l’évolution, par cinq groupes de doublets (les acides aminés sont « A, P, V, G et T ») (Yang, 2003). Des acides aminés dans la couleur bleue et bleu clair sont produits à partir de l'expérience de Miller (Weber et Miller, 1981). « o » dénote des codons de « arrêt ». Remarque: Un cycle de Hamilton est un cycle qui inclut chaque sommet exactement une fois (en d'autres termes, c'est un cycle d enjambement). Puisque, si une carte a un cycle de Hamilton, alors il peut être quatre coloré (ou 4 colorable) (Figure 3.10). Pour atteindre un graphique sphérique fermé, les 16 doubles illustrés dans la Figure 3.9, sont réarrangés topologiquement par le biais de la rotation dans la Figure 3.10. Cette forme sphérique montre non seulement la symétrie de la rotation et le dispositif sphérique du code génétique, mais elle explique aussi dans un sens 79 Chapitre 3 Différentes Modélisations visuel (graphiquement), pourquoi le code génétique a la possibilité individuelle pour maintenir son intégrité. Figure 3.10 : L’affichage Sphérique du Code Génétique. On considérons à la fois le dispositif sphérique fermé avec le dispositif symétrique de la rotation nouvellement identifié Figure 3.10, le code génétique dans cet arrangement, peut être aisément repris par un modèle de polyèdre (quasi-28gon), Figure 3.11, [47]. Par conséquent, l’attribution et la distribution des acides aminés autour d'un quasi-28-gon sont conformes à la contrainte générale de la dégénérescence de même ordre, qui est la symétrie de base comme définie pour les codons doublement dégénérés. En plus des codons dégénérés d’ordre 4 et 6, il y a, deux ensembles de codons triplement dégénérés (Ile et Stop), et les deux codons non dégénéré sont Met et Trp. Figure 3.11 : polyèdre (quasi-28-gon) 80 Chapitre 3 Différentes Modélisations Un quasi-28-gon indique clairement que des légères déviations de la symétrie, se sont produites dans les positions des doublets Y/o, de C/W/o et M/I. En dépit des codons dégénérés d’ordre impair, néanmoins, tout le nombre d'acides aminés à ces positions demeure C-symétrique (Tableau 3.11). Notamment, les codons stop « o », ne sont pas totalement non-sens, mais permettent un compensateur pour la distribution numérique des acides aminé et de la chaîne latérale C-atome le long d'un axe évolutionnaire présumé du A à Y et de S à I/M, dans un quasi-28-gon model. Tableau 3.11 : La symétrie dans la dégénérescence (distribution numérique) 3.14. Modèle Rako evi (2004) : Dans cette approche, [48]-[53], M. M. Rako evi à étudier les acides aminés dans un système 4x5 (quatre quintets et cinq quartets en même temps), de plusieurs manières différentes c’est-à-dire par : le nombre de nucléons Tableau 3.12, la masse moléculaire Tableau 3.13, par la règle de codon de (troisième- lettre, premiertroisième-lettre et premier-deuxième-lettre), [54], et par la polarité et le nombre d'atome Tableau 3.14, [55]. Enfin, par le biais de nucléotides et les régularités et l’équilibre des codons Tableau 3.15 et 3.16, [56]. Tableau 3.12 : la distribution harmonique des acides aminés avec, a, b, c et d sont le nombre de nucléons dans 20 chaînes latérales d’acide aminés, avec des isotopes différents : (H-1, C-12, N-14, O-16, S-32) pour a et b, (H- 81 Chapitre 3 Différentes Modélisations 2, C-13, N-15, O-17, S-36) pour c ; (H-2, C-13, N-15, O-18, S-36) pour d, et enfin M est la masse moléculaire des acides aminés Tableau 3.13 : La distribution de la masse moléculaire Tableau 3.14 : Les acides aminés polaires et non polaires Tableau 315 : la distribution du nombre de nucléotides Tableau 3.16 : la distribution du nombre de codon Cette étude met en évidence la structure harmonique caché du code génétique, c’est-à-dire (il existe une état d’ordre entre ces différentes acides aminés), mais avec des distinctions fonctionnelles logiques. 3.15. Modèle de Wilhelm-Nikolajewa (2004) : Le modèle de T. Wilhelm et S. Nikolajewa, [57], se base sur une classification binaire des purines et des pyrimidines, dénotés 1 et 0 respectivement, [58], [59]. Ce qui implique 23 = 8 combinaisons possibles de trois chiffres binaires pour les 82 Chapitre 3 Différentes Modélisations différents codons. Chaque combinaison (case) contient encore 8 possibilités, par exemple le codon 000 (trois pyrimidines) représente les 8 codons : CCC, CCU, ..., UUU, Tableau 3.17. Ainsi, les huit rangées et quatre colonnes sont suffisantes pour placer 20 acides aminés. Tableau 3.17 : Classification binaire du code génétique Cette représentation illustre très bien l’importance de la troisième base dans le codon (triplet), c’est-à-dire : dans la première colonne la complémentarité entre les deux première bases garanties toujours 6 liaisons d’hydrogène (3 + 3 = 6 H) appelés codon forts, [60], la troisième base n'a pas d'importance pour la détermination de l'acide aminé correspondant. De même, dans la deuxième et la troisième colonne, les deux premières bases garanties exactement 5 liaisons d’hydrogène (codons mixtes), la troisième base est importante exactement pour la moitié des cas (s'il y a une purine dans la deuxième position - moitié inférieure du tableau). Enfin, dans la quatrième colonne les deux premières bases (A, U), impliquent seulement 4 liaisons d’hydrogène (codons faibles), la troisième base est toujours nécessaire pour la détermination du bon acide aminé. 3.16. Modèle de Sánchez (2004) : Dans cette approche R. Sánchez, [61], à suggéré une représentation booléen (binaire) duelle du code génétique en utilisant les nombres de liaison d'hydrogène, et les types chimiques de bases : purines {A, G} et pyrimidines {U, C}. En effet, 83 Chapitre 3 Différentes Modélisations l’algèbre de Boole ou le treillis booléen, des quatre bases est construit en supposant que les bases complémentaires dans le treillis sont les bases complémentaires dans la molécule d'ADN (G C et A=U) Figure 3.12. Figure 3.12 : Les diagrammes de Hasse des treillis booléen (A : Primal et B : dual) La correspondance entre l'ordre du codon et les propriétés physico-chimiques des acides aminés sont reflétées dans le diagramme de Hasse du code génétique Figure 3.13. Cette structure, est équivalente à un hypercube booléen à six dimension avec des sommets représentant les codons. Figure 3.13 : Le diagramme de Hasse associé au code génétique booléen. Remarque : Les différents codons sont dénotés selon leur deuxième base. Les noeuds sont : noir quand la deuxième base est U (acides aminés hydrophobes), et gris foncé quand la deuxième base est G. gris quand la deuxième base est C, gris clair quand la deuxième base est A comme deuxième base (acides aminés hydrophiles), et les triplets UAA, UAG et UGA sont les codons stops. 84 Chapitre 3 Différentes Modélisations Les treillis booléens obtenus reflètent un raccordement fort entre l'ordre du code génétique et les propriétés physico-chimiques des acides aminés. Par ailleurs, l'image symétrique d'un codon avec U comme deuxième base codant les acides aminés hydrophobes est toujours un codon avec A comme deuxième base codant les acides aminés hydrophiles. Par exemple, l'image symétrique de l'anti-chaîne {GUG, UGG, GGU, GGA, AGG, GAG} dans le diagramme de Hasse Figure 3.13 est l'anti-chaîne {CAC, ACC, CCA, CCU, UCC, CUC} en prenant les éléments un par un comme image. 3.17. Modèle de Dragovich (2006) : Dans cette approche, A. Dragovich, [62], à utilisé les propriétés de base des nombres p-adic, [63], [64], pour décrire les aspects principaux de l’information dans l'ADN et par conséquence dans le code génétique. Out d’abord, on commence par la formulation d’un nouvel espace appelé l'espace de l'information génétique padic (espace muni d’une distance p-adique). En d’autres termes, un modèle 5adique est approprié pour l'ADN, où ses éléments de base sont les nucléotides (C, A, T/U, G), liées aux chiffres (1, 2, 3, 4), respectivement. Par ailleurs, les séquences de nucléotides de l’ADN peuvent s’écrire dans la représentation 5-adique, comme suit : xi ≠ 0, N = 0 , n ∈ ¥ x = 5 N ( x0 + x1 5 + x2 52 + ... + xn 5n ), (3.43) Par exemple : la chaîne d’ADN a = ATGCAAGTGA, (n = 10), correspond au nombre 5-adique : a = 2 + 3 · 5 + 4· 52 + 1 · 53 + 2 · 54 + 2 · 55 + 4 · 56 + 3 · 57 + 4 · 58 + 2 · 59 (3.44) De même, Les codons peuvent être classifié dans des quadruplés et des doublets, (Tableau 3.18 et 3.19), et ils sont décrits par la formule suivante : x = x0 + x1 5 + x2 52 x0 , x1 , x2 ∈{1 , 2 , 3 , 4} (3.45) On remarque que : ü Les Codons avec les mêmes deux premiers chiffres ont des distances 5-adique égaux 5-2. Explicitement, deux codons quelconques a0a1a2 et a0 a1b2 , ont comme distance 5-adique : d5 (a, b) = a0 + a15 + a2 52 − (a0 + a15 + b2 52 ) = (a2 − b2 ) 5 2 5 =5 5 −2 ∀ a0 , a1, a2 , b2 ∈{1 , 2 ,3 ,4}, avec a2 ≠ b2 . Ce qui mène à grouper les 64 codons dans 16 quadruplés. 85 (3.46) Chapitre 3 Différentes Modélisations ü Les groupes ci-dessus peuvent être considérés comme composés de deux doublets : le premiers doublet b = a0a13 et le second d = a0a14. La distance 2adique entre les codons dans chacun de ces doublets est 1/2 1 1 , d 2 (c, d ) = | (4 − 2) 52 |2 = (3.47) 2 2 ü Les quadruplés qui ont à la deuxième position le chiffre 1, ne se décomposent d 2 (a, b) = | (3 − 1) 52 |2 = pas en deux doublets. Chacun de ces quatre quadruplés correspond à celui de quatre acides aminés différents. ü Les quadruplés qui ont à la deuxième position du chiffre 2 se décomposent en deux doublets. Chacun de ces huit doublets correspond à l'un des huit nouveaux acides aminés différents. ü Les doublets qui constitué les quadruplés, qui ont à la deuxième position le chiffre 3 ou 4 devient de plus en plus complexes et dépendent aussi des chiffres à la première position. Les quadruplés avec les chiffres 13i, 43i, 14i et 44i, où i (1, 2, 3, 4), sont stables et Ils n'ont pas de sous structure. Cependant, pour les quatre autres combinaisons, les deux premiers chiffres dépendent de la nature du codage (mitochondriale ou eucaryotiques), c’est-à-dire pour le code vertébrale mitochondriale : les quadruplés avec les chiffres 23i, 33i, 24i et 44i, où i (1, 2, 3 et 4), ne sont pas stables et ils se décomposent en doublets. Dans le cas du code eucaryotiques : le quadruplet avec des chiffres 23i se désintègre en un seul Ile triplets (231, 232, 233) et un Met-singlet 234, tandis que le quadruplet 34i se décompose en un double et deux singlets différents. Tableau 3.18 : Le code mitochondrial vertébral 86 Chapitre 3 Différentes Modélisations Tableau 3.19 : Le code eucaryotiques 3.18. Modèle de White (2007) : L’approche de M. White, [65], à la description du code génétique repose sur une configuration géométrique des nucléotides dotés d’une symétrie maximale (Rafiki map). Par ailleurs, les données attribuées au code génétique sont basées sur la permutation des nucléotides, ce qui signifie qu’ils doivent être traité comme indépendamment de la position. En effet, cette construction peut être réalisé en adoptant les douze visages d'un dodécaèdre, une structure qui produit comme par magie tous les 64 codons possibles, où le modèle de base de ce dernier est un tétraèdre simple avec une base différente (U, C, G, A) à chaque sommet. (Figure 3.14) Figure 1 : modèle de Rafiki En résumé, le modèle de White est un outil général utile pour étudier l’ensemble des données connu sous le nom de code génétique, parce qu'elle apporte la symétrie maximum à sa structure. La préservation de l'ensemble de ces éléments de symétrie dans la structure globale des données est instructive à une vue appropriée du code génétique. 87 Chapitre 3 Différentes Modélisations Références [1] F.H.C. Crick and al: Nature 192, (1961)1227, [2] M.W. Nirenberg and J.H. Matthaei, Proc. Nat. Acad. Sci. USA 47, (1961)1588, [3] P. Lengyel and al, Proc. Nat. Acad. Sci. USA 47, (1961)1936, [4] M.W. Nirenberg, Sci. Am. 208, (1963)80, [5] M.W. Nirenberg and P. Leder: Science 145, (1964)1399, [6] H.P. Ghosh and al, J. Mol. Biol. 25, (1967)275, [7] G. Gamow, Possible relation between deoxyribonucleic acid and protein structures , Nature 173, (1954)318. [8] B. Hayes, (1998). The invention of the genetic code. American Scientist 86(1) 814. [9] G. Gamow, (1954). Possible mathematical relation between deoxyribonucleic acid and proteins. Det Klongelige Danske Videnskabernes Selskab, Biologiske Meddelser 22, 1-13. [10] G. Gamow, A. Rich and M. Ycas. (1956). The problem of information transfer from nucleic acids to proteins. Advances in Biological and Medical Physics, Vol.4, pp.23-68.New-York Academic Press. [11] S. Brenner, (1957). On the impossibility of all overlapping triplet codes in information transfer from nucleic acid to proteins. Proceedings of the National Academy of Sciences of the U.S.A. 43, 687-694. [12] H.G. Wittmann, Studies on the genetic code in Tobacco Mosaic Virus , in: Informational macromolecules, A symposium, Eds H.J. Vogel, V. Bryson and J.O. Lampen, Academic Press N.Y. and London, (1963)177, [13] Yu. B. Rumer , About systemization of the codons of the genetic code , Dokl. Acad. Nauk. SSSR, 167 (1966)1393-1394. [14] B.G. Konopel’chenko and Yu. B. Rumer : The codon classification inside the genetic code , Dokl. Acad. Nauk. SSSR, 223 (1975)471-474. [15] V.I. Shcherbak, « Rumer s rule and transformation in the context of co-operative symmetry of the genetic code », J. Theor. Biol., 139 (1989)271-276, [16] V.I. Shcherbak, « Arithmetic inside the universal genetic code », Biosystems, 70 (2003)187-209. [17] G. L. Findley, A. M. Findley, AND S. P. McGlynn, Symmetry characteristics of the genetic code. Proc. Natl Acad. Sci. USA, Vol. 79, pp. 7061-7065, November 1982 [18] M. Yeas, (1969).The Biological Code (North-Holland, Amsterdam), 88 Chapitre 3 Différentes Modélisations [19] L. L. Gatlin, (1972) Information Theory and the Living System. (Columbia Univ. Press, New York), Ch. 6. [20] G. L. Findley & S. P. McGlynn, (1979) Int. J. Quantum Chem, Quantum Biol. Symp. 6, 313-327. [21] W. Magnus, A. Karrass, & D. Solitar, (1976) Combinational Group Theory (Dover, New York), 2nd Revised Ed. [22] D. Duplij, S. Duplij: Symmetry analysis of genetic code and determinative degree // Biophysical Bull. Kharkov Univ. -2000. - V. 488. 1(6). - P. 60–70. [23] D. Duplij, S. Duplij, N. Chashchin , 2000. Symmetric properties of genetic code. Biopolymers and Cell, 16:449-454. [24] D. Duplij, S. Duplij, symmetry, determinative degree and DNA physics / physics/0008231v1. [25] U. B. Rumer, Sistematics of codons in the genetic codå // DAN SSSR. - 1968. V. 183. - N°1. - P. 225–226. [26] U. B. Rumer, On codon sistematics in the genetic code // DAN SSSR. - 1966. V. 167. - N°6. - P. 1393–1394. [27] Y. K. Nikolsky, Tricarboxylic acid cycle and genetic code // Biophysika. - 1983. V. 28. - N°1. - P. 133–134. [28] M. Singer, P. Berg, Genes and genomes. - Mill Valley: University Science Books, 1991. - 373 p. [29] D. R. Forsdyke, Different biological species broadcast their DNAs at different (C + G) Wavelengths // J. Theor. Biol. - 1996. - V. 178. - P. 405–417. [30] D. R. Forsdyke, Relative roles of primary sequence and (C + G)% in determining the hierarchy of frequencies of complementary trinucleotide pairs in DNAs of different species // J. Mol. Biol.- 1995. - V. 41. - P. 573–581. [31] P. Demers, http://www.er.uqam.ca/nobel/c3410/quebecium.html [32] P. Cristea, Genetic signals: An emerging concept, Proceedings of IWSSIP 2001 pp. 17-22, 2001 [33] P. Cristea, Genetic signal analysis, Proceedings of ISSPA 2001 The Sixth International Symposium on Signal Processing and its Applications, Invited Paper, Kuala Lumpur, Malaysia, August 13 – 16, 2001, pp. 703–706 [34] P. Cristea, Genetic signal representation and analysis, SPIE Conference BiOS 2002 -International Biomedical Optics Symposium, Functional Monitoring and DrugTissue Interaction, San Jose, USA, 19-25 January 2002, Conference 4623 89 Chapitre 3 Différentes Modélisations [35] H. Gee, Junk Science, Draft of a journey into the genome: What’s there, Nature, http://www.nature.com [36] M. A. Jiménez-Montano,.(1994). On the syntactic structure and redundancy distribution of the genetic code. BioSystems, 32: 11–23. [37] M. A. Jiménez-Montano, C. R. de la Mora-Basanez, and T. Pöschel, On the Hypercube Structure of the genetic Code preprint (1994). [38] M. Eigen, Selforganization of matter and the evolution of biological macromolecules, Naturwiss., 58, 465–523 (1971). [39] J. Wong, The evolution of a universal genetic code, Proc. Nat. Acad. Sci. USA, 73, 2336–2340 (1976). [40] M. Guéron, E. Charretier, M. Kochoyan, and J. L. Leroy, Applications of imino proton exchange to nucleic acid kinetics and structures, in: Frontiers of NMR in Molecular Biology., 225–238 (Alan R. liss Inc., 1990). [41] T. Négadi, « Cracking the genetic code(s) with a modular degree : An algebraic approach », Int. J. Quantum Chem. 91, (2003) 651-662, [42] T. Négadi, « Rumer s transformation, in biology, as the negation, on classical logic », Int. J. Quantum Chem. 94, (2003)65-74, [43] T. Négadi, « On the symmetries of the 16 genetic code-doublets », Proceedings of the XXIV International Colloquium on Group Theoretical methods in Physics, Paris, 15-20 July (2002), IOP Conference Series, GROUP 24 Physical and Mathematical Aspects of Symmetries, Eds J.P. Gazeau, J.P. Antoine, S. Métens and J.Y. Thibon, (2003)687-690, [44] T. Négadi, « Symmetry groups for the Rumer-Konopel chenko-Shcherbak Bisections of the genetic code and applications », Internet Electron J. Mol. Des. 3, (2004)247-270 (http://www.biochempress.com), [45] C. M. Yang, The naturally designed spherical symmetry in the genetic code, qbio/0309014 [46] M.O. Bertman, J.R. Jungck, 1979. Group graph of the genetic code. The Journal of Heredity 70, 379-384. [47] C. M. Yang, In a previous paper, http://preprint.chemweb.com/biochem/0306001 (Date/Time of upload: 8 June 2003/09:21:3 [48] M. M. Rako evi , 2004. A harmonic structure of the genetic code. J. Theor. Biol. 229, 463 – 465. 90 Chapitre 3 Différentes Modélisations [49] M. M. Rako evi , 1997. Two classes of the amino acyl-tRNA synthetases in correspondence with the codon path cube. Bull. Math. Biol. 59, 645–648. [50] M. M. Rako evi , 1998a. The genetic code as a Golden mean determined system. Biosystems 46, 283–291. [51] M. M. Rako evi , 1998b. Whole-number relations between protein amino acids and their biosynthetic precursors. J. Theor. Biol. 191, 463–465. [52] M. M. Rako evi , 2002. Genetic Code: Alphanumerical Regularities Within a Codon Determined Amino Acid Order. Glasnik of the Section of Natural Sciences of Montenegrin Academy of Sciences and art (CANU) 14, 183-197. [53] M. M. Rako evi , A. Joki , 1996. Four stereochemical types of protein amino acids: synchronic determination with chemical characteristics, atom and nucleon number. J. Theor. Biol. 183, 345–349. [54] I. Z. Siemion, P. J. Siemion, 1994. The informational context of the third base in amino acid codons. Biosystems 33, 139–148. [55] O.V. Davydov, 1998. Amino acid contribution to the genetic code structure: endatom chemical rules of doublet composition. J. Theor. Biol. 193, 679–690. [56] S. Marcus, 1989. Symmetry in the simplest case: the real line. Comput. Math. Appl. 17, 103–115. [57] T. Wilhelm, S. Nikolajewa, A New Classification Scheme of the Genetic Code, J Mol Evol (2004) 59:598–605. [58] W. M. Fitch, K. Upper, (1987) The phylogeny of tRNA sequences provides evidence for ambiguity reduction in the origin of the genetic code. Cold Spring Harbor Symposia on Quantitative Biology 52:759-767 [59] F. J. R Taylor, D. Coates (1989) The code within the codons. BioSystems 22:177-187. [60] U. Lagerkvist, (1978) “Two out of three”: An alternative method for codon reading. Proc. Natl. Acad. Sci. USA 75:1759-1762. [61] R. Sánchez, E. Morgado, R. Grau, The Genetic Code Boolean Lattice, MATCH Commun. Math. Comput. Chem 52, 29-46. (2004). [62] B. Dragovich, A. Dragovich, A p-Adic Model of DNA Sequence and Genetic Code, q-bio.GN/0607018 v1. [63] F.Q. Gouvea, p-Adic numbers: An introduction, (Universitext), Springer, Berlin, 1993. 91 Chapitre 3 Différentes Modélisations [64] V.S. Vladimirov, I.V. Volovich and E.I. Zelenov, p-Adic Analysis and Mathematical Physics, World Scientific, Singapore, 1994. [65] M. White, Maximum Symmetry in the Genetic Code: The Rafiki Map, Copyright Rafiki, Inc. 2007. 92 CHAPITRE 4 : Modélisations Algébriques 93 Chapitre 4 Modélisations Algébriques 4.1. Introduction Ce chapitre, est consacré à l’étude des symétries présentes dans ce code génétique. Ainsi, nous présentons deux modélisations algébriques (algèbres de Lie, [7]-[10], et algèbre quantique, [25]-[32]) pour mieux décrire ces symétries. 4.2. La symétrie Dans le langage courant, le mot symétrie signifie une correspondance exacte en forme, taille et position de parties opposées. On parlera ainsi de la symétrie entre un objet et son image dans un miroir. En géométrie, le terme symétrie prend un sens plus général qui peut se définir comme suit : transformation qui ne change ni la forme, ni les dimensions d'une figure, [1]. On peut remarquer que le sens courant du mot symétrie correspond à un cas particulier de symétrie au sens géométrique du terme, qui consiste à inverser les objets par rapport à un plan. En physique, la définition d'une symétrie est semblable à sa consoeur géométrique mais s'applique aux lois de la nature et non plus aux figures géométriques. Ainsi une symétrie en physique est une transformation des variables du système - qui peuvent être des variables géométrique ou plus abstraites - qui ne changent pas la formulation des lois physiques. Une fois de plus, la symétrie selon le sens commun est encore une fois le cas particulier d'une transformation qui consisterait à remplacer les positions des différentes composantes d'un système physique par leur opposé (transformation de x en -x). A noter que ce type très particulier de symétrie porte un nom spécifique en physique : il s'agit d'une transformation de parité. On distinguer différentes familles de symétries en physique (et en géométrie) : • Les symétries globales : La même transformation s'applique partout. Par exemples : symétrie par rapport aux translations dans l'espace : la formulation des lois physiques est indépendante de la position de l'observateur. • Les symétries locales : La transformation dépend de la valeur de la variable à transformer, notamment, s'il s'agit d'une transformation géométrique, cette transformation va dépendre de la position. Si la nature est intrinsèquement invariante ou symétrique pour certaines transformations globales ce n'est en général pas le cas vis-à-vis des symétries locales. Par exemple : la translation locale du temps et de la position. Cette transformation consiste à modifier, en chaque point de l'espace temps, le point et l'instant de référence. Il peut paraître étonnant que les lois de la physique restent invariantes après ce genre de transformation car elle met 94 Chapitre 4 Modélisations Algébriques violemment à mal la notion même d'espace et de temps. Une symétrie locale est également nommée une symétrie de jauge et les théories bâties sur de telles symétries sont appelées des théories de jauge. Les travaux de H. Weyl ont donc montré que la théorie de la relativité générale était une théorie de jauge. On appelle champ de jauge un champ qui prend son origine dans les propriétés de symétrie de jauge ou locale. Pour qu'une symétrie locale soit parfaite ou "exacte" il est nécessaire qu'elle puisse être appliquée partout. Ceci implique que si l'on considère deux points arbitraires dans l'espace, le respect de la symétrie locale va résulter en la création d'un champ entre ces deux points. Comme ces deux points peuvent être a priori n'importe quel point de l'espace, ils peuvent notamment être choisis aussi éloignés que l'on souhaite l'un de l'autre. Par conséquent, notre utilisation du terme « symétrie » en ce mémoire se rapportera toujours à des symétries globales, (pas local). • Symétrie discrète et continue : Une symétrie est dite discrète lorsque l'ensemble des opérations de transformation autorisées constitue un ensemble fini. Par exemple les cristaux possèdent le plus souvent un groupe de symétrie discret appelé groupe cristallographique. D'autres symétries discrètes sont importantes en mécanique quantique: il s'agit des symétries de conjugaison de charge, de parité et d'inversion du temps qui permettent d'exprimer le théorème CPT affirmant que toute théorie quantique doit être invariante sous le produit de ces trois symétries. Par contre, une symétrie est dite continue lorsque les paramètres qui la déterminent varient de façon continue. C'est le cas de la symétrie de rotation qui est associée au groupe de rotations dans l'espace par exemple. La structure mathématique qui décrit le mieux les symétries continues est la théorie des groupes de Lie dont le groupe des rotations est un exemple. • Symétrie exacte et brisée : On parle une symétrie brisée, [2], si elle est seulement approximative, c'est-à-dire, il y a une déviation de la symétrie exacte, qui est cependant suffisamment petite pour qu'elle demeure clairement perceptible. En physique on dit qu'une symétrie est brisée, si après changement de certaines caractéristiques du système, ce dernier ou les lois qui régissent son comportement ne sont plus invariants sous la transformation associée à cette symétrie. En générale, la brisure de symétrie se produit souvent en plusieurs étapes, plutôt qu’une seule étape, c’est-à-dire en supposant que G est une séquence décroissante 95 Chapitre 4 Modélisations Algébriques de sous-groupes G1 ,..., Gk , tel que : G ⊃ G1 ⊃ ... ⊃ Gk (4.1) Cela nous conduit à un ensemble de séquences successives, où à chaque étape une représentation irréductible du groupe précédent, se décompose en plusieurs représentations irréductibles du groupe suivant de la chaîne. Enfin, nous pouvons dire que les symétries sont associées à des dégénérescences, tandis que la brisure de la symétrie conduit à la levée des dégénérescences. Une symétrie est explicitement brisée lorsque la loi qui régit son comportement est modifiée et n'est plus invariante. Une symétrie est brisée spontanément lorsque les lois sous-jacentes sont invariantes sous la symétrie mais que la réalisation particulière du système observé ne l'est pas. 4.3. Les symétries dans le code génétique Il existe aussi des formes asymétriques. Un exemple classique d’asymétrie est la structure de la molécule d’ADN qui contient le code génétique des êtres vivants. • La symétrie de la molécule d’ADN : La configuration de la molécule d’ADN peut être vue comme une symétrie topologique, [3], c'est-à-dire le surenroulement de cette molécule d’ADN se fait uniquement dans le sens inverse des aiguilles d’une montre (sens lévogyre). Il est rare dans la nature de trouver des molécules qui s’enroule dans le sens des aiguilles d’une montre (sens dextrogyre). Dans son état habituel, les brins de la double hélice moléculaire décrivent un certain nombre de tours autour de l’axe de l’hélice, où chaque tour (constitué de 10 nucléotides) à un pas de 3,4 nm. Certaines enzymes peuvent augmenter ou réduire cet entortillement, un peu comme on peut surenrouler ou sous-enrouler un fil de téléphone, ce qui modifie sa forme. Qui plus est, dans un ADN circulaire, le nombre de tours de la double hélice est une propriété topologique invariante : il ne peut être changé par aucune modification de la forme de la structure, [4]. Ainsi, une question fondamentale reste à posé est-ce que on peu simuler tous ces mécanismes enzymatiques en utilisant les opérations de base introduites pour les n uds mathématiques ? une autre question voisine, dans quelle mesure une classification topologique des noeuds permet de remonter aux mécanismes enzymatiques. • La symétrie codon-anticodon : Les codons et leurs anticodons sont symétriques par rapport à l’axe horizontal Rouge, [5], avec (G C et A exemple, le codon GGG est symétrique à l’anticodon CCC (voir Tableau 4.1). 96 U). Par Chapitre 4 • Modélisations Algébriques Symétrie Purine-Pyrimidine : Les purines et les pyrimidines sont symétriques, [6], par rapport à l’axe vertical rouge, avec (G A, U C). Par exemple, GGG est symétrique avec AAA. • Symétrie codon-condon inverse : Soit ZYX un codon inverse du codon XYZ . Les flèches rouges sur le tableau 1 indiquent de la symétrie entre les codons et codons inverses. Par exemple, le CCU est inverse à UCC. Dans les lignes 1, 4, 5 et 8 des codons sont inversé directement par rapport à l’axe vertical. • Symétrie sens-antisens : Soit XYZ un codon sens et Z′Y′X ′ son anti-sens, ou, les bases X′,Y′,Z′ sont les bases complémentaires des bases X,Y,Z , suivant la règle de Watson et Crick (C-G et A-C) Par exemple, la CGU est un antisens du codon d'ACG (tableau 4.1). • Point de symétrie de Halitsky : L'étoile dans le centre indique un point de symétrie qui décompose le code génétique en deux familles symétriques l’une par rapport à l’autre. Halitsky a constaté que par l’échange des bases (A C) et (G U) On obtient une cartographie de deux familles. Par exemple, la famille des codons GG (A / G) de Gly dans le coin inférieur à gauche sont symétriques non à la famille des codons UU (C / U) de Phe dans le coin supérieur à droit Tableau 4.1 : Les Symétries dans le code génétique On distingue aussi d’autres symétries : - Le code génétique établit toujours une correspondance entre les codons et les acides aminés. On a 4.4.4 = 64 codons. 97 Chapitre 4 - Modélisations Algébriques La dégénérescence est toujours de l’ordre : 1, 2, 3, 4 ou 6, associés à 20 acides aminés. - Pour les codons XYZ formant un quartet, XY ne varie pas et c’est celui en troisième place qui prendra la valeur A, C, G, T dans l'ADN, ou : A, C, G, U dans l'ARN. 4.4. La brisure de symétrie dans le code génétique Ce modèle fût un long projet de recherche d’algèbres de Lie et de représentations pouvant servir à décrire le code génétique standard. En effet, les auteurs ont proposé une approche algébrique au code génétique, dont le but était d’expliquer les dégénérescences rencontrées dans le code génétique comme étant le résultat d’une séquence de brisures de symétrie qui se sont produites lors de son évolution, [7]-[14]. La première étape dans la recherche des symétries dans le code génétique consiste à sélectionner une algèbre de Lie simple g et une représentation irréductible de g sur un espace vectoriel de dimension 64. Une telle représentation sera dorénavant appelée : représentation de codon. La raison pour laquelle il a été exigé à cette représentation d’être irréductible est qu’une représentation réductible est un objet composé et peut être exprimé en une somme de composantes irréductibles. L’usage d’une représentation réductible ne peut correspondre à un point de départ d’un processus de brisure de symétrie mais plutôt à une étape postérieure dans laquelle un type de brisure aurait été déjà opéré. De même, seulement les algèbres de Lie simples sont considérées parce qu’elles sont les blocs de construction d’algèbres de Lie semi-simples. En effet, une algèbre de Lie semi-simple est la somme directe d’algèbres de Lie simples et pourrait ainsi correspondre à une symétrie composée. Par ailleurs, on sait qu’une algèbre de Lie générale se décompose en une somme semi-directe d’une algèbre de Lie semi-simple et de son radical. De plus, toute représentation irréductible d’une telle algèbre de Lie peut, sous cette décomposition, s’écrire comme le produit tensoriel d’une représentation irréductible de sa sous-algèbre semi-simple par une représentation unidimensionnelle de son radical, [15]. Comme cette dernière ne contribue pas aux dimensions et aux 98 Chapitre 4 Modélisations Algébriques multiplicités quand on calcule les règles de branchement, on peut supposer au départ, sans aucune perte de généralité, que l’algèbre originale est semi-simple. La détermination de toutes les représentations de codons est basée sur la classification de Cartan (Tableau 4.2), à partir de laquelle, quatre séries d’algèbres de Lie classiques différentes forment la classe des algèbres de Lie simples : An = su(n+1) , Bn = so(2n+1) , Cn = sp(2n) , Dn = so(2n) , (4.2) en plus des 5 algèbres de Lie exceptionnelles : G2, F4, E6 , E7 , E8. (4.3) Le résultat obtenu montre que seulement les algèbres de Lie simples suivantes admettent une représentation de codon : su(2) , su(3) , su(4) , sp(4) , sp(6) , so(13) , so(14) , G2 , su(64) , so(64) , sp(64). L’existence d’un nombre fini de représentations de codons s’explique par le fait de la croissance monotone des dimensions des représentations irréductibles des algèbres de Lie simples en fonction de leur rang. En effet, les algèbres de Lie de rang supérieure à 64 ne sont pas prises en compte puisque la dimension de la représentation de codons est bornée par cette limite supérieure, [16]. Tableau 4.2 : Classification de Cartan des algèbres de Lie simples Après étude détaillée, la liste complète des représentations de codons est résumée dans le Tableau 4.3 ci-dessous : 99 Chapitre 4 Modélisations Algébriques Table 4.3 : Représentations de codons des algèbres de Lie simples Les auteurs de cette approche algébrique se sont convenus d’éliminer les trois dernières algèbres de Lie, i.e. C32 , D32 et A63, puisqu’elles possèdent un grand nombre de générateurs et un nombre énorme de chaines possibles de sous-algèbres maximales. En partant d’une des représentations de codons des autres algèbres de Lie de la Tableau 4.3, la première étape de l’analyse consiste à établir les règles de branchement lors de la réduction de l’algèbre de Lie originale à une de ces sousalgèbres maximales. Pour cela, il est suffisant de considérer les sous-algèbres semisimples maximales, puisque, comme on l’a déjà cité plus haut, un centre non-trivial possible ne contribue pas aux dimensions ou aux règles de branchement. En utilisant la classification des sous-algèbres semi-simples maximales des différentes algèbres de Lie simples, [17], [18], on obtient ce qui suit pour les algèbres de Lie d’intérêt (Voir Tableau 4.4): 100 Chapitre 4 Modélisations Algébriques Tableau 4.4 : Les sous-algèbres semi-simples maximales de certaines algèbres de Lie Notons ici que : su (2) ≅ so (3) ≅ sp (2) , su (2) ⊕ su (2) ≅ so(4) , sp (4) ≅ so(5) , su (4) ≅ so(6) , et que la dernière colonne indique l’espace symétrique (ou Grassmannienne) associé, [19] : Séries A I : Espaces symétriques SU(n)/SO(n) associés à su (n) ⊃ so(n) , Séries A II : Espaces symétriques SU(2n)/Sp(2n) associés à su (2n) ⊃ sp (2n) , Séries A III : Grassmaniennes complexes SU(p+q)/SU(p)xSU(q) associées à su ( p + q) ⊃ su ( p ) ⊕ su (q ) , Séries BD I: Grassmaniennes réelles SO(p+q)/SO(p)xSO(q) associées à so ( p + q ) ⊃ so ( p) ⊕ so (q) , Séries C I : Espaces symétriques Sp(2n)/U(n) associés à sp (2n) ⊃ su (n) , Séries C II : Grassmaniennes quaternioniques Sp(p+q)/Sp(p)xSp(q) associées à sp ( p + q) ⊃ sp ( p ) ⊕ sp (q ) , 101 Chapitre 4 Modélisations Algébriques Séries D III : Espaces symétriques SO(2n)/U(n) associés à so (2n) ⊃ su (n) . Les règles de branchement des représentations irréductibles sous de telles réductions sont connues, [16]. Ce procédé de réduction de symétrie aux sous-algèbres maximales peut être répété et mène à des chaines de sous-algèbres descendantes, chacune d’entre elles est la sous-algèbre maximale de celle qui la précède. Le problème rencontré à ce niveau est qu’il va falloir classifier les sousalgèbres semi-simples maximales des algèbres de Lie semi-simples et pas seulement des algèbres de Lie simples. Pour cela, on utilise un théorème de Dynkin, [17], qui dit que : Les sous-algèbres semi-simples maximales g’ d’une algèbre de Lie semi-simple g sont de deux types : Ø Type simple : A un isomorphisme près, en incluant une permutation appropriée des idéaux simples qui constituent g, on a g=g0 ⊕ g1 et g =g 0 ⊕ g1, où g0 est un des idéaux simples de g, g1 est la somme directe des autres idéaux simples de g et 0 est une sous-algèbre semi-simple maximale de g0 . Ø Type diagonal : A un isomorphisme près, en incluant une permutation appropriée des idéaux simples qui constituent g, on a g=g0 ⊕ g0 ⊕ g1 et g =g0 ⊕ g1, où g0 est un des idéaux simples de g qui apparait (au moins) deux fois dans g, g1 est la somme directe des autres idéaux simples de g et l’inclusion de g0 dans g0 ⊕ g0 est diagonale, i.e. associant à tout X0 ∈ g0 l’élément (X0, X0) ∈ g0 ⊕ g0. De ce fait, les chaines peuvent être classées dans soit des : Ø chaines simples, Les chaines qui n’inclut pas une brisure à une sous-algèbre de type diagonale à aucune étape, Ø chaines diagonales : Les chaines qui inclut une brisure à une sous-algèbre de type diagonale au moins au niveau d’une étape. Dans leur approche originale, [7], [8], les auteurs se sont restreints aux chaines simples, bien que l’inclusion des chaines diagonales qui a été accomplie plus tard, [20], [21], ne change pas l’image finale obtenue. Pour toute chaine, la distribution des multiplets obtenus doit être comparée à celle observée dans le code génétique standard, résumée dans la Tableau 4.5. Plus précisément, la stratégie adoptée est de procéder le long de chaque chaine 102 Chapitre 4 Modélisations Algébriques étape par étape et de prendre le soin d’analyser, après chaque étape, si les dégénérescences obtenues sont toujours compatibles à celles du code génétique. Tableau 4.5 : Dimensions et multiplicités dans le code génétique standard Après avoir défini des règles de sélection qui permettent d’éliminer les chaines qui ne vérifient pas la condition précédente à une certaine étape, et après une étude détaillée des algèbres de Lie simples retenues (Voir partie supérieure de la Tableau 4.3), seules les huit chaines suivantes demeurent : • Chaine 1 : su(2) • Chaine 2 : sp(4) ⊃ su(2) • Chaine 3 : sp(4) ⊃ su(2) ⊕ su(2) • Chaine 4 : G2 ⊃ su(2) ⊕ su(2) • • Chaine 5 : sp(6) ⊃ su(2) Chaine 6 : sp(6) ⊃ su(2) x su(2) • Chaine 7 : sp(6) ⊃ sp(4) ⊕ su(2) ⊃ su(2) ⊕ su(2) • Chaine 8 : sp(6) ⊃ sp(4) ⊕ su(2) ⊃ su(2) ⊕ su(2) ⊕ su(2) Il est maintenant facile de voir ce qui se passe quand le procédé de brisure de symétrie continue au-delà de su(2) dans le sens d’une brisure d’une ou de plusieurs des sous-algèbres su(2) à des sous-algèbres Abéliennes U(1). D’abord, il faut vérifier qu’au moins une des sous-algèbres su(2) reste non brisée, sinon on va à la fin obtenir 64 singlets. Ceci exclut immédiatement les chaines 1, 2 et 5. La chaine 3 est aussi exclue puisque le fait de briser une des deux sous-algèbres su(2) sans briser l’autre va produire 24 multiplets (2 quintets, 4 quartets, 6 triplets, 8 doublets et 4 singlets). Quant aux chaines 4, 6 et 7, elles sont aussi exclues puisque : ü Chaine 4 : Briser la première sous-algèbre su(2) sans briser la deuxième va produire 18 multiplets (2 sextets, 4 quintets, 2 quartets, 4 103 Chapitre 4 Modélisations Algébriques triplets et 6 doublets). Briser la deuxième sous-algèbre su(2) sans briser la première va produire 30 multiplets (2 quartets, 8 triplets, 12 doublets et 8 singlets). ü Chaine 6 : Briser la première sous-algèbre su(2) sans briser la deuxième va produire 16 multiplets (2 septets, 6 quintets, 6 triplets et 2 singlets). Briser la deuxième sous-algèbre su(2) sans briser la première va produire 24 multiplets (8 quartets, 16 doublets). ü Chaine 7 : Briser la première sous-algèbre su(2) sans briser la deuxième va produire 40 multiplets (4 triplets, 16 doublets et 20 singlets). Briser la deuxième sous-algèbre su(2) sans briser la première va produire 15 multiplets (1 octet, 2 septets, 1 sextet, 2 quintets, 4 quartets, 2 triplets, 1 doublet et 2 singlets). Enfin la chaine 8 est aussi exclue puisque la brisure d’une sous-algèbre su(2) sans briser les deux autres va produire 24 multiplets (2 sextets, 4 quartets, 4 triplets, 10 doublets et 4 singlets). D’où, en résumé, on conclut que : Il n’y a aucun genre de brisure de symétrie à travers les chaines de sous-algèbres capable de reproduire exactement les dégénérescences du code génétique. Notons ici, que ce résultat est aussi valable même pour le cas des algèbres de Lie simples de rang moyen so(13) et so(14), et même si on inclut les chaines diagonales. A ce niveau, et pour résoudre ce problème épineux, les auteurs se sont inspirés d’une constatation biologique, qui était et qui demeure encore une énigme non encore correctement élucidée à ce jour. En effet, durant la première décade après la découverte du code génétique standard, il fût considéré comme universel, bien qu’on sait maintenant qu’il ne l’est pas. Les déviations découvertes dans la forme de codes génétiques non-standards sont minimes. Dans chaque cas, la modification concerne seulement un petit nombre de relation codon-acide aminé et ne s’applique que pour une classe restreinte d’espèces ou à des codes d’organelles telles que les mitochondries et les chloroplastes, [22]. L’argument utilisé généralement par les biologistes et les généticiens pour expliquer ce phénomène est celui avancé par Crick lui-même, [23], quand il formula sa fameuse hypothèse de « Frozen accident », selon laquelle le code génétique, après être passé par une 104 Chapitre 4 Modélisations Algébriques phase primordiale d’évolution, fût à une certaine étape « gelé » en sa forme observée présentement, c'est-à-dire quand la machinerie de synthèse des protéines arriva à un stade de complexité tel que d’autres changements seraient devenus létaux. Ainsi, l’universalité du code génétique fût une conséquence de ce « gel » apparu très tôt lors de son évolution, bien avant la bifurcation des formes de vie en différents royaumes. L’analyse des codes non-standards et de leurs origines réalisée par Crick, pourrait alors être interprétée comme une évidence que le gel n’est pas total, un certain type de fusion (melting) pourrait occasionnellement survenir. Mais même si l’on accepte ces arguments, le simple fait que le code génétique a été gelé à un certain stade de son évolution ne nous éclaire pas sur, par exemple, les lois qui ont gouverné cette évolution avant que ce gel ne se produise. Une étude statistique simple, [24], a montré que le nombre possible de codes génétiques est de l’ordre de 1071, dont la majorité n’exhibe aucun type de structure régulière. Ceci montre que l’opération identification des lois qui ont gouverné l’évolution primordiale du code génétique reste vraiment un défi à relever par les chercheurs. A la base de cette constatation, les auteurs identifient exactement ce problème à celui qu’ils ont rencontré dans leur approche algébrique. Ils postulent alors que la dégénérescence observée du code génétique est une réflexion de la symétrie primordiale qui, au cours de l’évolution du code génétique, fût brisée en une séquence d’étapes. Un des principaux avantages de cette approche est que les conditions de compatibilité avec une certaine symétrie s’abattent de façon radicale sur le nombre de possibilités mentionnées auparavant, et menant à une probabilité non négligeable pour que le code génétique standard soit ce qu’il est maintenant. D’où cette approche algébrique s’apparente à l’hypothèse du gel. En effet, dans cette approche, la procédure de brisure de symétrie a été généralisée par l’introduction de certains opérateurs de Casimir associés aux chaines de sousalgèbres, qui permettent d’incorporer, de manière rigoureuse, le phénomène d’un gel (partiel) du processus de brisure de symétrie durant la dernière étape, en concordance avec l’hypothèse de Crick concernant l’évolution du code génétique. Soit une algèbre de Lie semi-simple et une chaine descendante de sousalgèbres semi-simples : g ⊃ g1 ⊃ g2 ⊃ ….. . (4.4) La distribution des multiplets obtenus par la décomposition successive d’une représentation irréductible de g peut être encodée dans le spectre d’un opérateur H 105 Chapitre 4 Modélisations Algébriques unique. Il peut être défini comme étant une combinaison linéaire générique d’opérateurs de Casimir Cj associés aux sous-algèbres simples de g, qui constituent en fait les sous-algèbres semi-simples g1, g2, …apparaissant dans la chaine : H= ∑λ j Cj . (4.5) j En effet, due à la chaine d’inclusion précédente, les opérateurs de Casimir commutent entre eux, et pour un choix générique des coefficients j, les espaces propres de l’opérateur H coïncident avec les espaces propres joints de l’ensemble des opérateurs de Casimir, lesquels sont juste les sous-espaces irréductibles pour la plus petite (la dernière) sous-algèbre dans la chaine. En Physique, l’opérateur H n’est autre que l’opérateur Hamiltonien, les opérateurs Cj représentent eux l’ensemble des invariants reflétant les différentes sous-symétries présentent dans le système physique étudié, et enfin les coefficients j sont déterminés en les ajustant au spectre d’énergie observé expérimentalement. Rappelons aussi, qu’après la première phase du processus de brisure de symétrie, la dernière sous-algèbre dans la chaine est une somme directe de sousalgèbres su(2), de telle manière à ce que l’opérateur H associé à ce stade peut s’écrire sous la forme : H= p ∑λ j Cj + ∑α k =1 j k L2k , (4.6) où p, le nombre total de sous-algèbres su(2) apparaissant à la fin de la chaine, varie entre 1 et rang(g), selon la chaine considérée. Les opérateurs Cj représentent maintenant les opérateurs de Casimir associés aux sous-algèbres simples différentes de su(2) qui constituent les sous-algèbres semi-simples g1, g2, …etc présentes dans la chaine, tandis que l’opérateur L2k = L2k , x + L2k , y + L2k , z est l’opérateur de Casimir standard de la kième sous-algèbre su(2) (1<k<p). La seconde phase, qui inclut la brisure d’une ou de plusieurs des sousalgèbres su(2), sera caractérisée par un opérateur H tel que : H= ∑ λ j Cj + j p ∑ α k L2k + k =1 p ∑β k =1 p 2 k Lk , z + ∑γ k =1 k Lk , z . (4.7) Pour bien comprendre l’effet des nouveaux termes, considérons le cas d’une seule copie de su(2). En prenant en compte le fait que les représentations irréductibles de su(2), qui sont caractérisées par leur spin s (correspondant au plus haut poids 2s, qui peut prendre n’importe quelle valeur entière non négative), forment des espaces 106 Chapitre 4 Modélisations Algébriques de dimension (2s+1) sur lesquels l’opérateur de Casimir standard L2 de su(2) prend la valeur s(s+1), alors que Lz possède (2s+1) valeurs propres distinctes : m = -s, s+1, …., s-1, s. On note alors que : Ø L’opérateur Lz engendre une réduction d’un multiplet de dimension (2s+1) en (2s+1) singlets, Ø L’opérateur L2z engendre quant à lui une réduction d’un multiplet de dimension (2s+1) en s doublets et un singlet si s est entier, ou s doublets si s est demi-entier. Seule la première possibilité correspond à une brisure de symétrie au niveau des algèbres de Lie : de l’algèbre de Lie su(2) à sa sous-algèbre maximale u(1). Par contre, il a été observé que les deux possibilités peuvent être naturellement interprétées en termes d’une brisure de symétrie au niveau des groupes de Lie : du groupe (connexe) SU(2) à : a)- son sous-groupe maximal connexe U (1) ≅ SO (2) , ou à b)- son sous-groupe maximal (non connexe) Z 2 × U (1) ≅ O (2) , qui est un sous-groupe de SU(2) formé par deux cercles : e iα 0 e iβ 0 β ∈ R . (4.8) α Z 2 × U (1) = R ∈ ∪ −iβ − iα 0 e 0 e Remarquons que Z 2 × U (1) est généré par U(1) et la seule matrice : 0 1 (4.9) 1 0 qui n’est autre que le générateur du groupe de Weyl de SU(2) et qui, dans une représentation de spin s, lie les deux états de nombre quantique magnétique (m) et (-m). Par abus de notation, les auteurs ont choisi d’appeler ces deux réductions de la symétrie su(2) comme : la symétrie so(2) et la symétrie o(2) respectivement. Le dernier ingrédient utilisé par les auteurs dans ce procédé de brisure de symétrie est le fait d’autoriser les coefficients γ k d’être des polynômes des opérateurs de Casimir standard L2k des sous-algèbres su(2) plutôt que des constantes. Ceci va permettre une forme très spécifique d’interruption du processus de brisure de symétrie à la dernière étape, parce que les multiplets de l’avant dernière étape qui devraient normalement se subdiviser à la dernière étape vont rester non brisés si (et seulement si) leurs labels de su(2) sont tels que le coefficient 107 Chapitre 4 γ Modélisations Algébriques correspondant s’annule. Une telle interruption partielle à la dernière étape correspond à l’hypothèse biologique de Crick. Après ces observations, on peut maintenant reconsidérer la seconde phase du procédé de brisure de symétrie, au cours de laquelle un ou plusieurs des sousalgèbres su(2) se brisent. La nouveauté principale réside dans le fait que cette réduction peut se réaliser suivant deux voies possibles : - Soit, vers o(2), en utilisant l’opérateur L2z , - Ou, vers so(2), en utilisant l’opérateur Lz . Dans le second cas, la dégénérescence est complètement liftée, alors que le premier cas donne un ensemble de doublets pour des représentations de dimension paire de su(2) (spin demi-entier) et une collection de doublets plus un singlet pour des représentations de dimension impaire de su(2) (spin entier). Dans ce qui suit, on va désigner les singlets par 2m (m=-s,…,s) et les doublets par ±2m (m=0,…s avec m>0). De plus, l’option de brisure de symétrie vers so(2) peut être réalisée de deux façons différentes : - Soit directement, de su(2) vers so(2), - Ou indirectement, de su(2) vers o(2), ensuite en so(2). Nous allons voir que ces deux possibilités mèneront à des résultats différents, dû à la possibilité de « gel » à la dernière étape. Dans leurs travaux originaux, [7], [8], les auteurs ont éliminé la brisure indirecte, puisque l’étape intermédiaire n’a pas d’interprétation naturelle au niveau des algèbres de Lie. Une telle interprétation devient possible quand des aspects globaux sont pris en compte, [9]. Préliminairement, notons que la première phase du processus de brisure de symétrie doit avoir produit des multiplets qui se transforment suivant la représentation (vectorielle) de spin 1 d’au moins une des sous-algèbres su(2). En effet, si ce n’est pas le cas, il ne sera pas possible de générer les sextets et les triplets du code génétique. Notons aussi que, jusqu’à l’avant-dernière étape du processus, au moins une sous-algèbre su(2) doit rester non brisée, parce que si toutes les sous-algèbres su(2) sont brisées vers o(2) ou so(2), la multiplicité de tous les multiplets seront des puissances de 2. En fait, l’argument concernant l’impossibilité de générer des sextets et des triplets du code génétique peut être affiné par l’introduction d’un critère supplémentaire qui permettra de réduire 108 Chapitre 4 Modélisations Algébriques davantage le nombre de chaines à analyser. Ce critère est basé sur l’observation que, durant sa seconde phase, le processus de brisure de symétrie ne peut générer des multiplets dont la dimension est multiple de 3 à partir de multiplets dont la dimension ne l’est pas. Il est donc plus convenable d’introduire un nombre de trialité d3 défini comme suit : d3 = somme des dimensions de tous les multiplets dont la dimension est multiple de 3. De ce fait, ce nombre de trialité ne peut pas décroitre durant la seconde phase. En partant du fait que, dans la distribution finale des multiplets dans le code génétique standard ce nombre est égal à 24, alors on conclut que les chaines de brisure qui, au début ou à un certain point de la seconde phase du processus jusqu’à l’avant-dernière étape, violent le critère d3 ≥ 24, ne seront pas aptes à générer les sextets et les triplets du code génétique et donc seront disqualifiées. Considérons maintenant les huit chaines retenues précédemment. Toutes ont, jusqu’à la fin de la première phase, produit moins de 21 multiplets. D’où le processus de brisure de symétrie doit procéder à la deuxième phase et aucun gel ne s’est encore produit. Par ailleurs, la chaine 1 (d3 = 0) et les chaines 2, 5 et 6 (d3 = 18) sont immédiatement éliminées conformément au critère précédent. Pour les autres chaines, nous procédons de la même façon en éliminant toutes les chaines avec moins de 21 multiplets et d3 < 24. Après traitement, ils obtinrent finalement trois chaines qui décrivent correctement les dégénérescences du code génétique standard, la première étant la chaine sp(6), [7]-[8] : sp(6) ⊃ sp(4) ⊕ su(2) ⊃ su(2) ⊕ su(2) ⊕ su(2) ⊃ su(2) ⊕ o(2) ⊕ su(2) ⊃ su(2) ⊕ o(2) ⊕ su(2)f et les deux chaines G2 , [9] : G2 ⊃ su(2) ⊕ su(2) ⊃ su(2) ⊕ o(2) ⊃ su(2)f ⊕ o(2) , G2 ⊃ su(2) ⊕ su(2) ⊃ su(2) ⊕ o(2) ⊃ su(2) ⊕ so(2)f . L’indice « f » indique ici le fait que la dernière brisure est seulement partielle, due au phénomène de « gel », qui peut être implémenté par les opérateurs H respectivement pour les trois chaines : 109 Chapitre 4 Modélisations Algébriques H = H0 + C2(sp(4)) + 2 1 L1 2 2 + + 2 L2 2 + 1( L2 2 + 2( L2 H = H0 + 1 L1 2 + 2 L2 2 + 2 L 2, z H = H0 + 1 L1 2 + 2 L2 2 + 2 L 2, z 3 L3 + 2 2 L 2, z + 2 2 3( L1 + L2 )( L23 -2) L3, z 2 -2)( L22 -15/4)( L22 -6)( L22 - 35/4) L1, z , 2 -2)( L22 -6)( L22 - 35/4) L2, z . Notons ici que les deux premières chaines correspondent à une brisure directe alors que la troisième correspond à une brisure indirecte. Enfin, pour le cas du modèle sp(6), on obtient la représentation suivante de l’évolution du code génétique : Figure 4.1 : Arbre d’évolution du code génétique dans le modèle sp(6) 110 Chapitre 4 Modélisations Algébriques 4.5. Algèbre de Lie quantique du code génétique Les quatre nucléotides ( A, C, G, A ) de la chaîne d’ADN sont proposées comme des états fondamentaux de la représentation (1 2,1 2 ) de l’algèbre enveloppante quantique U h ( sl (2) ⊕ sl (2) ) dans la limite h → 0 . En effet, les triplets (codons) de nucléotides seront obtenus par le produit tensoriel des 3 nucléotides, [25], cette approche peut être comparé a la classification des baryon dans la physique des particules. Par exemple : • • Codons ≈ 3 nucléotides (A, A, U) → (AAU, AUA, UAA) Photon ≈ 3 quarks p → uud + udu + duu Remarque La différence essentielle réside dans la propriété de la base cristalline à fournir un ordre naturel des constituants, cet ordre étant crucial dans le codon, ce qui n’est pas le cas pour les baryons. La règle de complémentarité de l’ADN-ARNm peut suggéré l’attribution d’un nombre quantique avec des valeurs opposés pour les couples ( A, T/U ) et ( C, G ) , la distinction entre les bases puriques ( A, G ) et les bases pyrimidiques ( C, T/U ) peut être représentée algébriquement dans un sens analogue. Considérons le groupe SU(2)xSU(2), et plaçons les 4 nucléotides dans la (1/2,1/2) de cette algèbre, les vecteurs de base correspondant aux valeurs propres ± 1 du générateur J 3 sont définit algébriquement comme suit : 2 1 1 1 1 su (2) H C ≡ ( + , + ) ←→ U ≡(− , + ) 2 2 2 2 su (2)V b b su (2)V (4.10) 1 1 1 1 su (2) H G ≡ ( + , − ) ←→ A ≡ ( − ,− ) 2 2 2 2 les indices H (horizontal) et V (vertical) sont ajoutés pour spécifier l’action du groupe tels que : SU(2)H distingue purine/pyrimidine, et le SU(2)V la complémentarité CG/AT par liaison d'hydrogène. 111 Chapitre 4 Modélisations Algébriques Toutefois, Pour représenter un codon (trois nucléotides), nous devrons 1 1 effectuer le produit tensoriel de trois représentations irréductibles de , . En effet, 2 2 Tableau 1.2 (Chp I) on remarques que Les deux premiers bases constituent le codon sont les plus descriptifs, c’est-à-dire que les deux nucléotides sont stables pour la représentation du codon, mais la dégénérescence est plutôt généré par le troisième nucléotide. Donc Il est préférable d’étudier le codon comme 2 + 1 états (nucléotides) au lieu d’un simple triplet. On définit le produit tensoriel des 2 premiers nucléotides de dim = 4 , par 1 1 1 1 , ⊗ , = (1,1) ⊕ (1,0 ) ⊕ ( 0,1) ⊕ ( 0,0 ) 2 2 2 2 (4.11) D’après le théorème de Kashiwara « (2.100 et 2.101) Chp2 », on obtient : su (2) H ( 0,0) ←→ (1,0) su (2)V b ( 0,0) ( −1,0) ( 0,1) (1,1) su (2)H ( 0,0) ←→ (1,0) ( 0, −1) (1, −1) On a alors, [CA] (4.12) b su(2)V ( 0,1) ( −1,1) ( 0,0) ( −1,0) ( 0, −1) ( −1, −1) su (2)H ← → [ CG UG UA] su(2)V b b su(2)V CU GU ← su (2)H → GA CC UC UU GC AC AU GG AG AA Soit en résumé, Tableau 4.6 : Représentation Irréductibles du dinucléotides 112 (4.13) Chapitre 4 Modélisations Algébriques On remarques que : • Les deux premiers nucléotides dans un codon peuvent être mit en correspondance avec le quadruplet ; doublet et le singlet relative au acide Aminée. de plus, le sextet et le triplet peuvent être vus comme la somme du quadruplet plus le doublet et comme la somme du doublet plus le singlet respectivement. • Les états du dinucléotide associer au quadruplet (ainsi celles incluses dans les sextets) vérifies : J Hd ,3 > 0 • ou J Hd ,3 = 0, JVd ,3 ≥ 0, JVd ,3 ≠ 0 (4.14) Les états du dinucléotide associer au doublet (ainsi celles incluses dans les triplets) et le singlet vérifies : J Hd ,3 < 0 ou J Hd ,3 = 0, JVd ,3 < 0, JVd ,3 = 0 (4.15) Avec J Hd ,3 et JVd ,3 Sont les troisièmes constituent du spin générateur de l’état du dinucléotide. Par Exemples : i. Le quadruplet → Pro = CCX avec ( X=C, U, G et A ) ⇒ J Hd ,3 = 1 > 0 et JVd ,3 = 1 > 0 (4.16) ii. Le doublet → Cys = UGR → ( R=C et A ) ⇒ J Hd ,3 = 0 et JVd ,3 = 0 Les valeurs ci-dessous sont déduites à partir des équations (2.94, 2.95) d d Tableau 4.7 : Valeurs J α ,± J α ,m (α = H ,V ) pour les deux Premiers nucléotides 113 (4.17) Chapitre 4 Modélisations Algébriques 1 1 On définit le triple produit tensoriel de représentations irréductibles de , 2 2 U h→0 ( sl (2) ⊕ sl (2)) par 1 1 1 1 1 1 3 3 3 1 1 3 1 1 , ⊗ , ⊗ , = , ⊕ 2 , ⊕ 2 , ⊕ 4 , 2 2 2 2 2 2 2 2 2 2 2 2 2 2 (4.18) 3 3 la structure de représentation irréductible , correspond au : 2 2 3 3 2, 2 3 1 , 3 3 2 2 2 , 2 = 3 1 , − 2 2 3 3 , − 2 2 Qui est équivalent à : CCC 3 3 GCC , ≡ 2 2 GGC GGG 1 3 , 2 2 1 1 , 2 2 1 1 ,− 2 2 1 3 ,− 2 2 1 3 − , 2 2 1 1 − , 2 2 1 1 − ,− 2 2 1 3 − ,− 2 2 UCC UUC ACC AUC AGC AAC AGG AAG 3 1 − , − 2 2 3 3 − , − 2 2 3 3 − , 2 2 3 1 − , 2 2 UUU AUU AAU AAA (4.19) (4.20) De même, La structure des représentations irréductibles peuvent être généralisé pour les différents états 3 1 CCG UCG UUG UUA , ≡ 2 2 GCG ACG AUG AUA (4.21) 3 1 CGC UGC UAC UAU , ≡ 2 2 CGG UGG UAG UAA (4.22) 1 2 CCU 1 3 GCU 2 , 2 ≡ GGU GGA 1 UCU ACU AGU AGA CUC 1 3 GAC 2 , 2 ≡ GAG GGA CUU GUU GAA AGA 1 1 1 CCA UCA , 2 2 ≡ GCA ACA 2 1 1 CGU UGU , 2 2 ≡ CGA UGA 1 1 CUG CUA , ≡ GUG GUA 2 2 1 1 CAC CAU , ≡ CAG CAA 2 2 (4.23) (4.24) 3 4 114 Chapitre 4 Modélisations Algébriques Tableau 4.8 : les valeurs de la Représentation Irréductibles des acides aminées Sous SU(2) ( = H, V) On définit la charge Q du dinucléotide, [26], par : 1 1 Q = J 3,H + CV ( J 3,V + 1) − 4 4 (4.25) Par conséquent, on remarque que les dinucléotide ce devise en deux catégories : i. Les dinucléotides fortes : CC, GC, UC, AC, CU, GU, CG et GG → Les quadruplets → Q > 0 ii. Les dinucléotides faibles : UU, AU, UG, AG, CA, GA, UA et AA → Les doublets → Q < 0 115 Chapitre 4 Modélisations Algébriques Exemples i. Pour le quadruplet → Pr o = CCC , on a : CV = ce qui implique que 15 3 3 , J H ,3 = et JV ,3 = 4 2 2 (4.26) Q = 3,59 > 0 (4.27) ii. Pour le doublet → Asn = AAC , on a : CV = 15 3 3 , J H ,3 = et JV ,3 = 4 2 2 Ce qui donne (4.28) Q = −0.25 < 0 (4.29) 4.5.1. Opérateur de lecture (R) Un opérateur R peut être définit par le biais de l’algèbre enveloppante quantique U q→0 ( sl (2) ⊕ sl (2) ) , qui est une fonction des générateurs (Casimirs, ...) possédant la propriété suivante : • Agissant sur les codons de façon diagonale, les valeurs propres seront les mêmes pour deux codons associés au même acide aminé et différentes pour deux codons associés à deux acides différents. Cette opérateur sera appelé Opérateur de lecture (opérateur ribosomique), [27]. C'est un fait remarquable que les différents codes génétiques partagent la même structure de base, pour reproduire cette structure un prototype de lecture peut être met en évidence. La première Partie de l’opérateur R sera responsable de la structure du quadruplet donné essentiellement par le dinucléotide, définit par : 4 4 c1CH + c2CV − 4c1PH J H ,3 − 4c2 PV JV ,3 3 3 ∀ci (4.30) Les opérateurs Jα ,3 (α = H , V ) , sont les troisièmes composantes du spin générateur totale U q→0 ( sl (2) ⊕ sl (2) ) , Cα est l’opérateur casimir définit dans la base cristalline U q→0 ( sl (2)α ) et PH et PV sont des Projecteurs définit par : PH = J Hd + J Hd − et PV = JVd+ JVd− (4.31) La deuxième partie de l’opérateur R engendre la division du quadruplet en doublets, lie par : −2 PD c3 JV ,3 116 (4.32) Chapitre 4 Modélisations Algébriques où, le projecteur PD est donné par ( )( J J )( J J ) + (1 − J J )(1 − J + (1 − J J )( J J )( J J ) PD = 1 − JVd+ JVd− d H+ d H− d H+ d H− d H− d H+ d H+ d d V+ V− d H− d H− d d V+ V− J ) (4.33) d H+ La troisième partie de l’opérateur R permet de reproduire les sextets vus comme une fusion des quadruplets avec les doublets, définit par : −2 PS c4 JV ,3 (4.34) Où, le projecteur PS est donné par ( )( )( ) ( )( )( ) Ps = J Hd − J Hd + J Hd + J Hd − 1 − JVd+ JVd− + JVd+ JVd− JVd− JVd+ 1 − J Hd + J Hd − (4.35) A ce stade, il est très facile d’obtenir les valeurs propres de l'opérateur de lecture R pour les 64 codons, par exemple i. Pro = CCC , on a 15 15 et CV = 4 4 PH = 1, PV = 1, PD = 0 et Ps = CH = (4.36) (4.37) On remplace (4.36) et (4.37) dans les différentes parties responsables de la structure des acides aminées (4.30, 4.32 et 4.33), on obtient : R ( CCC ) = −c1 − c2 (4.38) ii. Cys = UGC , on a : 15 3 et CV = 4 4 PH = 1, PV = 0, PD = 1 et Ps = 1 CH = (4.39) (4.40) d’où on en déduit que : UGC = 3c1 + c2 − c3 − c4 De même, on obtient avec, CCN = −c1 − c2 GCN = −c1 + 3c2 UCN = −3c1 − c2 ACN = 3c1 + 3c2 CUN = c1 − c2 GUN = c1 + 3c2 CGN = −c1 + c2 GGN = −c1 + 5c2 UUY = 5c1 − c2 − 3c3 UUR = 5c1 − c2 − c3 AUY = 5c1 + 3c2 − c3 − c4 AUR = 5c1 + 3c2 + c3 + c4 UGY = 3c1 + c2 − c3 − c4 UGR = 3c1 + c2 + c4 + c5 AGY = 3c1 + 5c2 + c3 + c4 AGR = 3c1 + 5c2 + 3c3 + 3c4 CAY = c1 + c2 − c3 CAR = c1 + c2 + c3 GAY = c1 + 5c2 + c3 GAR = c1 + 5c2 + 3c3 117 (4.41) Chapitre 4 Modélisations Algébriques UAY = 5c1 + c2 − c3 UAR = 5c1 + c2 + c3 AAY = 5c1 + 5c2 + c3 AAR = 5c1 + 5c2 + 3c3 Y = C, U (Pyrimidines), R = G, A (Purines) et N = C, U, G, A En effet, les coefficients arbitraires c3 et c4 sont fixés comme suit : • Le quadruplet (CUN) et le doublet (UUR) Correspond au même acide aminée (leu) CUN ; UUR ⇒ c3 = 4c1 (4.42) On a donc R (Leu) = c1 − c2 • (4.43) Le quadruplet (UCN) et le doublet (AGY) Correspond au même acide aminée (Ser) UCN ; AGY ⇒ c4 = −4c1 − 6c2 Ce qui implique : (4.44) R(Ser) = 3c1 − c2 (4.45) De même on obtient : CCN = −c1 − c2 → Pro GCN = −c1 + 3c2 → Ala UCN = −3c1 − c2 → Ser ACN = 3c1 + 3c2 → Thr CUN = c1 − c2 → Leu GUN = c1 + 3c2 → Val CGN = −c1 + c2 → Arg GGN = −c1 + 5c2 → Gly UUY = −7c1 − c2 → Phe UUR = c1 − c2 AUY = 5c1 + 9c2 → Ile AUR = 5c1 − 3c2 → Met UGY = 3c1 + 7c2 → Cys UGR = 3c1 − 5c2 → Trp AGY = 3c1 − c2 → Ser AGR = 3c1 − 13c2 → (X) CAY = −3c1 + c2 → His CAR = 5c1 + c2 → Gln GAY = 5c1 + 5c2 → Gln GAR = 13c1 + 5c2 → Glu UAY = c1 + c2 → Tyr UAR = 9c1 + c2 AAY = 9c1 + 5c2 → Asn AAR = 17c1 + 5c2 → Lys → Leu → Ter (4.46) Par conséquent, le prototype de l’opérateur de lecture R prend la forme suivante : 4 4 R = c1C H + c2CV − 4c1PH J H ,3 − 4c2 PV JV ,3 3 3 + ( −8c1PD + ( 8c1 + 12c2 ) Ps ) J V ,3 (4.47) 4.5.2. Les différents codes génétiques Dans ce qui suit nous allons déterminer l’opérateur de lecture, [27], pour les codes génétiques suivants: Ø The Eukariotic Code (EC) 118 Chapitre 4 Modélisations Algébriques Ø The Vertebral Mitochondrial Code (VMC) Ø The Yeast Mitochondrial Code (YMC) Ø The Invertebrate Mitochondrial Code (IMC) Ø The Protozoan Mitochondrial and Mycoplasma Code (PMC) Ne remarquons, que chacun de ces codes est très proche du prototype donné en (4.47). Les principales différences entre les codes biologiques et le prototype sont les suivantes : • Le doublet AGR correspond au Arg pour les codes (EC, YMC et PMC), Ser pour les codes (IMC) et Ter pour le code (VMC) Cette attribution sur l’opérateur de lecture est donnée par le terme suivant : 1 (4.48) c5 PAG − JV(3),3 2 où, l’opérateurs J α(3,3) est le troisième composant du codon correspondant au troisième nucléotide, définit par Jα( 3,3) = J α ,3 − J αd ,3 (4.49) le Projecteur PAG est donné par ( )( )( )( PAG = J Hd + J Hd − J Hd − J Hd + 1 − JVd+ JVd− JVd− JVd+ ) (4.50) À partir des relations (4.47 et 4.50), on a : PAG = 1 (4.51) 3 1 3 JV( ,3) = JV ,3 − JVd ,3 = − + 1 = − 2 2 ce qui implique que • (4.52) R(AGR) = 3c1 − 13c2 + c5 (4.53) Le quadruplet (CGN) et le doublet (AGR) Correspond au même acide aminée (Arg). Tel que, CGN ≡ AGR ⇔ −c1 + c2 = 3c1 − 13c2 + c5 • (4.54) ⇒ c5 = −4c1 + 14c2 Le quadruplet (UCN) et le doublet (AGR) Correspond au même acide aminée (Ser). Tel que, UCN = AGR ⇔ 3c1 − c2 = 3c1 − 13c2 + c5 ⇒ c5 = 12c2 (4.55) c5 = −4c1 + 18c2 c5 = 6c1 + 14c2 (4.56) (4.57) De même, on obtient pour le Gly Ter 119 Chapitre 4 • Modélisations Algébriques La division de certains doublets en singles (un élément du singlet sera combinait avec un autre doublet pour donner un triplet) : se dévise Met → Met + Ile Pour les codes (EC et PMC) se devise Trp → Trp + Ter Pour le code (EC) Cette attribution sur l’opérateur de lecture est donnée par l’expression suivante : 1 1 c6 p XY − JV( 3,3) − J H( 3,3) 2 2 (4.58) Où, nous utilisons le projecteur PAU pour la division du doublet Met et le PUG pour le doublet Trp. Ces projecteurs sont donnés par PAU = (1 − J Hd + J Hd − )( J Hd − J Hd + )( JVd+ JVd− )( JVd− JVd+ ) (4.59) PUG = ( J Hd + J Hd − )( J Hd − J Hd + )(1 − JVd + JVd− )(1 − JVd− JVd+ ) (4.60) La division du doublet ( Met ) en singles ( Met + Ile ) , peut être interprété par le calcule suivant : PAU = 1 3 1 3 J H( ,3) = J H ,3 − J Hd ,3 = − + 1 = − 2 2 1 1 d J v(3) +0= − ,3 = J v ,3 − J v ,3 = − 2 2 (4.61) Ce qui implique que : Met = R(AUR) = 5c1 − 3c2 + c6 On en déduit que : AUY = AUR ⇔ 5c1 + 9c2 = 5c1 − 3c2 + c6 ⇒ c6 = 12c2 • (4.62) (4.63) Pour la division du Trp → Trp + Ter , on a les valeurs suivantes : PUG = 1 3 3 +0= 2 2 1 1 = J v,3 − J vd,3 = − + 0 = − 2 2 J H( ,3) = J H ,3 − J Hd ,3 = 3 J v(3) ,3 (4.64) Ce qui implique que : Trp = R(UGR) = 3c1 − 5c2 + c6 On a alors, UGY = UGR ⇔ 3c1 − 5c2 + c6 = 9c1 + c2 ⇒ c6 = 6c1 + 6c2 120 (4.65) (4.66) Chapitre 4 • Modélisations Algébriques Dans le cas du YMC le quadruplet CUN est codé par Thr plutôt que le leu. Ce changement est obtenue en multipliant le terme responsable de la structure du quadruplet (4.30) par (1 + 2 PCU ) pour la partie horizontal et par (1 − 4 PCU ) pour la partie vertical. v The Eukariotic code (EC) Le code Eukariotic est le plus important des codes génétiques et il est souvent désigné comme le code génétique universel. La différence entre le code Eukariotic (E.C) et le prototype se situ à : Partant de (4.48), (4.54), (4.58) et (4.63) l’opérateur de lecture pour le EC prend la forme suivante : 4 4 c1C H + c2CV − 4c1 PH J H ,3 − 4c2 PV JV ,3 + ( −8c1 PD + ( 8c1 + 12c2 ) PS ) JV ,3 3 3 1 + ( -4c1 + 14c2 ) PAG − JV(3),3 2 1 1 + 12c2 PAU + ( 6c1 + 6c2 ) PUG − J V( 3,3) − J H( 3,3) 2 2 REC = v (4.67) The vertebral Mitochodrial (VMC) The vertebral Mitochodrial (VMC) est utilisé dans la mitochondrie des vertébrés. La différence entre le code mitochondrial vertébral et le prototype se situe au niveau de : De l’équation (4.48) et (4.57) l’opérateur de lecture pour le VMC prend la forme suivante : 4 4 RVMC = c1CH + c2CV − 4c1PH J H ,3 − 4c2 PV JV ,3 + ( −8c1 PD + ( 8c1 + 12c2 ) PS ) JV ,3 3 3 (4.68) 1 + ( 6c1 + 14c2 ) PAG − JV(3),3 2 121 Chapitre 4 v Modélisations Algébriques The Yeast Mitochodrial code (YMC) La différence entre le Prototype et le YMC se situ au niveau de Partant de (4.48) et (4.54) l’opérateur de lecture pour le YMC prend la forme suivante : 4 4 RYMC = c1CH − 4c1 PH J H ,3 (1 + 2 PCU ) + c2 CV − 4c2 PV JV ,3 (1 − 4 PCU ) 3 3 1 + ( -8c1 PD + (8c1 + 12c2 ) PS ) JV ,3 + ( −4c1 + 14c2 ) PAG − JV(3),3 2 v (4.69) The Invertebrate Mitochodrial code (IMC) La différence entre le Prototype et le IMC se situ au niveau de Partant de (4.48) et (4.55) l’opérateur de lecture pour le IMC prend la forme suivante : 4 4 RIMC = c1CH + c2CV − 4c1PH J H ,3 − 4c2 PV JV ,3 + ( −8c1PD + ( 8c1 + 12c2 ) PS ) J V ,3 3 3 1 +12c2 PAG − JV(3),3 2 v (4.70) The Protozoan Mitochodrial and Mycoplasma code (PMC) La différence entre le Prototype et le IMC se situe au niveau de Partant de (4.48), (4.54), (4.58) et (4.63) l’opérateur de lecture pour le PMC prend la forme suivante : 4 4 RPMC = c1CH + c2CV − 4c1PH J H ,3 − 4c2 PV JV ,3 + ( −8c1PD + ( 8c1 + 12c2 ) PS ) JV ,3 3 3 1 1 1 + ( −4c1 + 14c2 ) PAG − JV(3),3 + 12c2 PAU − JV(3),3 − J H(3),3 2 2 2 122 (4.71) Chapitre 4 Modélisations Algébriques À partir du code prototype, on vérifie facilement que les différents opérateurs de lecture donnent la même valeur pour un même acide aminée quel que soit le code génétique étudier. Par exemple pour le CUC, on à : PH = 0, PV = 1, PD = 0, PS = 0 et PAG = 0 1 5 3 et JV(3),3 = J H( ,3) = 2 2 3 15 CH = et CV = 4 4 (4.72) (4.73) (4.74) On remplace (4.72), (4.73) et (4.74) dans l’opérateur de lecture (4.67), (4.68), (4.69) (4.70) et (4.71), on obtient R(Leu) = REC = RVMC = RYMC = RIMC = RPMC = c1 − c2 Si on pose c = (4.75) c1 , on trouve c2 R(Leu) = REC = RVMC = RYMC = RIMC = RPMC = c −1 (4.76) De même, on obtient les valeurs propres des opérateurs de lecture pour les différents acides aminés Tableau 4.9 : les valeurs propres associés au différents acides aminés Remarque L’opérateur de lecture R(c ) peut être utilisé pour toute valeur real de c , sauf celle qui donne une même valeur propre par rapport à deux acides aminés différents. Ces valeurs interdites sont les suivantes : 7 5 3 4 5 4 3 5 −7, − 5, − 4, − 3, − , − 2, − , − , − , − 1, − , − , − , − 3 3 2 3 6 5 4 7 2 3 1 3 2 3 1 1 3 2 1 2 1 − , − , − , − , − , − , − , − , − , − , − , − , − , 3 5 2 7 5 8 3 3 10 7 4 9 5 1 1 1 1 1 1 1 1 1 2 1 2 4 3 5 , − , − , − , 0, , , , , , , , , 1, , , 2, , 3, 4, 5 6 7 8 9 7 6 5 4 3 5 2 3 3 2 2 123 Chapitre 4 Modélisations Algébriques Références [1] E. P. Wigner, « Symmetry Principles in Old and New Physics », Bull. Am. Math. Soc, 74, 793 (1968). [2] Brading, Katherine, Castellani, Elena, "Symmetry and Symmetry Breaking", The Stanford Encyclopedia of Philosophy (Winter 2004 Edition), Edward N. Zalta(ed). [3] D. W. Sumners, « Lifting the curtain : using topology to prob the hidden action of enzymes », Notices of the American Mathematical Society, 42 (5), pp. 528-537 (mai 1995). [4] A. Sossinsky, Noeuds - Genèse d’une théorie mathématique (Seuil, 1999). [5] T. Wilhelm and S. Nikolajewa (2004) A new classification scheme of the genetic code J. Mol. Evol., 59, 598–605. [6] T. Wilhelm and S. Nikolajewa (2004) A purine-Pyrimidine Classification Scheme of the Genetic Code BIOforum Europe 6, 46-49. [7] J. E. M. Hornos and Y. M. M. Hornos : Phys. Rev. Lett. 71, (1993) 4401, [8] J. E. M. Hornos and Y. M. M. Hornos : J. Biol. Phys. 20, (1994) 289, [9] M. Forger and al, Phys. Rev. E56 (6), (1997)7078, [10] J.E.M. Hornos and al, Int. J. Mod. Phys. B13 (23), (1999) 2795, [11] M. Forger and S. Sachse, J. Math. Phys. 41 (8), (2000) 5407-5444, [12] F. Antoneli Jr and al, Int. J. Mod. Phys. B17 (17), (2003) 3135, [13] M. Magini and J. E. M. Hornos, Braz. J. Phys. 33 (4), (2003) 825, [14] F. Antoneli Jr and al : Mod. Phys. Lett. B18 (18), (2004)971, [15] A. O. Barut and R. Raczka, “Theory of Group Representations and Applications”, 2nd Edition, World Scientific, Singapore, (1986), [16] W. G. McKay and J. Patera, “Tables of Dimensions, Indices and Branching Rules for Representations of Simple Lie Algebras”, Marcel Dekker, New York, (1981), [17] E. B. Dynkin : AMS Transl. 6 , (1957)111,245, [18] A. L. Onishchik and E. B. Vinberg (Eds): “Lie Groups and Lie Algebras III”, Encyclopedia of Mathematical Sciences, Vol. 41, Springer, Berlin (1994), [19] S. Helgason, “Differential Geometry, Lie Groups and Symmetric Spaces”, Academic Press, New York, (1978), [20] L. Braggion, “Search for Symmetries in the Evolution of the Genetic Code”, MSc Dissertation, University of São Paulo, São Carlos (1998), 124 Chapitre 4 Modélisations Algébriques [21] F. Antoneli, “Maximal Subalgebras of Semisimple Lie Algebras, Symmetry Breaking and the Genetic Code”, MSc Dissertation, University of São Paulo, São Carlos (1998), [22] S. Ozawa and al, Microbiol. Rev. 56, (1992) 229, [23] F.H.C. Crick, J. Mol. Biol. 38, (1968) 367, [24] M.O. Bertman and J.R. Jungck, “Some Unresolved Mathematical Problems in Genetic Coding ”, Not. AMS 25, (1978) A-174, [25] L. Frappat, A. Sciarrino, P. Sorba, A crystal base for the genetic code, Phys. Lett. A 250 (1998) 214. [26] L. Frappat, A. Sciarrino, P. Sorba, Predictions of Physical-Chemical Properties of amino acids from Genetic Code, physics/0007034. [27] L. Frappat, A. Sciarrino and P. Sorba, 2000. Crystalizing the genetic code physics/0003037. [28] L. Frappat, A. Sciarrino, P. Sorba, Symmetry and codon usage correlations in the genetic code, Phys. Lett. A 259 (1999) 339 and physics/9812041. [29] L. Frappat, A. Sciarrino, P. Sorba, Theoretical Prevision of Physical-Chemical Properties of Amino Acids from Genetic Code, physics/0007034 v1. [30] A. Sciarrino, A Mathematical Model Accounting for the Organisation in Multiplets of the Genetic Code, math-ph/0102022 v1. [31] A. Sciarrino, Wigner-Eckart theorem in the crystal basis and the organisation of the genetic code, math-ph/0111006 v1 5 Nov 2001. [32] A. Sciarrino, C. Minichini, Quantum spin model fitting the Yule distribution of oligonucleotides in DNA, quant-ph/0409071v1 125 CONCLUSION GENERALE CONCLUSION GENERALE Comprendre pourquoi le code génétique est-il ce qu’l est, a été le sujet de nombreux modèles proposés dans la littérature et reste encore largement un challenge pour les chercheurs, [1], [2]. Comme le code génétique est quasi-universel pour tous les organismes vivants, les modèles devraient être indépendants du temps, bien que certains modèles dépendant du temps ont été proposés, [2], [3], [4]. Le recensement de toutes les symétries présentes dans le code génétique sont d’un intérêt particulier puisqu’elles peuvent nous éclairer sur les principes d’organisation de base du code. Dans la première décade qui a suivi le décryptage du code génétique, il fût considéré comme étant universel. Cependant, la découverte que la mitochondrie mammalienne utilise un code légèrement différent, dans lequel le codon UGA est modifié de « STOP » à Trp, et l’identification induite de familles entières de codes non-standards, aussi bien mitochondriaux que nucléaires, relança l’intérêt des biologistes à la recherche de l’origine du code génétique et de ses propriétés. En effet, une analyse phylogénique de ces déviations révéla que ces codes non-standards sont relativement récents (pas plus d’1,5 billion d’années d’âge) et qu’ils dérivent effectivement du code génétique standard, dont l’origine est estimée à 3,8 billions d’années, par le biais de déviations postérieures, [5], [6]. De plus, comprendre la formation des codes non-standards à partir du code standard et comprendre l’évolution du code standard lui-même sont deux problèmes à priori logiquement distincts et indépendants. Le problème de l’évolution du code génétique standard reste lui intimement lié à la recherche de la compréhension de l’origine de la vie sur terre. La suite de notre travail présenté dans ce mémoire s’inscrit dans la recherche de cette symétrie originale et des sous-symétries qui en découlent par un procédé de brisure de symétrie spontanée, procédé bien connu chez les Physiciens des particules élémentaires. Nous nous proposons aussi de traiter ce problème dans le cadre des groupes de tresses (Braiding groups) et dans le cadre des groupes quantiques et la théorie des n uds. 126 CONCLUSION GENERALE Références [1] S.J. Freeland and al : Early fixation of an optimal genetic code , Mol. Biol. Evol. 17, (2000)511, [2] G. Sella and D.H. Ardell : « The coevolution of genes and genetic codes : Crick s frozen accident revisited », J. Mol. Evol. 63, (2006)297, [3] J.M. Bahi and C.J. Michel: A stochastic gene evolution model with time dependent mutations , Bull. Math. Biol. 66, (2004)763, [4] S.N. Rodin and A.S. Rodin: Origin of the genetic code: first aminoacyl-tRNA synthetases could replace isofunctional ribozymes when only second base of codons was established , DNA Cell. Biol. 25, (2006)365, [5] S. Osawa and al : Recent evidence for the evolution of the genetic code , Microbiol. Rev. 56, (1992)229, [6] S. Osawa: Evolution of the genetic code , Oxford Univ. press, (1995) 127