physique subatomique
Transcription
physique subatomique
David Sénéchal PHYSIQUE SUBATOMIQUE NOTES DE COURS (PHQ-636) Université de Sherbrooke Faculté des Sciences Avril 2005 PHYSIQUE SUBATOMIQUE NOTES DE COURS (PHQ-636) par David Sénéchal Professeur Département de physique Faculté des Sciences Université de Sherbrooke Avril 2005 c 2005, David Sénéchal, Faculté des Sciences, Université de Sherbrooke. Tous droits réservés. CHAPITRE 1 Processus élémentaires Notre connaissance du monde subatomique est tirée d’expériences et d’observations faisant intervenir des processus de désintégration et de collisions. Ces processus sont gouvernés par la mécanique quantique, et sont donc essentiellement probabilistes. C’est en mesurant, de manière statistique, les probabilités de ces processus et en identifiant leurs produits, qu’on parvient à imaginer et corroborer les différentes théories sur la composition de la matière et sur les interactions fondamentales. Il est donc important de bien comprendre comment les probabilités de ces différents processsus sont reliées aux produits, à l’énergie disponible, et ainsi de suite. C’est ce que veux présenter ce chapitre. Note importante : système d’unités naturelles Nous utiliserons dans ce cours un système d’unités naturelles, dans lequel h̄ = 1 et c = 1. Ainsi, nous ne distinguerons plus l’impulsion du vecteur d’onde, ou l’énergie de la fréquence et de la masse. Dans ce système d’unités, il n’y a qu’une seule unité fondamentale, soit l’énergie. La longueur n’est qu’une énergie inverse, tout comme le temps. Une fois en présence d’une expression en unités naturelles, il est toujours possible de revenir au système d’unités usuel par analyse dimensionnelle. Un facteur de conversion très utile dans ce cas est le produit h̄c = 197 MeV fm. 1.1 Probabilité de transition Les processus de désintégration et de collision (ou diffusion) sont illustrés schématiquement cidessous : N N 1 … … 1 3 désintégration 2 4 2 collision (1.1) 3 Les particules (ou objets) en jeu sont numérotés de 1 à N , et le temps s’écoule de gauche à droite. Une désintégration implique au moins trois objets : la particule instable (1) et au moins deux produits de désintégration (numérotés de 2 à N ). On parle d’une désintégration à deux corps, à trois corps, etc, selon le nombre de produits. Une collision implique au moins quatre objets : deux réactants (1 et 2) et au moins deux produits (numérotés de 3 à N ). D’un point du vue quantique, ces processus sont un passage d’un état quantique initial |ii vers un état quantique final |f i différent. On suppose que les particules en cause, à l’état libre, sont 4 1. Processus élémentaires décrites par un certain hamiltonien H0 . Par exemple, dans le cas non relativiste, ce hamiltonien est simplement X P2 i (1.2) H0 = 2m i i où Pi est l’opérateur de qantité de mouvement de la particule i et mi est la masse correspondante. Si H0 était le hamiltonien total du système, alors les particules seraient stables et aucune interaction (ou collision) ne serait possible. Les processus de désintégration et de collision sont donc attribuables à un hamiltonien supplémentaire, noté V et qualifié d’interaction, qui porte les particules à se transformer : on décompose donc le hamiltonien total en H = H0 + V . Par exemple, si une particule se désintègre, c’est que son état de particule n’est pas un état propre du hamiltonien total H, mais de H0 seulement. Ainsi, un état excité de l’atome d’hydrogène est un état propre du hamiltonien de l’atome d’hydrogène lui-même, mais n’est pas un état propre du hamiltonien complet qui comprend l’interaction entre l’atome et le champ électromagnétique. C’est donc pour cela que les états excités sont instables, et qu’ils se “désintègrent” en un atome d’hydrogène à l’état fondamental et un photon. 1.1.1 Règle d’or de Fermi Si, dans un certain sens, le terme d’interaction V est “petit” devant H0 , alors il ne se manifeste que par des processus, comme la désintégration et les collisions, qui se produisent suffisamment rarement pour que les particules isolées soient concevables. Autrement, les états de particules libres seraient si éloignés des véritables états propres du hamiltonien, que la notion même de particule n’aurait pas beaucoup de sens. Il est alors raisonnable de traiter V comme une perturbation, d’autant plus que la résolution du hamiltonien complet est impossible. On applique alors la théorie des perturbations dépendantes du temps, via la fameuse règle d’or de Fermi : ωi→f = 2π|Mf i |2 δ(Ef − Ei ) (1.3) où ωi→f est la probabilité par unité de temps (ou taux de transition) pour que l’état initial |ii se transmute en état final |f i. L’énergie étant conservée, la fonction delta δ(Ei − Ef ) nous assure que les énergies des deux états sont les mêmes. Enfin, Mf i est l’amplitude de transition entre les états initial et final, donné au premier ordre de la théorie des perturbations par l’élément de matrice de la perturbation V entre ces deux états : Mf i = hf |V |ii (1.4) Il s’agit bien sûr d’une approximation, au premier ordre en V . Aux ordres suivants, l’amplitude comporte en plus une sommation sur des états intermédiaires : Mf i = hf |V |ii + X hf |V |nihn|V |ii n Ei − En + i0+ + X n,m hf |V |nihn|V |mihm|V |ii + ··· (Ei − En + i0+ )(Ei − Em + i0+ ) (1.5) Le deuxième terme est une somme sur les états propres |ni du hamiltonien non perturbé H0 , dont les énergies sont En . Le troisième terme comporte deux sommations sur des états intermédiaires, et ainsi de suite. La partie imaginaire infinitésimale au dénominateur sert parfois à résoudre des ambiguités analytiques lors de la sommation sur les états intermédiaires. Le deuxième terme doit être considéré si le premier s’annule, ou afin d’améliorer la précision du calcul (nous allons nous limiter au premier terme dans ce qui suit, mais le deuxième ordre interviendra dans un chapitre ultérieur, lors de l’introduction des diagrammes de Feynman). 1.2. Normalisation des états et espace des phases 5 1.2 Normalisation des états et espace des phases Les états de particules libres sont caractérisés par un certaine impulsion p. La normalisation de ces états est matière à convention. Trois de ces conventions seront utilisées ici : une normalisation discrète (ND), une normalisation continue (NC) et une normalisation relativiste (NR) invariante de Lorentz. Dans la normalisation discrète, on suppose que l’espace physique est contenu dans une boı̂te rectangulaire dont les côtés sont de longueurs Lx , Ly et Lz , et on impose des conditions aux limites périodiques aux fonctions d’onde. Une onde plane a alors la forme (non normalisée) ψ(r) = eip·r = eipx x eipy y eipz z (1.6) La condition de périodicité restreint les valeurs possibles de l’impulsion. Il faut en effet que la translation x → x + Lx (ou l’équivalent en y et z) n’affecte pas la fonction d’onde. Donc, eipx Lx = 1 =⇒ px = 2πnx Lx où nx est un entier. Les impulsions possibles sont donc nx ny nz , , p = 2π Lx Ly Lz (1.7) (1.8) où nx , ny et nz peuvent prendre toutes les valeurs entières possibles (∈ Z). Une seule valeur de px est admise dans une intervalle ∆px = 2π/Lx , correspondant à ∆nx = 1. Il y a donc un seul état (une seule valeur possible des entiers) dans un élément de volume donné par ∆px ∆py ∆pz = (2π)3 V (1.9) où V = Lx Ly Lz est le volume de l’espace physique. Le nombre d’états dans un élément de volume d3 p est donc simplement le rapport V 3 dp (1.10) (2π)3 Exprimé autrement, le nombre d’états d’onde plane par élément de volume d3 p de l’espace des implusions est d3 n V = (1.11) 3 dp (2π)3 Notons qu’on peut aussi exprimer ce résultat comme un nombre d’états par unité de volume dans l’espace des phases, c’est-à-dire l’espace décrit par les positions (r) et les impulsions (p) : 1 d3 n = d3 pd3 r (2π)3 ou = 1 h3 (1.12) si on retourne aux unités usuelles. C’est sous cette forme que le résultat est le plus simple à mémoriser : une cellule d’espace des phases de volume h3 (ou (2π)−3 en unités naturelles) contient exactement un état quantique. Les états d’impulsion donnée, dans cette normalisation, forment un ensemble discret : les valeurs de p sont nettement séparées. Les états sont donc normalisables et on peut imposer la condition X hp0 |pi = δp,p0 et |pihp| = 1 (ND) (1.13) p 6 1. Processus élémentaires La fonction d’onde associée est 1 hr|pi = √ eip·r V (1.14) L’avantage de cette normalisation est sa clarté du point de vue du décompte des états, qui sont discrets. Son désavantage est la référence au volume V de l’espace physique, qui est artificiel (la limite V → ∞ doit être prise à la fin des calculs, et le résultat final ne doit pas dépendre de V). Un autre désavantage de cette normalisation pest qu’elle n’est pas invariante de Lorentz : en effet, le volume est contracté d’un facteur γ = 1/ 1 − β 2 lorsqu’on passe d’un référentiel où le volume est au repos, à un référentiel où il est en mouvement à une vitesse β. Comme l’invariance de Lorentz est une symétrie fondamentale de la Nature, particulièrement visible dans le domaine de particules élémentaires, il est souhaitable d’adopter une autre normalisation des états d’impulsion, sans référence à un volume fini de l’espace. À cette fin, notons premièrement que la somme sur les vecteurs d’onde peut être remplacée par une intégrale, dans la limite où le volume V est grand : Z X d3 p (1.15) →V (2π)3 p Ceci provient directement de (1.11). En conséquence, le delta de Kronecker δp,p0 peut être remplacé par une fonction delta de Dirac : δp,p0 → (2π)3 3 δ (p − p0 ) V Il suffit, pour s’en convaincre, de constater l’équivalence de Z X d3 p (2π)3 3 δ (p − p0 ) δp,p0 avec V 3 (2π) V p (1.16) (1.17) Une première modification à la normalisation ND serait de supprimer le facteur de volume, c’està-dire de considérer des états d’impulsion dans le spectre continu tels que Z d3 p 0 3 3 0 hp |pi = (2π) δ (p − p ) et |pihp| = 1 (NC) (1.18) (2π)3 La fonction d’onde associée est alors hr|pi = eip·r (1.19) Cependant, cette normalisation continue (appelons-la NC) n’est toujours pas invariante de Lorentz. En effet, la mesure d’intégration d3 p n’est pas invariante : il s’agit d’un élément de volume dans l’espace des impulsions. Lors d’un changement de référentiel, cet élément de volume est contracté d’un facteur γ. Par contre, un élément de volume dans l’espace des quadri-impulsions d4 p = d3 p dp0 (1.20) où p0 = E est l’énergie de la particule, est invariant. En effet, la transformation de Lorentz implique une contraction des longueurs d’un facteur γ et une dilatation du temps d’un même facteur, de sorte que l’élément de volume d’espace-temps d3 rdt est invariant. Il en est de même pour tout quadri-vecteur, en particulier pour l’élément de volume de la quadri-impulsion. Nous ne pouvons 1.3. Désintégration et espace des phases 7 cependant pas remplacer d3 p par d4 p sans autre forme de procès, car l’énergie p0 est déterminée par la quantité de mouvement p, en vertu de la relation p (p0 )2 − p2 = E 2 − p2 = m2 ou E = p2 + m2 (1.21) On impose donc cette relation par une fonction delta supplémentaire, c’est-à-dire qu’on adopte la mesure d’intégration suivante : Z Z d3 p d4 p → δ((p0 )2 − p2 − m2 )θ(p0 ) (1.22) (2π)3 (2π)3 oùpla fonction de Heaviside θ(p0 ) s’assure qu’on ne conserve que la racine positive, soit p0 = + p2 + m2 . Notons que cette mesure d’intégration est manifestement invariante de Lorentz, car (i) la mesure d4 p est invariante, comme noté ci-haut; (ii) l’argument de la fonction delta est un invariant de Lorentz et (iii) comme le quadrivecteur (p0 , p) est toujours de genre temps, si p0 > 0 dans un référentiel, il le sera dans tous les référentiels et donc θ(p0 ) est un invariant. On montre dans ce qui suit que cette mesure peut aussi d’exprimer comme Z Z d3 p d4 p 0 2 2 2 0 δ((p ) − p − m )θ(p ) = (1.23) (2π)3 (2π)3 2E En effet, la fonction delta peut s’écrire comme δ((p0 )2 − p2 − m2 ) = δ((p0 − E)(p0 + E)) où E = p p2 + m2 (1.24) En intégrant sur p0 , seule la racine p0 = E est considérée en raison du facteur θ(p0 ). Au voisinage de cette racine, on peut remplacer p0 + E par 2E et la fonction delta se réduite à δ((p0 − E)(p0 + E)) → δ(2E(p0 − E)) = 1 δ(p0 − E) 2E (1.25) On intègre ensuite sur p0 pour retrouver le résultat annoncé, en remplaçant partout p0 par E. Une normalisation relativiste des états d’impulsion est donc fixée par les conditions Z d3 p 0 3 3 0 |pihp| = 1 (NR) hp |pi = 2E(2π) δ (p − p ) et (2π)3 2E p où E = p2 + m2 . (1.26) 1.3 Désintégration et espace des phases 1.3.1 Forme générale du taux de désintégration Lors d’une désintégration, il existe un très grand nombre (en pratique, un continuum) d’états finaux possibles. Ces états ont la même énergie que l’état initial, mais sont caractérisés par des impulsions différentes des particules émises. La quantité pertinente est la probabilité totale par unité de temps pour qu’un transition se produise vers l’un des états finaux appartenant à un ensemble expérimentalement identifiable. Considérons un processus dans lequel une particule de masse m1 se désintègre en N −1 particules, de masses mi (i = 2, . . . , N ). Les énergies des états initial et final sont Ei = E1 et Ef = E2 + · · · + EN , respectivement. Le taux de transition de l’état initial vers un ensemble d’états finaux compris dans 8 1. Processus élémentaires un élément d’espace des phases d3 p2 d3 p3 · · · d3 pN est (nous adoptons la normalisation NC des états d’impulsions, éq. (1.18)) dω = 2π|Mf i |2 d3 p2 d3 p3 d3 pN · · · δ(E1 − E2 − E3 − · · · − EN ) (2π)3 (2π)3 (2π)3 (1.27) En général, le hamiltonien d’interaction V conserve la quantité de mouvement totale, de sorte que l’amplitude de transition n’est non nulle que si les impulsions respectent la condition p1 = p2 + p3 + · · · + pN . On peut donc écrire l’amplitude comme Mf i = Mf i δp1 −p2 −p3 −···−pN (1.28) dans la normalisation discrète ND, éq. (1.13) Cette relation définit en fait Mf i , qu’on appelle aussi amplitude de transition. Au carré, cette relation est simplement |Mf i |2 = |Mf i |2 δp1 −p2 −p3 −···−pN (1.29) car le carré du delta de Kronecker est encore un delta de Kronecker. Notons ici que la normalisation discrète des états (ND) est la plus sûre quand vient le temps de compter les états ou de calculer le carré d’un delta de Kronecker. Par contre, quand vient le temps d’effectuer un calcul pratique, on lui préfère la normalisation continue NC, éq. (1.18). Avec cette nouvelle définition de l’amplitude, le taux de désintégration devient dω = |Mf i |2 d3 p2 d3 p3 d3 pN · · · (2π)4 δ 4 (p1 − p2 − p3 − · · · pN ) (2π)3 (2π)3 (2π)3 (1.30) où pi dénote le quadrivecteur (Ei , pi ). Dans la normalisation relativiste NR, éq. (1.26), cette formule devient plutôt dω = |Mf i |2 1 d3 p2 d3 p3 d3 pN · · · (2π)4 δ 4 (p1 − p2 − p3 − · · · pN ) 2E1 (2π)3 2E2 (2π)3 2E3 (2π)3 2EN (1.31) Notons que dans ce cas, un facteur 2E1 a été introduit pour tenir compte du changement de normalisation de l’état initial, qui affecte l’amplitude Mf i . Cette dernière est alors une quantité invariante de Lorentz, qui a les dimensions (unités) de l’énergie. 1.3.2 Exemple : désintégration à deux corps Appliquons le résultat général (1.31) au cas d’une désintégration à deux corps. La formule est, dans ce cas, 1 d3 p2 d3 p3 dω = |Mf i |2 (2π)4 δ 4 (p1 − p2 − p3 ) (1.32) 2E1 (2π)3 2E2 (2π)3 2E3 p p où E2 = p22 + m22 et E3 = p23 + m23 . Plaçons-nous dans le référentiel de la particule instable, de sorte que E1 = m1 et p1 = 0. Le taux de désintégration total est obtenu en intégrant sur les états finaux possibles : Z d3 p2 d3 p3 |Mf i |2 ω= (2π)4 δ 4 (p1 − p2 − p3 ) (1.33) (2π)3 2E2 (2π)3 2E3 2E1 Utilisons la fonction delta pour intégrer sur p3 : p p Z 3 d p2 |Mf i |2 (2π)δ(m1 − p2 + m22 − p2 + m23 ) p p ω= (2π)3 8m1 p2 + m22 p2 + m23 (1.34) 1.3. Désintégration et espace des phases 9 où on a utilisé le fait que p23 = p22 et où on pose simplement p = |p2 |. Il est clair, par symétrie, que l’amplitude ne peut pas dépendre de la direction de p2 . On peut donc intégrer sur les angles et on trouve p p Z |Mf i |2 δ(m1 − p2 + m22 − p2 + m23 ) 2 p p ω = p dp (1.35) 8πm1 p2 + m22 p2 + m23 La dernière intégrale se fait facilement si on procède au changement de variable suivant : on pose q q E = p2 + m22 + p2 + m23 (1.36) alors dE p Ep p p p p + = =p dp p2 + m22 p2 + m23 p2 + m22 p2 + m23 (1.37) On trouve ensuite Z ω= dE p |Mf i |2 δ(m1 − E) 8πm1 E = |p2 | |Mf i |2 8πm21 (1.38) en autant que les impulsions des deux produits permettent à leur énergie totale E d’être égale à m, c’est-à-dire que la désintégration soit énergétiquement possible. Dans cette formule |p2 | est la quantité de mouvement de l’un ou l’autre des produits de la désintégration, dans le référentiel de la particule instable. Ce résultat est très simple et pourtant très général, car nous n’avons pas besoin de connaı̂tre la forme détaillée de l’amplitude Mf i pour le démontrer. 1.3.3 Loi exponentielle de désintégration Le résultat essentiel du calcul précédent est que la présence d’une interaction qui met en contact une particule et un continuum d’états rend cette particule instable, et mène à un taux de désintégration fixe, c’est-à-dire une probabilité par unité de temps pour qu’une désintégration ait lieu. Ceci mène directement à la loi exponentielle de désintégration : Si N (t) représente la population de particules se désintégrant à un instant t, alors le nombre de désintégration ayant lieu entre les temps t et t + dt est ωdt. Donc on trouve l’équation différentielle suivante : N (t + dt) = N (t) − ωN dt =⇒ dN = −ωN dt (1.39) dont la solution est la loi exponentielle N (t) = N (0)e−ωt (1.40) où N (0) est le nombre de particules au temps t = 0. Quelques définitions : 1. vie moyenne : τ = 1/ω. Durée moyenne de la vie d’une particule. 2. Demi-vie : t1/2 = τ ln 2, temps au bout duquel la moitié de la population initiale s’est désintégrée. Remarques : 1. La loi exponentielle est statistique. Il s’agit de probabilités. Lorsque la population de particules n’est pas très grande, les fluctuations peuvent être importantes. Ces fluctuations sont gouvernées par la loi de Poisson (voir Williams, section 2.11). 2. L’activité I (ou intensité) d’une source est définie simplement comme le nombre de désintégrations par unité de temps. Dans le cas d’un échantillon ne contenant qu’une espèce de particule 10 1. Processus élémentaires instable, I = ωN = −dN/dt. L’activité se mesure fondamentalement en secondes inverses : un Becquerel (Bq) est l’activité d’une source qui produit une désintégration par seconde. Un Curie (Ci) est l’activité d’un gramme de radium pur, soit 3.7 × 1010 Bq. 3. La loi exponentielle suppose qu’aucun processus de regénération n’existe. En général, un noyau instable est lui-même le fruit de la désintégration d’un autre noyau. Les équations de population d’espèces sont dans ce cas plus complexes, mais impliquent toujours des fonctions exponentielles. Par exemple, si un noyau 1 se désintègre en un noyau 2 avec un taux ω1 , et que le noyau 2 se désintègre en autre chose avec un taux ω2 , les populations N1 et N2 des deux espèces seraient régies par les équations différentielles suivantes : dN1 = −ω1 N1 dt dN2 dN1 = −ω2 N2 − = −ω2 N2 + ω1 N1 dt dt (1.41) et des modèles plus complexes sont possibles. 4. La loi exponentielle est étroitement liée à l’existence du continuum d’états finaux. S’il n’y avait qu’un seul état final de même énergie que l’état initial, il n’y aurait pas décroissance exponentielle de l’état initial, mais plutôt oscillation entre les deux états (les oscillations de Rabi). 5. L’élément de matrice Mf i dépend en général de l’énergie E. Mais abstraction faite de cette dépendance, on constate que le taux de désintégtation augmente avec l’énergie disponible, plus précisément de manière proportionnelle à p. Plus p est élevé, plus le nombre d’états finaux possibles est grand et plus la probabilité totale est grande. En contrepartie, la désintégration ne peut pas se produire si aucun état d’onde plane n’est disponible, c’est-à-dire si la masse des produits est plus grande que celle de la particule initiale (m1 < m2 + m3 ). 6. Une particule ou noyau instable peut avoir plusieurs modes de désintégration, c’est-à-dire plusieurs types de produits. Dans ce cas, chaque mode est caractérisé par son propre taux de désintégration. Par exemple, si deux modes sont possibles, deux taux (ω1 et ω2 ) existent et le taux total de désintégration en est la somme : ω = ω1 + ω2 . Dans un intervalle de temps donné, le rapport des nombres N1 et N2 de désintégrations des deux types et N1 /N2 = ω1 /ω2 . 1.4 Collisions et section efficace 1.4.1 Diffusion par un potentiel Considérons le problème d’un projectile de masse m qui entre en collision avec une cible qu’on suppose fixe. L’état initial du projectile est une onde plane d’impulsion p1 , et son état final, après la collision, est une onde plane d’impulsion p2 . Une quantité de mouvement q = p2 − p1 a été transférée à la cible, mais nous allons négliger l’énergie cinétique associée, comme si la cible était infiniment massive. Dans un premier temps, nous supposerons aussi que l’état de la cible ne change pas, de sorte que la collision est élastique et que l’effet de la cible puisse être compris par un potentiel diffuseur V (r). Il s’agit en somme d’un problème à un corps. Nous traiterons ce problème dans le régime non relativiste, et adopterons la normalisation continue des états (1.18). La probabilité de transition d’un état |p1 i du projectile vers un état |p2 i, par unité de temps, est donnée par la règle d’or de Fermi : ωi→f = 2π|Mf i |2 δ(E1 − E2 ) (1.42) 1.4. Collisions et section efficace 11 Le taux de transition vers un ensemble d’états finaux compris dans un élément de volume d3 p2 est dω = 2π|Mf i |2 d3 p2 δ(E1 − E2 ) (2π)3 (1.43) En coordonnées polaires, d3 p2 = dΩ p22 dp2 où dΩ = sin θ dθ dϕ = d cos θ dϕ. La probabilité de transition par unité de temps vers un ensemble d’états d’impulsions comprises dans un angle solide dΩ est donc dω 1 = |M |2 p2 dp δ(E1 − E2 ) (1.44) dΩ (2π)2 f i 2 2 Comme d|p2 |/dE2 = E2 /|p2 |, dω 1 |M |2 p E dE δ(E1 − E2 ) = dΩ (2π)2 f i 2 2 2 (1.45) L’intégrale sur E2 peut maintenant se faire grâce à la fonction delta et 1 dω = |M |2 pE dΩ (2π)2 f i (1.46) où maintenant E = E1 = E2 et p = |p1 | = |p2 |. Calculons maintenant l’élément de matrice, au premier ordre en théorie des perturbations : Z Mf i = hp2 |V |p1 i = d3 r hp2 |riV (r)hr|p1 i Z (1.47) = d3 r e−i(p2 −p1 )·r V (r) = Ṽ (q) où Ṽ (q) désigne la transformée de Fourier du potentiel V (r), évaluée au vecteur d’onde q. On trouve donc le taux de transition suivant : 1 dω = |Ṽ (q)|2 pE (1.48) dΩ (2π)2 Cette quantité en soi n’est pas directement reliée à l’expérience, car en pratique on n’envoie pas un projectile à la fois, mais un faisceau de projectiles. Ce faisceau possède un certain flux Φ, c’est-à-dire un nombre de projectiles par unité de temps et par unité de surface. Le flux Φ est égal à la densité de courant de projectiles, soit la vitesse v multipliée par la densité ρ. Dans notre normalisation, ρ = |hr|ki|2 = 1 et la vitesse est égale à p/E, donc Φ = p/E. La quantité étudiée en pratique est la section différentielle de diffusion, soit le taux de transition divisé par le flux incident de projectiles : dσ 1 dω E2 (1.49) = = |Ṽ (q)|2 dΩ Φ dΩ 4π 2 Dans le domaine non relativiste, on peut remplacer E par m (l’énergie de repos) et cette formule devient dσ m2 = |Ṽ (q)|2 (1.50) dΩ 4π 2 La section efficace, elle, est l’intégrale de la section différentielle sur les angles solides : Z dσ σ = dΩ (1.51) dΩ 12 1. Processus élémentaires 1.4.2 Interprétation de la section efficace D’après la définition donnée ci-haut, la probabilité que le projectile soit dévié (par unité de temps et dans n’importe quelle direction) est σΦ, le produit de la section efficace par le flux Φ associé à un seul projectile. Si N projectiles identiques et indépendants sont impliqués, le flux incident est multiplié par N , de même que le taux de probabilité de collision, mais la section efficace reste la même : c’est une caractéristique d’une collision individuelle entre un projectile et la cible. Or, dans le cas d’une interaction de contact entre des projectiles classiques ponctuels et une cible (ou diffuseur), ceux-là ne sont diffusés que s’ils entrent en contact direct avec la cible. Le nombre de projectiles dans cette situation (par unité de temps) est précisément Φ, multiplié par l’aire transversale A de l’objet. Donc, dans ce cas, on trouve σ = A, d’où le nom de section efficace. En somme, dans un problème plus général (sans interaction de contact), la section efficace nous indique la capacité d’une cible à dévier les projectiles, en donnant la superficie équivalente d’un objet qui diffuserait uniquement par contact. 1.4.3 Longueur d’atténuation Considérons maintenant un milieu comportant une densité % de cibles (nombre par unité de volume), ainsi qu’un faisceau de projectiles incident sur ce milieu. Après avoir traversé une épaisseur dx du milieu, la fraction de projectiles diffusés sera %σdx. On peut le voir comme suit : considérons une aire A transversale au flux incident. Dans le volume délimité par cette aire et par l’épaisseur dx il y a %Adx cibles. La probabilité qu’un projectile soit diffusé par une cible en particulier en passant dans cette aire A est σ/A. Donc la probabilité qu’il soit diffusé par l’une des cibles présentes est %Adx × σ = %σdx A (1.52) Le flux Φ(x) du faisceau décroı̂t en rapport avec la proportion de particules diffusées entre les positions x et x + dx : Φ(x + dx) = Φ(x) − Φ(x)%σdx =⇒ dΦ = −Φ%σ dx (1.53) Il s’ensuit que l’intensité du faisceau incident diminuera de façon exponentielle en fonction de x: Φ(x) = Φ(0)e−%σx (1.54) On peut aussi décrire cette atténuation par une longueur caractéristique ξ = (%σ)−1 . 1.4.4 Formule de Rutherford Étudions le cas particulier de la collision entre une particule chargée (masse m, charge e1 ) et une cible massive (masse M m, charge e2 ), sous l’effet de la seule force électrique entre les deux particules. Le potentiel associé est1 ee V (r) = 1 2 (1.55) r 1 Nous adoptons le système d’unités cgs pour l’électromagnétisme. Plusieurs formules SI équivalentes peuvent s’obtenir simplement en remplaçant e2 par e2 /4πε0 , où e est la charge élémentaire. 1.4. Collisions et section efficace 13 Le problème, mathématiquement parlant, est de calculer la transformée de Fourier de ce potentiel. On procède comme suit, en coordonnées sphériques : Z 1 Ṽ (q) = e1 e2 r2 dr sin θ dθ dϕ e−iqr cos θ r Z 1 Z ∞ e−iqzr (1.56) dz = e1 e2 2π dr r2 (z = cos θ) r −1 0 Z 4πe1 e2 ∞ = dr sin qr q 0 Malheureusement, cette dernière intégrale est mal définie. Ce problème est lié au fait que le potentiel de Coulomb a un rayon d’action infini et que sa section efficace est, strictement parlant, infinie. Pour remédier à cette situation, modifions le potentiel de Coulomb pour lui donner un rayon d’action fini (ce qu’on appelle le potentiel de Yukawa) : e−µr e1 e2 → e1 e2 r r (1.57) Ici µ−1 est une longueur caractéristique (on fera tendre µ vers 0 à la fin du calcul). Sa transformée de Fourier est alors Z 4πe e 4πe1 e2 ∞ dr e−µr sin qr = 2 1 22 (1.58) Ṽ (q) = q q +µ 0 On peut ensuite prendre la limite µ → 0 pour trouver Ṽ (q) = 4πe1 e2 q2 (1.59) La section différentielle associée est donc dσ 1 = 4m2 e21 e22 4 dΩ q (1.60) En posant p = pẑ et p0 = pr̂ (coordonnées sphériques), on calcule que q 2 = p2 (2 − 2 cos θ) = 4p2 sin2 θ/2 (1.61) dσ m2 e21 e22 θ = cosec4 dΩ 4p4 2 (1.62) On peut donc écrire En fonction de l’énergie cinétique non relativiste T = p2 /2m, ceci s’exprime comme e2 e2 θ dσ = 1 22 cosec4 dΩ 16T 2 (1.63) Il s’agit ici de la célèbre formule de Rutherford. La diffusion est maximale quand l’angle est faible. De plus, on constate que la section efficace σ est infinie, ce qui est encore dû au rayon d’action infini du potentiel de Coulomb. En pratique, le potentiel de Coulomb est écranté par d’autres charges et son rayon d’action effectif est fini, ce qui élimine ce problème. Par exemple, lors de la diffusion d’une particule α par un atome d’or, la charge électronique entourant le noyau rend l’atome effectivement neutre sur une distance d’environ 10−10 m, ce qui élimine le caractère non intégrable de la singularité à θ = 0. 14 1. Processus élémentaires 1.4.5 Forme relativiste générale de la section efficace Allons maintenant au-delà du problème à un corps. Considérons le processus illustré à droite de (1.1), où deux particules d’impulsions p1 et p2 se transforment en N − 2 autres particules d’impulsions p3 , . . . , pN . Le taux de transition associé est, toujours dans la normalisation NC et par analogie avec la relation (1.30), dω = |Mf i |2 d3 p3 d3 p4 d3 pN · · · (2π)4 δ 4 (p1 + p2 − p3 − · · · pN ) (2π)3 (2π)3 (2π)3 (1.64) Plaçons-nous dans le référentiel du laboratoire, tel que p2 = 0. La section différentielle s’obtient, dans cette normalisation (NC) en divisant par la vitesse du projectile, soit par |p1 |/E1 : dσ = |Mf i |2 E1 d3 p3 d3 p4 d3 pN · · · (2π)4 δ 4 (p1 + p2 − p3 − · · · pN ) |p1 | (2π)3 (2π)3 (2π)3 (1.65) Passons maintenant à la normalisation relativiste (1.26), ce qui implique un changement dans la mesure d’intégration, ainsi que de diviser par 2E1 2E2 = 4E1 m2 , pour tenir compte du changement de normalisation des états initiaux : dσ = |Mf i |2 d3 p3 d3 pN · · · (2π)4 δ 4 (p1 + p2 − p3 − · · · pN ) 4m2 |p1 | (2π)3 2E3 (2π)3 2EN (1.66) Cette expression n’est valable que dans le référentiel du laboratoire. Pour la généraliser à un référentiel quelconque, on doit trouver une expression manifestement invariante de Lorentz qui se réduise à la forme ci-haut dans le repère du laboratoire. En effet, la section efficace est un invariant de Lorentz, car elle est une aire transversale à la direction de l’impulsion du projectile, et donc n’est pas affectée par une transformation de Lorentz effectuée dans cette direction. Vu différemment, la section efficace est une probabilité par unité de temps, divisée par un flux, qui est un nombre de particules par unité de temps de de surface. Le fait de procéder à une transformation de Lorentz dans la direction de l’impulsion apporte certainement un facteur de dilatation du temps, mais de manière égale au numérateur et au dénominateur, sans par ailleurs affecter les aires transversales à la quantité de mouvement. Dans l’expression (1.66), la mesure d’intégration est invariante de Lorentz, de même que l’amnplitude (car nous avons adopté une normalisation des états qui est aussi invariante de Lorentz). Il reste l’expression m2 p1 du dénominateur qui ne l’est pas. Mais cette p expression est un cas particulier dans le référentiel du laboratoire de l’expression invariante (p1 ·2 )2 − (m1 m2 )2 . En effet, dans ce référentiel, p1 = (E1 , p1 ) et p2 = (m2 , 0), donc p1 ·p2 = E1 m2 et (p1 · p2 )2 − (m1 m2 )2 = E12 m22 − m21 m22 = (E12 − m21 )m22 = |p1 |2 m22 (1.67) p Donc (p1 · p2 )2 − (m1 m2 )2 → |p1 |m2 . L’expression générale de la section différentielle est donc, dans la normalisation relativiste et dans un référentiel quelconque, |Mf i |2 d3 p3 d3 pN dσ = p · · · (2π)4 δ 4 (p1 + p2 − p3 − · · · pN ) 3 2E 3 2E 2 2 (2π) (2π) 4 (p1 · p2 ) − (m1 m2 ) 3 N (1.68) 1.5. Résonances et masse invariante 15 1.5 Résonances et masse invariante Le processus de collision de deux particules peut en principe mener à la création de nouvelles particules. L’apparition d’une particule de masse m est possible d’un point de vue énergétique si l’énergie totale des particules entrant en collision est au moins égale à m dans le référentiel du centre d’impulsion. En fait, quel que soit le référentiel utilisé, l’énergie disponible peut être obtenue en calculant la masse invariante associée aux impulsions et énergies des particules impliquées. Expliquons de quoi il s’agit. Si E1 et E2 désignent les énergies des deux particules, et p1 et p2 leurs impulsions, alors on appelle masse invariante M l’invariant associé au quadrivecteur (E1 + E2 , p1 + p2 ), soit M 2 = (E1 + E2 )2 − (p1 + p2 )2 (1.69) Dans le référentiel du centre d’impulsion, p1 + p2 = 0 et la masse invariante est simplement la somme des énergies des particules, soit l’énergie disponible pour la création d’une particule de masse M (en supposant que les particules 1 et 2 sont annihilées). L’invariant M 2 est aussi noté s et appelé première variable de Mandelstam. S’il est possible de créer une particule de masse m en annihilant deux particules de masses m1 et m2 , alors la section efficace σ, si on la considère comme une fonction de la masse invariante M , devrait comporter un maximum évident à M = m, car à cette énergie une nouvelle possibilité de transition quantique apparaı̂t, qui n’existait pas à plus faible énergie. Cette possibilité s’ajoute à la possibilité de diffusion élastique, où les produits de la collision sont les particules initiales, quoique dans des états différents. D’autre part, la possibilité de création de cette nouvelle particule n’existe qu’à cette valeur de M et à aucune autre, car elle ne peut pas avoir d’autre énergie que m dans son propre référentiel. Donc, si cette particule était stable, un pic delta apparaı̂trait dans la section efficace σ à une valeur de l’énergie incidente telle que la masse invariante M vaut m. Or, la particule ainsi créée ne peut être stable. En effet, s’il est possible de la créer, il est également possible qu’elle se désintègre, par le processus inverse qui a mené à sa création, à savoir l’émission de deux particules. Cette particule possède donc une vie moyenne τ = Γ−1 , Γ étant le taux de désintégration (noté ω dans la section 1.3). Par le principe d’incertitude temps-énergie, cela implique que son énergie dans son propre référentiel n’est pas bien définie, mais comporte une incertitude ∆E ∼ Γ. On montre plus bas que la densité d’états ρ(E) associée n’est plus une fonction delta δ(E − m), mais plutôt une lorentzienne : ρ(E) = 1 Γ 2π (E − m)2 + (Γ/2)2 (1.70) Il est donc possible, par une mesure de la largeur du pic lorentzien apparaissant dans la section efficace, de mesurer le temps de vie d’une particule créée lors d’un processus de collision. Ces considérations sont à la base de toutes les découvertes expérimentales de la physique des particules, mais s’appliquent aussi à des domaines en apparence aussi éloignés que la physique du solide, car les même principes de base sont en jeu (exception faite de l’invariance relativiste). Justifions maintenant la forme lorentzienne de la courbe. Si un état quantique |ψi est instable, c’est que sa projection sur sa valeur initiale décroı̂t exponentiellement. Autrement dit, hψ(0)|ψ(t)i = e−iE0 t e−Γt/2 (1.71) où E0 est l’énergie approximative de l’état. En effet, la probabilité de trouver le système au temps t dans le même état où il était au temps t = 0 est |hψ(0)|ψ(t)i|2 = e−Γt (1.72) 16 1. Processus élémentaires ce qui correspond bien à la notion de vie moyenne τ = Γ−1 . Introduisons ici le concept de fonction spectrale A(E) associée à l’état |ψi. Si on désigne par |ni les véritables états stationnaires du système physique étudié (donc les états propres du hamiltonien complet), la fonction spectrale A(E) est la probabilité qu’une mesure de l’énergie dans l’état |ψi donne E : X A(E) = hψ|δ(E − H)|ψi = δ(E − En )|hψ|ni|2 (1.73) n La fonction spectrale est reliée à la résolvente G(z), définie comme suit : G(z) = hψ| 1 |ψi z−H (1.74) où z est une variable complexe. En effet, on montre sans peine que A(E) = − 1 lim Im G(E + iη) π η→0+ (1.75) Il suffit pour cela d’exprimer la résolvente en fonction de la base des états |ni : G(z) = X |hψ|ni|2 n 1 z − En (1.76) et de constater que η 1 1 1 − Im = π E − En + iη π (E − En )2 + η 2 (1.77) η 1 2 π x + η2 (1.78) Or, la fonction tend vers la fonction δ(x) quand η → 0+ . Donc, dans cette limite, on retrouve bien la fonction spectrale. D’autre part, si on calcule la fonction d’autocorrélation Z ∞ S(E) = eiEt−ηt hψ(0)|ψ(t)i (η → 0+ ) (1.79) 0 on trouve S(E) = X n i |hψ|ni|2 = iG(E + iη) E − En + iη (1.80) Donc on peut retrouver la fonction spectrale A(E) en calculant S(E). Pour un état en décroissance exponentielle, on a justement Z ∞ i S(E) = e−iE0 t−Γt/2 eiEt−ηt = (1.81) E − E0 + iΓ/2 0 Notons que nous avons pu prendre la limite η → 0 dès à présent, car Γ joue le même rôle que η dans l’intégration, et donc le facteur de convergence e−ηt n’est plus nécessaire. Ceci correspond à une résolvante 1 z − E0 + iΓ/2 (1.82) Γ 1 2π (E − E0 )2 + (Γ/2)2 (1.83) G(z) = et donc à une fonction spectrale A(E) = ce qui est bien le résultat cherché. La notion de masse invariante est utilisée dans l’analyse des produits d’une réaction, afin de déterminer si une particule instable n’aurait pas été produite lors de la réaction, même si elle 1.5. Résonances et masse invariante 17 n’est pas détectée dans les produits finaux en raison de sa désintégration subséquente. Par exemple, considérons une réaction où deux particules (1 et 2) donnent lieu à trois produits (3, 4 et 5) détectés. Les techniques de détection nous donnent accès àp la quantité de mouvement et à l’énergie des produits et on peut former la masse invariante M = (E4 + E5 )2 − (p4 + p5 )2 . Si la section efficace, portée en fonction de M , présente un pic significatif à une valeur précise (appelons-la m∗ ), c’est qu’on peut interpréter la réaction comme donnant naissance à deux particules, de masses m3 et m∗ . Cette réaction particulière ne peut se produire que si la masse invariante M est égale à m∗ (modulo l’incertitude reliée au temps de vie de la particule de masse m∗ ). Par contre, dans un canal de réaction différent, les particules 4 et 5 pourraient être produites directement (sans passer par la résonance m∗ ) et alors la section efficace ne serait pas piquée à M = m∗ , mais affecterait une forme étendue (appelée “fond d’espace de phase”). En réalité, on assiste à une superposition de ces deux processus. Problèmes Problme 1.1 Le positronium est un atome instable formé d’un électron et d’un positron. Il se désintègre rapidement en deux photons. Dans son état singulet (c’est-à-dire quand le spin total des deux particules est nul), sa vie moyenne inverse, calculée en électrodynamique quantique, est donnée par la formule τ −1 = 12 mα5 , où m est la masse de l’électron et α est la constante de structure fine. (i) Exprimez τ en restaurant les constantes h̄ et c et (ii) évaluez sa valeur numérique en secondes. Problme 1.2 Le méson π − (masse 139,569 MeV) se désintègre par interaction faible en un muon µ− (masse 105,659 MeV) et un antineutrino ν̄µ (masse nulle). En supposant que le pion est initialement au repos, calculez la vitesse du muon produit par sa désintégration. Indice : la solution à ce problème est particulièrement simple dans le langage des quadri-vecteurs. Problme 1.3 Une particule A, de masse mA et d’énergie E, est incidente sur une particule B au repos, de masse mB . La collision est inélastique et produit N particules dans l’état final. On définit l’énergie de seuil comme la valeur minimale de E en-deça de laquelle la réaction est impossible. Exprimez l’énergie de seuil en fonction seulement de mA , de mB et de la masse totale M des produits de la réaction. Notez que ce calcul est particulièrement simple dans le langage des quadrivecteurs, en utilisant la notion de masse invariante, surtout si on se place dans le référentiel du centre d’impulsion dans l’analyse des produits. Appliquez ensuite la formule obtenue pour évaluer numériquement l’énergie de seuil (en MeV) de la réaction p + p → p + p + π0 où p désigne le proton (masse 938.280 MeV) et π 0 le pion neutre (masse 134.964 MeV). Problme 1.4 Considérons un processus de collision élastique 1 + 2 → 3 + 4 comme dans le devoir no 1, où m1 = m3 et m2 = m4 . Nous nous plaçons dans le référentiel du laboratoire, où la particule 2 est initialement au repos. La particule 1 est déviée d’un angle θ (l’angle de diffusion) par rapport à sa direction initiale. Expliquer comment déterminer l’énergie E3 du projectile après la collision en fonction de l’énergie incidente E1 et de l’angle θ. Indice: Appliquez la conservation de l’énergie et de la quantité de mouvement et calculez l’invariant p24 = (p1 + p2 − p3 )2 . 18 1. Processus élémentaires Problme 1.5 214 214 L’isotope 210 83 Bi se désintègre par émission β en 84 Po avec une vie moyenne de 7.2 jours. À son tour, le 84 Po 206 se désintègre en 82 Pb par émission α avec une vie moyenne de 200 jours. Si la source ne contient que du 210 Bi initialement, après combien de jours le taux de production de particules α est-il maximum? (rép. : 24.8 83 jours). Problme 1.6 Le potassium naturel a un poids atomique de 39.089 et contient une proportion égale à 1.18×10−4 de l’isotope 40 K. Cet isotope est instable et comporte deux modes de désintégration : 19 40 19 K − → 40 20 Ca + e + ν̄e et 40 − 19 K + e → 40 18 Ar + γ + ν̄e Le premier est une désintégration β − (émission d’un électron), le deuxième une capture d’électron atomique. L’intensité de la désintégration β − est de 2.7 × 104 kg−1 s−1 (par kilogramme de potassium naturel). De plus, en moyenne, 12 rayons γ sont émis pour chaque centaine de rayons β. À partir de ces données, calculez la vie moyenne du 40 19 K. (réponse : 1.9 × 109 années) Problme 1.7 Une météorite, soumise à l’analyse chimique, se révèle contenir 1g de potassium et 10−5 g d’argon. En supposant que tout cet argon provient de la désintégration du 40 19 K, qu’aucune partie de l’argon ne s’est échappé, et que le potassium n’est pas renouvelé par la désintégration d’autres éléments, calculez l’âge de cette météorite (c’est-à-dire le temps écoulé depuis que les hypothèses ci-dessus sont valables). Servez-vous des données du problème précédent. (réponse : 1.1 × 109 années) Problme 1.8 La forme générale de la section différentielle est |Mf i |2 d3 pN d3 p3 dσ = p ··· (2π)4 δ 4 (p1 + p2 − p3 − · · · pN ) 3 (2π)3 2EN 4 (p1 · p2 )2 − (m1 m2 )2 (2π) 2E3 Considérons maintenant une collision à deux réactants et deux produits. Plaçons-nous dans le référentiel du centre d’impulsion des réactants, de sorte que p1 + p2 = 0. a) Démontrez que, dans ce référentiel, q (p1 · p2 )2 − (m1 m2 )2 = |p1 |(E1 + E2 ) b) Démontrez que la section différentielle dans ce référentiel est |Mf i |2 pf 1 dσ = dΩ (8π)2 pi E 2 où pi est la grandeur de l’impulsion d’un des réactants, et pf celle de l’un des produits, et E l’énergie totale des réactants. 1.5. Résonances et masse invariante 19 Problme 1.9 Considérons une collision 1 + 2 → 3 + 4, dans le référentiel du laboratoire (particule 2 au repos) et supposons que les produits sont les mêmes que les réactants (m3 = m1 et m4 = m2 ). a) En partant de la relation (1.68), démontrez que la section différentielle de diffusion (par unité d’angle solide de la particule 3, c’est-à-dire du projectile diffusé) est p23 |Mf i |2 dσ 1 = 2 dΩ (8π) m2 |p1 | (|p3 |(E1 + m2 ) − |p1 |E3 cos θ) où Ei désigne l’énergie de la particule i. Notez qu’un changement de variable semblable à celui effectué en (1.36) est requis. b) Montrez que, dans le cas d’un projectile de masse nulle (m1 = 0), comme dans l’effet Compton, on a la relation 1 1 1 = + (1 − cos θ) E3 E1 m2 et que la formule ci-haut se réduit à dσ = |Mf i |2 dΩ E3 8πE1 m2 2 Problme 1.10 Dans ce problème nous allons étudier la cinématique de l’émission β par un noyau. On considère un noyau instable (masse M ) qui se désintègre en émettant un électron (masse me ), un neutrino (masse mν qu’on suppose non nulle dans les calculs) et un noyau de masse M 0 . Les masses des noyaux sont très grandes par rapport à me ou mν . Une énergie E est libérée par la désintégration, c’est-à-dire que E = (M − M 0 )c2 Cette énergie sert à créer l’électron, le neutrino et à donner de l’énergie cinétique aux trois produits (électron, neutrino et noyau). On suppose que E M c2 . Établissons d’abord la notation. Si n représente le nombre d’états finaux possibles, alors dn/dE représente le nombre d’états par intervalle d’énergie libérée, ce qu’on appelle habituellement la densité d’états finaux et qu’on note ρ(E). Mais des distributions plus fines peuvent être considérées : par exemple, d3 n d2 ρ = d|pe |dΩe dE d|pe |dΩe représente le nombre d’états finaux par unité d’énergie libérée, par unité d’angle solide de l’électron et par unité d’impulsion |pe | de l’électron. En effet, comme l’énergie de l’électron n’est pas fixe dans ce problème (parce qu’il y a trois produits de désintégration et non deux), on peut s’intéresser au spectre en impulsion des électrons produits. a) Expliquer pourquoi on peut négliger l’énergie cinétique du noyau produit, par rapport à celle donnée au neutrino et à l’électron. Autrement dit, l’électron et le neutrino se partagent l’énergie E. b) Pour une énergie libérée E fixe, quel est l’intervalle de valeurs possibles pour l’énergie de l’électron? c) Montrez que l’élément de matrice associé au processus est proportionnel au volume de l’espace, ce qui signifie qu’on peut l’écrire comme suit : hf |V |ii = Mf i V−1 20 1. Processus élémentaires où Mf i est indépendant du volume dans la limite V → ∞. On supposera par la suite que Mf i ne dépend pas de la direction d’émission des particules. d) Montrez que d2 n 1 = V2 4 6 2 p2e Eν pν d|pe |dEν 4π h̄ c où E et p désignent respectivement l’énergie (de repos et cinétique) et la grandeur de la quantité de mouvement; les indices e et ν réfèrent à l’électron et au neutrino. e) Montrez que le taux d’émission par unité de quantité de mouvement de l’électron est v u u dω 1 2 2 2t = |M | p (E − E ) 1− e fi e d|pe | 2π 3 h̄7 c3 mν c2 !2 E − Ee f) Si N (|pe |)d|pe | est le nombre de désintégrations, dans un intervalle de temps donné (et assez long), pour lesquelles l’impulsion pde l’électron est comprise entre |pe | et |pe |+d|pe |, alors il découle de la partie précédente qu’un graphique de N (|pe |)/|pe | porté en ordonnée et de (E −Ee ) porté en abcisse est une droite (dite droite de p Kurie*) si la masse du neutrino est nulle. Faites un graphique (par exemple,2 à l’aide de Mathematica) de N (Ee )/|pe | en fonction de E − Ee pour les paramètres suivants : E = 1,1 me c et mν /me = 0, 0,01 et 0,05. L’analyse des droites de Kurie obtenues expérimentalement a permis d’obtenir une limite supérieure de 60 eV à la masse des neutrinos. * Oui, c’est un ‘K’. Rien à voir avec Curie. CHAPITRE 2 Modèles élémentaires du noyau 2.1 Composition des noyaux En 1912, peu après la proposition du modèle nucléaire de l’atome, Frederick Soddy découvre que les atomes d’un même élément ne sont pas tous identiques. Un même élément comporte parfois plusieurs variétés d’atomes, appelés isotopes, qui ont des masses différentes. L’abondance relative de chaque isotope pour un élément donné est inscrite au tableau 2.1. La masse de chaque isotope est très proche d’un multiple entier de la masse de l’hydrogène. On note A ce multiple, qu’on appelle le nombre de masse, alors que la charge de chaque isotope est un multiple Z de la charge élémentaire, où Z est le numéro atomique. Chaque isotope est alors représenté symboliquement par la notation A Z Sy (2.1) où Sy est le symbole chimique de l’élément associé. La masse quasi-entière des isotopes suggère naturellement que les noyaux ne sont pas élémentaires, mais constitués d’un nombre entier A de protons (comme on appelle le noyau de l’isotope courant de l’hydrogène). Pour assurer la bonne valeur de la charge, on a supposé assez tôt que le noyau contenait également A − Z électrons. Cette hypothèse fut renforcée lors de l’observation, par le groupe de Rutherford, de la première réaction nucléaire, en 1919. On découvrit en effet que l’impact des particule α sur les noyaux d’azote de l’atmosphère produisait des protons, selon la réaction suivante : 4 2 He + 147 N → 178 O + 11 H (2.2) Cette réaction est naturellement interprétée comme une fusion de la particule α avec le noyau d’azote, suivie de l’éjection d’un proton surnuméraire. Le fait que le noyau contienne des électrons expliquait la désintégration bêta, au cours de laquelle des électrons sont émis par des noyaux instables. Par contre, on s’explique mal pourquoi les électrons atomiques jouiraient d’une certaine indépendance, alors que d’autres seraient perpétuellement prisonniers du noyau. Cette hypothèse sur la composition du noyau fut en vogue jusqu’en 1932, année de la découverte du neutron. On comprit alors que le noyau (A, Z) comporte Z protons et N = A − Z neutrons, et ne comporte pas d’électrons. Le neutron est une particule neutre, de masse légèrement supérieures à celle du proton, et instable à l’état isolé; sa désintégration produit un proton, un électron et un antineutrino. 22 2. Modèles élémentaires du noyau Abondance relative des isotopes, recommandée par l'IUPAC P. De Bievre and P.D.P. Taylor, Int. J. Mass Spectrom. Ion Phys. 123, 149 (1993). Isotope Abondance 1 H 2 H 99.985 0.015 3 He He 0.000137 99.999863 6 7.5 92.5 4 Li Li 7 9 Be 10 100 B B 19.9 80.1 C C 98.90 1.10 11 12 13 14 N 15 N 99.634 0.366 16 O 17 O 18 O 99.762 0.038 0.200 19 100 20 Ne 21 Ne 22 Ne 90.48 0.27 9.25 23 100 F Na 24 Mg Mg 26 Mg 25 27 Al 78.99 10.00 11.01 100 Isotope Fe 56 Fe 57 Fe 58 Fe 5.8 91.72 2.2 0.28 55 100 Mn 58 Ni 60 Ni 61 Ni 62 Ni 64 Ni 68.077 26.223 1.140 3.634 0.926 59 100 63 Cu 65 Cu 69.17 30.83 64 Zn Zn 67 Zn 68 Zn 70 Zn 48.6 27.9 4.1 18.8 0.6 69 60.108 39.892 Co 66 Ga Ga 71 70 Ge 72 Ge 73 Ge 74 Ge 76 Ge 21.23 27.66 7.73 35.94 7.44 74 Se Se Se 78 Se 80 Se 82 Se 0.89 9.36 7.63 23.78 49.61 8.73 75 100 78 Kr 80 Kr 82 Kr 83 Kr 84 Kr 86 Kr 0.35 2.25 11.6 11.5 57.0 17.3 Br 81 Br 50.69 49.31 84 0.56 9.86 7.00 82.58 76 77 28 Si Si Si 92.23 4.67 3.10 31 P 100 32 S 33 S 34 S 36 S 95.02 0.75 4.21 0.02 35 Cl 37 Cl 75.77 24.23 36 Ar 38 Ar 40 Ar 0.337 0.063 99.600 79 39 93.2581 0.0117 6.7302 86 96.941 0.647 0.135 2.086 0.004 0.187 85 29 30 K 40 K 41 K 40 Ca 42 Ca 43 Ca 44 Ca 46 Ca 48 Ca 45 100 46 8.0 7.3 73.8 5.5 5.4 Sc Ti 47 Ti 48 Ti 49 Ti 50 Ti 50 V V 0.250 99.750 Cr Cr 53 Cr 54 Cr 4.345 83.789 9.501 2.365 51 50 52 Abondance 54 As Sr Sr 87 Sr 88 Sr Rb 87 Rb 72.165 27.835 89 100 90 51.45 11.22 17.15 17.38 2.80 Y Zr 91 Zr 92 Zr 94 Zr 96 Zr 92 Mo Mo 95 Mo 96 Mo 97 Mo 98 Mo 100 Mo 94 93 Nb 14.84 9.25 15.92 16.68 9.55 24.13 9.63 100 Isotope 96 Ru 98 Ru 99 Ru 100 Ru 101 Ru 102 Ru 104 Ru 102 Abondance 5.52 1.88 12.7 12.6 17.0 31.6 18.7 Pd Pd 105 Pd 106 Pd 108 Pd 110 Pd 1.02 11.14 22.33 27.33 26.46 11.72 103 100 106 1.25 0.89 12.49 12.80 24.13 12.22 28.73 7.49 104 Rh Cd Cd 110 Cd 111 Cd 112 Cd 113 Cd 114 Cd 116 Cd 108 107 Ag Ag 109 112 51.839 48.161 Sn Sn 115 Sn 116 Sn 117 Sn 118 Sn 119 Sn 120 Sn 122 Sn 124 Sn 0.97 0.65 0.34 14.53 7.68 24.23 8.59 32.59 4.63 5.79 113 In 115 In 4.3 95.7 120 Te Te Te 124 Te 125 Te 126 Te 128 Te 130 Te 0.096 2.603 0.908 4.816 7.139 18.95 31.69 33.80 121 57.36 42.64 114 122 123 Sb Sb 123 124 Xe 126 Xe 128 Xe 129 Xe 130 Xe 131 Xe 132 Xe 134 Xe 136 Xe 127 I 130 0.10 0.09 1.91 26.4 4.1 21.2 26.9 10.4 8.9 100 Ba Ba Ba 135 Ba 136 Ba 137 Ba 138 Ba 0.106 0.101 2.417 6.592 7.854 11.23 71.70 133 100 132 134 Isotope 136 0.19 0.25 88.48 11.08 138 0.0902 99.9098 La La 139 Isotope 100 142 Nd 143 Nd 144 Nd 145 Nd 146 Nd 148 Nd 150 Nd 27.13 12.18 23.80 8.30 17.19 5.76 5.64 144 Sm Sm 148 Sm 149 Sm 150 Sm 152 Sm 154 Sm 3.1 15.0 11.3 13.8 7.4 26.7 22.7 151 Eu 153 Eu 47.8 52.2 152 Gd 154 Gd 155 Gd 156 Gd 157 Gd 158 Gd 160 Gd 0.20 2.18 14.80 20.47 15.65 24.84 21.86 156 Dy 158 Dy 160 Dy 161 Dy 162 Dy 163 Dy 164 Dy 0.06 0.10 2.34 18.9 25.5 24.9 28.2 159 100 Pr W 182 W 183 W 184 W 186 W 0.13 26.3 14.3 30.67 28.6 184 Os Os 187 Os 188 Os 189 Os 190 Os 192 Os 0.02 1.58 1.6 13.3 16.1 26.4 41.0 185 37.40 62.60 Re Re 187 190 147 Pt Pt 194 Pt 195 Pt 196 Pt 198 Pt 0.01 0.79 32.9 33.8 25.3 7.2 191 37.3 62.7 192 Ir Ir 193 196 Hg Hg 199 Hg 200 Hg 201 Hg 202 Hg 204 Hg 198 Tb 162 Er Er 166 Er 167 Er 168 Er 170 Er 0.14 1.61 33.6 22.95 26.8 14.9 165 100 168 Yb 170 Yb 171 Yb 172 Yb 173 Yb 174 Yb 176 Yb 0.13 3.05 14.3 21.9 16.12 31.8 12.7 169 100 164 Ho Tm 174 Hf 176 Hf 177 Hf 178 Hf 179 Hf 180 Hf 0.162 5.206 18.606 27.297 13.629 35.100 175 Lu Lu 97.41 2.59 Ta Ta 0.012 99.988 176 181 Abondance 180 186 141 180 Cs Abondance Ce 138 Ce 140 Ce 142 Ce 0.15 9.97 16.87 23.10 13.18 29.86 6.87 197 100 203 Tl 205 Tl 29.524 70.476 204 1.4 24.1 22.1 52.4 Au Pb Pb 207 Pb 208 Pb 206 209 Bi 100 232 Th 100 234 0.0055 0.7200 99.2745 U U 238 U 235 Tableau 2.1 Abondance relative des isotopes de tous les éléments, en pourcent. 2.2. Taille des noyaux 23 2.1.1 Terminologie Définissons maintenant quelques termes utilisés dans la classifications des noyaux, ou rappelons des définitions déjà connues : Nucléon : désigne un proton ou un neutron Nuclide : Une espèce de noyaux, avec Z et N fixe. Isobares : Nuclides ayant le même nombre de masse A, mais des numéros atomiques Z différents. Isotones : Nuclides ayant le même nombre de neutrons N , mais des numéros atomiques Z différents. Isotopes : Nuclides ayant le même nombre de protons, mais des N différents. Isomères : Nuclides de même Z et N mais dans un états nucléaire excité, identifiable par une vie moyenne suffisamment longue (par exemple τ > 10−6 s). 2.2 Taille des noyaux En 1911, Rutherford, Geiger et Marsden réalisèrent une série d’expériences qui démontrèrent que l’essentiel de la masse de l’atome est concentrée dans un noyau de rayon inférieur à 10−14 m, alors que le rayon de l’atome est de l’ordre de 10−10 m. Ces expériences consistaient à diffuser un faisceau de particules α (en fait, des noyaux d’hélium) sur une mince feuille d’or, dans une enceinte évacuée, et à mesurer la section différentielle de diffusion dσ/dΩ. Le résultat observé était compatible avec la section différentielle de Rutherford dσ e2 e2 θ = 1 22 cosec4 dΩ 16T 2 (2.3) où e1 = 2e et e2 = Ze, Z étant le numéro atomique de l’or. Rien n’indique à cette époque que le noyau est non ponctuel. Les expériences de diffusion seront plus tard effectuées à l’aide d’électrons, à des énergies beaucoup plus grandes, qui permettront une résolution spatiale supérieure. La section différentielle observée n’est plus compatible avec une cible ponctuelle, mais plutôt avec une distribution de charge nucléaire étendue. Voyons comment la section différentielle de Rutherford doit être modifiée en conséquence. Premièrement, la grande énergie des électrons utilisés comme projectiles rend nécessaire l’emploi d’une version relativiste de la formule de Rutherford, que nous ne démontrerons pas ici. Il s’agit de la formule de Mott, donnée simplement par dσ dσ 2 2 θ 1 − β sin = (2.4) dΩ Mott. dΩ Ruth. 2 où θ est l’angle de diffusion et β la vitesse de l’électron (en rapport à celle de la lumière). Deuxièmement, l’effet d’une charge non ponctuelle est représentée par un autre facteur multiplicatif, appelé facteur de forme. Supposons à cet effet qu’une charge ponctuelle (comme l’électron, e1 = −e) soit diffusée sur une charge e2 = Ze caractérisée par une distribution de probabilité ρ(r), telle que Z d3 r ρ(r) = 1 Le potentiel électrostatique créé par cette distribution est Z ρ(r0 ) 2 V (r) = −Ze d3 r0 |r − r0 | (2.5) (2.6) 24 2. Modèles élémentaires du noyau car un élément de volume d3 r0 situé à r0 contient une charge dq = Zeρ(r0 )d3 r0 et cause une énergie potentielle −edq/|r − r0 |. D’après la règle d’or de Fermi, La section différentielle de diffusion est proportionnelle à la transformée de Fourier du potentiel diffuseur. Or, le potentiel (2.6) a justement la forme d’une convolution : Z Ze2 V (r) = d3 r0 ρ(r0 )U (r − r0 ) U (r) = − (2.7) |r| et donc Ṽ (q) = Ũ (q)ρ̃(q) (2.8) En somme, la section différentielle a la forme suivante : dσ dσ = |ρ̃(q)|2 dΩ dΩ ponc. (2.9) où |ρ̃(q)|2 est appelé facteur de forme, et contient l’information relative à la forme du noyau. 1 ˜ | |ρ(q) 2 0.1 0.01 0.001 0.0001 0 5 10 qa 15 20 Figure 2.1. Facteur de forme associé au modèle de la sphère dure, en échelle logarithmique. Notons l’annulation quasi périodique, conséquence de la forte oscillation présente dans ρ̃(q), attribuable à la discontinuité dans ρ(r). Considérons, comme exemple, une distribution de charge uniforme (et normalisée) à l’intérieur d’une sphère de rayon a : ( −1 4 πa3 (r < a) 3 ρ(r) = (2.10) 0 (r > a) On calcule sans trop de peine que sin x − x cos x (x = qa) (2.11) x3 Le facteur de forme associé est illustré à la figure 2.1. Il comporte de fortes oscillations en fonction de q, en raison de la discontinuité dans la densité à r = a. ρ̃(q) = 3 Une forme plus réaliste de la densité nucléaire comporterait une transition plus douce entre les régions de densité nulle et celles de densité non nulle. Un modèle phénoménologique souvent utilisé utilise la forme dite de Saxon-Woods : ρ0 ρ(r) = (2.12) 1 + e(r−a)/d 2.3. Masse des noyaux 25 Figure 2.2. Facteur de forme associé à la diffusion d’électrons de 450 MeV sur des noyaux de 58 28 Ni. Les points (avec barres d’erreur) sont les résultats expérimentaux. La courbe pleine est le facteur de forme théorique associé au modèle de densité illustré à droite, proche du modèle de Saxon-Woods. Notons que le facteur de forme a été mesuré sur 11 ordres de grandeur! Tiré de Sick et al., Phys. Rev. Lett. 35, 910 (1975). où a est encore le rayon de la distribution, mais où la surface est floue, caractérisée par une épaisseur d. La figure 2.2 illustre (i) le facteur de forme obtenue expérimentalement de la diffusion d’électrons de haute énergie (450 MeV) sur des noyaux de 58 28 Ni et (ii) le facteur de forme théorique associés à un modèle proche de celui de Saxon-Woods (à droite sur la figure). Ceci démontre l’utilité réelle des expériences de diffusion dans la détermination de la dimension des noyaux. Il se trouve que la taille des noyaux est assez bien représentée par la valeur a = (1.18A1/3 − 0.48)fm d = 0.55fm (2.13) Le fait capital qui ressort de cette étude est que la densité nucléaire est à peu près constante. En effet, le rayon du noyau se comporte comme la racine cubique du nombre de nucléons, sauf pour une correction qui est de moins en moins importante au fur et à mesure que A augmente. Donc, dans la limite ou A est grand, chaque nucléon occupe un volume à peu près identique pour tous les noyaux. 2.3 Masse des noyaux 2.3.1 Les noyaux stables On doit distinguer les noyaux stables, qui ne se désintègrent jamais, des noyaux instables. Ces 235 derniers ont des vies moyennes variables, allant du milliard d’années (comme 238 92 U ou 92 U) jusqu’au milliardième de seconde. Il est bien-sûr impossible de dire qu’un noyau est absolument stable : il suffit de dire qu’aucune désintégration de ce noyau n’a jamais été observée. Les noyaux stables sont répartis étroitement autour d’une courbe dans le plan Z − N , appelée courbe de stabilité, comme illustré à la figure 2.3. On note que cette courbe tend vers la droite Z = N pour les petites valeurs de 26 2. Modèles élémentaires du noyau Z, mais s’en écarte pour les Z plus élevés, et que le nombre de neutrons peut alors être jusqu’à 50% plus élevé que le nombre de protons. L’un des problèmes fondamentaux de la physique nucléaire est de comprendre justement pourquoi certains noyaux sont stables – en particlier pourquoi le long de cette courbe – et de comprendre les différents mécanismes de désintégration des noyaux instables. N 120 100 80 60 N=Z 40 20 0 0 20 40 60 80 Z Figure 2.3. Répartition des noyaux stables sur le plan Z − N . 2.3.2 Énergie de liaison Soit M (A, Z) la masse d’un noyau (et non d’un atome) de nombre de masse A et de numéro atomique Z. Si mp et mn désignent respectivement la masse du proton et du neutron, alors on définit l’énergie de liaison B(A, Z) comme B(A, Z) = Zmp + (A − Z)mn − M (A, Z) (2.14) (souvenons-nous que nous travaillons en unités naturelles et que c = 1). L’énergie de liaison est l’énergie qu’il faudrait fournir pour dissocier complètement un noyau en ces constituants, protons et neutrons. La figure 2.4 illustre l’énergie de liaison par nucléon (B(A, Z)/A) en fonction de A, pour une série de noyaux représentatifs. Cette quantité (B/A) est pertinente, car elle permet d’identifier les noyaux les plus stables, situés autour de A ∼ 60. En principe, il serait avantageux pour un noyau plus lourd (A 60) de se scinder en fragments plus petits (de l’ordre de A ∼ 60), comme il serait avantageux pour des noyaux plus petits (A 60) de se fusionner en noyaux plus grands. Comme les noyaux illustrés sont stables, aucun mécanisme naturel n’est à l’oeuvre pour effectuer ces transformations, au moins dans l’environnement terrestre. 2.3. Masse des noyaux 27 12 C 56 Fe 16 O énergie de liaison par nucléon B(A,Z)/A 4 He 0 50 100 150 nombre de masse A 200 250 Figure 2.4. Énergie de liaison par nucléon, pour quelques noyaux représentatifs, sur une échelle allant de 0 à 10 MeV. 2.3.3 Modèle de la goutte liquide et formule semi-empirique des masses Dans les années 1930, un modèle phénoménologique fut proposé pour comprendre comment l’énergie de liaison des noyaux dépend de Z et de A. Le fait que la densité nucléaire soit à peu près la même pour tous les noyaux porte naturellement à comparer la matière nucléaire à un liquide incompressible. La cohésion d’un liquide est due à des forces intermoléculaires de courte portée. Ces forces n’agissent efficacement que d’une molécule vers une molécule voisine et ne se transmettent pas “à travers” une molécule vers d’autres molécules plus éloignées. En conséquence, chaque molécule du volume de la goutte est liée à un nombre donné de molécules, c’est-à-dire ses voisines immédiates, en nombre fixe si le liquide est incompressible. C’est donc dire que l’énergie de liaison d’une goutte de liquide est en première approximation proportionnelle au nombre de molécules qui la composent. Cependant, les molécules qui forment la surface de la goutte ont un nombre de voisines plus petit (environ la moitié) et donc on doit soustraire de l’énergie de liaison une contribution proportionnelle à la surface pour tenir compte de cet effet. On écrirait donc l’énergie de liaison de la goutte ainsi, si n est le nombre de molécules de la goutte : B = αn − βn2/3 (2.15) où α et β sont des constantes, car n1/3 est proportionnel au rayon de la goutte et n2/3 à sa surface. Par analogie, l’énergie de liaison d’un noyau aurait la forme suivante en première approximation : B(A, Z) = av A − as A2/3 (2.16) Ces deux termes sont respectivement appelés terme de volume et terme de surface. On voit que, d’après cette formule, le terme dominant de l’énergie de liaison par nucléon B/A est une constante (av ), ce qui est grosso modo conforme aux observations (fig. 2.4). Cependant, comme les noyaux sont chargés, l’énergie de liaison doit aussi être diminuée par l’énergie potentielle électrostatique. Par exemple, une sphère uniformément chargée de charge q et de rayon 28 2. Modèles élémentaires du noyau a créé un champ électrique donné par qr 3 (r < a) a E= q (r > a) r2 et l’énergie emmagasinée dans ce champ dans tout l’espace est Z 1 q2 U= d3 r E2 = 53 8π a (2.17) (2.18) De toute manière, quelle que soit la distribution de charge à l’intérieure de la sphère, cette énergie doit être proportionnelle au carré de la charge et inversement proportionnelle au rayon de la sphère (ou à une taille caractéristique), ne serait-ce que pour des raisons dimensionnelles. Cette énergie électrostatique est l’énergie nécessaire pour assembler la distribution de charge à partir de constituants initialement infiniment éloignés. On ajoute donc un terme électrostatique à l’énergie de liaison nucléaire, dit terme de Coulomb, proportionnel à la charge au carré (Z 2 ) et inversement proportionnel au rayon (A1/3 ) du noyau : B(A, Z) = av A − as A2/3 − ac Z2 A1/3 (2.19) Les trois contributions à l’énergie de liaison que nous avons identifiées jusqu’ici proviennent toutes d’une forme ou l’autre d’énergie potentielle. Or l’énergie cinétique des constituants des nucléons va aussi diminuer l’énergie de liaison. Cette contribution doit être évaluée en mécanique quantique. Le modèle utilisé à cette fin est celui d’un gaz de fermions dégénéré. Un calcul soigné, dans le cadre de ce modèle, montre que l’énergie de liaison doit être diminuée encore d’un terme proportionnel à (N − Z)2 /A. On peut intuitivement comprendre le nécéssité de ce terme par l’argument suivant. En supposant qu’on puisse représenter les états quantiques d’un noyau comme ceux d’un atome, c’est-à-dire par un ensemble de niveaux d’énergie occupés par des particules obéissant au principe d’exclusion de Pauli, on arrive à la conclusion que, pour une valeur fixe de A, ce sont les noyaux qui ont N = Z qui ont la plus basse énergie. En effet, les protons et les neutrons sont des fermions de spin 12 qui obéissent au principe d’exclusion. On ne peut donc placer plus de deux protons (de spins opposés) dans un même niveau, ou plus de deux neutrons, mais les protons et les neutrons ne s’excluent pas mutuellement. Un niveau d’énergie donné peut donc contenir au plus 2 protons et 2 neutrons. Si un noyau contient trop de protons par rapport au nombre de neutrons, alors le dernier niveau occupé est plus élevé, en raison de l’accumulation des protons et de leur exclusion mutuelle dans les niveaux. La même chose se dit des noyaux qui contiennent un nombre trop élevé de neutrons. La modélisation quantitative de cette effet se fait dans le cadre d’un modèle très simple où les nucléons sont traités comme des particules libres dans un volume restreint (celui du noyau). L’énergie de ce gaz de nucléons comporte deux termes (en supposant que N − Z n’est pas trop grand) : (i) un terme de volume proportionnel à A et qui s’ajoute au terme de volume déjà obtenu plus haut et (ii) une correction en (N − Z)2 /A, qui définit ce qu’on appelle le terme d’asymétrie. Enfin, on ajoute un dernier terme à l’énergie de liaison, lié à l’observation que cette énergie est toujours plus grande quand le nombre de protons ou le nombre de neutrons est pair. On note cette contribution (Z et N impairs, cas impair-impair) − 12 MeV 1/2 δ(A, Z) = ap /A où ap = 0 (Z + N impair, cas pair-impair ou impair-pair) 12 MeV (Z et N pairs, cas pair-pair) (2.20) 2.4. Le modèle en couches des noyaux 16 29 terme de surface as 14 B(Z,A)/A 12 terme de Coulomb ac 10 terme dʼasymétrie a 8 a 6 terme de volume av 4 Énergie de liaison nette 2 50 100 A 150 200 Figure 2.5. Contribution de chaque terme dans la formule de Bethe-Weizsäcker pour l’énergie de liaison par nucléon. Les paramètres utilisés sont ceux de l’éq. (2.22), et la valeur de Z choisie pour chaque valeur de A est celle qui maximise B/A. On écrit enfin une formule complète pour l’énergie de liaison des noyaux, dite formule de BetheWeizsäcker : B(A, Z) = av A − as A2/3 − ac Z2 (A − 2Z)2 − a + δ(A, Z) a A A1/3 (2.21) On l’appelle aussi la formule semi-empirique des masses nucléaires (car l’énergie de liaison détermine la masse des noyaux). Les paramètres de cette formule empirique ont été déterminés par un lissage sur les données observées : av = 15.56 MeV as = 17.23 MeV ac = 0.697 MeV aa = 23.285 MeV (2.22) et leur rôles sont illustrés à la figure 2.5. Il est clair que la formule de Bethe-Weizsäcker n’est pas dérivée d’un modèle fondamental du noyau. Elle n’est qu’une formule empirique qui repose sur un modèle vaguement collectif du noyau, c’està-dire un modèle où les nucléons n’agissent pas de manière quasi-indépendante, mais comme un ensemble. Cette formule a le mérite de faire ressortir certaines caractéristiques physiques importantes mais simples du noyau et de bien représenter les masses observées. La figure 2.6 démontre à quel point elle s’approche de la réalité. Les déviations entre les énergies de liaison observées et la formule de Bethe-Weizsäcker sont l’un des arguments en faveur du modèle en couches du noyau, étudié plus bas. 2.4 Le modèle en couches des noyaux 2.4.1 La force nucléaire Étant donné le succès de la mécanique quantique dans l’explication de la structure atomique et moléculaire, on pourrait s’attendre au même succès dans l’étude de la structure des noyaux. Malheureusement, on ne connait pas bien la nature de la force nucléaire, contrairement à la force 30 2. Modèles élémentaires du noyau Figure 2.6. Comparaison entre l’énergie de liaison par nucléon décrite par la formule de Bethe-Weizsäcker et les observations, pour les noyaux à A impair (ce qui permet d’exclure le terme d’appariement). Notons les déviations occasionnelles autour de ce qu’on appelle les “nombres magiques”. électromagnétique. On sait que (i) cette force est de courte portée et (ii) qu’elle comporte une composante attractive plus intense que la répulsion électrique, de sorte que les charges positives à l’intérieur du noyau forment une structure stable. Cependant, cette force nucléaire ne se manifeste pas à de grandes échelles de longueur, contrairement à la force électrique, de sorte qu’elle est beaucoup moins bien comprise. De plus, depuis les années 1970, on accepte le fait que les nucléons ne sont pas des particules élémentaires, mais plutôt qu’ils sont composés d’éléments plus fondamentaux appelés quarks, et que la force nucléaire est en quelque sorte une force effective, dérivée d’une interaction plus fondamentale. La situation est analogue à celle des forces interatomiques à courte portée qui lient des objets neutres entre eux, mais qui dérivent fondamentalement de la force électrique. Il n’est d’ailleurs pas clair que cette force nucléaire peut se prêter à une description non relativiste, en fonction d’un potentiel d’interaction qui ne dépend que de la distance entre deux nucléons. Cependant, des signes existent qu’un modèle des noyaux analogue au modèle en couches utilisé en physique atomique possède un fond de vérité. Expliquons d’abord en quoi consiste le modèle en couches usuel. 2.4.2 Fondements du modèle en couches dans les atomes L’équation de Schrödinger pour un atome à plusieurs électrons n’admet pas de solution exacte connue. On doit donc avoir recours à des méthodes approximatives. La plus usitée consiste à remplacer l’énergie potentielle mutuelle des électrons, qui dépend des positions de tous les électrons simultanément, par une énergie potentielle moyenne. Autrement dit, on suppose qu’un électron donné se déplace dans le potentiel moyen créé par tous les autres électrons, plutôt que dans le potentiel instantané créé par les autres électrons dans une configuration précise de leurs positions. On se trouve alors à remplacer un problème à N corps par un problème à un corps. Cependant, le potentiel moyen V̄ (r) doit être calculé en connaissant les fonctions d’ondes des autres électrons, car 2.4. Le modèle en couches des noyaux 31 on se doit de connaı̂tre la densité de charge qui en résulte afin de déterminer V̄ . On fait donc face à un problème auto-cohérent (on doit connaı̂tre V̄ pour calculer les fonctions d’ondes, et on doit connaı̂tre les fonctions d’onde pour calculer V̄ ). Ce type de problème se résout de manière itérative. L’important est que, dans un problème à un corps, les électrons sont effectivement indépendants, de sorte que les états propres d’un système à plusieurs électrons sont simplement des produits tensoriels des états à un électron. Autrement dit, il suffit de déterminer les états propres à un électron, et les états à plusieurs électrons sont obtenus en “remplissant des niveaux”, tout en veillant à respecter le principe d’exclusion de Pauli qui interdit l’occupation d’un état par plus d’un électron (on doit considérer que l’orientation du spin est comprise dans la description d’un état, de sorte que des orbitales identiques associées à des orientations de spin différentes définissent des états différents). Comme le potentiel moyen ne dépend que de la coordonnée radiale de l’électron, le moment cinétique de l’électron est conservé et les états propres à un électron sont caractérisés par une valeur donnée de L2 et de Lz , soit par des nombres quantiques orbital l et magnétique m, en plus d’un nombre quantique principal n. Tous les états associés à une même valeur de n forment une couche électronique. À l’intérieur d’une couche, les états associés à des valeurs différentes de l forment des sous-couches d’énergies différentes. Les électrons peuplent des sous-couches électroniques successives, en ordre croissant d’énergie. Cette description est cependant trop simpliste, car elle néglige les effets importants de l’interaction spin-orbite, qui sera discutée plus bas dans le contexte nucléaire. 2.4.3 Les nombres magiques Le modèle en couche des atomes prédit qu’un atome est plus stable et son énergie d’ionisation plus élevée si toutes les couches occupées sont remplies à pleine capacité. Des maximums dans l’énergie d’ionisation sont observés aux valeurs suivantes de Z : 2 (He), 10 (Ne), 18 (Ar), 36 (Kr), 54 (Xe), 80 (Hg), 86 (Rn) (2.23) Ce sont tous des gaz rares, sauf le mercure. Les configurations électroniques correspondantes comportent des sous-couches complètement remplies. En particlier, les gaz rares correspondent à des couches s et p complètement remplies. Des nombres magiques sont aussi observés dans les noyaux, par exemple en observant l’énergie nécessaire pour faire passer le noyau à un état excité, ou pour extraire un neutron. Ces nombres magiques nucléaires sont différents des nombres magiques atomiques, et appartiennent à la liste suivante : 2, 8, 20, 28, 50, 82, 126 (2.24) De plus, ils s’appliquent séparément aux neutrons et aux protons, car ces deux espèces ne sont pas identiques et le principe de Pauli qui régit le remplissage des couches ne s’applique qu’entre protons ou entre neutrons. Un noyau qui comporte à la fois un nombre magique de protons et de neutrons est qualifié de “doublement magique”. Les évidences expérimentales appuyant l’existence des nombres magiques dans les noyaux sont les suivantes : 1. L’énergie de liaison montre des déviations par rapport à la formule de Bethe-Weizsäcker quand N ou Z est magique. 2. L’énergie de séparation des protons a un maximum local aux nombres magiques; l’énergie de séparation est l’énergie requise pour enlever un proton au noyau. La même remarque s’applique à l’énergie de séparation des neutrons. 32 2. Modèles élémentaires du noyau 3. Les éléments à Z magique possèdent plus d’isotopes que la moyenne. De même, les nuclides à N magique possèdent plus d’isotones que la moyenne. 4. Les éléments à Z magique ont une abondance plus grande que celle des éléments voisins dans le tableau périodique. 5. Les nuclides à N magique ont une section d’absorption de neutrons plus petite que la normale. Autrement dit, ils ont une probabilité plus faible d’absorber un neutron qui passe. 6. Les premiers états excités de spin-parité 2+ ont une énergie d’excitation anormalement élevée si Z ou N est magique. 2.4.4 Forme du potentiel nucléaire Nous allons présenter un argument semi-quantitatif en faveur d’un potentiel nucléaire impliquant une interaction spin-orbite, en se basant sur les nombres magiques observés. Considérons à cet effet la figure 2.7. À gauche, on indique la position des niveaux d’énergie d’une particule dans un potentiel harmonique tridimensionnel. Remarquons que les niveaux d’énergie sont espacés de manière uniforme. Chaque niveau, sauf les deux premiers, comptent des états de plusieurs valeurs différentes du nombre quantique orbital l : les états à l pairs alternent avec les états à l impair.1 On indique à côté de chaque niveau le nombre de protons (ou de neutrons) associé à un remplissage complet de ce niveau et des niveaux qui lui sont inférieurs, en comptant 2 particules par état, en raison du spin- 12 des nucléons. Au milieu, on indique les niveaux correspondant à un potentiel nucléaire réaliste, différent du potentiel quadratique de l’oscillateur harmonique. Ce potentiel ressemble à celui de l’oscillateur harmonique, sauf qu’il est tronqué à une valeur a du rayon, correspondant à la portée courte du potentiel nucléaire moyen. L’effet de cette troncature est de diminuer l’énergie de tous ls états, à des degrés variables. Plus la fonction d’onde s’étale sur les grandes valeurs de r, plus l’énergie est diminuée. En particulier, plus l est élevé, plus le potentiel centrifuge est important et plus la fonction d’onde est déplacée vers l’extérieur, et donc plus l’énergie du niveau est abaissée. Ceci a comme conséquence immédiate de lever la dégénérescence des niveaux de l’oscillateur harmonique tridimensionnel, comme indiqué sur la figure. On a ici aussi indiqué le nombre de nucléons d’une espèce donnée (proton ou neutron) associé à un remplissage complet d’un niveau et de ceux qui lui sont inférieurs. Cependant, il y a maintenant des “sous-couches”. Les nombres magiques doivent correspondre à des différences d’énergie importantes entre des niveaux successifs, de sorte qu’il coûte une énergie anormalement élevée pour ajouter un nucléon de l’espèce considérée au noyau. On voit que les trois premiers nombres magiques (2, 8 et 20) se comprennent facilement à la fois dans le potentiel harmonique comme dans le potentiel nucléaire réaliste. Cependant, les nombres magiques plus élevés ne peuvent pas être observés dans le potentiel nucléaire réaliste simple. Ils peuvent cependant être compris si on ajoute au potentiel réaliste une interaction spin-orbite : on suppose que le potentiel nucléaire total a la forme V (r) + W (r)L · S 1 (2.25) Nous verrons, dans un chapitre ultérieur, comment cette dégénérescence est reliée à une symétrie plus grande que la seule invariance par rotation, caractérisée par le groupe SU(3). 2.4. Le modèle en couches des noyaux 4s, 3d, 2g, 1i 168 3p, 2f, 1h 3s, 2d, 1g 2p, 1f 2s, 1d 112 70 40 20 8 1p 2 1s Oscillateur harmonique 33 1j 198 4s 3d 2g 168 166 156 1i 138 3p 112 2f 106 1h 92 3s 2d 70 68 1h11/2 3s1/2 1g 58 1g7/2 2p 40 1f 34 2s 20 1d 1p 8 1s 2 Potentiel réaliste 4s1/2 3d3/2 2g7/2 3d 1j15/2 5/2 1i 2g9/2 11/2 126 3p1/2 2f 3p3/2 5/2 1i13/2 1h9/2 2f7/2 82 2d3/2 2d5/2 1g9/2 1f5/2 2p1/2 2p3/2 1f7/2 2s1/2 1d3/2 1d5/2 1p1/2 1p3/2 1s1/2 50 28 20 8 2 Potentiel réaliste et interaction spin-orbite Figure 2.7. Schéma des niveaux d’énergie et des couches dans trois modèles : (I) l’oscillateur harmonique 3D, (II) un oscillateur harmonique tronqué (modèle réaliste) et (III) le modèle réaliste additionné d’une interaction spin-orbite. Comme expliqué dans l’annexe qui suit, ce potentiel prend des formes différentes selon la valeur du moment cinétique total j du nucléon : l V (r) + W (r) 2 V (r) + W (r)L · S = l V (r) − + 1 W (r) 2 (j = l + 12 ) (j = l − 1 2) (2.26) 34 2. Modèles élémentaires du noyau En supposant que W (r) < 0, il cause un diminution supplémentaire de l’énergie des états à j = l+ 12 , et une augmentation chez les états à j = l − 12 . L’effet global est illustré sur la troisième colonne de la figure 2.7 : les niveaux à l donné sont séparés en sous-niveaux à j et l donnés, et plus l est grand, plus la séparation des sous-niveaux est grande. Ceci fait qu’un sous-niveau peut se rapprocher d’un groupe de niveaux initialement éloigné, et changer du tout au tout les nombres magiques. C’est ainsi qu’on retrouve les nombres magiques observés et indiqués sur la figure. 2.5 Annexe : L’addition des moments cinétiques et l’interaction spin-orbite Considérons une particule (par exemple un électron autour du noyau, ou encore un nucléon dans le potentiel nucléaire moyen) possédant un moment cinétique orbital L et un moment cinétique de spin S. Ces deux moments cinétiques agissant dans des espaces différents, ils commutent : [La , Sb ] = 0, où a, b = x, y, z. Le moment cinétique total de la particule est la somme vectorielle J=L+S (2.27) Les composantes de J agissent dans l’espace global (orbital + spin), et obéissent aussi aux règles de commutation générales du moment cinétique. Si le hamiltonien commute avec toutes les composantes de L et de S, il est alors utile d’utiliser une base des états propres communs à L2 , Lz , S2 et Sz . Comme S2 est une constante pour une particule donnée, sa valeur n’est pas nécessaire pour spécifier un état, de sorte qu’on peut paramétriser un état par trois nombres quantiques : l, lz et sz . Cependant, dans certains cas, le hamiltonien de commute pas avec L et S séparément, mais seulement avec le moment cinétique total J. Autrement dit, le moment cinétique de spin et le moment cinétique orbital ne sont pas séparément conservés; seul le moment cinétique total l’est. C’est le cas notamment d’une interaction spin-orbite, c’est-àdire d’un potentiel qui a la forme suivante : W (r)L · S (2.28) Dans ce cas, il est préférable d’utiliser une base des états propres de J2 et de Jz . On remarque cependant que L2 et S2 commutent aussi avec J, et donc que les quatre opérateurs L2 S2 J2 Jz (2.29) commutent mutuellement. On peut donc choisir une base dont les états propres sont spécifiés par les nombres quantiques (l, s, j, jz ) associés aux opérateurs ci-dessus (dans le même ordre). On constate que J2 = (L + S)2 = L2 + S2 + 2L · S =⇒ L·S= 1 2 J − L2 − S2 2 (2.30) et donc que les valeurs propres de l’opérateur L · S sont 1 [j(j + 1) − l(l + 1) − s(s + 1)] 2 (2.31) Il reste à voir quelles sont les valeurs possibles de j pour des valeurs données de l et de s. C’est le fameux problème de la composition des moments cinétiques, que nous n’expliquerons pas ici en détail. Contentons-nous de donner le résultat principal : Les valeurs possibles de j vont de |l − s| à l + s, par pas entier, et un seul multiplet existe pour une valeur donnée de j (c’est-à-dire qu’il 2.5. Annexe : L’addition des moments cinétiques et l’interaction spin-orbite 35 n’y a qu’une série d’états avec un j donné). En particulier, pour un spin 12 , les deux valeurs de j possibles sont j = l − 21 et j = l + 12 , pourvu que l ≥ 1. Si l = 0, alors j ne peut prendre que la valeur j = s. Résumons différemment : le nombre d’états de spin 21 associés à un moment cinétique orbital l est 2(2l+1). Parallèlement, le nombre d’états associés à un moment cinétique j est 2j + 1. Le nombre total d’états associés à j = l − 21 et j = l + 12 est donc [2(l − 12 ) + 1] + [2(l + 12 ) + 1] = [2l] + [2l + 2] = 4l + 2 = 2(2l + 1) (2.32) soit exactement le même nombre d’états, comme il se doit. L’opérateur L · S peut prendre deux valeurs différentes, selon j : 1 l (l + 12 )(l + 32 ) − l(l + 1) − 34 = 2 2 L·S= 1 (l − 1 )(l + 1 ) − l(l + 1) − 3 = − l + 1 2 2 4 2 2 (j = l + 12 ) (2.33) (j = l − 12 ) Ainsi, les 2l + 2 états associés à j = l + 12 ont une valeur positive de L · S et correspondent à des valeurs de L et de S qui sont dans le même sens. Par contre, les 2l états associés à j = l − 12 ont une valeur négative de L · S et correspondent à des valeurs de L et de S orientées dans des sens opposés. Signalons enfin la notation utilisée pour spécifier un état de nombres quantiques l et j : nLj où n est le nombre quantique principal (caractérisant la partie radiale de la fonction d’onde), L est la lettre associée au nombre quantique orbital (s, p, d, f, h, i, etc.) et j est le nombre quantique du moment cinétique total. Par exemple, on écrit1p1/2 , 2d3/2 , etc. Problèmes Problme 2.1 Si ρ(r) représente la densité de charge dans un noyau de numéro atomique Z, alors le facteur de forme F (q 2 ) est défini comme Z 1 F (q 2 ) = d3 r e−iq·r ρ(r) Ze On suppose ici que la densité ρ ne dépend que de la distance au centre du noyau et non de la direction dans l’espace. a) Montrez que F (q 2 ) = 1 4π Ze q Z ∞ dr rρ(r) sin qr 0 b) Montrez que dF (q 2 ) 1 = − hr2 i dq 2 q2 =0 6 où hr2 i représente la valeur moyenne de r2 dans la distribution de charge du noyau. Indice : un développement limité de résultat de (a) en puissances de q peut être la voie à suivre, mais ce n’est pas la seule. 36 2. Modèles élémentaires du noyau c) Calculez le facteur de forme dans le modèle I : ρ(r) = et dans le modèle II : ρ(r) = ρ0 0 ρ0 1 + exp (r ≤ a) (r > a) r−a d avec les paramètres a = 7fm et d = 0.5fm (le paramètre a s’applique aux deux modèles). Notez que ρ0 est ajusté de manière à ce que F (0) = 1. Faites le calcul analytiquement pour le modèle I et numériquement (avec Mathematica) pour le modèle II. Faites un graphique de q 2 F (q 2 ) en fonction de q dans l’intervalle q ∈ [0, 4]fm−1 , pour les deux modèles (superposez les graphiques) et commentez sur la différence entre les deux modèles. Problme 2.2 Le muon est une particule élémentaire, cousin massif de l’électron avec les mêmes propriétés que celui-ci, sauf pour sa masse (105.7 MeV) et le fait qu’il soit instable (vie moyenne dans le vide de 2.197 µs). Les muons sont un produit secondaire des rayons cosmiques, et peuvent être également produits copieusement par des faisceaux de protons incidents sur la matière. Un muon qui pénètre dans un matériau sera ralenti par ses collisions successives avec les électrons et finira souvent, avant même de se désintégrer, par être capturé par un atome. Il tombe alors dans une orbite, comme l’électron, sauf qu’il n’est pas exclu des orbitales basses par le principe de Pauli (n’étant pas identique à l’électron) et que le rayon de son orbite (c’est-à-dire la dimension de son orbitale) est beaucoup plus petit en raison de sa plus grande masse. On utilise couramment ces atomes “muoniques” pour déterminer plus précisément la taille et la forme des noyaux. a) Quel est le rayon caractéristique (l’équivalent du rayon de Bohr pour l’atome d’hydrogène) de l’orbitale 2s du muon en présence d’un noyau de 126 C ? Exprimez votre réponse en fm. Supposez que le noyau est ponctuel. b) Quelle est l’énergie de liaison de cet état 2s, en eV? Si le noyau n’est plus ponctuel, mais de rayon a, avec une distribution de charge uniforme, l’énergie de cet état 2s est légèrement modifiée. La théorie des perturbations stationnaires dicte que le changement d’énergie d’un état |ψi attribuable à une perturbation V est ∆E = hψ|V |ψi. Dans le cas qui nous occupe, la perturbation V est la différence entre le potentiel d’une charge ponctuelle et celui d’une distribution de charge uniforme dans une sphère de rayon a : Z ρ0 1 V (r) = −Ze2 d3 r0 − |r − r0 | r 4 3 où l’intégrale est prise dans la sphère de rayon a et ρ−1 0 = 3 πa . Cette perturbation, naturellement, s’annule si r > a, car le champ électrique en dehors d’une sphère uniformément chargé est le même que celui d’une charge ponctuelle. c) Calculez le déplacement du niveau d’énergie de l’état 2s du muon dû au caractère étendu de la distribution de charge du noyau. Vous pouvez supposer que a est beaucoup plus petit que le rayon de Bohr du muon, de sorte que la fonction d’onde du muon est pratiquement constante à l’intérieur de la sphère. Vous pouvez utiliser une connaissance préalable du rayon de Bohr et de la forme explicite de la fonction d’onde de l’état 2s. Il est en fait pratique de faire ce calcul en fonction des transformées de Fourier et d’utiliser le résultat des notes pour le facteur de forme associé à la distribution de charge. Exprimez votre réponse en fonction de Z, e, a et mµ (la masse du muon). Réponse partielle : pour 126 C et a = 2.75 fm, le déplacement est d’environ 42 eV. 2.5. Annexe : L’addition des moments cinétiques et l’interaction spin-orbite 37 Problme 2.3 La plupart des termes qui sont motivés par le modèle de la goutte liquide sont des termes d’énergie potentielle. Il faut aussi tenir compte de l’énergie cinétique, qui donne naissance au terme d’asymétrie. Pour cela, nous adoptons ici le modèle du gaz de Fermi, qui traite les nucléons comme des particules libres dans un volume restreint égal au volume du noyau, soit V = 34 πr03 A, où r0 est le “rayon” d’un nucléon. Les neutrons et les protons obéissent séparément au principe de Pauli, mais pas ensemble, et ont chacun un spin 21 . Le modèle s’applique strictement au cas où N et Z sont grands. Pour les fins du problème, on négligera la différence de masse entre proton et neutron. a) Montrer que l’énergie de Fermi dans un gaz de N neutrons, soit l’énergie du dernier neutron ajouté au gaz, est 1 9πN 2/3 EF = 4A 2mr02 Que vaut cette énergie numériquement, si r0 = 1.2 fm et N = A/2? b) Montrez que l’énergie cinétique totale du gaz de nucléons (protons et neutrons) est E = 35 (N EF (n) + ZEF (p)) où EF (n) est l’énergie de Fermi du gaz de neutrons et EF (p) celle du gaz de protons. c) En posant ε = N − Z, montrez que l’énergie cinétique totale du gaz de nucléons est approximativement (pour ε petit) 3 1 ε2 E(A) = EF A + EF 5 3 A Ceci justifie le terme d’asymétrie (le permier terme ci-haut contribue au terme de volume de la formule semi-empirique). Problme 2.4 Jouons avec la formule de Bethe-Weizsäcker. a) À l’aide des coefficients de cette formule donnés dans les notes et en ne considérant que les noyaux à A impair, tracez un graphique sur le plan Z − N sur lequel on retrouve (i) la courbe de stabilité, (ii) la courbe d’émission de protons (proton drip line) et (iii) la courbe d’émission de neutrons (neutron drip line). Rappelons que la courbe de stabilité est fixée par la valeur de Z qui, pour un A donné, maximise l’énergie de liaison. La courbe d’émission de protons est le lieu géométrique dans le plan Z − N où l’émission d’un proton est tout juste favorable énergétiquement, et pareillement pour la courbe d’émission de neutrons. Utilisez Mathematica pour faire les calculs et les graphiques. La fonction Mathematica FindRoot sera utile pour solutionner numériquement les conditions énergétiques requises. b) Toujours avec les même outils informatiques, trouver la valeur de Z sur la courbe de stabilité à partir de laquelle l’émission d’une particule alpha est énergétiquement favorable. L’énergie de liaison de la particule alpha est de 28.3 MeV. CHAPITRE 3 Instabilités nucléaires 3.1 Processus alpha, bêta et gamma On sait depuis le tout début du XXe siècle que les substances radioactives émettent trois types de particules (ou rayons, comme on les appelait à l’époque) : alpha, bêta et gamma. Les rayons alpha sont des noyaux d’hélium (42 He), les rayons bêta sont des électrons et les rayons gamma sont des photons de haute énergie. Ces trois types de rayonnement sont associés à trois types de désintégrations très différents, impliquant trois interactions fondamentales distinctes. 4+ 3+ 6,01 MeV 5,24 2+ 4+ 4,24 4,12 (28%) γ 2+ (72%) γ α 4,983 MeV 4,938 4,835 4,676 242 94 Pu 74% 26% 0,11% 1,5x10−3% 1,37 γ 0 0 + + 24 12Mg (a) 6+ 4+ 2++ 0 238 92 U 4307,2 keV 148,4 44,9 0 (b) Figure 3.1. (a) diagramme de transition entre différents états d’un nuclide, par émission gamma. On indique le spin et la parité de chaque état. (b) La même chose, pour une émission alpha. 3.1.1 Émission gamma L’émission d’un rayon gamma par un noyau est comparable en principe à celle d’un photon par un atome dans un état excité. Cette émission n’entraı̂ne aucun changement dans la composition du noyau, mais seulement en changement dans son état. Le modèle en couche explique cette émission comme le fruit de la désexcitation d’un nucléon d’une couche supérieure vers une couche inférieure. Indépendamment du modèle utilisé pour décrire le noyau, il s’agit en fait d’un passage du noyau 3.1. Processus alpha, bêta et gamma 39 ∗ d’un état excité, souvent indiqué par un astérisque (A Z Sy ), vers l’état fondamental du noyau, ou vers un autre état excité, d’énergie plus basse : A ∗ Z Sy →A Z Sy + γ Cependant, comme c’est un photon qui est émis, le processus de transition est nécessairement gouverné par l’interaction électromagnétique, même si les états initial et final du noyau sont déterminés en majeure partie par l’interaction forte. Les vies moyennes associés à ces processus peuvent varier énormément, en fonction de l’énergie du photon émis et du spin de l’état excité. La figure 3.1a illustre un diagramme de transition entre différents états d’un noyau de 24 12 Mg. Chaque état nucléaire est caractérisé par une énergie, une valeur du moment cinétique total du noyau et une parité (+ ou −).1 Plusieurs transitions gamma possibles sont indiquées. 3.1.2 Émission bêta La forme élémentaire d’émission bêta est la désintégration du neutron libre : n → p + e− + ν̄e (τ = 886 s) (3.1) Il s’agit d’une désintégration à trois corps. Le neutrino, cependant, est difficilement détectable. L’hypothèse de son existence a été formulée par Pauli (1930) afin d’expliquer l’apparente non conservation de l’énergie, de la quantité de mouvement et du moment cinétique dans l’émission bêta si on admet qu’il n’y a que deux particules dans l’état final. Ce processus est gouverné par l’interaction faible. Les vies moyennes relativement longues (par rapport à l’émission gamma) s’expliquent justement par la faiblesse de l’interaction. La désintégration du neutron est un processus impliquant 4 particules : le neutron, le proton, l’électron et le neutrino. Un processus équivalent peut se produire lors d’une réaction, par exemple p + e− ↔ n + νe Nous verrons plus tard comment la plupart des particules élémentaires peuvent aussi exister sous la forme d’une antiparticule, ayant les mêmes propriétés que la particule en ce qui a trait à la masse et aux interactions, sauf pour l’inversion de la charge électrique (ou des autres “charges” reliées aux interactions fondamentales). Ainsi, l’anti-électron est appelé positron et noté e+ . Le neutrino νe possède aussi une antiparticule, notée ν̄e . Une règle fondamentale de la théorie des particules élémentaires stipule que lorsqu’une particule participe à un processus dans un état initial, un autre processus est possible dans lequel l’antiparticule existe dans l’état final, ou vice-versa. Ainsi, la réaction n + νe → p + e− correspond à la désintégration n → p + e− + ν̄e , où le neutrino initial est devenu un antineutrino dans l’état final. De même, ce pourrait être l’électron qui change de rôle et on pourrait en principe observer la désintégration du proton p → n + e+ + νe (3.2) sauf, évidemment, que la masse du neutron est plus élevée que celle du proton et donc ce processus est impossible par conservation de l’énergie. Cependant, le bilan énergétique peut être différent dans un noyau. L’émission bêta peut alors prendre trois formes : 1 Rappelons que la parité d’un état est son comportement, pair ou impair, face à une inversion des coordonnées. 40 3. Instabilités nucléaires 1. L’émission par le noyau d’un électron et d’un antineutrino, accomagnée de la conversion d’un neutron en proton : (A, Z) → (A, Z − 1) + e− + ν̄e émission β − (3.3) 2. L’émission par le noyau d’un positron et d’un neutrino, accompagnée de la conversion d’un proton en neutron : (A, Z) → (A, Z + 1) + e+ + νe émission β + (3.4) 3. La capture, par un proton du noyau, d’un électron atomique dans un état s, suivi de leur conversion en neutron et neutrino : (A, Z) + e− → (A, Z − 1) + νe capture d’électron (EC) (3.5) On désigne par la lettre Q l’énergie cinétique disponible dans l’état final, soit la différence entre les masses des constituants initiaux et les constituants finaux. Il faut bien sûr que Q > 0 pour que le processus se réalise. En clair, Qβ − = M (A, Z) − M (A, Z + 1) − me Qβ + = M (A, Z) − M (A, Z − 1) − me (3.6) QEC = M (A, Z) − M (A, Z − 1) + me Il peut être utile d’exprimer ces conditions non pas en fonction des masses nucléaires M (A, Z), mais des masses atomiques M(A, Z) = M (A, Z) + Zme (3.7) où nous avons ajouté les masses des Z électrons de l’atome. Nous avons négligé ici l’énergie de liaison des atomes, de l’ordre de quelques eV, très petite en comparaison de l’énergie de liaison nucléaire. En fonction des masses atomiques, les valeurs de Q deviennent Qβ − = M(A, Z) − M(A, Z + 1) Qβ + = M(A, Z) − M(A, Z − 1) − 2me (3.8) QEC = M(A, Z) − M(A, Z − 1) L’émission bêta, lorsqu’elle est énergétiquement possible, va se produire inévitablement. Ce processus change Z sans affecter A, et permet typiquement à des nuclides éloignés de la courbe de stabilité de s’en rapprocher. De plus, l’émission bêta est généralement suivie d’un émission gamma. Les noyaux produits par l’émission bêta ne sont pas dans leur état fondamental, et émettent un ou plusieurs photons avant d’y accéder. Les deux processus (bêta et gamma) sont donc étroitement liés en pratique. 3.1. Processus alpha, bêta et gamma 41 3.1.3 Émission alpha L’émission alpha est un processus d’éjection d’un noyau d’hélium par un noyau instable. Ce processus est gouverné par l’interaction forte, principalement, quoique l’interaction électrique joue un rôle important, comme nous allons le voir. L’émission alpha est en principe possible si Qα > 0, où Qα = M (A, Z) − M (A − 4, Z − 2) − M (4, 2) (3.9) Un calcul rapide basé sur la formule de Bethe-Weizsäcker montre que le bilan énergétique est favorable à l’émission alpha le long de la courbe de stabilité si A > 150 environ. Cependant, dans le domaine A ≥ 144, seuls 7 émetteurs alpha existent parmis les nuclides “naturels”. En fait, le plus frappant dans l’ensemble des émissions alpha possibles est la variation des vies moyennes d’un processus à l’autre. Le plus lent des processus observés est 232 90 Th → 228 88 Ra + α (τ = 2.03 × 1010 y) (3.10) → 208 82 Pb + α (τ = 4.3 × 10−7 s) (3.11) alors que le plus rapide est 212 84 Po 22 ordres de grandeurs séparent ces deux vies moyennes. Nous verrons que cette diversité de vies moyennes se comprend par une théorie de l’émission alpha basée sur l’effet tunnel. 238 La figure La figure 3.1b illustre un diagramme de transitions alpha entre le 242 94 Pu et le 93 U. Les 238 différentes émissions correspondent à des états différents du nuclide 93 U, et sont suivies, sauf pour la plus énergétique, par une émission gamma. Les différentes énergies des particules alpha impliquées sont indiquées, ainsi que les rapports d’embranchements, c’est-à-dire les probabilités relatives de transition. 93080 masse atomique (MeV) 94005 93075 EC,β + EC,β + 94000 93070 β– β– β– EC,β + 93995 β– 41 42 β– 43 44 Z EC,β 45 EC,β + 93065 EC + 93060 46 47 40 41 42 EC,β + β– 43 44 45 46 Z Figure 3.2. À Gauche : Diagramme de masse atomique des nuclides associé à A = 101. À droite : la même chose, pour les nuclides associés à A = 100. 47 42 3. Instabilités nucléaires 3.2 Séquences radioactives 3.2.1 Stabilité des nuclides par émission bêta Considérons la partie gauche de la figure 3.2. Elle indique les masses atomiques des isobares à A = 101. Les cercles noirs sont obtenus de la formule de Bethe-Weizsäcker (BW), alors que les cercles vides sont les valeurs réelles. En raison de la dépendance quadratique en Z de l’énergie de liaison dans la formule de Bethe-Weizsäcker, les cercles noirs tombent sur une parabole. Le nuclide ayant la plus petite masse atomique est le 101 44 Ru. Tous les nuclides situés à sa gauche peuvent se − convertir en 101 Ru par émissions β successives, et tous les nuclides situés à droite peuvent subir le 44 même sort par captures électroniques successives, car les conditions Q > 0 sont toujours satisfaites d’après l’éq. (3.8), à la fois pour les valeurs prédites par la formule de Bethe-Weizsäcker et pour les valeurs réelles des masses atomiques. De plus, tous les nuclides situés à droite (Z > 44) peuvent se convertir par émissions β + successives, d’après les valeurs données par la formule semi-empirique. En réalité, l’émission β + n’est pas énergétiquement possible entre Z = 45 et z = 44, mais la capture électronique l’est. Conclusion : le seul nuclide stable est le 101 44 Ru. En général, la même conclusion s’applique à tous les isobares à A impair, en raison de l’absence du terme d’appariement : Il n’y a au plus qu’un seul isobare stable pour les valeurs impaires de A. Cette règle est vérifiée par l’observation. Le “au plus” est ajouté pour laisser la porte ouverte à d’autres formes d’instabilité, par émission alpha par exemple. Considérons maintenant la partie droite de la figure 3.2. Elle indique maintenant les masses atomiques des isobares à A = 100. Les masses atomiques tirées de la formule de Bethe-Weizsäcker sont situées sur deux paraboles, en alternance, en raison du terme d’appariement qui distingue les nuclides pair-pair des nuclides impair-impair. Cette alternance fait que la chaı̂ne de désintégrations bêta peut être interrompue par une condition énergétique défavorable, et donc que plus d’un isobare stable peuvent coexister. En fait, la formule de Bethe-Weizsäcker nous pousse à émettre les hypothèses suivantes : 1. Il n’y a pas de nuclide impair-impair stable. 2. Les nuclides pair-pair peuvent avoir plus d’un isobare stable. La deuxième hypothèse est vraie. La première est presque vraie : les exceptions sont rares. Parmis 14 les nuclides légers, quatre nuclides impair-impair stables existent : 11 H, 63 Li, 10 5 B et 7 N. Seule180 ment deux autres nuclides impair-impair sont stables : 50 23 V et 73 Ta; en fait, la désintégration est énergétiquement possible dans ces deux cas, mais les taux de transitions sont trop petits pour être observés. 3.2.2 Séquences d’émission alpha et bêta L’émission alpha, lorsqu’elle est possible, diminue A par 4 et Z par deux. Dans le plan Z − N , elle procède par sauts de (∆Z, ∆N ) = (−2, −2). Typiquement, l’émission alpha d’un nuclide lourd donnera naissance à une séquence radioactive, tel qu’illustré à la figure 3.3. Dans une telle séquence, émissions alpha et bêta se succèdent afin de ramener les produits le plus près possible de la courbe de stabilité. Bien entendu, toutes ces transmutations sont ponctuées d’émissions gamma (non indiquées) car les noyaux produits ne sont pas toujours dans leur état fondamental. Si une telle séquence est observée aujourd’hui, c’est que le début de cette séquence est un processus extrêmement lent, avec une vie moyenne excédant le milliard d’années. En supposant que des nuclides très massifs aient un jour existé, ils seraient disparus de longue date par émission alpha, dans une séquence radioactive qui aurait trouvé son goulot d’étranglement dans une transition particulièrement lente, comme la désintégration du 238 92 U. Comme l’émission alpha change A par 3.2. Séquences radioactives 43 τ Qα (MeV) 238 92 U 234 90Th 234 91 Pa 4,27 6.45×109 a 4,86 3.53×105 a 4,77 1.12×105 a 4,87 2 310 a 5,59 5.51 j 6,11 4.40 m (a) 5,62 94 j 237 µs 234 92 U 230 90Th 226 88 Ra 222 86 Rn 218 84 Po 214 82 Pb 214 83 Bi 214 84 Po (a) 210 81Tl (b) 210 82 Pb 210 83 Bi 210 84 Po 206 82 Pb Figure 3.3. Séquence radioactive issue de (b) 7,83 5,41 200 j 238 U. 92 4, on pourrait s’attendre à 4 séquences distinctes. En fait, trois sont observées, car une émission alpha particulièrement lente les empêche de se vider dans un temps comparable à l’âge du système solaire. Les points de départ et les aboutissements de ces trois séquences sont : 238 92 U → 206 82 Pb 235 92 U → 207 82 Pb 232 90 Th → 208 82 Pb (3.12) 3.2.3 Équilibre séculaire Le caractéristique fondamentale d’une telle séquence est la lenteur de la première émission alpha : sa vie moyenne excède le milliard d’années. Tous les autres processus sont beaucoup plus rapides, allant de 300 000 ans à 10−4 s. Même si certains processus de la séquence sont extrêmement rapides, on peut en observer tous les chaı̂nons, car ils sont constamment alimentés par la désintégration des éléments supérieurs de la séquence. Ainsi, même si le 226 86 Ra a une vie moyenne de 2 300 ans seulement, on en retrouve encore dans les minéraux d’uranium, en faible concentration cependant. Voyons comment les populations des différents nuclides de la séquence sont reliées. Numérotons les nuclides d’une séquence de 1 jusqu’à n, et soit N1 , N2 , etc. les populations des différents nuclides dans un échantillon naturel. Pour simplifier, supposons que chaque nuclide se désintègre vers le suivant, selon un seul canal (ou chemin) de désintégration. Si on note ω1 , ω2 , etc les taux de désintégration, les populations des différents nuclides sont gouvernées par le système suivant 44 3. Instabilités nucléaires d’équations différentielles : dN1 = −ω1 N1 dt dN2 = −ω2 N2 + ω1 N1 dt dN1 = −ω3 N3 + ω2 N2 dt ··· On peut représenter ce système en notation matricielle, comme suit : −ω 0 0 N 1 1 0 ω1 −ω2 N2 dN −ω 0 ω 2 3 = W N où N = N et W = 3 dt 0 0 ω 3 .. .. .. .. . . . . La solution générale à un tel système d’équations est de la forme X Na (0)eλa t N (t) = (3.13) 0 0 0 −ω4 .. . ··· ··· ··· ··· .. . (3.14) (3.15) a où les valeurs propres de la matrice W sont notées λa (a = 1, 2, 3, . . .). Comme la matrice W est nulle au-dessus de sa diagonale, ses valeurs propres sont justement ses éléments diagonaux. On a donc X N (t) = Na (0)e−ωa t (3.16) a On suppose maintenant que ω1 ωa (a > 1), c’est-à-dire que la première désintégration de la séquence est beaucoup plus lente que toutes les autres. Comme le temps initial remonte à la formation même des éléments (lors d’une explosion de supernova), on peut négliger tous les facteurs e−ωa t sauf le premier, et ne rechercher que la première de ces solutions, soit celle qui décroı̂t dans le temps comme e−ω1 t . Cette solution est telle qu’on peut remplacer, dans le système d’équations, toutes les dérivées temporelles par −ω1 et on obtient l’équation du vecteur propre associé à la valeur propre −ω1 : −ω1 N1 = −ω1 N1 −ω1 N2 = −ω2 N2 + ω1 N1 (3.17) −ω1 N3 = −ω3 N3 + ω2 N2 ··· En négligeant maintenant ω1 devant ω2 , ω3 , etc., on trouve la condition ω1 N1 = ω2 N2 = ω3 N3 = · · · (3.18) qui caractérise un équilibre séculaire des populations, c’est-à-dire des valeurs presque constantes, en fait variant très lentement dans le temps. Ainsi, la population d’un nuclide dans un échantillon naturel (qu’on peut supposer avoir été composé exclusivement du nuclide initial de la séquence dans un passé lointain) est inversement proportionnelle à son taux de désintégration. 3.3. Théorie de l’émission alpha 45 3.3 Théorie de l’émission alpha 3.3.1 Mécanisme de l’émission alpha La caractéristique la plus frappante de l’émission alpha est la grande variation dans les taux de désintégration observés, comme mentionné plus haut. Ceci mène à l’hypothèse que l’émission alpha est le résultat d’un effet tunnel, car il est bien connu que le taux de pénétration d’une barrière par effet tunnel dépend de manière très sensible de la hauteur de de la largeur de la barrière. V (r) E α R b r ppnn Figure 3.4. Formation d’une particule alpha dans un noyau et diagramme énergétique contrôlant son émission par effet tunnel. On peut comprendre l’émission alpha à peu près de cette manière. Considérons deux protons et deux neutrons du noyau, dans la couche occupée la plus élevée. Si ces quatre nucléons formaient, à l’intérieur du noyau, une particule alpha, l’énergie de liaison gagnée par ce processus (28.3 MeV) pourrait propulser la particule vers une énergie supérieure à zéro à l’intérieur du noyau (voir fig. 3.4).2 Cependant, cette particule ne peut pas s’échapper du noyau, car le potentiel V (r) qu’elle subit, dominé par l’interaction forte, comporte tout-de-même une barrière électrostatique considérable. Cette barrière, bien-sûr, peut empêcher une particule alpha provenant de l’extérieur de pénétrer dans le noyau, comme dans l’expérience de Rutherford. Mais elle joue aussi le rôle inverse. Classiquement, la particule alpha est donc prisonnière du noyau. Lord Kelvin, au début du siècle, avait émis l’hypothèse que la radioactivité, en particulier l’émission de particules alpha, était un phénomène d’activation thermique, par lequel certaines parties de l’atome (c’est-à-dire du noyau) étaient éjectées par-dessus une barrière de potentiel. Rutherford a clairement démontré la fausseté de cette interprétation, en remarquant que l’énergie des particules alpha émises par les sources courantes était trop faible pour pénétrer à l’intérieur des noyaux (car celles-ci étaient diffusées par la répulsion coulombienne). Elle n’avaient donc pas l’énergie nécessaire pour traverser cette barrière de potentiel. C’est donc par effet tunnel qu’elles doivent s’échapper. 2 Plus précisément, on peut affirmer que la fonction d’onde des quatre nucléons (ppnn) dans le noyau comporte une projection non nulle vers la fonction d’onde de l’état fondamental du noyau d’hélium. Il n’y a donc pas “formation” de particule alpha, mais la particule alpha est toujours présente, avec une certaine amplitude de probabilité. 46 3. Instabilités nucléaires 3.3.2 Calcul élémentaire du taux de désintégration L’effet tunnel est le plus souvent étudié dans le contexte d’un problème simple : celui d’une barrière de potentiel en une dimension. Considérons donc une telle barrière, de largeur ` et de hauteur V0 . Supposons que cette barrière s’étend de x = 0 à x = ` et considérons une particule dans un état d’onde plane d’énergie cinétique E, incidente sur la barrière en provenance de la gauche. Dans les trois régions de l’espace, la fonction d’onde de cette particule a les formes suivantes : ikx −ikx (x < 0) e + Ae p √ −qx qx (3.19) ψ(x) = Be k = 2mE , q = 2m(V − E) + Ce (0 < x < `) ikx De (x > `) La probabilité que la particule franchisse la barrière est T = |D|2 et porte le nom de coefficient de transmission. Les constantes A, B, C, D sont déterminées en imposant la continuité de la fonction d’onde et de sa dérivée à x = 0 et x = `. On montre que −1 2 4qk (k 2 + q 2 )2 2 ≈ [cosh(2q`) − 1] e−2q` si (eq` 1) (3.20) T = |D| = 1 + 8q 2 k 2 k2 + q2 Essentiellement, si le coefficient de transmission est petit, c’est qu’il décroı̂t exponentiellement avec p la largeur de la barrière et avec q = 2m(V0 − E). La situation présente n’est pas tout-à-fait équivalente, car la particule alpha à l’intérieur du noyau n’est pas dans un état d’onde plane en provenance d’un point éloigné. Un traitement élémentaire et intuitif de la probabilité d’émission suppose que la particule alpha fait des aller-retour à l’intérieur du noyau, à une fréquence v/2R, où v est sa vitesse, et qu’à chaque fois qu’elle frappe la paroi elle tente une percée par effet tunnel, réussie avec une probabilité T . Pour une barrière de forme quelconque (et non simplement carrée), le coefficient de transmission aurait la forme suivante : Z b p −G dr 2m(V (r) − E) T ∼e où G = 2 (3.21) R où r = R et r = b sont les bornes de la barrière de potentiel (voir fig. 3.4), soit les points où le vecteur d’onde de la particule alpha redevient réel. Cette expression est l’extension naturelle du R coefficient p de transmission d’une barrière carrée, où q` est remplacé par une intégrale dr q(r) et q(r) = 2m(V (r) − E). Bref, on peut présumer que la probabilité d’émission aura la forme suivante : Z b p v ω= D exp −2 dr 2m(V (r) − E) (3.22) 2R 0 R où D0 est un nombre sans dimensions dépendant de k et de la forme du potentiel, mais dont la valeur est de l’ordre de l’unité, en tout cas pas très différente de cet ordre de grandeur. 3.3.3 Traitement plus rigoureux de la barrière sphérique Le traitement élémentaire de l’émission alpha donné ci-haut est certainement insatisfaisant pour les esprits épris de rigueur. En voici donc un autre, plus rigoureux. On suppose que la particule alpha est dans un état quasi-stationnaire, c’est-à-dire que sa fonction d’onde a la forme suivante : ψ(r, t) = ψ(r)e−iEt (3.23) où E est l’énergie de l’état. Cependant, à la différence d’un état stationnaire ordinaire, cette énergie comporte une petite partie imaginaire : E = E0 − iω/2. Ainsi, l’évolution temporelle de 3.3. Théorie de l’émission alpha 47 l’état est réellement e−iE0 t e−ωt/2 , et la probabilité que la particule reste à l’intérieur d’un rayon donné décroı̂t comme le carré de la fonction d’onde, soit comme e−ωt . On peut donc identifier ω au taux de désintégration de la particule. Supposons que l’état quasi-stationnaire est un état s, donc indépendant des angles en coordonnées sphériques. Pour simplifier le problème, supposons que la barrière de potentiel s’annule exactement pour une valeur suffisamment grande de r, de sorte que la forme de la fonction d’onde dans cette région est celle d’une onde sortante : eikr ψ(r) = C (3.24) r Le courant de probabilité associé à cette forme est k |C|2 1 ∗ ∂ψ r̂ ≈ r̂ (3.25) J = Im ψ m ∂r m r2 Le flux de ce courant de probabilité à travers une sphère de rayon r est précisément la probabilité par unité de temps que la particule s’échappe à l’infini, et est précisément ω= 4πk 2 |C| m (3.26) La perte de probabilité de présence à l’intérieur de la barrière sphérique est directement reliée au flux sortant de probabilité, à l’extérieur de la barrière. En pratique, il est plus simple de calculer la partie imaginaire de l’énergie que de calculer C. C’est ce qui est fait dans le problème 3.1. Ce problème est conseillé à tous ceux qui désirent approfondir le sujet. On y traite d’une barrière sphèrique de hauteur V0 et de largeur `, située entre r = R et r = R + `. On montre que le taux d’émission est 2 4kq qR −2q` v e (3.27) ω= 2 2 2R k + q 1 + qR où v = k/m et k et q sont définis comme plus haut, dans l’exemple de la barrière unidimensionnelle. Ce résultat suppose cependant que e−2q` 1. 3.3.4 Relation entre l’énergie et le taux d’émission Appliquons la relation (3.22) au cas spécifique d’une barrière coulombienne autour d’un noyau de numéro atomique Z : Z b p G=2 dr 2m(V (r) − E) R Z b s √ 1 1 2 = 4 mZe − dr (3.28) r b R ! r r 2 √ R R R −1 − − 2 = 4 mZe2 b cos b b b Supposons maintenant que R b, ce qui est raisonable étant donné la petitesse de R en comparaison p de la distance d’approche d’une particule alpha de E = 1 MeV. On peut alors poser que cos−1 R/b ≈ π/2 et que R/b (R/b)2 . De plus, l’énergie cinétique de la particule alpha à l’infini est égale à son énergie potentielle au point d’émergence b de la barrière : Q = 2Ze2 /b. En exprimant b en fonction de l’énergie de la particule alpha, on trouve donc r √ 2m 2 G ≈ 2πZe − 4 mRZe2 (3.29) Q 48 et 3. Instabilités nucléaires r √ v 2m 2 2 exp − −2πZe + 4 mRZe ω= 2R Q (3.30) En fonction du logarithme, on écrit √ v − 4 mRZe2 + 2πZe2 ln ω = ln 2R r 2m Q (3.31) Nous avons jusqu’ici négligé le recul du noyau. Pour en tenir compte, nous devons passer du problème à un corps au problème à deux corps, en remplaçant la masse m de la particule alpha par la masse réduite µ = mM/(m + M ), où M est la masse du noyau. L’essentiel est cependant que le logarithme du taux d’émission varie comme Q−1/2 . Ceci est à peu près confirmé par l’expérience et tend à confirmer la théorie de l’émission alpha par effet tunnel. Effet de la barrière de moment cinétique Il arrive que le noyau produit par l’émission alpha n’ait pas le même spin que le noyau initial. Comme la particule alpha a un spin nul, ceci implique nécessairement que le moment cinétique orbital entre la particule alpha émise et le noyau produit est non nul. Le potentiel ressenti par la particule alpha dans un état de moment cinétique orbital l n’est plus simplement le potentiel électrostatique, mais comporte aussi un potentiel centrifuge L2 /2mr2 : V (r) = l(l + 1) 2Z 2 e2 + 2mr2 r (3.32) Ceci contribue à augmenter la vie moyenne (diminuer le taux d’émission) dans ce cas. Problèmes Problme 3.1 Dans ce problème, nous cherchons à calculer le taux de désintégration d’un état quasi-stationnaire formé d’une particule prisonnière d’un puits de potentiel sphérique simple. On considère une particule de masse m dans un potentiel sphérique ayant la forme suivante : (r < R) 0 V (r) = V0 (R < r < R + `) 0 (r > R + `) Autrement dit, la particule est confinée par une barrière sphérique de hauteur V0 et d’épaisseur `. On pose ici que la fonction d’onde de la particule se factorise comme ψ(r, t) = ψ(r)e−iEt où E = E0 − iω/2 et on considère un état s, de sorte que ψ(r) ne dépend que de la coordonnée radiale r. On peut supposer que ω E0 . On définit aussi, comme c’est habituellement le cas dans les problèmes sphériques, u(r) = rψ(r). a) Établissez les équations différentielles obéies par u dans les trois régions d’intérêt : (i) r < R, (ii) R < r < R + `, (iii) r > R + `. Exprimez vos solutions en fonction de p √ k = 2mE et q = 2m(V0 − E) 3.3. Théorie de l’émission alpha 49 b) En appliquant les conditions de continuité approrpiées à r = R et r = R + `, montrez qu’une solution à l’équation de Schrödinger n’est possible que si la contrainte suivante est respectée : k k q + ik tan(kR) + = e−2q` tan(kR) − q q q − ik c) Supposons maintenant que ` → ∞, de sorte que la particule est prisonnière à jamais du puits, c’est-à-dire que ω = 0. Quelle est la valeur minimum de V0 afin qu’il y ait au moins un état lié dans le puits? Que sont k et E0 à cette valeur de V0 ? d) Supposons maintenant que V0 est assez grand pour qu’au moins un état lié existe dans le puits. Supposons maintenant que ` est fini, mais que e−2q` est tout-de-même très petit. En posant que k0 est la valeur de k associée à un état stationnaire dans la limite e−2q` → 0 et que, en dehors de cette limite, on puisse poser k = k0 + δk où δk k0 , montrez que le taux de désintégration est 2 4kq qR −2q` v e ω= 2R k 2 + q 2 1 + qR où v est la vitesse de la particule dans le puits. CHAPITRE 4 Réactions nucléaires 4.1 Modèle du noyau composé N. Bohr est à l’origine non seulement du modèle de la goutte liquide, mais aussi d’une idée qui lui est étroitement reliée : le noyau composé. L’idée de base est qu’un projectile qui entre en collision avec un noyau forme avec celui-ci un noyau composé, qui a une existence propre pendant un bref laps de temps avant de se désintégrer. Plus précisément, les nucléons du noyau cible se comportent de manière collective face au projectile – comme dans le modèle de la goutte liquide – et les interactions du projectile se font avec l’ensemble du noyau et non avec un nucléon en particulier dans le noyau. Il existe plusieurs canaux de désintégration, qui peuvent être en principe autant de canaux de formation du noyau composé. L’important est que le noyau composé n’a pas la mémoire de la manière dont il a été formé, de sorte qu’il se désintègre selon les différents canaux dans des proportions (les rapports d’embranchement) qui sont les mêmes quelle que soit le canal de formation du noyau (voir Fig. 4.1). α+ 60 28 Ni (1) p+n+ (5) 62 29 Cu (4) n + n + 62 30 Zn 64 30 Zn p+ 63 29 Cu (2) (3) n+ 63 30Zn Figure 4.1. Exemple d’application du modèle du noyau composé. Les 3 canaux de désintégration du 64 30 Zn (numérotés de 3 à 5) ont des rapports d’embranchement sont les mêmes quel que soit le canal de formation (1 ou 2). De plus, cette relation a été observée pour chaque énergie incidente (Goshal, 1950). La validité du modèle du noyau composé n’est pas universelle, mais est corroborée dans un très grand nombre de cas. Les exceptions sont appelées réaction directes et correspondent à la situation 4.2. Fission induite 51 où le projectile interagit directement avec l’un des nucléons (présumément à la surface du noyau) sans affecter l’ensemble des nucléons. 4.2 Fission induite L’une des réactions nucléaires les plus importantes en pratique est l’absorption d’un neutron par un noyau, suivi de la fission de ce noyau en fragments. C’est la fission induite. Cette réaction libère une quantité d’énergie importante (variable selon la nature précise des fragments) en plus de libérer des neutrons (généralement 2 ou 3). Ces neutrons secondaires peuvent à leur tour réagir avec d’autres noyaux, induire une fission et libérer d’autres neutrons, etc. Il s’ensuit une réaction en chaı̂ne qui peut soit s’atténuer, devenir explosive, ou être contrôlée. La fission peut aussi se produire spontanément, mais c’est un processus très rare. En principe, ce processus est énergétiquement permis, mais il nécessite une déformation transitoire du noyau coûteuse en énergie de surface. Il y a donc une barrière de potentiel à franchir – la barrière de fission – ce qui peut se faire par effet tunnel, mais entraı̂ne d’ordinaire des temps caractéristiques très 8 longs. Par exemple, la fission spontanée du 238 92 U est 1.6 × 10 fois plus rare que sa désintégration alpha, qui pourtant ne se produit qu’avec une vie moyenne de 6.45 milliards d’années. La capture d’un neutron par un noyau produit un état excité qui peut grandement accélérer le passage de la barrière de fission. Les nuclides qui peuvent subir une fission par absorption d’un 239 neutron lent sont qualifiés de fissiles. 235 92 U et 94 Pu sont les nuclides fissiles par excellence. Ils possèdent un nombre impair de neutrons et pair de protons, de sorte que l’absorption d’un neutron supplémentaire mène à un état excité d’un noyau pair-pair. Comme les noyaux pair-pair sont plus liés que les autres, l’énergie de cet état excité, par rapport à celle de l’état fondamental, est particulièrement élevée, et cette énergie peut être suffisante pour faire franchir au noyau la barrière de fission. La fission induite est cependant en concurrence avec d’autres processus, en particulier l’absorption radiative, par laquelle le noyau excité émet un rayon gamma plutôt que de se fissioner. La possibilité d’une réaction en chaı̂ne de fission dépend de l’importance relative de l’absorption radiative et de la fission, ce qui dépend de la composition isotopique du milieu et de l’énergie des neutrons. La figure 4.2 illustre la probabilité d’absoprtion d’un neutron dans un micron d’uranium naturel (cette probabilité est proportionnelle à la section efficace et à la densité de l’uranium), pour les processus décrits par 1. 2. A A 92 U(n,γ) : capture d’un neutron par le 92 U, suivie d’une émission gamma (A = 235 A A 92 U(n,f) : capture d’un neutron par le 92 U, suivie d’une fission (A = 235 ou 238). ou 238). On notera les caractéristiques suivantes de ces courbes : 1. La capture radiative est très importante entre 5 eV et 1 keV et comporte un très grand nombre de résonances, associées aux états excités des noyaux. Cependant, la capture radiative par l’U238 mène à la formation de plutonium, aussi une substance fissile, par la séquence suivante : 238 92 U + n −→ 239 92 U + γ 34m 239 93 Np + e− + ν̄e 81j 239 94 Pu + e− + ν̄e 239 92 U −→ 239 93 Np −→ (4.1) 2. La fission induite de l’U238 possède un seuil élevé (environ 1 MeV), mais devient après cela le processus le plus probable. 52 4. Réactions nucléaires Figure 4.2. Probabilité d’absorption d’un neutron dans un micron d’uranium naturel 235 (composé à 99.3% de 238 92 U et de 0.7% de 92 U) menant soit à la fission ou à l’absorption radiative. Notez l’échelle logarithmique des deux axes. 3. La fission induite de l’U235 est le processus dominant dans l’uranium naturel (et a fortiori dans l’uranium enrichi) pour des neutrons de basse énergie (< 500 meV). Notez que la température ambiente (293 K) est indiquée sur l’échelle. Pourquoi la section de capture des neutrons augmente-t-elle autant à basse énergie? Remarquons d’abord l’évidence : le neutron ne fait pas face à une barrière de Coulomb et son absorption par le noyau est relativement directe, voire géométrique. En fait, étant donné l’intensité de la force nucléaire et sa courte portée, la section efficace pourrait être purement géométrique. Cependant, ce raisonnement classique sous-estime la section efficace. La taille du neutron à considérer est plutôt donné par sa longueur d’onde de de Broglie, et la section géométrique associée est 2 2π 2.5 × 109 2 2 = πλ = π fm (4.2) p Tn (eV) où p est la quantité de mouvement du neutron et Tn son énergie cinétique. La section efficace observée est une fraction de cette section géométrique, mais la section géométrique se comporte comme l’inverse de l’énergie cinétique, ce qui la rend très importante aux basses énergies. 4.2. Fission induite 53 4.2.1 Réaction en chaı̂ne La fission d’un noyau entraı̂ne l’éjection, parmi les fragments plus massifs, de deux ou trois neutrons secondaires : en moyenne 2.47 pour l’U235 et 2.89 pour Pu239. Appelons k le nombre moyen de neutrons secondaires qui causent aussi une fission induite. Bien-sûr, k n’est pas égal à 2 ou 3, car en général des neutrons s’échappent du matériau, ou encore leur capture ne mène pas à une fission, mais à un émission gamma. Si k est supérieur à l’unité cependant, une réaction en chaı̂ne se produit. On dit que la réaction est critique si k = 1, sur-critique si k > 1 et sous-critique si k < 1. Les neutrons secondaires possèdent au départ une énergie comprise entre 0.1 et 1 MeV. Dans de l’U235 pur ou dans le l’uranium suffisamment enrichi (∼ 20% d’U235), le sort le plus probable de ces neutrons est la capture par un noyau d’U235, suivie d’une autre fission. Il est donc possible d’obtenir un k > 1 dans ce cas, si la géométrie de l’échantillon le permet. En clair, il faut assembler une masse critique d’U235, afin que les neutrons secondaires aient une probabilité suffisante d’être absorbés avant de s’échapper de l’échantillon. Les bombes atomiques sont basées sur ce principe. Dans l’uranium naturel, ou insuffisamment enrichi, les neutrons secondaires subiront préférablement une capture radiative par l’U238 et la réaction s’arrêtera. Afin de maintenir la réaction en chaı̂ne dans un réacteur nucléaire, il faut donc ralentir les neutrons à l’aide d’un modérateur. Un modérateur est un matériau qui fait subir des collisions élastiques aux neutrons, donc sans les absorber. Plus le nuclide modérateur est léger, plus grande est la part de l’énergie du neutron qui lui est cédée à chaque collision: on montre sans peine que lors d’une collision élastique, le neutron perd en moyenne une fraction 2A/(1 + A)2 de son énergie cinétique. Le neutron finit par être thermalisé, c’est-à-dire que son énergie cinétique est décrite par la distribution de Maxwell-Boltzmann, à la température ambiante (∼ 300K). Les modérateurs les plus utilisés sont le carbone (sous forme de graphite) et l’eau lourde (D2 O, où D symbolise le deutérium, dont le noyau est le deutéron 21 H). 4.2.2 Les réacteurs nucléaires Un réacteur nucléaire est un dispositif de conversion d’énergie nucléaire en chaleur, basé sur une réaction en chaı̂ne contrôlée. Il s’agit en fait d’une machine thermique, qui alimente une turbine à gaz, sauf pour le fait que la source de chaleur est une réaction de fission contrôlée plutôt qu’une réaction de combustion ordinaire. La fission d’un noyau d’U235 peut produire environ 200 MeV d’énergie cinétique pour les produits, soit environ 107 fois ce que produit une réaction chimique typique. Plus précisément, un gramme de matière fissile produit 7 × 1010 J, alors qu’un gramme de charbon produit, par combustion, 3.3 × 104 J. On distingue les éléments suivants d’un réacteur : 1. Le combustible : il contient un matériau fissile, mais en faible pourcentage. Par exemple : l’uranium naturel (0.7% d’U235), l’uranium enrichi (jusqu’à 3%) ou même un mélange contenant du thorium ou du plutonium. 2. Le modérateur : du graphite, de l’eau lourde, ou même de l’eau ordinaire. 3. Le caloporteur : le fluide qui circule entre le réacteur pour en évacuer la chaleur. Dans la plupart des cas, ce fluide circule dans un circuit primaire, et un échange thermique a lieu avec un autre fluide (de l’eau, typiquement) qui circule dans un circuit secondaire et qui est transformée en vapeur au contact de l’échangeur de chaleur. C’est cette vapeur qui alimente la turbine à gaz qui fournit le travail mécanique et génère la puissance électrique. Certains types de réacteurs ne comportent qu’un circuit : c’est le caloporteur qui alimente directement la turbine dans ces cas. Le gaz est alors recyclé : condensé et recirculé dans le réacteur. 4. Le contrôleur : le matériau qui sert à contrôler la criticalité de la réaction en chaı̂ne. Typiquement des barres de cadmium ou de bore qu’on peut mécaniquement introduire dans le réacteur afin d’absorber des neutrons. 54 4. Réactions nucléaires De plus, comme un réacteur est une machine thermique, son fonctionnement requiert un réservoir chaud (le réacteur lui-même) et un réservoir froid, fourni par un circuit de refroidissement alimenté typiquement par un cours d’eau situé à proximité. Il existe plusieurs technologies nucléaires ou filières, qui diffèrent notamment par le type de combustible utilisé, le modérateur et le caloporteur. Le tableau 4.1 résume les caractéristiques principales de chacune des filières. Elles ont chacune leurs avantages et inconvénients, à la fois techniques et économiques. Les réacteurs fonctionnement à l’uranium naturel ont l’avantage de diminuer les coûts en combustible, mais aussi de contourner les difficiles technologies d’enrichissement de l’uranium (avantage notable pour les pays qui n’ont pas accès à ces technologies). Par contre, la filière CANDU, la seule encore en fonction qui utilise l’uranium naturel, requiert de l’eau lourde comme modérateur et caloporteur, et la séparation isotopique de l’hydrogène, même si elle est moins coûteuse que celle de l’uranium, est toute de même dispendieuse. L’utilisation de l’eau lourde (plutôt que l’eau ordinaire) comme caloporteur dans de CANDU est nécessaire car la plus faible concentration en matière fissile demande un caloporteur qui absorbe très peu les neutrons. La filière la plus répandue dans le monde est celle du réacteur à eau sous pression (REP) qui forme le gros de la puissance nucléaire française et une bonne partie de la puissance américaine. La France et la Belgique sont les pays où la fraction de la puissance électrique d’origine nucléaire est la plus élevée (environ 70%). Tableau 4.1 Liste abrégée des principales filières nucléaires. Filière combustible modérateur caloporteur remarque UNGG U naturel graphite gaz Royaume-Uni, France. Abandonné depuis 1969. eau lourde U naturel D2 O D2 O sous pression CANDU (CANada Deutérium Uranium) REP U enrichi 3% eau eau sous pression France, USA. 50% de la puissance mondiale installée. BWR U enrichi eau eau & vapeur USA, Suède, Allemagne, Japon HTR U enrichi + thorium graphite hélium (1 circuit) expérimental (USA, Allemagne) RBMK U enrichi 1.8% graphite eau (1 circuit) 45% de l’ex URSS, dont Tchernobyl Stabilité du réacteur Un réacteur nucléaire doit être conçu de sorte que le facteur de multiplication k soit contrôlable et stable. Les barres de contrôle en cadmium ou en bore sont essentielles, mais insuffisantes : l’insertion mécanique requiert un temps de l’ordre de la seconde, alors que l’échelle de temps caractéristique de la réaction en chaı̂ne est de l’ordre de la milliseconde. Une réaction surcritique par 1% seulement (k = 1.01) pourrait doubler un intensité en 30 ms et la situation serait catastrophique. La situation est sauvée par l’émission retardée de neutrons : parmi les produits de la fission, plusieurs sont des émetteurs bêta avec des vies moyennes de plusieurs secondes, et les produits secondaires de ces émetteurs peuvent émettre des neutrons. Ces neutrons contribuent au bilan 4.3. Nucléogenèse 55 général des neutrons, mais ont un effet temporisateur en raison du temps caractéristique plus long qui gouverne leur émission. Ces neutrons retardés représentent 0.7% des neutrons dans un réacteur à l’uranium, mais permettent de garder le réacteur sous contrôle si k n’excède pas l’unité de plus d’un millième, environ. D’autre part, il faut concevoir le réacteur de manière à ce que le gradient de k en température soit négatif (dk/dT < 0), de sorte qu’un emballement du réacteur provoque une diminution de k. La filière RBMK, dont le réacteur de Tchernobyl, avait au contraire un dk/dT positif; mais la situation a semble-t-il été corrigée après l’accident de 1986. 4.3 Nucléogenèse L’univers foisonne de réacteurs nucléaires, car les étoiles ne sont autre chose que des machines nucléaires contrôlées par la pression gravitationnelle. Nous allons brièvement décrire les principales réactions qui ont lieu dans les étoiles, en commençant par les réactions qui ont formé la plus grande partie de l’hélium existant, bien avant que les étoiles ou les galaxies soient formées. 4.3.1 Nucléogenèse primordiale Nous ne décrirons pas en détail ici la théorie du big bang, selon laquelle l’univers connu est le fruit d’une expansion qui a commencé il y a 13.7 milliards d’années. Dans son évolution, le rayon de l’univers a augmenté en même temps que diminuait sa densité et sa température. Environ 225 s après le big bang, l’univers est constitué principalement de protons, de neutrons, d’électrons, de neutrinos et de photons. Les neutrons existent non seulement parce que leur vie moyenne est plus longue (∼ 900s), mais aussi parce que leur désintégration par émission bêta est compensée par le processus inverse, également probable à cette température. À partir de ce moment, la réaction suivante est en rupture d’équilibre : n + p → d + γ + 2.22 MeV (4.3) Ceci signifie que la réaction de photodésintégration du deutéron (c’est-à-dire la réaction inverse) s’effectue moins rapidement que la réaction directe, de sorte que le deutéron vit assez longtemps pour être impliqué dans les réactions suivantes : p + d → 32 He + γ + 5.49 MeV n + d → t + γ + 6.26 MeV (4.4) où t symbolise le tritium (31 H), un isotope d’hydrogène avec une vie moyenne d’envrion 18 ans. Comme ces deux réactions sont plus exothermiques que la première, les réactions inverses (photodésintégration) sont moins probables. Une fois cette étape franchie, les réactions suivantes ont lieu : t + p → α + γ + 19.81 MeV 3 2 He + n → α + γ + 20.58 MeV t + d → α + n + 17.59 MeV (4.5) d + d → α + γ + 23.85 MeV De l’hélium est alors formé, et les modèles cosmologiques prévoient que la quasi-totalité de l’hélium existant dans l’univers (soit environ 24%) provient de cette nucléogenèse primordiale. Après 30 minutes d’existence, ces réactions cessent : la température et la densité ont trop diminué pour les soutenir. Les réactions nucléaires ne reprendront qu’une fois les étoiles formées, un million d’années plus tard. . . 56 4. Réactions nucléaires Notons qu’après environ un million d’années, la température de l’univers sera suffisamment basse pour que les atomes se forment. Les photons, qui sont environ un milliard de fois plus nombreux que les électrons, se découplent en majeure partie de la matière et subissent un décalage vers le rouge, en fait vers les micro-ondes qui constituent le rayonnement fossile observable aujourd’hui. 4.3.2 Le cycle du proton Une fois les étoiles formées, d’autres réactions nucléaires se produisent au coeur des étoiles, là où la densité et la température sont suffisantes. La condensation du plasma stellaire, causée par la gravité, est freinée par la pression de dégénérescence électronique, provenant du principe d’exclusion de Pauli : toute réduction du volume dans lequel évoluent les électrons cause une augmentation de l’énergie du gaz d’électrons, comme dans la matière condensée. Si la masse de l’étoile est supérieure à 0.1M (M est la masse du soleil), alors la température du coeur peut atteindre 107 K et la combustion de l’hydrogène peut commencer.1 L’effet net de cette combustion est : 4p + 2e− → α + 2ν̄e + 26.7 MeV (4.6) Dans le détail, ceci est produit par les quatre réactions suivantes : p + p → d + e+ + νe + 0.42 MeV (a) 3 2 He (b) (c) e + e → 2γ + 1.02 MeV (d) p+d → 3 3 2 He + 2 He + − + γ + 5.49 MeV → p + p + α + 12.86 MeV (4.7) La réaction (a) est causée par l’interaction faible. Sa section efficace est infime, de l’ordre de 10−21 fm2 . C’est donc cette réaction qui contrôle la vitesse de toutes les autres. On montre que la vie moyenne d’un proton dans cet environnement est de 1010 années. C’est la lenteur de cette réaction qui fait que les étoiles ne sont pas des bombes thermonucléaires et que leur combustion est suffisamment lente, entre autres, pour permettre à la vie d’apparaı̂tre et d’évoluer sur Terre. Les réactions catalytiques La production d’hélium à partir de protons peut aussi se faire dans deux cycles de réactions qui comportent un catalyseur, c’est-à-dire un nuclide qui participe à la chaı̂ne de réaction, mais qui est produit en quantité égale à la quantité consommée. Il s’agit de la chaı̂ne catalysée à l’hélium, et de la chaı̂ne CNO (carbone-azote-oxygène). Voir Williams pour plus de détails. 4.3.3 Combustion de l’hélium Lorsque la combustion d’hydrogène s’achève par épuisement du combustible, le destin de l’étoile dépend de sa masse. Se celle-ci est inférieure à 0.25M , l’étoile s’éteint progressivement et devient une naine blanche. Sinon, la contraction gravitationnelle, qui était contenue par la pression de rayonnement résultant de la combustion de l’hydrogène, peut parvenir à augmenter la température jusqu’à 108 K au coeur de l’étoile.2 À ce stade, la combustion de l’hélium commence. L’effet net est le suivant : 3α → 126 C + 7.27 MeV (4.8) 1 On emploie librement le mot “combustion” dans ce contexte, mais il s’agit bien sûr de réaction nucléaire sans aucun rapport avec la combustion chimique. 2 La densité est fixée par la température, via l’équation d’état de l’étoile. 4.3. Nucléogenèse 57 Les réactions séparées sont les suivantes : α + α → 84 Be − 0.09 MeV α + 84 Be → 126 C + 2γ + 7.37 MeV (4.9) La première de ces réactions est endothermique et le 84 Be est très instable, avec une vie moyenne de 10−16 s. Fort heureusement, la deuxième réaction possède une section efficace considérable en raison de la présence d’une résonance à 287 keV d’énergie relative. Sans cette résonance, la suite des réactions ne pourrait avoir lieu et l’univers serait encore composé d’éléments légers; la vie ne serait pas apparue. Le soleil n’a pas encore atteint ce stade de combustion : il devrait l’atteindre dans environ 5 milliards d’années. Les étoiles plus massives franchissent cette étape plus rapidement. 4.3.4 Combustion du carbone et de l’oxygène Une fois terminée la combustion de l’hélium, un autre processus s’ensuit après contraction et augmentation de la température si M > 4M : la combustion du carbone, qui nécessite une température de l’ordre de 6 × 108 K. La température requise est plus élevée, parce que les réactions impliquées doivent vaincre des barrières coulombiennes de plus en plus élevées au fur et à mesure que les noyaux participants sont plus gros. Les réactions particulières sont : 12 6C + 126 C → 20 10 Ne + α + 4.62 MeV → 23 11 Na + p + 2.24 MeV → 23 12 Mg + n − 2.61 MeV → → (4.10) 24 12 Mg + γ + 13.93 MeV 16 8 O + 2α − 0.114 MeV Lorsque la température atteint 2 × 109 K, un cycle de combustion de l’oxygène se produit : 16 8O + 168 O → 24 12 Mg + 2α − 0.393 MeV → 28 14 Si + α + 9.59 MeV → 31 15 P + p + 7.68 MeV → → 31 16 S 32 16 S (4.11) + n + 1.46 MeV + γ + 16.54 MeV 4.3.5 Combustion du silicium et au-delà Une température encore plus grande pourrait en principe favoriser la combustion d’éléments comme le silicium selon un schéma similaire à celui du carbone ou de l’oxygène. Mais une température plus élevée favorise aussi une photodésintégration (endothermique) du silicium : 27 γ + 28 14 Si → 13 Al + p − 11.58 MeV 24 γ + 28 14 Si → 12 Mg + α − 9.98 MeV (4.12) Cette photodésintégration permet aux noyaux déjà présent de capturer les protons et particules alpha ainsi produites et de construire peu à peu des noyaux plus lourds. Ce processus se poursuit jusqu’à l’obtention des noyaux les plus stables, autour du fer. On appelle ce processus la combustion du silicium. Les éléments plus lourds que le fer sont formés par capture progressive de neutrons. Ces processus ne sont pas énergétiquement favorables, mais possible à haute température. Ces captures sont 58 4. Réactions nucléaires suivies d’une émission bêta, qui ramène les nuclides vers la courbe de stabilité. On distingue deux chaı̂nes de processus : 1. le processus lent : le taux de capture de neutrons (ωn ) est inférieur au taux d’émission bêta (ωn ωβ ). Dans ce cas, les nuclides produits se rapprochent de la courbe de stabilité avant d’absorber d’autres neutrons, et l’évolution se produit essentiellement le long de la courbe de stabilité. La source de neutrons pour ce processus n’est pas encore clairement élucidée. 2. Le processus rapide : dans le cas contraire (ωn ωβ ), la capture de neutrons est rapide et les nuclides évoluent vers des valeurs élevée de A un peu au-dessous de cette courbe. La source de neutrons pour ce processus est probablement l’explosion d’une supernova. Il est possible donc que les éléments plus lourds que le fer ne soient formés que lors de l’explosion de supernovas. Le système solaire serait alors un système de deuxième génération, fruit de la condensation des reste d’une étoile primitive, plus lourde, qui aurait explosé il y a environ 6 milliards d’années. 4.3.6 La fusion nucléaire sur Terre La réaction de fusion est possible sur Terre, mais pas sous la forme du cycle proton-proton, qui est beaucoup trop lent en raison de la réaction (4.7a). Les bombes thermonucléaires (ou “bombes H”) sont basées sur les deux réactions suivantes : d + t → α + n + 17.6 MeV 6 3 Li + n → α + t + 4.79 MeV (4.13) Le deutérium et le tritium sont donc des éléments essentiels (combustible) de ces engins de destruction. Ils entrent sous la forme des composés chimiques LiD et LiT. La chaleur nécessaire pour initier la réaction (pour vaincre la barrière de coulomb) est fournie par une explosion atomique ordinaire qui fait office de détonateur et qui produit une quantité énorme de rayons X. Cet effet est amplifié en entourant le combustible de matière plastique qui émet des rayons X suite à sa destruction par le détonateur atomique. C’est le schéma dit de Teller-Ulam. La puissance des bombes H est illimitée. La plus puissante jamais testée (par les soviétiques) faisait 58 mégatonnes de TNT équivalent, soit 4 000 fois la puissance de la bombe d’Hiroshima. La fusion contrôlée est un domaine de recherche très actif (et très couteux). Plusieurs pays mettent maintenant leurs ressources en commun afin de réaliser un plasma contrôlé, confiné dans un tokamak, qui pourrait peut-être produire plus d’énergie qu’il en consomme; c’est le projet ITER. Problèmes Problme 4.1 Imaginons un savant fou cherchant à assembler une masse critique de matière fissile de manière à provoquer une réaction en chaı̂ne explosive (eh oui, une arme de destruction massive). Il est certain que cette masse minimale doit être assemblée en forme de sphère, car c’est la forme qui minimise la surface en rapport avec le volume, et que les neutrons secondaires qui s’échappent par la surface ne peuvent plus contribuer à la réaction en chaı̂ne. Considérons une sphère de rayon R et possédant une densité ρ de matière fissile (nombre de noyaux fissiles par unité de volume). On note la section efficace d’absorption des neutrons par ces noyaux (à une énergie qui est celle des noyaux secondaires) par σ. On appelle ξ le nombre moyen de neutrons secondaires émis à chaque fission (entre 2 et 3) et λ le rapport d’embranchement de la fission sur la capture radiative suite à l’absorption d’un neutron. 4.3. Nucléogenèse 59 a) Montrez que la probabilité qu’un neutron s’échappe de la sphère s’il est émis à une distance r du centre est Z h i p 1 1 f (r, R) = dz exp −ρσ(rz + z 2 r2 + R2 − r2 ) 2 −1 Calculez cette intégrale dans les cas limites suivants : (i) r = 0 et (ii) r = R. Le résultat est-il raisonnable dans ces cas? b) Démontrez une condition approximative (en vous servant de la fonction f (r, R) sans l’expliciter) qui puisse nous aider à déterminer le rayon critique Rc de la sphère. Problme 4.2 La réaction la plus lente du cycle proton-proton à l’intérieur du soleil est p + p → d + e+ + νe + 0.42 MeV où d représente le deutéron. a) Démontrez que le taux de la réaction (le nombre de réactions par unité de temps et de volume) est R = n2 hσvi, où n est la densité (nombre par unité de volume) des protons, v leur vitesse relative et σ la section efficace de la réaction. La notation h· · ·i désigne une valeur moyenne sur les différents protons. Démontrez aussi que la vie moyenne d’un proton dans cet environnement, c’est-à-dire le temps moyen avant que le proton ne participe à la réaction, est τ = (nhσvi)−1 . b) Adoptons un modèle naı̈f de cette réaction. Supposons que les deux protons doivent surmonter classiquement la barrière de potentiel électrostatique qui les sépare avant de pouvoir réagir. Supposons donc que le rayon d’un proton est de a = 1 fm, qu’en deça de cette distance la barrière ne joue plus mais que l’interaction forte est en jeu. Calculez l’énergie de seuil E0 (en keV) de cette réaction dans le référentiel du centre de masse et la température associée. c) Supposons que la section efficace soit nulle si l’énergie est inférieure au seuil E0 , et égale à la section géométrique proton-proton (4πa2 ) si E > E0 . Supposons aussi que l’énergie des protons est répartie selon la distribution de Boltzmann. Supposons enfin que la température du plasma est celle qu’on suppose exister au coeur du soleil, soit T = 1.6 × 107 K. Démontrez que dans un tel modèle, la vie moyenne d’un proton est impossiblement longue, incompatible avec une évolution stellaire se produisant sur une échelle de milliards d’années. La densité au coeur du soleil est approximativement de 105 kg/m3 . d) Supposons, à l’opposé, que la barrière électrostatique n’est pas franchie classiquement, mais par effet tunnel. Expliquez pourquoi nous sommes justifiés de poser comme hypothèse que la section efficace a la forme suivante en fonction de la vitesse relative des protons : σ = σ0 exp − 2πe2 v e) Sachant que la vie moyenne d’un proton dans le soleil est de 1010 années et que la température est celle donnée ci-haut, estimez la valeur correspondante de σ0 . Réponse : 2.5 × 10−21 f m2 . Note : les calculs nécessaires dans ce problème sont bien évidemment des ordres de grandeurs. Inutile de conserver 4 chiffres après la virgule partout! Les facteurs de conversion nécessaires se trouvent dans plusieurs livres, en particulier au début du Particle Physics booklet. 60 4. Réactions nucléaires Problme 4.3 La chaı̂ne de réactions de fusion qui se produisent au coeur du Soleil peut se résumer par la réaction nette 4p → 42 He + 2e+ + 2νe + 26.72 MeV La luminosité du Soleil est de 3.83×1026 W. On suppose que 2% de l’énergie émise par le soleil est indétectable (c’est-à-dire sous forme de neutrinos). a) D’après ces données, quel devrait être le flux de neutrinos sur Terre (en nombre de neutrinos par seconde par m2 )? La distance Terre-Soleil est de 1.49 × 1011 m. b) Un détecteur de neutrinos en opération en 1968 était formé de 600 tonnes de C2 Cl4 (perchloréthylène, le solvant utilisé dans l’industrie du nettoyage à sec). Le chlore naturel est composé à 24.47% de neutrinos participent à la réaction 37 − 37 17 Cl + νe → e + 18 Ar 37 Cl, 17 et les (4.14) Cependant, le seuil de cette réaction est de 5.8 MeV et la vaste majorité des neutrinos solaires ne peuvent convenir. Le seuls neutrinos ayant assez d’énergie sont ceux qui proviennent de la désintégration 8 5B → 84 Be∗ + e+ + νe + 14.02 MeV (4.15) et le nombre de neutrinos produits par cette désintégration représente un dix-millième (10−4 ) du nombre total de neutrinos émis par le soleil. La section efficace de la réaction (4.14) (moyennée sur les énergies possibles du neutrino provenant de la désintégration (4.15)) est de 1 × 10−46 m2 . À combien de réactions comme celle-ci doit ont s’attendre par jour, dans le détecteur en question? CHAPITRE 5 Particules élémentaires : généralités L’objectif de ce cours chapitre est de servir de transition entre la première partie du cours, qui traite de la physique nucléaire de manière relativement descriptive et phénoménologique, et la deuxième partie, qui traite de la description théorique des particules élémentaires et de leurs interactions fondamentales. Plusieurs concepts evoqués dans cette courte introduction seront décrits en détail dans les chapitres suivants. 5.1 Le modèle standard Toute explication scientfique, simple ou complexe, repose sur ce qu’on appelle un “paradigme”, c’est-à-dire un modèle avec ses hypothèses et concepts fondamentaux. Une “super-théorie”, en quelque sorte. La physique subatomique repose sur un tel paradigme, couramment appelé le modèle standard1 . Ce modèle standard est provisoirement considéré comme la théorie correcte des phénomènes subatomiques. “Provisoirement” signifie depuis la fin des années 1970, et jusqu’à ce qu’une théorie plus satisfaisante soit proposée, ce qui n’est toujours pas le cas trente années après. À la base du modèle standard est un outil théorique fondamental : la théorie quantique des champs (TQC). La TCQ est une description quantique d’objets qui s’étendent dans tout l’espace, comme le champ électromagnétique, qui en est l’exemple le plus ancien. La TCQ doit aussi être formulée dans le cadre de la relativité restreinte, car toute description des particules élémentaires se doit de respecter le principe de relativité. Le développement historique qui a mené au modèle standard à partir des premières théories quantiques des particules élémentaires à la fin des années 1920 est long et tortueux. Ses jalons les plus importants sont : 1. La quantification du champ électromagnétique et la compréhension de la nature du photon (nom proposé en 1926) comme quantum du champ électromagnétique. 2. L’équation de Dirac (1929) pour décrire les particules relativistes de spin 12 . 3. La première théorie des interactions faibles de Fermi (1933), et la notion de champ de fermions qui l’accompagnait. 4. 1934 : L’hypothèse de Yukawa sur l’existence de bosons associés à l’interaction forte. 5. 1947 : La théorie de la renormalisation (Feynman, Schwinger, Tomonaga et, avant, Stückelberg) qui donne un sens à la théorie des perturbations dans l’électrodynamique quantique en particulier et dans la TQC en général. Les diagrammes dit “de Feynman” sont introduits. 1 ou, plus longuement, modèle standard des particules élémentaires, pour le distinguer d’autres modèles standards qui prévalent dans d’autres disciplines comme la cosmologie ou la biologie moléculaire. . . 62 5. Particules élémentaires : généralités 6. 1964 : Le modèle des quarks, proposé par Gell-Mann et Zweig. 7. La théorie électrofaible, construite dans les années 1960 par Glashow (1961), Weinberg et Salam (1967). 8. La théorie de l’interaction forte (QCD) proposée au début des années 1970 par Gross, Wilceck et Politzer. Le modèle standard offre une description des phénomènes subatomiques compatible avec essentiellement toutes les données expérimentales, exception faite des oscillations de neutrinos soupçonnées depuis les années 1980 et confirmées plus solidement au début des années 2000. Il décrit les interaction forte, faible et électromagnétique à l’aide de ce qu’on appelle des “théories de jauge”. Ces interactions agissent sur des particules de matière, des fermions, qui sont rangées en trois familles semblables et comptent quarks et leptons (voir classification ci-dessous). 5.2 Classification des particules élémentaires photon (inter. électromagnétique) W± Z0 bosons intermédiaires Q famille 1 famille 2 famille 3 0 νe νµ ντ (neutrino µ) (neutrino τ) µ τ c t s b (neutrino e) –1 e 2 3 u – 13 d (électron) (muon) (tauon) (inter. faible) g gluons (inter. forte) H Higgs ? bosons (interactions) quarks bosons de jauge γ leptons Le concept fondamental de la théorie quantique des champs est que les particules élémentaires sont considérées comme des quanta, c’est-à-dire comme des oscillations ou fluctuations quantifiées de champs. Ces particules (et par extension, les champs correspondants) sont soit des bosons ou des fermions. Les champs de bosons peuvent être formulés plus intuitivement dans la limite classique, comme par exemple le champ électromagnétique; ils correspondent à aux interactions fondamentale. les champs de fermions n’ont pas de limite classique; ce sont des objets purement quantiques qui correspondent aux particules de matière (quarks et leptons). (up) (down) (charm) (strange) fermions (matière) Figure 5.1. Tableau des particules élémentaires dans le modèle standard. (top) (bottom) 5.2. Classification des particules élémentaires 63 Fermions Commençons par les fermions, tous de spin 12 comme l’électron. Ils sont organisés en trois familles distinctes, semblables dans la manière avec laquelles ils interagissent (comme par exemple la charge électrique Q) mais très différentes dans leurs masses (les familles sont numérotées dans l’ordre croissant des masses). On distingue les leptons, qui ne ressentent pas l’interaction forte, des quarks, qui la ressentent et qui, par une propriété singulière des interactions forte appelée confinement, ne peuvent être observées en tant que particules libres. Chaque quark, de surcroı̂t, existe en trois couleurs, c’est-à-dire trois exemplaires équivalents (non répété sur le tableau). En tenant compte de ce fait, on voit que la charge électrique totale de chaque famille est nulle. Les fermions élémentaires ont tous un spin 12 et sont tous décrits par l’équation de Dirac (c’est-àdire que les champs correspondants sont des “champs de Dirac”, mathématiquement décrits par des spineurs à 4 composantes). Ils ont tous des antiparticules (non inscrites sur le tableau), qu’on note généralement par une barre au-dessus du symbole (par exemple, ē désigne l’anti-électron, ou positron). Les quarks, qui ne sont pas observables individuellement, forment des particules composites de deux types : les mésons sont formés d’un quark et d’un antiquark (on écrirait q q̄, q signifiant un quark quelconque) et les baryons, formés de trois quarks (qqq). Les mésons sont des bosons, car ils sont formés de deux fermions, mais ne sont pas élémentaires. Les baryons, dont les plus connus sont le proton (uud) et le neutron (udd) sont des fermions. Les baryons et les mésons sont collectivement appelés hadrons, terme qui désigne toutes les particules sensibles à l’interaction forte. La nature fermionique des quarks et des leptons, c’est-à-dire le fait qu’ils obéissent au principe de Pauli, donne justement à la matière la propriété de solidité, d’impénétrabilité qui la distingue des ondes électromagnétiques et, par extension, des objets formés de bosons élémentaires seulement. Bosons Les bosons sont associés aux interactions. Ceci signifie que les fermions n’interagissent pas directement entre eux, mais uniquement par l’intermédiaire des bosons. Un concept important qui survient dans la théorie des perturbations appliquée à la TCQ est celui de particule virtuelle. Une particule virtuelle n’est pas observable et ne constitue pas un objet se propageant librement, mais constitue plutôt un objet transitoire, une fluctuation du champ correspondant, dont l’existence se définit sur un temps très court. On dit que les fermions interagissent en échangeant (c’est-à-dire en émettant et absorbant) des bosons virtuels. Les trois interactions fondamentales décrites dans le modèle standard (celui-ci ignore la gravité) sont : 1. L’électromagnétisme. La particule correspondante est le photon (γ). Ceci signifie que les oscillations quantifiées du champ électromagnétique forment des objets détectables qu’on appelle des photons et que les particules chargées peuvent échanger des photons virtuels. 2. L’interaction faible. Les particules correspondantes n’ont pas de nom, mais sont notées W ± et Z0 . La faiblesse de l’interaction faible aux basses énergies est liée à la masse très grande de ces particules (de l’ordre de 100 GeV). En fait, l’interaction faible et l’interaction électromagnétique sont intimement reliées et forment ensemble l’interaction dite électrofaible. 3. L’interaction forte. La particule correspondante est le gluon (g). Ceux-ci (car il y en a huit) sont inobservables comme les quarks car ils sont soumis à la règle du confinement. En principe, des objets composées de deux gluons ou de trois gluons (les boules de glue ou glueballs) ne sont pas interdits par cette règle, mais aucun n’a été observé. Cependant, l’existence des gluons laisse des traces dans les expériences de diffusion de protons à haute énergie. Ces trois interactions reposent sur un principe théorique important appelé invariance de jauge. En somme, les théories de ces interactions sont modelées sur l’interaction électromagnétique, quoique 64 5. Particules élémentaires : généralités la théorie électrofaible et la théorie des interactions fortes (appelée chromodynamique quantique ou QCD) soient plus complexes. L’un des ingrédients de la théorie électrofaible est le mécanisme de Higgs qui explique entre autre pourquoi les particules W ± et Z0 sont massives alors que le photon est sans masse. Ce mécanisme requiert l’existence d’un bosons supplémentaire, dit boson de Higgs (noté H), qui n’a pas à ce jour été observé. Le boson de Higgs aurait une spin zéro, alors que les bosons de jauge ont nécessairement un spin unité. De tous ces bosons et fermions élémentaires, seuls l’électron, le photon et les trois espèces de neutrino existent de manière stable en tant que particules individuelles. Tous les autres sont instables ou n’existent qu’à l’intérieur d’objet composites. La proton est le seul baryon stable. Aucun méson stable n’existe. Bien sûr, des neutrons existent à l’intérieur des noyaux, car leur environnement immédiat change les conditions de stabilité. De même, de la matière “étrange” (c.-à-d. comportant des particules composées en partie de quarks s) existe vraisemblablement dans le coeur des étoiles à neutron, là encore parce que les canaux de désintégration de ces objets sont “obstrués” par la pré-existence des produits de désintégration dans l’environnement. 5.3 Plan du reste du cours Dans le chapitre 6, on abordera la théorie quantique des champs en procédant à la quantification du champ électromagnétique. Le concept de quantum du champ sera introduit avec le photon. De plus, on introduira le champ scalaire décrivant un boson de spin 0 et le champ de Schrödinger, décrivant des fermions non relativistes, dans le but d’introduire les diagrammes de Feynman. Enfin, le formalisme lagrangien sera utilisé, car c’est dans ce langage que les théories des champs sont habituellement décrites. Le chapitre 7 est consacré à l’équation de Dirac. La notion d’antiparticule y est aussi introduite. Le couplage au champ électromagnétique, et donc l’électrodynamique quantique (ou QED), y est aussi décrit, ainsi que les règles de Feynman correspondantes. Le chapitre 8 est de nature plus mathématique et peut être survolé plus rapidement si nécessaire. Il s’agit d’une introduction à la théorie des groupes, préalable à la discussion des théories de jauge. La classification des hadrons formés des trois quarks (u,d,s) y est aussi abordée. Le chapitre 9 décrit les théories de jauge non abéliennes, en particulier la chromodynamique quantique (QCD). L’accent est mis sur l’invariance de jauge et la forme du lagrangien que cela implique. Les propriétés de la QCD sont (très) sommairement discutées. Enfin, le chapitre 10 décrit les premières théorie de l’interaction faible ainsi que la théorie électrofaible du modèle standard, incluant le mécanisme de Higgs. Il se conclut par une discussion de la violation de la symétrie CP dans les systèmes de kaons neutres. CHAPITRE 6 Quantification du champ et interactions Le but de ce chapitre est d’introduire la notion de champ quantique, un concept fondamental dans la théorie des particules élémentaires. Nous commençons pas une révision de l’électromagnétisme (équations de Maxwell), pour démontrer que le champ électromagnétique classique peut être considéré comme un ensemble continu d’oscillateurs harmoniques. La quantification de ces oscillateurs mène au concept de photon ou, plus généralement, de quantum du champ. Ensuite, nous faisons interagir ce champ avec de la matière non relativiste, décrite par le champ de Schrödinger et nous introduisons les diagrammes de Feynman, qui sont une représentation graphique des termes de la théorie des perturbations. En chemin, nous remplaçons le champ électromagnétique par un champ scalaire simple, dans le but de simplifier quelque peu la discussion. 6.1 Ondes électromagnétiques 6.1.1 Équations de Maxwell et transformées de Fourier Rappelons les équations de Maxwell dans le système gaussien (mais dans les unités naturelles c = 1): ∂B =0 ∇·E = 4πρ ∇∧E + ∂t (6.1) ∂E ∇·B = 0 ∇∧B − = 4πJ ∂t où ρ est la densité de charge et J la densité de courant. Ces équations peuvent aussi s’écrire en fonction des transformées de Fourier spatiales des champs. Adoptons pour ce faire un espace de volume fini V avec des conditions aux limites périodiques. Placer le système physique dans une telle “boı̂te” présente l’avantage de quantifier les vecteurs d’ondes possibles et donc de discrétiser les modes de vibrations du champ électromagnétique. Les transformées de Fourier s’expriment alors comme suit : Z 1X ik·r E(r) = Ek e Ek = d3 r E(r)e−ik·r (6.2) V k et de même pour toute autre quantité (B, J, ρ, etc.). Il est sous-entendu ici que E(r) et Ek dépendent du temps. Comme le champ électrique est réel (par opposition à complexe), on voit aisément que E∗k = E−k (6.3) 66 6. Quantification du champ et interactions et il en est de même de la transformée de Fourier de tout champ réel. Notons enfin qu’on peut toujours retourner à un volume infini à la fin des calculs en remplaçant la somme sur les vecteurs d’ondes par une intégrale : Z 1X d3 k → (6.4) V (2π)3 k La traduction des équations de Maxwell dans l’espace réciproque (i.e. en fonction des transformées de Fourier) se fait par la substitution ∇ → ik, de sorte que ∇·E(r) → ik · Ek et ∇∧E(r) → ik ∧ Ek (6.5) Les équations de Maxwell prennent donc la forme suivante : k · Ek = −4πiρk k ∧ Ek − iḂk = 0 k · Bk = 0 k ∧ Bk + iĖk = −4πiJk (6.6) où un point (˙) désigne la dérivée par rapport au temps. L’avantage de cette formulation dans l’espace réciproque est que les équations associées à des valeurs différentes de k sont découplées. Autrement dit, nous avons réduit le problème d’un système d’équations différentielles aux dérivées partielles à un systèmes d’équations différentielles ordinaires. 6.1.2 champs transverses et longitudinaux Un champ vectoriel F(r) est qualifié de transverse si ∇·F = 0. Il est qualifié de longitudinal si ∇∧F = 0. Dans l’espace réciproque, ces conditions sont respectivement k · Fk = 0 et k ∧ Fk = 0 (6.7) Autrement dit, la transformée de Fourier d’un champ transverse est perpendiculaire au vecteur d’onde, alors que celle d’un champ longitudinal y est parallèle. Mais tout vecteur Fk peut être écrit comme la somme d’une composante parallèle à k et d’une composante perpendiculaire à k : k k Fk = Fk + F⊥ k k Fk = (Fk · k̂)k̂ , F⊥ k = Fk − Fk (6.8) où k̂ est le vecteur unitaire dans la direction de k. Ceci démontre, par les transformées de Fourier, que tout champ est la somme d’un champ transverse et d’un champ longitudinal : F(r) = Fk (r) + F⊥ (r) (6.9) De plus, on montre facilement que la partie transverse est le rotationnel d’un autre champ de vecteur, alors que la partie longitudinale est le gradient d’une fonction : Fk (r) = ∇φ F⊥ (r) = ∇∧G(r) (6.10) En effet, il suffit de contempler ces relations dans l’espace réciproque : k Fk = ikφk F⊥ k = ik ∧ Gk (6.11) et de voir qu’elles peuvent être satisfaites si on choisit i φk = − k̂ · Fk k Gk = i k̂ ∧ F⊥ k k (6.12) 6.1. Ondes électromagnétiques 67 Les équations de Maxwell séparent nettement les composantes transverses et longitudinales des champs : k k · Ek = −4πiρk (6.13a) ⊥ Ḃ⊥ k = −ik ∧ Ek k k · Bk Ė⊥ k k Ėk (6.13b) =0 (6.13c) ⊥ = ik ∧ B⊥ k − 4πJk (6.13d) = k −4πJk (6.13e) La troisième de ces équations (c) nous dit que le champ magnétique est purement transverse : Bk = 0. Nous ne ferons donc plus la distinction entre B et B⊥ . La première et la dernière de ces équations gouvernent la partie longitudinale de E. En les combinant, on retrouve la loi de conservation de la charge : en effet, ∂ k k k · Ek = −4πk · Jk = −4πiρ̇k ∂t (6.14) ce qui revient à écrire ik · Jk + ρ̇k = 0 =⇒ ∇·J + ∂ρ =0 ∂t (6.15) ce qui est l’équation de continuité. La partie longitudinale de E est de fait complètement déterminée par la densité de charge : 4πi k Ek = − k̂ρk (6.16) k ce qui signifie que le problème de résolution des équations de Maxwell est résolu en ce qui concerne cette composante. 6.1.3 Variables normales Nous allons maintenant formuler les équations de Maxwell pour les composantes transverses des champs (les seules qui nous restent à étudier) en fonction de nouvelles variables qui permettent de découpler les équations (6.13b) et (6.13d). On définit le vecteur i ⊥ Ek − k̂ ∧ Bk 2Ck ak = − (6.17) où Ck est une constante de normalisation à déterminer (on supposera qu’elle est réelle et qu’elle ne dépend que de la grandeur k du vecteur d’onde). Ce vecteur n’est pas réel dans l’espace ordinaire, de sorte que a∗−k 6= ak . En fait, a∗−k = i ⊥ Ek + k̂ ∧ Bk 2Ck (6.18) On peut exprimer E⊥ k et Bk en fonction de a, à partir des deux équations précédentes : ∗ E⊥ k = iCk ak − a−k Bk = iCk k̂ ∧ ak + a∗−k (6.19) 68 6. Quantification du champ et interactions L’avantage de la nouvelle variable a est la simplicité de son évolution temporelle. En effet, d’après les équations (6.13), i ⊥ ȧk = − Ėk − k̂ ∧ Ḃk 2Ck 1 ⊥ k ∧ Bk + 4πiJ⊥ + k̂ ∧ (k ∧ E ) = k k 2Ck (6.20) 1 ⊥ = −k(E⊥ − k̂ ∧ B ) + 4πiJ k k k 2Ck 2πi ⊥ = −ikak + J Ck k En définissant la fréquence ωk = k = |k|, on peut enfin écrire ȧk + iωk ak = 2πi ⊥ J Ck k (6.21) Il s’agit d’une simple équation différentielle linéaire du premier ordre, à coefficients constants. Elle est inhomogène, cependant. Dans le cas d’un champ sans source (J = 0), la solution est immédiate : ak (t) = ak (0)e−iωk t (6.22) Comme le vecteur a est transverse, on peut l’exprimer en fonction d’une base orthonormée de deux vecteurs ejk (j = 1, 2) perpendiculaires à k : ak = a1,k e1,k + a2,k e2,k (6.23) Ces deux vecteurs correspondent aux deux polarisations possibles d’une onde électromagnétique. 6.2 Quantification du champ électromagnétique 6.2.1 Hamiltonien du champ En toute rigueur, nous devrions dériver le hamiltonien du champ électromagnétique à partir de son lagrangien et trouver par la même occasion les variables canoniques qui y figurent. L’approche que nous suivons ici est un raccourci qui nous mènera au même point d’arrivée. Nous poserons que le hamiltonien du champ est donné par son énergie totale (ce qui est naturel). L’énergie du champ est (voir à cet effet les notes de cours de PHQ-420) Z 1 H= d3 r (E2 + B2 ) (6.24) 8π On peut récrire ce résultat en fonction des transformées de Fourier, en utilisant le théorème de Parseval : 1 1 X H= |Ek |2 + |Bk |2 (6.25) V 8π k Exprimons maintenant cette énergie en fonction de la variable normale a. Notons tout d’abord que seul E⊥ contribue à l’énergie dans ce cas, car en l’absence de sources Ek est nul. Après un court calcul, on trouve X C2 X C2 k ∗ k H= a∗k · ak = a a (6.26) 2πV 2πV jk jk k j,k 6.2. Quantification du champ électromagnétique 69 Trouver le hamiltonien n’est pas tout. Il faut aussi connaı̂tre le statut des variables ajk du point de vue canonique, c’est-à-dire leur crochet de Poisson. Comme la méthode des crochets de Poisson n’est peut-être pas familière, nous pouvons directement passer à la version quantique du problème, car la quantification canonique procède par le remplacement des crochets de Poisson par les commutateurs. La variable normale ajk devient alors un opérateur, et le conjugué complexe devient l’opérateur conjugué hermitique a†jk . Le hamiltonien est alors H= X C2 † k a a 2πV jk jk (6.27) j,k et ce hamiltonien doit mener aux équations de Maxwell, c’est-à-dire à l’équation d’évolution ȧjk = −iωk ajk (6.28) On constate ici la similitude avec la théorie de l’oscillateur harmonique. Dans ce cas, le hamiltonien est H = ωa† a et le commutateur des opérateurs d’échelle est [a, a† ] = 1, ce qui mène à l’équation d’évolution ȧ = i[H, a] = iω[a† a, a] = iω(a† aa − aa† a) = −iωa =⇒ a(t) = a(0)e−iωt (6.29) Dans le cas qui nous occupe, on retrouve la forme habituelle du hamiltonien de l’oscillateur harmonique en posant p (6.30) Ck = 2πωk V et alors H= X ωk a†jk ajk (6.31) j,k Si on pose ensuite que [ajk , a†j 0 ,k0 ] = δjj 0 δk,k0 (6.32) alors, exactement comme dans l’oscillateur harmonique, on retrouve l’évolution temporelle correcte des variables ajk , ce qui est en principe équivalent aux équations de Maxwell. Nous avons donc réalisé la quantification du champ électromagnétique : le champ électromagnétique libre de sources est en fait une collection d’oscillateurs harmoniques, un pour chaque vecteur d’onde et chaque polarisation. Résumons maintenant comment exprimer les champs E et B en fonction des opérateurs d’échelle (ex variables normales); nous combinons pour cela les équations (6.2), (6.19) et (6.30) : r r X 2πω X 2πω k k ik·r E(r) = i ajk êjk e − c.h. B(r) = i ajk k̂ ∧ êjk eik·r − c.h. V V j,k j,k (6.33) 6.2.2 Photons Nous avons établi que le hamiltonien du champ électromagnétique sans sources est celui d’une collection d’oscillateurs harmoniques découplés, un pour chaque vecteur d’onde et polarisation, de fréquences ωk = k. Rappelons que, dans le cas d’un oscillateur harmonique simple, les états propres du hamiltonien sont notés |ni (n un entier positif ou nul), avec les propriétés : √ √ a|ni = n|n − 1i a† |ni = n + 1|n + 1i a† a|ni = n|ni (6.34) 70 6. Quantification du champ et interactions L’état fondamental est |0i et l’énergie de l’état |ni est nω, par rapport à celle de l’état fondamental. L’opérateur N = a† a prend des valeurs propres entières et est appelé l’opérateur du nombre. Le hamiltonien s’exprime ensuite comme H = ωN (modulo une constante additive). Dans le cas d’une collection d’oscillateurs découplés, l’état fondamental est le produit tensoriel des états fondamentaux de tous les oscillateurs. On le note encore |0i. L’interprétation physique fondamentale du champ électromagnétique quantifié est que l’opérateur Njk = a†jk ajk (6.35) représente le nombre de photons de vecteur d’onde k et de polarisation j. Ainsi, l’énergie du champ est la somme des énergies des photons : X H= ωk Njk (6.36) j,k Il est également simple de démontrer que la quantité de mouvement du champ, définie comme Z 1 P= d3 r E ∧ B (6.37) 4π s’exprime ainsi en fonction des opérateurs de nombre : X kNjk P= (6.38) j,k Donc les quantités physiques (énergie, quantité de mouvement) sont quantifiés, et Njk représente le nombre de ces quantas associés à un vecteur d’onde et une polarisation donnés, donc le nombre de photons. Comme l’opérateur a†jk augmente de 1 la valeur propre de ce nombre, on dit qu’il crée un photon et on l’appelle opérateur de création. De même, l’opérateur ajk diminue de 1 la valeur de Njk et est appelé opérateur d’annihilation ou de destruction de photons. L’état fondamental |0i, qui ne contient aucun photon puisque h0|Njk |0i = 0, est appelé vide. Les états quantiques qui ne contiennent qu’un seul photon sont obtenus par application sur le vide de l’opérateur de création : a†jk |0i (6.39) Les photons sont des bosons : il est possible d’en mettre autant qu’on veut dans un mode de vecteur d’onde et de polarisation donné : l’état suivant 1 √ (a†jk )n |0i n! (6.40) représente un état où n photons occupent le mode de vecteur d’onde k et de polarisation j. D’autre part, comme les opérateurs de création et d’annihiliation associés à des modes différents commutent entre eux, l’état quantique obtenu par application des opérateurs de création ne dépend pas de l’ordre dans lequel les opérateurs sont appliqués (i.e. le signe est le même dans tous les cas). 6.3. Fermions 71 6.3 Fermions 6.3.1 Électrons non relativistes : champ de Schrödinger Voyons maintenant comment notre traitement du champ électromagnétique peut être généralisé au cas de particules matérielles, comme les électrons. L’équivalent des équations de Maxwell pour les ondes de matière est l’équation de Schrödinger : i 1 2 ∂ψ =− ∇ ψ ∂t 2m (6.41) (nous considérons ici le cas des électrons libres). On ne voit plus ici la fonction d’onde ψ comme associée à une seule particule, mais on la considère comme un champ, le champ de Schrödinger, dont les oscillations quantifiées sont les électrons, de la même manière que les oscillations quantifiées du champ électromagnétique sont les photons. On peut ainsi traiter le cas d’un nombre arbitraire d’électrons, et non seulement celui d’un seul électron. En fonction de la transformée de Fourier du champ ψ, l’équation de Schrödinger prend la forme iψ̇ k = k2 ψ 2m k (6.42) dont la solution est k2 (6.43) 2m Par analogie avec ce qui a été fait ci-haut, on cherche à exprimer le hamiltonien du champ de Schrödinger comme une combinaison d’oscillateurs. Ce hamiltonien n’est autre que la valeur moyenne de l’énergie cinétique : Z −1 2 1 X ∗ k2 H = d3 r ψ ∗ ∇ ψ= ψk ψ (6.44) 2m V 2m k ψ̇ k (t) = ψ̇ k (0)e−iεk t où εk = k Le passage à un formalisme quantique se fait en remplaçant le champ ψ ∗ par un opérateur ψ † et on trouve ainsi le hamiltonien 1X εk ψk† ψk (6.45) H= V k Pour mettre à profit l’analogie avec les oscillateurs, on introduit les opérateurs de création et d’annhiliation d’électrons ayant la bonne normalisation : 1 ck = √ ψk V 1 c†k = √ ψk† V et enfin H= X (6.46) εk c†k ck (6.47) k Mais attention! Les électrons sont des fermions : on ne peut pas en mettre plus d’un dans un mode de vecteur d’onde donné (nous ignorons le spin pour le moment). Donc les opérateurs ck et c†k ne peuvent pas se comporter comme les opérateurs d’échelle de l’oscillateur harmonique. L’opérateur du nombre Nk = c†k ck ne peut prendre que les valeurs 0 et 1. De plus, dans un état comportant plus d’un électron, il doit y avoir un changement de signe lorsque deux électrons sont échangés. Ces contraintes importantes peuvent être respectées si on impose aux opérateurs de création et d’annhiliation des relations d’anticommutation : ck c†k0 + c†k0 ck = δk,k0 ck ck0 + ck0 ck = 0 c†k c†k0 + c†k0 c†k = 0 (6.48) 72 6. Quantification du champ et interactions On utilise couramment la notation suivante pour l’anticommutateur de deux opérateurs A et B : {A, B} = AB + BA (6.49) et on écrit les relations de commutation ci-dessus comme {ck , c†k0 } = δk,k0 {ck , ck0 } = 0 {c†k , c†k0 } = 0 (6.50) Dans le cas k = k0 , ces relation assurent que (c†k )2 = 0 (ck )2 = 0 (6.51) ce qui signifie qu’il est impossible de créer (ou détruire) plus d’un électron dans un mode donné. D’autre part, un état à deux électrons est antisymétrique lors de l’échange des deux électrons, tel que prescrit par la statistique de Fermi-Dirac : c†k c†k0 |0i = −c†k0 c†k |0i (6.52) Les relations d’anticommutation nous assurent donc que la nature fermionique des électrons est bien représentée, mais il faut aussi que la dynamique le soit : vérifions donc que l’équation de Heisenberg s’applique correctement à l’opérateur d’annihilation : ċk = i[H, ck ] = iεk [c†k ck , ck ] = iεk c†k ck ck − ck c†k ck (6.53) = −iεk ck c†k ck = −iεk ck (c†k ck + ck c†k ) = −iεk ck ce qui est bien la bonne équation d’évolution (la même que pour ψk ). Résumons. Les électrons libres non relativistes peuvent être conçus comme les excitations quantifiées d’un champ ψ(r) qui se développe ainsi en fonction des opérateurs de création et d’annihilation : 1 X ψ(r) = √ ck eik·r (6.54) V k Le hamiltonien correpondant est une somme de termes découplés, un pour chaque mode d’oscillation (i.e. chaque vecteur d’onde) : X H= εk c†k ck (6.55) k et les opérateurs de création et d’annihilation obéissent aux relations d’anticommutation (6.50). On montre également que la quantité de mouvement associée au champ de Schrödinger, soit la valeur moyenne de la quantité de mouvement Z P = d3 r ψ ∗ (−i∇ψ) (6.56) devient l’expression suivante en fonction des opérateurs de nombre : X P= kNk k (6.57) 6.3. Fermions 73 Remarque : deuxième quantification et limite classique Nous avons traité le champ de Schrödinger comme un champ classique qu’on quantifie, comme pour le champ électromagnétique. Comment est-ce possible? L’équation de Schrödinger n’est-elle pas fondamentalement quantique? En fait, la procédure que nous avons suivi porte le nom de deuxième quantification, ce qui encourage l’équivoque. Pour résoudre ce paradoxe, il faut réfléchir à la limite classique. Dans le cas de bosons, cette limite est atteinte quand le nombre moyen de quanta (i.e. de photons, dans notre cas) dans un mode donné est grand. Plus précisément encore, il est bon de réfléchir à la limite classique de l’oscillateur harmonique, car c’est précisément de quoi il s’agit ici. Dans la limite classique, l’oscillateur harmonique n’est pas typiquement dans un état propre du hamiltonien, mais plutôt dans un état cohérent, sorte de superposition d’états propres, de paquet d’onde, qui se rapproche de la description d’un objet en oscillation. Par contre, dans le cas des fermions, ces états n’existent pas, du fait que le nombre de quanta dans chaque mode ne peut être supérieur à un. Donc la limite classique du champ de Schrödinger n’existe pas vraiment, du moins pas au sens habituel. il n’y a pas vraiment de “deuxième quantification”, car la “première quantification” ne correspond pas à la limite classique du champ de Schrödinger, mais plutôt à la restriction de ce champ quantique aux états qui ne comportent qu’un seul électron. 6.3.2 Interaction électrons-photons Tout l’intérêt du formalisme de deuxième quantification vient du traitement des interactions entre les électrons et le champ électromagnétique quantifié. Rappelons ici le hamiltonien d’un électron en présence d’un champ électromagnétique : H= 1 (P − eA)2 + eΦ 2m (6.58) L’important ici est que ce sont les potentiels électromagnétiques qui interviennent dans le hamiltonien, et non les champs électrique et magnétique directement. L’une des propriétés fondamentales du champ électromagnétique est l’invariance de jauge. Les champs électrique et magnétique sont dérivés de potentiels électromagnétiques A et Φ de la manière suivante : ∂A E = −∇Φ − B = ∇∧A (6.59) ∂t Ces potentiels ne sont pas définis de manière unique : on peut procéder à une transformation de jauge, par laquelle les potentiels sont modifiés de la manière suivante : A → A + ∇ξ Φ→Φ− ∂ξ ∂t (6.60) où ξ est une fonction quelconque des coordonnées et du temps. Cette transformation n’affecte pas du tout les champs E et B. Exprimons ces relations dans l’espace réciproque : Ek = −ikΦk − Ȧk Bk = ik ∧ Ak (6.61) et Ak → Ak + ikξk Φk → Φk − ξ˙k (6.62) Le fait que les potentiels électromagnétiques ne soient pas définis de manière unique nous permet de leur imposer des conditions supplémentaires, appelées conditions de jauges. Celle que nous utiliserons est la jauge de Coulomb, également appelée jauge transverse, car elle impose l’annulation de la partie longitudinale du potentiel vecteur : ∇·A = 0 ou k · Ak = 0 (6.63) 74 6. Quantification du champ et interactions Il est clair d’après la relation (6.62) qu’on peut toujours choisir une fonction ξ de manière à annuler Ak . Dans ce cas, la partie longitudinale de E est entièrement fixée par le potentiel scalaire Φ. Le champ B de toute manière n’est pas affecté par la partie longitudinale de A. Comme A est dorénavant transverse, la relation entre B et A peut également s’écrire Ak = i k̂ ∧ Bk k (6.64) ce qu’on vérifie comme suit : Bk = ik ∧ Ak = −k̂ ∧ (k̂ ∧ Bk ) = Bk (6.65) On tire donc de cette équation et de (6.33) une expression du potentiel vecteur en fonction des opérateurs de création et d’annihilation : s A(r) = X j,k 2π ajk êjk eik·r + c.h. ωk V (6.66) Cette expression sera utile pour exprimer le hamiltonien d’interaction entre électrons et photons. À cette fin, écrivons le hamiltonien du champ de Schrödinger en interaction avec le champ électromagnétique comme la valeur moyenne de le hamiltonien (6.58) dans le cas Φ = 0 : Z 1 H= d3 r ψ ∗ (P − eA)2 ψ 2m Z 1 = d3 r ψ ∗ P2 ψ − eψ ∗ (P · A + A · P)ψ + e2 ψ ∗ ψA2 (6.67) 2m Z 1 = d3 r ψ ∗ P2 ψ − 2eψ ∗ A · Pψ + e2 ψ ∗ ψA2 2m Dans la troisième équation, nous avons utilisé le fait que P · A = A · P − i∇·A = A · P (jauge transverse) En introduisant les hamiltoniens d’interaction suivants Z Z e2 e H1 = − d3 r ψ ∗ A · Pψ H2 = d3 r ψ ∗ ψA2 m 2m (6.68) (6.69) Le hamiltonien global (photons et électrons) s’écrit donc comme H = Hem + He + H1 + H2 (6.70) où Hem est le hamiltonien du champ électromagnétique libre donné par l’éq. (6.31) et où He est le hamiltonien des électrons libres. Le deuxième terme (He ) est le hamiltonien du champ de Schrödinger étudié précédemment. Les troisième et quatrième termes (H1 et H2 )) représentent l’interaction du champ de Schrödinger (donc des électrons) avec le champ électromagnétique. Afin de comprendre en détail le mécanisme d’interaction associé au hamiltonien H1 , exprimons-le en fonction des opérateurs de création et d’annihilation des photons et des électrons, en utilisant les développements (6.66) et (6.54) : Z 1 X ir·(k−k0 +q) † e H1 = − d3 r 2 e ck0 k · Aq ck (6.71) m V 0 k,k ,q 6.3. Fermions 75 L’intégrale sur les coordonnées produit un delta de Kronecker Vδk0 ,k+q et on trouve e 1X † ck+q k · Aq ck mV (6.72) 2πV X (ajq êjq + a†j−q ê∗j,−q ) ωq j (6.73) H1 = − k,q D’autre part, s Aq = On trouve donc finalement e X H1 = − m k,q,j s 2π (êjq · k)ajq c†k+q ck + (ê∗jq · k)a†jq c†k−q ck Vωq (6.74) Le hamiltonien H2 a lui-aussi son expression en fonction des opérateurs de création et d’annhiliation, mais nous allons nous concentrer dans ce qui suit sur H1 seulement. Remarquons premièrement que H1 , contrairement à Hem , ne conserve pas le nombre de photons. Autrement dit, l’opérateur du nombre total de photons X † Nγ = ajq ajq (6.75) q,j ne commute pas avec H1 . Par contre, H1 commute avec l’opérateur du nombre total d’électrons X † Ne = (6.76) ck ck k Donc, au total, le nombre d’électrons est conservé, mais pas le nombre de photons. Le premier terme dans H1 représente un processus au cours duquel un photon d’impulsion q est absorbé par un électron d’impulsion k qui se retrouve par la suite avec une impulsion k + q. Plus précisément, l’électron d’impulsion k est détruit et un électron d’impulsion k + q est créé à sa place (le nombre total d’électrons est conservé). Le deuxième terme de H1 représente un processus au cours duquel un électron d’impulsion k émet un photon d’impulsion q et se retrouve après avec une impulsion k − q. Graphiquement, on représente ces deux termes par les diagrammes suivants : k+q k–q q (6.77) k q k Dans ces diagrammes, on représente les particules de matière (les électrons, par exemple) par des traits pleins, et les photons par des lignes ondulées. Chaque ligne porte une quantité de mouvement précise, et le point de rencontre de ces lignes représente un terme dans le hamiltonien. On peut imaginer, à cette étape, que les particules annihilées apparaissent en bas du diagramme, et les particules créées en haut. 76 6. Quantification du champ et interactions 6.3.3 Théorie du champ scalaire Dans le but de simplifier au maximum notre discussion des diagrammes de Feynman, nous allons remplacer le champ électromagnétique par une théorie plus simple, celle du champ scalaire. Dans cette théorie, il n’existe qu’une seule “polarisation” et le champ associé, noté φ, n’est pas de nature vectorielle (on peut penser, pour fixer les idées, à des ondes longitudinales). Le hamiltonien de ce champ, en fonction des opérateurs de création et d’annihilation, est X Hφ = ωk a†k ak (6.78) k L’équivalent de la relation (6.66) est s φ(r) = X k 2π ak eik·r + c.h. ωk V (6.79) Il s’agit en somme d’une simplification de l’électrodynamique, où l’aspect vectoriel a été supprimé. Les photons sont alors remplacés par une autre sorte de bosons, sans spin. L’opérateur du nombre de ces bosons est alors X † N= (6.80) ak ak k et l’opérateur de la quantité de mouvement est X † kak ak P= (6.81) k L’équivalent du hamiltonien H1 ci-haut est Z Heφ = g d3 r φψ ∗ ψ (6.82) où g est une constante, appelée constante de couplage. En fonction des opérateurs de création et d’annihilation, ce hamiltonien d’interaction devient s X 2π † Heφ = g aq ck+q ck + a†q c†k−q ck (6.83) Vωq k,q Nous retrouvons en fait le hamiltonien (6.74), mais sans les références à la polarisation. Les termes de ce hamiltonien on exactement la même interprétation, en fonction de particules créées ou annihilées, que ceux du hamiltonien (6.74) et sont représentés par les mêmes symboles graphiques, sauf qu’on remplace généralement les lignes ondulées par une ligne pointillée lorsqu’on traite du champ scalaire : k+q k–q q (6.84) k q k 6.4. Théorie des perturbations et diagrammes de Feynman 77 6.4 Théorie des perturbations et diagrammes de Feynman Comme il est impossible de résoudre exactement le hamiltonien global (6.70), on a recours à la théorie des perturbations, d’autant plus que H1 , dans un certain sens, est petit devant Hem et He , comme nous le verrons par la suite. La théorie des perturbations nous permet de calculer une probabilité de transition par unité de temps d’un état initial |ii vers un état final |f i, tous deux états propres du hamiltonien non perturbé, soit He +Hφ dans le cas qui nous occupe (celui d’un champ de Schrödinger en interaction avec un champ scalaire). En particulier, nous pouvons ainsi calculer une section différentielle de diffusion. Cependant, la théorie des perturbations n’est pas adéquate pour déterminer, par exemple, les états liés d’électrons sous l’influence de la force coulombienne, ou de la force associée au champ scalaire. Le problème des états liés est essentiellement non perturbatif. La théorie des perturbation utilisée ici est la version dépendante du temps, en l’occurence la règle d’or de Fermi, sauf qu’il faut aller au-delà de l’ordre le plus bas. Rappelons cette règle, qui donne le taux de transition d’un état initial |ii vers un état final |f i : ωi→f = 2π|Mf i |2 δ(Ef − Ei ) (6.85) où l’amplitude Mf i est, aux deux ordres les plus bas de la théorie des perturbations, Mf i = hf |V |ii + X hf |V |nihn|V |ii n Ei − En + ··· (6.86) où V est la perturbation étudiée (ici V = Heφ ) et où le deuxième terme est une somme sur les états propres |ni du hamiltonien non perturbé, qualifiés d’états virtuels, dont les énergies sont En . Le deuxième terme doit être considéré si le premier s’annule. Dans le cas qui nous occupe (V = H1 ), le premier terme s’annule toujours, car H1 change le nombre de bosons, alors que les états propres de Hφ + He ont un nombre fixe de bosons. Il faut donc toujours effectuer une somme sur des états virtuels. Chacun des termes de Mf i peut être représenté par un diagramme illustrant l’état intermédiaire impliqué. Un exemple détaillé est discuté ci-après. 6.4.1 Diffusion des électrons par un champ scalaire Comme exemple fondamental d’application de la théorie des perturbations, considérons la collision de deux électrons. Les quantités de mouvement initiales des deux électrons sont k1 et k2 , et les quantités de mouvement finales (après la collision) sont k3 et k4 . Les états initial et final sont donc |ii = c†k1 c†k2 |0i |f i = c†k3 c†k4 |0i (6.87) Les états intermédiaires possibles contiennent forcément un boson, car les termes d’interactions (6.83) changent le nombre de bosons par 1 ou −1. Nous ne sommes intéressés que par les états intermédiaires |ni tels que hf |Heφ |nihn|Heφ |ii est non nul. Quatre possibilités existent. Deux de ces possibilités sont illustrées graphiquement ci-dessous : k3 k4 q k1 k2 (i) |f |f |n |n |i |i k3 k4 q k1 (6.88) k2 (ii) 78 6. Quantification du champ et interactions Les deux autres sont obtenues en échangeant k3 et k4 . Expliquons, en commençant par le diagramme de gauche (cas (i)). Dans ce cas, les trois états (initial, intermédiaire et final) sont représentés successivement de bas en haut. Un sommet (ou vertex) du diagramme correspond à l’action du hamiltonien d’interaction Heφ , qui nous fait passer successivement de l’état |ii à l’état |ni = c†k3 c†k2 a†q |0i, à l’état |f i. Le premier vertex représente l’action du terme a†q c†k3 ck1 de Heφ , qui détruit l’électron de vecteur d’onde k1 et le remplace par un électron de vecteur d’onde k3 , en créant un boson de vecteur d’onde q = k1 − k3 . On associe à ce vertex l’élément de matrice s 2π q = |k1 − k3 | (6.89) hn|Heφ |ii = g Vωq Le deuxième vertex représente l’action du terme aq c†k4 ck2 de Heφ , qui détruit l’électron de vecteur d’onde k2 et le remplace par un électron de vecteur d’onde k4 , tout en annihilant le boson de vecteur d’onde q = k1 − k3 = k4 − k2 . On associe à ce vertex l’élément de matrice s 2π (6.90) hf |Heφ |ni = g Vωq En ajoutant le dénominateur figurant dans l’amplitude (6.86), ce diagramme a la valeur numérique suivante : diagramme (i) = g2 2π 2π 1 1 = g2 Ei − En Vωq V ω q ε1 − ε3 − ω q q = |k1 − k3 | (6.91) où ε1 = ε(k1 ) et ainsi de suite. Le diagramme de droite (ii) diffère de (i) en ce que l’état intermédiaire est maintenant |ni = c†k4 c†k1 a†q |0i et q = k2 − k4 , soit l’opposé de la valeur correspondante dans le diagramme (i); notons cependant que ωq est le même dans les deux cas. La valeur numérique du diagramme (ii) est plutôt diagramme (ii) = g2 1 2π 1 1 2π 1 = g2 V ω q ε2 − ε4 − ω q V ω q ε3 − ε1 − ω q (6.92) (on a utilisé la conservation de l’énergie ε1 + ε2 = ε3 + ε4 ). En notant ε13 = ε1 − ε3 , il est d’usage de combiner les deux contributions (i) et (ii) en une seule expression : 2π 1 1 1 4π 1 − = g2 (6.93) g2 V ωq ε13 − ωq ε13 + ωq V ε231 − ωq2 et de l’associer à un seul diagramme, dit diagramme de Feynman : k3 k4 (6.94) q k1 k2 Ce diagramme ne comporte plus un état intermédiaire bien défini, car il est la combinaison de deux termes associés à des états intermédiaires différents. Cependant, il comporte un boson virtuel, 6.4. Théorie des perturbations et diagrammes de Feynman 79 auquel on attribue une énergie ω = ε1 − ε3 et un vecteur d’onde q = k1 − k3 . Cette énergie et ce vecteur d’onde résultent de la conservation de l’énergie et de la quantité de mouvement appliquée à chaque vertex. La valeur du diagramme est alors g2 4π 4π 1 1 = g2 2 2 2 V ω − ωq V ω − q2 (6.95) Ce boson virtuel est émis par l’électron 1 et absorbé par l’électron 2, qui tous deux voient leur énergie et leur quantité de mouvement changer en conséquence. Le boson est virtuel, et non réel : son énergie et sa quantité de mouvement ne respsectent pas la condition ω = |q|. On dit aussi qu’il n’est pas sur la “couche de masse”. 6.4.2 Calcul de l’amplitude de diffusion complète Terminons maintenant le calcul de l’amplitude Mf i . Nous devons ajouter au diagramme ci-haut celui associé à l’échange des deux particules finales, qui est aussi une possibilité. Ce diagramme comprend les deux autres états intermédiaires possibles évoqués ci-haut. k3 k4 k3 q k4 (6.96) q k1 k2 k1 k2 Le signe − entre les deux diagrammes tient au fait que le deuxième se calcule exactement comme le premier si on échange les indices 3 et 4, sauf pour le fait que l’état final, lui ne change pas, et que changer les indices 3 et 4 dans l’état final revient à en changer le signe (antisymétrie par échange de deux fermions). L’amplitude totale, d’où on a factorisé le delta de Kronecker assurant la conservation de la quantité de mouvement, est ) ( 1 1 4π − (6.97) Mf i = g 2 V ω 2 − q2 q=k1 −k3 ω 2 − q2 q=k1 −k4 Calculons la section différentielle de diffusion dans le référentiel du centre de masse. Posons donc k1 = kx̂ k2 = −kx̂ k3 = kn k4 = −kn (6.98) où n est le vecteur unitaire dans la direction de la particule diffusée, faisant un angle θ avec l’axe des x. Dans le premier terme de l’amplitude, q = k1 − k3 = k(x̂ − n) =⇒ q 2 = k 2 (2 − 2 cos θ) = 4k 2 sin2 θ/2 (6.99) =⇒ q 2 = k 2 (2 + 2 cos θ) = 4k 2 cos2 θ/2 (6.100) alors que, dans le second, q = k1 − k4 = k(x̂ + n) Dans le deux cas, ω = 0, car ε1 = ε2 = ε3 = ε4 dans ce référentiel. On calcule que (voir problème 1.8) que dσ 1 |Mf i |2 |p3 | 1 = (6.101) dΩ 2 (8π)2 |p1 | E 2 80 6. Quantification du champ et interactions où E est l’énergie totale des deux électrons incidents, énergie de masse comprise, soit 2m. Le préfacteur 21 devant la première expressions de dσ/dΩ tient compte de l’identité des particules : il faut éviter, dans le décomtpe des états finaux, de compter comme deux états distincts les configurations qui s’obtiennent l’une de l’autre par échange de particules identiques. Ce résultat est cependant obtenu dans la normalisation relativiste des états. Pour adapter l’amplitude que nous venons de calculer à cette normalisation, nous devons la multiplier par 4E1 E2 = 4m2 et supprimer les facteurs de volume : 1 1 2 2 − Mf i = 16πg m 4k 2 sin2 θ/2 4k 2 cos2 θ/2 (6.102) 16πg 2 m2 cos θ = k 2 sin2 θ La section différentielle est alors dσ 1 |Mf i |2 1 1 = = dΩ 2 (8π)2 4m2 4 2g 2 m k 2 sin θ tan θ 2 1 = 4 g2 T sin θ tan θ 2 (6.103) où T est l’énergie cinétique de chacune des particules incidente. Notons que cette formule est la même si θ est remplacé par π − θ, ce qui équivaut à échanger les deux particules de l’état final. Ceci est la conséquence de l’identité des particles, qui se manifeste par la somme sur les deux termes de l’éq. (6.97). La section différentielle est piquée autour de θ = 0 et θ = π, et chute comme le carré de l’énergie cinétique des particules incidentes, comme la section de Rutherford. 6.5 Équation de Klein-Gordon L’équation de Schrödinger habituelle pour les particules libres i 1 2 ∂ψ =− ∇ ψ ∂t 2m (6.104) n’est pas compatible avec la théorie de la relativité restreinte. Elle décrit des particules dont l’énergie et la quantité de mouvement sont reliées par E = p2 /2m. Cela se constate immédiatement par la correspondance entre énergie, quantité de mouvement et les opérateurs différentiels, soit E→i ∂ ∂t p → −i∇ (6.105) Une version relativiste de l’équation d’onde pour les ondes de matière a été proposée par Klein et Gordon (1927) et suit de près les idées originales de Louis de Broglie. En appliquant la relation relativiste entre énergie et quantité de mouvement, soit E 2 = p2 +m2 , à la correspondance ci-dessus, on écrit l’équation suivante : ∂2ψ ∂2 − 2 = −∇2 ψ + m2 ψ ou ∇ 2 − 2 − m2 ψ = 0 (6.106) ∂t ∂t habituellement appelée équation de Klein-Gordon. Cette équation est très semblable à l’équation d’onde ordinaire, sauf pour un terme supplémentaire impliquant la masse. Si on substitue dans cette équation une solution en forme d’onde plane ψ(r, t) = ei(p·r−Et) (6.107) (−p2 + E 2 + m2 )ψ = 0 (6.108) on trouve la contrainte évidente : 6.5. Équation de Klein-Gordon 81 L’une des raisons pour lesquelles Schrödinger proposa une équation différente pour décrire les ondes de matière est que l’équation de Klein-Gordon est du deuxième ordre dans p le temps, et donc que l’énergie de la particule peut être à la fois négative ou positive : E = ± p2 + m2 . On ne savait pas, à l’époque, comment interpréter ces solutions à énergie négative. La raison fondamentale pour laquelle cette équation ne peut s’appliquer aux électrons est un peu plus subtile : cette équation, pour être fondamentale, ne peut décrire que des bosons. 6.5.1 Le champ scalaire massif Revenons à la théorie du champ scalaire, introduite plus haut comme modèle-jouet dans le but de simplifier la discussion de l’interaction entre électrons et photons. Comme le potentiel vecteur, dans la jauge de Coulomb, obéit à l’équation d’onde : ∂2 2 (6.109) ∇ − 2 A=0 ∂t le champ scalaire, qui correspond en fait à une sorte de champ électromagnétique duquel on aurait retranché l’aspect vectoriel, devrait lui-aussi obéir à cette équation : ∂2 2 (6.110) ∇ − 2 φ=0 ∂t Une conséquence de cette équation est que les quanta du champ φ, créés par les opérateurs a†k , ont la relation de dispersion suivante : E = |p| (ou ωk = k, comme écrit ci-haut). Une autre conséquence est que la force que ce champ représente décroı̂t comme l’inverse du carré de la distance. En effet, en présence de matière, le potentiel vecteur électromagnétique obéit à une équation inhomogène : ∂2 2 ∇ − 2 A = −4πJ (6.111) ∂t où J est la densité de courant. Par analogie, le champ scalaire, obtenu en élimimant la nature vectorielle du potentiel vecteur, doit obéir à l’équation inhomogène suivante : ∂2 2 (6.112) ∇ − 2 φ = −4πgρ ∂t où ρ est la densité de particules de matière (nous avons extrait de cette densité la constante g, l’équivalent de la charge élémentaire pour le champ scalaire, au lieu d’utiliser une “densité de charge”). Si on place une particule de matière fixe à l’origine, le champ scalaire créé par cette particule ne dépend pas du temps et obéit à l’équation ∇2 φ = −4πgδ(r) (6.113) C’est l’équation de Poisson, la même qui régit le potentiel électrique en présence d’une charge ponctuelle. La solution est donc la même : φ(r) = g r (6.114) et la force correspondante, soit F = −∇φ, décroı̂t comme l’inverse du carré de la distance. Supposons maintenant que les quantas du champ φ ont une masse m, au lieu d’être sans masse comme les photons. Le champ devrait alors obéir à l’équation de Klein-Gordon et l’équation (6.112) 82 6. Quantification du champ et interactions devrait être modifiée de la manière suivante : En coordonnées sphériques, cette équation a la forme suivante : ∂2 2 2 ∇ − 2 − m φ = −4πgρ (6.115) ∂t Pour une source ponctuelle fixe à l’origine, cette équation devient ∇2 − m2 φ = −4πgδ(r) (6.116) En coordonnées sphériques, cette équation est 1 ∂2 (rφ) − m2 φ = 0 r ∂r2 (r > 0) (6.117) en autant qu’on ne soit pas exactement à l’origine (r = 0). Si on définit la variable u = rφ, cette équation devient u00 − m2 u = 0 =⇒ u(r) = Ae−mr + Bemr (6.118) où A et B sont des constantes à déterminer. On peut immédiatement affirmer que B = 0, car une solution exponentiellement croissante n’est pas physiquement acceptable. La solution pour φ a donc la forme suivante : A φ(r) = e−mr (6.119) r La valeur de la constante A peut être tirée de la solution connue dans la limite m → 0, soit A = g, et donc e−mr φ(r) = g (6.120) r La forme de ce champ en fonction de r est appelée potentiel de Yukawa. La force tirée de ce potentiel décroı̂t exponentiellement, avec une distance caractéristique r0 = m−1 , la portée du potentiel. Autrement dit, si des particules de matière interagissent par l’intermédiaire d’un champ scalaire de masse m (au lieu d’interagir en échangeant des photons), leur force mutuelle va décroı̂tre exponentiellement, avec une portée égale à la longueur d’onde de Compton des bosons intermédiaires. 6.5.2 Théorie de Yukawa de l’interaction forte Le physicien japonais Hideki Yukawa propossa, en 1935, que la force nucléaire devait sa très courte portée au fait qu’elle était transmise par des particules massives, décrites par le champ scalaire cihaut. On appela ces particules hypothétiques mésons. En supposant que la portée de l’interaction forte est de 1 à 2 fm, on conclut que la masse des mésons doit être située entre 100 et 200 MeV. Notons qu’il doit y avoir trois type de mésons, de charges électriques ±e et zéro, qu’on note respectivement π ± et π 0 . Le méson neutre π 0 est échangé lors de collisions entre protons ou entre neutrons, comme illustré à l’éq. (6.96). Ce processus mène alors à une section différentielle de diffusion semblable à celle que nous avons calculée à l’éq. (6.103), avec une diffusion prononcée quand l’angle de diffusion est proche de zéro ou proche de π. C’est effectivement ce qui est observé. Mais on observe la même dépendance angulaire lors de la diffusion de neutrons sur des protons, ce qui peut laisser perplexe, car les protons et neutrons ne sont pas des particules identiques, et que le fait que la section différentielle soit piquée à θ = π provient justement de l’indiscernabilité des particules diffusantes, tel que représentée par le deuxième diagramme de (6.96). La solution à ce paradoxe est que des processus d’échange de 6.6. Formulation lagrangienne 83 mésons chargés ont aussi lieu, qui permettent de convertir un neutron en proton ou vice-versa. Les diagrammes de Feynman contribuant à la diffusion neutron-proton sont donc de la forme suivante : n p + π0 n p p n (6.121) π+ n p Le diagramme de droite joue alors le même rôle que dans le diagramme (6.96) : il donne à la section différentielle une symétrie par rapport à l’échange θ → π − θ. Notons que nous avons affublé la ligne du champ π + d’une flèche, mais pas celle du champ π 0 . Ceci est lié au fait que le champ π 0 est sa propre antiparticule, alors que l’antiparticule du méson π + est le méson π − . Ceci sera clarifié plus loin. Découverte des mésons La découverte, en 1937, parmi les rayons cosmiques, de particules de masse ∼ 105 MeV, fit penser que la particule hypothétique de Yukawa était enfin révélée. On se rendit compte très rapidement que cette particule n’avait pas les propriétés voulues. C’était en fait le muon, qu’on appelait initialement le méson-µ. Le véritable méson, le méson-π ou pion, fut découvert en 1947. Le méson neutre (π 0 ) a une masse de 135.0 MeV et le méson chargé une masse de 139.6 MeV. En fait, une pléthore de particules analogues au méson furent découvertes dans les années qui suivirent. La théorie de Yukawa n’est manifestement pas une théorie fondamentale de l’interaction forte, quoiqu’elle représente bien certaines de ses propriétés. Fondamentalement, les mésons sont formés de quarks, comme les nucléons. Plus précisément, les mésons sont formés d’un quark lié à un antiquark, et l’échange de mésons entre deux nucléons peut être vu comme la manifestation de l’échange de quarks entre deux nucléons. Nous reviendrons sur ce sujet dans le chapitre portant sur la classification des hadrons, les particules qui interagissent par l’interaction forte. 6.6 Formulation lagrangienne La mécanique quantique est habituellement formulée en termes d’opérateurs agissant sur des états appartenant à un espace de Hilbert. L’opérateur le plus important est le hamiltonien H, qui décrit comment les états évoluent dans le temps, par l’équation de Schrödinger : i ∂ |ψi = H|ψi ∂t (6.122) Cette formulation de la mécanique quantique porte le nom de “formalisme canonique”, car elle est en correspondance directe avec la mécanique classique dans le formalisme canonique de Hamilton. Cette formulation est très pratique dans le traitement des problèmes non relativistes, mais elle souffre d’un défaut important : elle n’est pas manifestement invariante de Lorentz. En effet, le temps, à travers l’opérateur de Hamilton H, joue ici un rôle privilégié par rapport aux autres coordonnées. Il est difficile de juger, à partir de la forme du hamiltonien, si la théorie est invariante de Lorentz ou non. Jusqu’ici, nous avons jugé de l’invariance de Lorentz à partir des équations d’ondes associées, comme l’équation de Klein-Gordon ou l’équation de Dirac. 84 6. Quantification du champ et interactions 6.6.1 Rappels de mécanique de Lagrange Les symétries d’une théorie sont beaucoup plus explicites dans le formalisme lagrangien. Rappelons que, pour une théorie décrite par N coordonnées généralisées qi , le lagrangien L(qi , q̇i ) est une fonction des coordonnées et de leurs dérivées par rapport au temps et que les équations classiques du mouvement, dites équations de Lagrange, ont la forme suivante : d ∂L ∂L − =0 dt ∂ q̇i ∂qi (6.123) Ces équations proviennent d’un principe variationnel, dit principe de la moindre action, qui stipule que le mouvement réel (classique) du système qi (t) est celui qui rend l’action stationnaire, où l’action est l’intégrale sur le temps du lagrangien : Z S[q] = dt L(qi , q̇i ) (6.124) En effet, la variation de l’action qui accompagne une variation δqi (t) du mouvement entre les temps initial et final considérés est Z Z ∂L ∂L d ∂L ∂L (6.125) δS[q] = dt δq + δ q̇ = dt − δqi ∂qi i ∂ q̇i i ∂qi dt ∂ q̇i où on a supposé que la variation δqi s’annule aux temps initial et final et où on a intégré par parties le deuxième terme. Si on demande que la variation δS soit nulle pour toute variation δqi (t) possible, on doit admettre que l’expression entre accolades s’annule en tout temps et donc que les équations de Lagrange s’appliquent. Le passage de la formulation lagrangienne à la formulation hamiltonienne se fait premièrement en définissant les variables conjuguées ∂L pi = ∂ q̇i et la fonction de Hamilton, qui est simplement la transformée de Legendre du lagrangien par rapport à la variables q̇i (sommation sur i implicite) : H = pi q̇i − L (6.126) Les N équations de Lagrange, du deuxième ordre dans le temps, sont alors équivalentes aux 2N équations de Hamilton, du premier ordre dans le temps : q̇i = ∂H ∂pi ṗi = − ∂H ∂qi (6.127) 6.6.2 Densité lagrangienne Dans un théorie des champs, le nombre de degrés de libertés N tend vers l’infini. Pour fixer les idées, considérons un champ scalaire φ. L’équivalent des coordonnées généralisées dans ce cas est constitué de la valeur du champ φ(r) à chaque position de l’espace. La fonction de Lagrange est alors l’intégrale sur l’espace d’une fonction L(φ, ∂µ φ) qu’on appelle la densité lagrangienne ou, par abus de langage, lagrangien tout simplement : Z L = d3 r L(φ, ∂µ φ) (6.128) 6.6. Formulation lagrangienne 85 Cette fonction dépend de la valeur du champ φ à un endroit donné et de ses dérivées spatiales et temporelle, regroupées sous le symbole covariant ∂µ φ. Le même principe variationnel s’applique : le champ φ(r, t) doit évoluer dans le temps et varier dans l’espace de manière à ce que l’action Z Z S[φ] = dt L = d3 rdt L(φ, ∂µ φ) (6.129) soit stationnaire. On voit facilement que la variation de l’action associée à une variation δφ(r, t) est Z Z ∂L ∂L ∂L ∂ ∂L 3 3 δφ + δ∂ φ = d rdt − µ δφ (6.130) δS[φ] = d rdt ∂φ ∂∂µ φ µ ∂φ ∂x ∂∂µ φ où nous avons intégré par parties sur tout l’espace et tout le temps pour obtenir la deuxième égalité, en supposant que les termes aux frontières (à l’infini de l’espace-temps) sont nuls, en raison de la décroissance suffisamment rapide du champs dans l’espace et dans le temps. Pour que l’action soit stationnaire pour toute variation δφ, il faut que la quantité entre parenthèses s’annule en tout temps et en tout lieu, et donc que l’équation suivante soit satisfaite : ∂L ∂ ∂L − µ =0 ∂φ ∂x ∂∂µ φ (6.131) 6.6.3 Action du champ scalaire Appliquons ce raisonnement au champ scalaire et à l’équation de Klein-Gordon. Montrons que dans ce cas la densité lagrangienne est simplement donnée par Lφ = 1 1 ∂µ φ∂ µ φ − m2 φ2 2 2 (6.132) Une application directe de l’équation (6.131) donne ∂Lφ = −m2 φ , ∂φ ∂Lφ = ∂µφ ∂∂µ φ =⇒ −m2 φ − ∂µ ∂ µ φ = 0 (6.133) ce qui n’est rien d’autre que l’équation de Klein-Gordon. Notons tout de suite que l’invariance de Lorentz de cette équation est une conséquence de l’invariance de Lorentz de la densité lagrangienne : si la densité lagrangienne est invariante, alors l’action S, qui est son intégrale sur l’espace-temps, l’est aussi; si l’action est stationnaire dans un référentiel, elle le sera donc dans tous les référentiels et l’équation d’onde correspondante devra être satisfaite dans tous les référentiels. On doit pour cela supposer que le champ scalaire φ est invariant de Lorentz. Ceci s’exprime par l’équation de transformation suivante : φ0 (x0 ) = φ(x) (6.134) où les quantités primées sont définies dans un référentiel S 0 et les quantités non primées dans le référentiel S (x sert d’abréviation pour les composantes xµ du quadrivecteur position). Étant donné que le champ φ est un invariant de Lorentz, alors ∂µ φ forme un quadrivecteur covariant et la densité lagrangienne ci-haut est manifestement invariante. Ceci est un principe général très important. Les théories qui décrivent les particules fondamentales sont toutes des théories de champs. Elles peuvent toutes être définies par une densité lagrangienne qui doit être invariante de Lorentz. Dans le prochaine section, nous verrons comment définir une théorie des électrons relativistes en se basant sur ce principe. 86 6. Quantification du champ et interactions Problèmes Problme 6.1 a) La densité d’impulsion du champ électromagnétique est proportionnelle au vecteur de Poynting : π= 1 E∧B 4π Démontrer comment passer de cette relation à la relation suivante pour l’impulsion du champ électromagnétique : X † P= kajk ajk j,k b) Faites de même pour l’impulsion totale des électrons. À partir de l’expression de l’impulsion du champ de Schrödinger, montrez que X † P= kck ck k c) Étant donné l’expression de la densité d’impulsion du champ électromagnétique, il est naturel de poser que le moment cinétique du champ est donné par l’expression suivante : Z 1 d3 r r ∧ (E ∧ B) L= 4π Dans la jauge de Coulomb, on montre que cette expression est équivalente à l’expression suivante : ) ( Z X 1 3 L= d r E∧A+ Ei (r ∧ ∇)Ai 4π (6.135) i On associe le dernier terme au moment cinétique orbital du champ, alors que le premier terme est le moment cinétique intrinsèque. Exprimez le premier terme en fonction des opérateurs de création et d’annihilation. Utilisez à cette fin une base de polarisations circulaires, c’est-à-dire ê1 = x̂ + iŷ √ 2 ê2 = x̂ − iŷ √ 2 où l’axe des z est dans la direction du vecteur d’onde. Interprétez votre résultat : quel est le spin du photon? Problme 6.2 Considérons un champ quantique scalaire φ, dont le développement en modes est le suivant : s X 2π φ(r) = aq eiq·r + a†q e−iq·r Vωq q Imaginons que nous avons un moyen de “mesurer” ce champ en un endroit donné, mais que nos appareils sont entachés d’une certaine erreur, de sorte qu’ils ne mesurent pas le champ φ(r) directement, mais une certaine moyenne de ce champ autour d’une position donnée, qu’on définit comme Z Φ(r) = d3 r0 φ(r0 )f (r − r0 ) 6.6. Formulation lagrangienne 87 où f est une fonction qui ne dépend que de la distance, qu’on prend comme étant une gaussienne de largeur R: 1 r2 A= f (r) = A exp − 2 R (πR2 )3/2 La constante A est choisie de manière à normaliser la fonction f à l’unité. Cette fonction caractérise l’imprécision de l’“appareil de mesure” et R est en quelque sorte la résolution de l’appareil. a) Montrez que la valeur moyenne dans le vide du “champ flou” Φ(0) est nulle. b) Calculez la fluctuation de ce champ dans le vide, c’est-à-dire sa variance, définie dans ce cas-ci comme ∆Φ2 = h0|Φ(0)2 |0i. Montrez que 1 ∆Φ = π 2 Z ∞ dq 0 q 2 −q2 R2 /2 e ωq c) Montrez que cette variance tend vers l’infini quand R → 0. Calculez l’intégrale dans les deux cas limites où (i) R 1/m et (ii) R 1/m, m étant la masse du champ φ. Indice : n’hésitez pas à vous servir du théorème de Parseval et de la notion de convolution. Toutes les intégrales en jeu se font analytiquement, mais l’usage de tables ou de Mathematica est bien sûr permis. Ceci démontre que les champs quantiques sont des quantités aux très fortes fluctuations. . . Problme 6.3 Un champ scalaire ordinaire φ (∈ R) représente un boson neutre. Pourquoi ne peut-il pas représenter un boson chargé électriquement? Montrer que pour représenter un boson chargé électriquement, on doit utiliser deux champs scalaires réels φ1 et φ2 de propriétés identiques (i.e. de même masse). Comment effectuer le couplage de ces champs avec le champ électromagnétique? Quels sont les diagrammes de Feynman possibles? Montrez que ces deux champs décrivent non seulement des bosons chargés, mais aussi leurs antiparticules. CHAPITRE 7 Théorie relativiste de l’électron 7.1 Spin et transformations de Lorentz L’équation de Klein-Gordon (ou, si on préfère, le champ correspondant) ne peut pas décrire des particules de spin 21 comme les électrons ou autres particules de matière. Lors d’une rotation, par exemple, les deux composantes d’un spineur se combinent entre elles, alors qu’un champ scalaire reste inchangé. Le problème est ici de trouver comment un spineur se transforme quand on passe d’un référentiel à l’autre, de manière à pouvoir écrire une équation d’onde pour un spineur qui soit la même dans tous les référentiels. Ceci nous mènera à l’équation de Dirac. Alors seulement pourrons-nous décrire des électrons relativistes. En guise d’introduction, considérons un spineur ψ = (ψ1 , ψ2 ) et rappelons-nous que l’opérateur du moment cinétique de spin S, dans ce langage, est S= 1 σ = (σ1 , σ2 , σ3 ) 2 où les trois matrices de Pauli sont données par 0 1 0 σ1 = σ2 = 1 0 i −i 0 (7.1) σ3 = 1 0 0 −1 (7.2) Lorsqu’on procède à une rotation des axes, la valeur moyenne ψ † σψ (7.3) se comporte comme un vecteur, mais les composantes du spineur se transforment différemment. Plus précisément, le spineur transformé ψ 0 est ψ 0 = Rψ où R = cos θ/2 + in · σ sin θ/2 (7.4) où n est la direction de l’axe de rotation et θ l’angle de rotation. Cette matrice R a la propriété que R† σR = R(σ) (7.5) où R est la matrice de rotation des axes associée à la rotation (n, θ). Par exemple, une rotation d’angle θ dans le plan xy correspond à la matrice cos θ sin θ 0 R(ẑ, θ) = − sin θ cos θ 0 (7.6) 0 0 1 7.1. Spin et transformations de Lorentz 89 Comment peut-on généraliser cette loi de transformation d’un spineur à une transformation de Lorentz? Considérons pour ce faire la matrice hermitique suivante, construite à l’aide des composantes du quadrivecteur position (ou en fait de tout autre quadrivecteur) : 0 x − x3 −x1 + ix2 = xµ σ µ (7.7) X(x) = −x1 − ix2 x0 + x3 où on a introduit la notation σ 0 = 1 et σ µ = (σ 0 , σ 1 , σ 2 , σ 3 ). La matrice X est la matrice hermitique 2 × 2 la plus générale qui soit. Son déterminant est det X(x) = (x0 )2 − (x1 )2 − (x2 )2 − (x3 )2 = xµ xµ (7.8) et est invariant de Lorentz. Considérons la transformation matricielle suivante : N †X 0N = X (7.9) où N est une matrice complexe unimodulaire (c’est-à-dire de déterminant unité). Notons que par définition, X 0 = x0µ σ µ et donc que la matrice N met en correspondance un quadrivecteur xµ avec un quadrivecteur transformé x0µ . Comme le déterminant d’un produit de matrices est le produit des déterminants et que det N = det N † = 1, on trouve det X 0 = det X et donc (x00 )2 − (x01 )2 − (x02 )2 − (x03 )2 = (x0 )2 − (x1 )2 − (x2 )2 − (x3 )2 (7.10) C’est donc qu’une matrice N préserve les invariants de Lorentz et correspond donc à une transformation de Lorentz bien précise, spécifiée par une matrice de transformation 4 × 4 Λ : x0µ = Λµ ν xν ou x0µ = Λµ ν xν (7.11) où la matrice Λµ ν est l’inverse de la transposée de Λµ ν (i.e. Λµ α Λν α = δνµ ). Notons qu’il faut 4×2 = 8 paramètres pour spécifier une matrice complexe 2 × 2 générale, et que la condition de déterminant unité impose une contrainte complexe qui réduit le nombre de paramètres à 6. Il faut aussi 6 paramètres pour spécifier une transformation de Lorentz générale (3 composantes pour la vitesse relative des deux référentiels et 3 pour spécifier une rotation relative des axes). La transformation (7.9) peut aussi s’écrire N † x0µ σ µ N = N † Λµ ν xν σ µ N = xν σ ν (7.12) Comme cette relation vaut pour toute valeur de x, on en déduit que σ µ se comporte comme un quadrivecteur contravariant, soit N † Λµ ν σ µ N = σ ν ou N † σ µ N = Λµ ν σ ν On aurait tout aussi bien pu considérer la matrice suivante : 0 x + x3 x1 − ix2 X̃(x) = = xµ σ̃ µ x1 + ix2 x0 − x3 (7.13) (7.14) où σ̃ µ = (σ 0 , −σ 1 , −σ 2 , −σ 3 ), et introduire une transformation M † X̃ 0 M = X̃ (7.15) M † σ µ M = Λµ ν σ ν (7.16) pour aboutir à la propriété Les matrices N et M sont reliées; on montrera plus bas que M = (N −1 )† . 90 7. Théorie relativiste de l’électron Considérons maintenant des exemples précis de transformations. La matrice −η/2 e 0 N =P = 0 eη/2 correspond à une transformation de Lorentz de rapidité η dans la direction z. En effet, −η cosh η − sinh η 0 e 0 † 0 = = σ 0 cosh η − σ 3 sinh η P σ P = 0 cosh η + sinh η 0 eη (7.17) (7.18) et † 3 P σ P = e−η 0 0 −eη = cosh η − sinh η 0 0 − cosh η − sinh η = σ 3 cosh η − σ 0 sinh η (7.19) = σ1 (7.20) alors que † 1 P σ P = e−η/2 0 0 eη/2 0 0 e−η/2 eη/2 et pareillement pour σ 2 . On vérifie aussi que changer le signe de σ 1,2,3 , donc passer de N à M , requiert changer le signe de η, et donc que la même transformation de Lorentz correspond plutôt à M = P −1 . Comme deuxième exemple, considérons la matrice iθ/2 e N =R= 0 0 (7.21) e−iθ/2 On vérifie dans ce cas que R† = R−1 et donc que P † σ 0 P = σ 0 . D’autre part, −iθ/2 iθ/2 e 0 e 0 † 3 Rσ R= = σ3 0 eiθ/2 0 −e−iθ/2 (7.22) Enfin, † 1 Rσ R= e−iθ/2 0 0 eiθ/2 e−iθ/2 0 −ie−iθ/2 0 0 eiθ/2 = 0 eiθ e−iθ 0 = σ 1 cos θ + σ 2 sin θ (7.23) et † 2 Rσ R= e−iθ/2 0 0 eiθ/2 0 ieiθ/2 = 0 ieiθ −ie−iθ 0 = σ 2 cos θ − σ 1 sin θ (7.24) On constate donc que cette matrice R correspond à une rotation d’angle θ par rapport à l’axe z. Il s’agit en fait de la même matrice de rotation qu’à l’éq. (7.4), dans le cas particulier n = ẑ. L’éq. (7.4) donne la forme de la matrice R correspondant à une rotation générale. On vérifie que la même rotation est obtenue en posant M = R. Par contre, une transformation de Lorentz associée à une vitesse v générale correspond plutôt à la matrice N = P (v̂, η) = cosh η/2 − v̂ · σ sinh η/2 (7.25) alors qu’une transformation générale (changement de référentiel plus rotation) peut toujours s’écrire comme N = P R. La matrice M correspondante est alors M = P −1 R = (N † )−1 . En somme, la relation entre M et N est M = (N † )−1 (7.26) 7.1. Spin et transformations de Lorentz 91 7.1.1 Spineurs droits et gauches La comparaison avec la transformation des spineurs non relativistes (éq. (7.4)) nous porte à poser simplement qu’un spineur se transforme comme ψ 0 = N ψ ou ψ 0 = M ψ lors d’une transformation de Lorentz. Pour distinguer ces deux possibilités, on définira un spineur droit ψR et un spineur gauche ψL tels que ψR0 = N ψR et ψL0 = M ψL (7.27) Les qualificatifs droit et gauches seront justifiés plus bas. La distinction entre spineurs gauche et droit n’a pas d’importance si on se limite à des rotations, sans changement de référentiel. Maintenant que nous savons comment les spineurs se transforment lors d’une transformation générale de Lorentz, nous pouvons construire un lagrangien invariant L impliquant ces spineurs, afin de construire théorie relativiste des particules de spin 21 . Pour cela, nous devons identifier des invariants construits à partir de ces spineurs. Comme démontré plus haut, N † σ µ N = Λµ ν σ ν et M † σ̃ µ M = Λµ ν σ̃ ν . Donc les combinaisons ψR† σ µ ψR et ψL† σ̃ µ ψL (7.28) se transforment comme des quadrivecteurs. Par exemple, ψR0† σ µ ψR0 = ψR† N † σ µ N ψR = Λµ ν ψR† σ ν ψR (7.29) D’autre part, comme M = (N † )−1 , la combinaison ψR† ψL et son conjugué complexe ψL† ψR sont des invariants de Lorentz : ψR0† ψL0 = ψR† N † M ψL = ψR† ψL (7.30) Les expressions suivantes sont donc des termes possibles d’une densité lagrangienne construite à l’aides de spineurs : iψL† σ̃ µ ∂µ ψL iψR† σ µ ∂µ ψR (ψL† ψR + ψR† ψL ) i(ψL† ψR − ψR† ψL ) (7.31) Notons que toutes ces quantités sont réelles, ce qui nécessite la prémultiplication par i dans les deux premiers cas. En effet, l’action S correspondant au premier terme est Z S = i d4 x ψL† σ̃ µ ∂µ ψL (7.32) Son conjugué complexe est alors Z Z n o † µ ∗ 4 S = −i d x ∂µ ψL σ̃ ψL = −i d4 x ∂µ ψL† σ̃ µ ψL − ψL† σ̃ µ ∂µ ψL (7.33) Le premier terme entre accolades est une dérivée totale et disparaı̂t de l’action, car il se transforme en intégrale sur une hypersurface d’espace-temps à l’infini par utilisation du théorème de Gauss, et la variation du lagrangien est toujours supposée nulle sur la frontière du domaine d’intégration (ici, l’infini). On trouve donc Z n o † µ ∗ 4 S = −i d x −ψL σ̃ ∂µ ψL = S (7.34) L’action est donc réelle, grâce au préfacteur i. Considérons donc une théorie construite à l’aide d’un seul type de spineur, droit ou gauche. Le lagrangien le plus simple, quadratique dans le champ ψ, serait L = iψL† σ̃ µ ∂µ ψL ou L = iψR† σ µ ∂µ ψR (7.35) 92 7. Théorie relativiste de l’électron Une variation du champ ψR ou ψL mène directement aux équations d’onde suivantes : σ̃ µ ∂µ ψL = 0 σ µ ∂µ ψR = 0 (7.36) Pour voir quel type d’objet est décrit par ces équations, posons une solution de type onde plane : µ ψL = uL e−ip µ ψR = uR e−ip xµ xµ (7.37) En substituant dans les équations d’ondes ci-haut, on trouve σ̃ µ pµ uL = 0 σ µ pµ u R = 0 (7.38) Supposons de plus que ces ondes se déplacent dans la direction +z, de sorte que pµ = (E, 0, 0, −p) (covariant). Ces équations deviennent explicitement E+p 0 E−p 0 uL = 0 uR = 0 (7.39) 0 E−p 0 E+p En supposant que l’énergie est nécessairement positive, on est forcé d’admettre uniquement les solutions suivantes : 0 1 uL = (E = p) et uR = (E = p) (7.40) 1 0 On constate que les objets décrits par ces solutions ont une masse nulle, car E = |p|. D’autre part, la projection de spin associée à ψL est négative, et celle associée à ψR est positive. 7.1.2 hélicité On définit l’hélicité comme la composante du spin s le long de la quantité de mouvement : h = s · p̂ (7.41) L’hélicité d’une particule sans masse est un invariant. En effet, la combinaison s · p̂ est un produit scalaire, et donc déjà invariante par rotations dans l’espace. Il suffit de montrer ici qu’elle est aussi invariante par rapport aux transformations de Lorentz dans la direction du mouvement de la particule. Posons justement que la particule se dirige le long de l’axe des z, de sorte que p̂ = ẑ. Dans ce cas, h = sz . Mais lors d’une transformation de Lorentz dans la direction z, le moment cinétique dans cette direction reste inchangé, car en général son expression est Lz = xpy −ypx et les composantes de r et de p perpendiculaires à la direction de la transformation ne sont pas affectées par la transformation. Cette propriété du moment cinétique s’étend aussi au moment cinétique intrinsèque (spin), même si celui-ci n’est pas exprimé en fonction de la position et de la quantité de mouvement. La seule manière de changer l’hélicité serait de changer la direction de p̂, ce qui peut se faire si la transformation de Lorentz nous permet de “dépasser” la particule, de sorte que h = s · p̂ change de signe. Mais une particule sans masse se déplace toujours à la vitesse de la lumière et ne peut être dépassée. Donc l’hélicité h est un invariant de Lorentz. Les solutions trouvées ci-haut montrent que le spineur ψL a une hélicité négative, soit un spin antiparallèle à sa vitesse. On dit que ceci correspond à une polarisation circulaire gauche, d’où le qualificatif “gauche” associé à ce type de spineur. Le contraire prévaut pour le spineur ψR . 7.2. Équation de Dirac 93 7.2 Équation de Dirac Un champ de spineur ψR ou ψL ne peut décrire, en soi, que des particules de spin 12 sans masse comme les neutrinos. Pour décrire une particule massive comme l’électron, nous devons combiner des spineurs droit et gauche. Nous devons écrire une densité lagrangienne invariante de Lorentz impliquant à la fois ψR et ψL , à l’aide des termes figurant dans (7.31). Si nous demandons en plus que la théorie soit invariante par inversion de l’espace (transformation de parité), il faut aussi que la densité lagrangienne reste la même lorsqu’on intervertit ψL et ψR . En effet, une inversion de l’espace change la polarisation droite en polarisation gauche et vice-versa. Une autre façon de le voir est que l’inversion de l’espace change le signe du vecteur vitesse (ou quantité de mouvement) mais préserve l’orientation du vecteur moment cinétique, de sorte que l’hélicité h = s · p̂ change de signe. La seule possibilité simple pour la densité lagrangienne est LD = iψL† σ̃ µ ∂µ ψL + iψR† σ µ ∂µ ψR − m(ψL† ψR + ψR† ψL ) (7.42) Nous verrons que le paramètre m correspond à la masse des particules. Plutôt que de travailler avec des spineurs droit et gauche séparés, on les combine généralement en un seul spineur à quatre composantes, dit spineur de Dirac : ψL ψ= (7.43) ψR On peut alors écrire la densité lagrangienne ainsi : µ σ̃ 0 0 1 † † L = iψ ∂µ ψ − mψ ψ 0 σµ 1 0 On définit en outre les matrices 4 × 4 suivantes : 0 1 0 γ = 1 0 k γ = 0 −σ k σk 0 (7.44) (7.45) ce qui équivaut à µ γ =γ 0 σ̃ µ 0 0 σµ (7.46) On les appelle matrices de Dirac. Enfin, on définit le spineur conjugué ψ̄ comme ψ̄ = ψ † γ 0 (7.47) La densité lagrangienne peut alors s’écrire de la manière suivante : LD = iψ̄γ µ ∂µ ψ − mψ̄ψ (7.48) L’avantage de définir le spineur conjugué ψ̄ est que la combinaison ψ̄ψ est un invariant de Lorentz, alors que la combinaison ψ̄γ µ ψ est un quadrivecteur. Une fois la forme de la densité lagrangienne établie, nous pouvons appliquer le principe de la moindre action et trouver les équations de Lagrange correspondantes. Lors d’une variation δψ du spineur de Dirac, le spineur conjugué varie comme δ ψ̄ = δψγ 0 . La variation de l’action de Dirac qui s’ensuit est Z δS[ψ] = d4 x δ ψ̄ iγ µ ∂µ ψ − mψ + iψ̄γ µ ∂µ δψ − mψ̄δψ Z (7.49) 4 µ µ = d x δ ψ̄ iγ ∂µ ψ − mψ + −i∂µ ψ̄γ − mψ̄ δψ 94 7. Théorie relativiste de l’électron où on a intégré par parties dans la dernière parenthèse. Comme le champ ψ est complexe, on peut considérer que ses parties réelle et imaginaire varient de manière indépendante, ce qui se traduit par des variations δψ et δ ψ̄ indépendantes. Le principe de la moindre action se traduit donc par les équations séparées iγ µ ∂µ ψ − mψ = 0 et − i∂µ ψ̄γ µ − mψ̄ = 0 (7.50) On montre que ces équations sont en fait équivalentes. La première de ces équations est la célèbre équation de Dirac. 7.2.1 Propriétés des matrices de Dirac Avant d’étudier les solutions à l’équation de Dirac, signalons que les matrices de Dirac ne prennent pas toujours la forme (7.45). Il est possible d’appliquer une transformation unitaire ψ → U ψ sur les spineurs de Dirac et de modifier en même temps les matrices de Dirac par γ µ → U γ µ U † sans modifier ni l’action, ni l’équation de Dirac. La représentation (7.45) est qualifiée de chirale, alors que nous allons surtout utiliser la représentation de Dirac : I 0 0 σi 0 i γ = γ = (7.51) 0 −I −σi 0 On vérifie que cette représentation s’obtient de (7.45) par la transformation 1 I I µ µ † γ → U γ U où U = √ 2 −I I (7.52) ceci correpond à l’utilisation du spineur 1 ψ=√ 2 ψL + ψR −ψL + ψR (7.53) Quelle que soit la représentation, on vérifie que les matrices de Dirac ont les propriétés suivantes : γ 0 γ µ γ 0 = (γ µ )† γ µ γ ν + γ ν γ µ = 2g µν (7.54) 7.2.2 Solution de l’équation de Dirac Trouvons maintenant les solutions à l’équation de Dirac sous la forme d’ondes planes : µ ψ = ψp ei(p·r−Et) = ψp e−ipµ x (7.55) En substituant dans l’équation de Dirac, on trouve ! 0 iγ (−iE) + i X j γ (ipj ) − m ψp = 0 (7.56) j Après prémultiplication par γ 0 , on trouve ! X 0 j 0 E− γ γ pj − mγ ψp = 0 j ou m p·σ p·σ −m ψp = Eψp (7.57) 7.2. Équation de Dirac 95 (avec la représentation de Dirac (7.51)). Il s’agit d’une équation aux valeurs propres : les valeurs possibles de E sont les valeurs propres de la matrice qui multiplie ψp et les spineurs ψp sont les vecteurs propres associés. Les valeurs propres se trouvent en solutionnant l’équation caractéristique : m − E p · σ 2 2 2 (7.58) p · σ −m − E = 0 =⇒ E − m − p = 0 p Si on définit Ep = p2 + m2 , alors les valeurs propres sont E = ±Ep . Il y a donc des solutions à énergie positive et d’autres à énergie négative. Déterminons maintenant la forme des vecteurs propres associés. Pour faciliter les choses, commençons par le cas de particules immobiles (p = 0). L’équation aux valeurs propres prend alors la forme très simple m 0 ψ0 = Eψ0 (7.59) 0 −m et les vecteurs propres normalisés, notés ui (i = 1, 2, 3, 4) sont simplement 0 0 1 1 0 0 E = −m : u3 = E = m : u1 = u2 = 1 0 0 0 0 0 0 0 u4 = 0 1 (7.60) Utilisons ensuite un truc pour trouver les solutions associées à des valeurs non nulles de p. L’équation qu’on veut résoudre est (iγ µ ∂µ − m)ψ = 0 et la solution recherchée a la forme µ ψ = ψp e−ipµ x en fonction du quadrivecteur impulsion covariant pµ = (Ep , −p). Appliquer la dérivée ∂µ sur l’exponentielle revient à remplacer ∂µ par −ipµ et l’équation de Dirac devient (pµ γ µ − m)ψp = 0. Or, tout spineur de la forme (pµ γ µ + m)ψ0 est une solution à cette équation, car (pµ γ µ − m)(pν γ ν + m) = pµ pν γ µ γ ν − m2 = (7.61) et pµ pν γ µ γ ν = 1 p p (γ µ γ ν + γ ν γ µ ) = pµ pν g µν = E 2 − p2 2 µ ν (7.62) Donc (pµ γ µ − m)(pν γ ν + m) = Ep2 − p2 − m2 = 0 (7.63) Il suffit donc d’appliquer l’expression matricielle (pν γ ν + m) aux solutions trouvées ci-haut pour p = 0 pour obtenir les solutions correspondant à une quantité de mouvement p 6= 0. Après normalisation, on trouve p 1 m + Ep 1 0 up,1 = p2E σ · p 1 p p Ep m + Ep 0 0 up,2 = idem avec 1 (7.64) −σ · p 1 p 1 Ep + m 0 up,3 = p2E p 1 p Ep + m −Ep 0 0 up,4 = idem avec 1 96 7. Théorie relativiste de l’électron Ces quatre vecteurs propres sont orthonormés : u†j uk = δjk (j, k = 1, 2, 3, 4) (7.65) Il est clair que les solutions trouvées correspondent à des particules de spin 12 , mais l’existence de 4 solutions (au lieu de deux) et la présence de solutions à énergie négative soulève des questions! Nous y répondrons dans la section suivante, en procédant à la deuxième quantification de l’équation de Dirac. 7.3 Deuxième quantification du champ de Dirac En multipliant l’équation de Dirac par γ 0 , on trouve une forme qui nous rapproche de l’équation de Schrödinger : X ∂ψ m −iσ · ∇ 0 j ∂ 0 i γ γ = Hψ où H = −i + mγ = (7.66) −iσ · ∇ −m ∂t ∂xi j La forme du hamiltonien en deuxième quantification devrait donc être Z H = d3 r ψ † Hψ (7.67) En introduisant les transformées de Fourier : ψ(r) = 1X ψ eip·r V p p (7.68) on trouve plutôt H= 1X † ψ V p p p·σ −m m p·σ ψp (7.69) Notons que les spineurs trouvés plus haut (7.64) sont précisément les vecteurs propres de la matrice qui apparaı̂t dans cette expression. En fonction de ces spineurs, on introduit la décomposition √ ψp = V cp,1 up,1 + cp,2 up,2 + cp,3 up,3 + cp,4 up,4 (7.70) et on trouve le hamiltonien H= X Ep c†p,1 cp,1 + c†p,2 cp,2 − c†p,3 cp,3 − c†p,4 cp,4 (7.71) p Nous avons procédé exactement de la même manière que pour le champ de Schrödinger, et les opérateurs cp,j doivent également obéir à des relations d’anticommutation : {cp,j , c†p0 ,j 0 } = δp,p0 δjj 0 {cp,j , cp0 ,j 0 } = 0 (7.72) On pourrait également calculer l’opérateur de la quantité de mouvement, et trouver facilement Z X † P = d3 r ψ † (−i∇)ψ = p cp,j cp,j (7.73) p,j De même, l’opérateur du nombre de particules serait Z X † cp,j cp,j N = d3 r ψ † ψ = p,j (7.74) 7.3. Deuxième quantification du champ de Dirac 97 7.3.1 Antiparticules Nous n’avons toujours pas réglé la question des états d’énergie négative, créés en agissant avec les opérateurs c†p,3 et c†p,4 . Il s’agit d’un problème en apparence très sérieux, car si on peut créer des états d’énergie négative en appliquant c†p,3 et c†p,4 sur le vide |0i, c’est que le vide n’est pas l’état fondamental. Dans ce cas, l’état fondamental serait obtenu en occupant tous les états d’énergie négative, et il y en a deux pour chaque valeur de quantité de mouvement possible! Cet état fondamental contiendrait un nombre infini de particules et serait l’analogue de ce qu’on appelle la mer de Fermi en physique de l’état solide. On l’appelle de fait la mer de Dirac. Annihiler une particule d’énergie négative de la mer de Dirac revient à augmenter l’énergie du système de Ep et modifier la quantité de mouvement du système de −p. En fait, point n’est besoin d’imaginer la mer de Dirac pour résoudre le problème des états d’énergie négative. C’est un simple problème d’interprétation. Il suffit de définir de nouveaux opérateurs : dp,1 = c†−p,3 et dp,2 = c†−p,4 (7.75) Ces opérateurs obéissent aux même relations d’anticommutation que les autres : {dp,j , d†p0 ,j 0 } = δp,p0 δjj 0 {dp,j , dp0 ,j 0 } = 0 (7.76) (ceci ne serait pas vrai pour des bosons, car un changement de signe des commutateurs serait survenu). On définit ensuite le vide |0i ainsi : cp,1 |0i = cp,2 |0i = dp,1 |0i = dp,2 |0i = 0 (7.77) Le hamiltonien prend alors la forme suivante : X † † † † Ep cp,1 cp,1 + cp,2 cp,2 − dp,1 dp,1 − dp,2 dp,2 H= (7.78) p ce qui devient, en utilisant les relations d’anticommutation, X X Ep Ep c†p,1 cp,1 + c†p,2 cp,2 + d†p,1 dp,1 + d†p,2 dp,2 − 2 H= (7.79) p p Le dernier terme est une constante. Une constante infinie, malheureusement, mais une constante tout de même, et on peut la laisser tomber, car l’énergie est de toute manière définie à une constante près. Une autre façon de voir les choses, est que le hamiltonien intervient à travers l’équation de Heisenberg Ȧ = i[H, A], et qu’une constante additive à H ne contribue pas au commutateur, et donc n’a aucun impact. Cette constante est en fait l’énergie de la mer de Dirac définie plus haut. Comme les définitions (7.75) font intervenir un changement dans le signe de la quantité de mouvement, on préserve quand même la forme correcte de l’opérateur quantité de mouvement : X † P= p cp,1 cp,1 + c†p,2 cp,2 + d−p,1 d†−p,1 + d−p,2 d†−p,2 p X † = p cp,1 cp,1 + c†p,2 cp,2 − d†−p,1 d−p,1 − d†−p,2 d−p,2 (7.80) p = X † p cp,1 cp,1 + c†p,2 cp,2 + d†p,1 dp,1 + d†p,2 dp,2 p Par contre, l’opérateur du nombre de particules est vraiment modifié par la transformation (7.75) : X † (7.81) N= cp,1 cp,1 + c†p,2 cp,2 − d†p,1 dp,1 − d†p,2 dp,2 p 98 7. Théorie relativiste de l’électron et rien ne peut changer les signes des deux derniers termes. Mais c’est ici que l’interprétation des solutions prend toute sa richesse : les particules créées par les opérateurs d†p,j ne sont pas des particules, mais des antiparticules! Elles ont les mêmes propriétés que les particules créées par les opérateurs c†p,j , mais une charge opposée. L’opérateur N représente le nombre de particules, moins le nombre d’antiparticules, soit la charge électrique (divisée par −e dans le cas des électrons). Autrement dit, les antiparticules contribuent de manière négative au nombre de particules et à la charge électrique. La théorie de Dirac prédit donc l’existence d’antiparticules à l’électron, et en fait à toutes les particules de spin 12 . L’anti-électron porte le nom de positron et a été identifié dès 1931 par Carl Anderson. Notons enfin que, en fonction des opérateurs de création et d’annihilation, le champ de Dirac a l’expression suivante : 1 XX ψ(r) = √ cp,j up,j eip·r + d†p,j vp,j e−ip·r (7.82) V p j=1,2 où on a définit des spineurs appropriés aux antiparticules : vp,1 = u−p,3 vp,2 = u−p,4 (7.83) 7.4 L’électrodynamique quantique 7.4.1 Transformations de jauge et couplage minimal Rappelons les propriétés des transformations de jauge du champ électromagnétique. Le potentiel électromagnétique Aµ = (Φ, −A) n’est pas défini de manière unique, pour une configuration donnée des champs E et B. On peut procéder à une transformation Aµ → A0µ = Aµ − ∂µ ξ où ξ est une fonction quelconque de l’espace-temps. Cette transformation n’affecte pas les champs E et B, qui sont contenus dans le tenseur de Faraday, car 0 Fµν = ∂µ A0ν − ∂ν A0µ = ∂µ Aν − ∂ν Aµ − ∂µ ∂ν ξ + ∂ν ∂µ ξ = Fµν D’un autre côté, le potentiel électromagnétique apparaı̂t aussi dans le couplage de la matière au champ électromagnétique, par exemple, dans l’équation de Schrödinger i∂t ψ = 1 (−i∇ − eA)2 ψ + Φψ 2m (7.84) Le potentiel électromagnétique, dans cet exemple, intervient par la substitution suivante : ∂µ → Dµ = ∂µ + ieAµ ~ = ∇ − ieA, et l’équation de où Dµ est appelée la dérivée covariante. En effet, D0 = ∂t + ieΦ et D Schrödinger dans un champ électromagnétique peut alors s’écrire comme suit : iD0 ψ = − 1 ~2 Dψ 2m (7.85) 7.4. L’électrodynamique quantique 99 Il est clair que la transformation de jauge doit aussi affecter la fonction d’onde ψ de la manière suivante : ψ → ψ 0 = ψeieξ Dans ce cas, la dérivée covariante Dµ ψ se transforme de la même manière que ψ : D0µ ψ 0 = (∂µ + ieA0µ )ψ 0 = (∂µ + ieAµ − ie∂µ ξ)(eieξ ψ) = eieξ ∂µ ψ + ie(∂µ ξ)eieξ ψ + ieAµ (eieξ ψ) − ie∂µ ξ(eieξ ψ) = eieξ ∂µ ψ + ieAµ ψ = eieξ Dµ ψ De même, si on applique la dérivée covariante plusieurs fois, un seul facteur de phase émerge. Par exemple, Dµ Dν ψ → eieξ Dµ Dν ψ comme cela se vérifie facilement, puisque Dν ψ se transforme exactement comme ψ, et ainsi de suite. L’équation de Schrödinger transformée est simplement 1 ieξ ~ 2 e Dψ 2m c’est-à-dire la même qu’avant, puisque le facteur de phase s’élimine de l’équation. ieieξ D0 ψ = − (7.86) L’introduction d’un champ électromagnétique permet donc d’élargir la symétrie de phase de la fonction d’onde en mécanique quantique. Au lieu d’avoir une symétrie de la théorie lors de la multiplication de la fonction d’onde ψ par une phase globale (i.e. constante) eiθ , nous avons maintenant une symétrie lors de la multiplication par une phase locale eieξ(r,t) quelconque. Une symétrie caractérisée par des changements ou transformations locales comme celle-ci porte le nom de symétrie de jauge. La prescription qui consiste à remplacer les dérivées ordinaires ∂µ par des dérivées covariantes Dµ afin de garantir l’invariance de jauge porte le nom de couplage minimal. Appliquons le couplage minimal à l’équation de Dirac (iγ µ ∂µ − m)ψ = 0. On trouve alors (iγ µ Dµ − m)ψ = (iγ µ ∂µ − eAµ γ µ − m)ψ = 0 (7.87) Le lagrangien associé à cette équation est alors LD = ψ̄(iγ µ Dµ − m)ψ = ψ̄(iγ µ ∂µ − eAµ γ µ − m)ψ (7.88) Le couplage du champ de Dirac avec le champ électromagnétique prend la forme L 1 = Aµ J µ J µ = −eψ̄γ µ ψ où J µ est le quadrivecteur courant associées au particules décrites par ψ (par exemple, les électrons et les positrons). La charge électrique est l’intégrale sur l’espace de la densité de charge, soit ρ = J 0 = eψ̄γ 0 ψ = eψ † ψ : Z Z 3 Q = d r ρ(r) = e d3 r ψ † ψ Ceci coı̈ncide (au facteur e près) avec l’expression de l’opérateur N du nombre de particules introduit plus haut. En substituant le développement en modes (7.82), on trouve XX † † Q= cp,j cp,j − dp,j dp,j p j=1,2 100 7. Théorie relativiste de l’électron ce qui démontre que les antiparticules ont la charge opposée des particules. 7.4.2 Hamiltonien d’interaction électron-photon Le Hamiltonien d’interaction électron-photon est l’opposé du lagrangien d’interaction, soit Z H = e d3 r Aµ ψ̄γ µ ψ = (7.89) Dans la jauge de Coulomb, A0 = 0 et donc Z H = −e d3 r A · ψ̄γψ = (7.90) En substituant les développements en mode (7.82) et (6.66), on trouve s Z X X 2π e d3 r ajk êjk eik·r + a†jk ê∗jk e−ik·r · H=− V ωk V j,k s,s0 ,p,p0 0 0 c†p,s ūp,s e−ip·r + dp,s v̄p,s eip·r γ cp0 ,s0 up0 ,s0 eip ·r + d†p0 ,s0 vp0 ,s0 e−ip ·r (7.91) Le développement s’effectue comme suit : s Z X X 1 2π 3 HI = −e d r V ωq V 0 0 p,p ,q j,j ,r 0 0 0 0 c†p,j cp0 ,j 0 arq (ūp,j γup0 ,j 0 ) · êr,q eir·(−p+p +q) + c†p,j d†p0 ,j 0 arq (ūp,j γvp0 ,j 0 ) · êr,q eir·(−p−p +q) c†p,j cp0 ,j 0 a†rq (ūp,j γup0 ,j 0 ) · ê∗r,q eir·(−p+p −q) + c†p,j d†p0 ,j 0 a†rq (ūp,j γvp0 ,j 0 ) · ê∗r,q eir·(−p−p −q) 0 0 dp,j cp0 ,j 0 arq (v̄p,j γup0 ,j 0 ) · êr,q eir·(p+p +q) + dp,j d†p0 ,j 0 arq (v̄p,j γvp0 ,j 0 ) · êr,q eir·(p−p +q) dp,j cp0 ,j 0 a†rq (v̄p,j γup0 ,j 0 ) · 0 ê∗r,q eir·(p+p −q) + dp,j d†p0 ,j 0 a†rq (v̄p,j γvp0 ,j 0 ) · 0 ê∗r,q eir·(p−p −q) L’intégrale sur r permet d’éliminer l’un des vecteurs d’ondes : s XX 2π HI = −e ωq V 0 p,q j,j ,r c†p,j cp−q,j 0 arq (ūp,j γup−q,j 0 ) c†p,j cp+q,j 0 a†rq (ūp,j γup+q,j 0 ) · êr,q + c†p,j d†−p+q,j 0 arq (ūp,j γvp−q,j 0 ) · êr,q · ê∗r,q + c†p,j d†−p−q,j 0 a†rq (ūp,j γvp+q,j 0 ) · ê∗r,q dp,j c−p−q,j 0 arq (v̄p,j γu−p−q,j 0 ) · êr,q + dp,j d†p+q,j 0 arq (v̄p,j γvp−q,j 0 ) · êr,q dp,j c−p+q,j 0 a†rq (v̄p,j γu−p+q,j 0 ) · ê∗r,q + dp,j d†p−q,j 0 a†rq (v̄p,j γvp+q,j 0 ) · ê∗r,q Chacun de ces huit termes correspond à un processus particulier et à un type de vertex distinct dans la théorie des perturbations ordinaires. En fonction de véritables diagrammes de Feynman, ces huit termes ne représentent qu’un seule vertex, soit le vertex fondamental de la QED. Les huit termes sont illustrés à la figure 7.1, dans le même ordre que ci-haut. Par convention et afin de les distinguer, les lignes associées au électrons sont munies d’une flèche orientée de l’état initial vers l’état final, alors que les lignes associées aux positrons sont munies de flèches orientées en sens contraire. Dans les véritables diagrammes de Feynman, ces flèches sont conservées, mais on ne 7.4. L’électrodynamique quantique 101 Figure 7.1. Les huit différents vertex associés à l’interaction électron-photon dans la théorie des perturbations ordinaire. Dans la théorie covariante des perturbations, c.-àd. dans les diagrammes de Feynman, tous ces vertex se fondent en un seul. distingue pas les électrons des positrons virtuels; on se doit cependant de conserver la continuité des flèches aux vertex. Selon une interprétation commune, les antiparticules sont comme des particules qui se propagent à l’envers dans le temps (d’où le signe négatif de l’énergie dans l’exponentielle associée à la dépendance temporelle). 7.4.3 Règles de Feynman Le calcul des diagrammes de Feynman peut se faire en suivant les règles suivantes, dites règles de Feynman: 1. Pour un processus donné, identifier les états inital et final et dessiner les lignes correspondantes. Les lignes sont affublées de flèches pour distinguer les particules (flèches dirigées vers les haut) des antiparticules (flèches dirigées vers le bas). Un photon est représenté par une ligne ondulée, sans flèche (le photon est sa propre antiparticule). 2. Construire les diagrammes possibles à un ordre donné de la théorie des perturbations en reliant les lignes par des vertex et en insérant des lignes internes, correspondant à des particules virtuelles, au besoin. Le nombre de vertex correspond à l’ordre dans le théorie des perturbations. Dans l’amplitude au carré, à chaque vertex correspond un facteur e2 = α ≈ 1/137. 3. Chaque ligne porte une certaine quadri-impulsion: notons-la pi pour les lignes externes, et qi pour les lignes internes. La direction de cette quadri-impulsion est arbitraire, c.-à-d. affaire de convention. On peut faire une analogie avec les lois de Kirchhoff dans la théorie des circuits. La quadri-impulsion est conservée à chaque vertex. 4. La contribution du diagramme à iM, où M est l’amplitude invariante du processus (normalisation relativiste) se calcule ensuite comme indiqué au tableau 7.1. a) À chaque ligne externe est associé un facteur associé au type de particule entrante ou sortante. b) À chaque ligne interne est associé un propagateur. c) À chaque vertex est associé un facteur proportionnel à e, et à une fonction delta imposant la conservation de la quadri-impulsion. 102 7. Théorie relativiste de l’électron 5. La conservation de la quadri-impulsion entre les états initial et final est une conséquence de sa conservation à chaque vertex. Cependant, le facteur global (2π)4 δ(p1 + p2 + · − pn ) associé à la conservation de l’énergie-impulsion doit être amputé, pour obtenir l’amplitude M (par opposition à M . Voir à cet effet la discussion du chapitre 1). 6. On doit intégrer sur toute quadri-impulsion interne qi qui n’est pas fixée par la conservation de la quadri-impulsion à chaque vertex. En pratique, à chaque boucle du diagramme correspond une intégration. On doit aussi sommer sur tout indice de polarisation ou de spineur associé à une ligne interne. 7. Les diagrammes qui diffèrent par la permutation de deux lignes externes associées à des fermions indiscernables doivent être combinés avec un signe relatif. De plus, toute boucle interne de fermions doit être accompagnée d’un facteur −1. Tableau 7.1 Facteurs associés aux différents éléments d’un diagramme de Feynman. fermion initial uα (p) fermion ūα (p) final antifermion initial vα (p) antifermion final v̄α (p) photon initial εµ α α α α µ µ photon final fermion virtuel photon virtuel ε∗µ (pµ γ µ + m)βα p 2 − m2 gµν −i 2 q i α µ β ν β vertex µ 4 µ −ie(γ )βα (2π) δ(q1 − q2 + q3 ) α Ces règles sont applicables dans la normalisation relativiste des états. Dans cette normalisation, les facteurs (2Ep )−1/2 qui apparaissent devant les spineurs (7.64) disparaissent. Les spineurs ont 7.4. L’électrodynamique quantique 103 les propriétés suivantes : ūp,j up,j 0 = 2mδjj 0 v̄p,j vp,j 0 = −2mδjj 0 ūp,j vp,j 0 = v̄p,j up,j 0 = 0 (7.92) Les spineurs forment aussi une base complète dans l’espace des spineurs, ce qui se traduit par les relations X X (vp,j )α (v̄p,j )β = (pµ γ µ − m)αβ (7.93) (up,j )α (ūp,j )β = (pµ γ µ + m)αβ j=1,2 j=1,2 Somme sur les polarisations et formules des traces Très souvent, on doit faire la somme de la section efficace sur les polarisations possibles de l’état final (si la polarisation des particules finales n’est pas observée dans une expérience) et la moyenne sur les polarisations des particules initiales (si les particules initiales ne sont pas préparées dans un état de polarisation donnée). Il s’agit d’une somme des carrés des amplitudes, et elle permet généralement de simplifier considérablement le résultats. La formule suivante, dite formule de Casimir, permettent d’effectuer cette somme : X [ū(p1 )Γu(p2 )][ū(p1 )Γ0 u(p2 )]∗ = Tr [Γ(p2 · γ + m2 )Γ0 (p1 · γ + m2 )] (7.94) j=1,2 0 où Γ et Γ sont des matrices 4 × 4, comme des matrices de Dirac ou des combinaisons ou produits de matrices de Dirac. L’expression p · γ signifie bien sûr pµ γ µ . Le calcul des traces s’effectue en utilisant les formules suivantes : Tr (γ µ γ ν ) = 4g µν Tr (γ µ γ ν γ ρ γ λ ) = 4(g µν g ρλ − g µρ g νλ + g µλ g ρν ) (7.95) 7.4.4 Exemples de processus Indiquons quelques processus décrits par la théorie de l’interaction électron-photon, et les diagrammes de Feynman associés à l’ordre le plus bas de la théorie des perturbations. 1. Diffusion électron-muon: 3 4 (7.96) 1 2 Dans ce processus, l’important est que les deux fermions qui diffusent l’un sur l’autre ne soient pas identiques. Le muon est représenté par une ligne pointillée pour le distinguer de l’électron, mais ceci est tout-à-fait arbitraire. Une application des règles de Feynman mène à l’amplitude suivante : M=− e2 [ū γ µ up1 ,j1 ][ūp4 ,j4 γ µ up2 ,j2 ] (p1 − p3 )2 p3 ,j3 (7.97) La somme sur les polarisation (j1,2,3,4 ) du carré de l’amplitude, effectuée à l’aide de la formule de Casimir et des formules de traces, donne h|M|2 i = 8e4 (p1 · p2 )(p3 · p4 ) + (p1 · p4 )(p2 · p3 ) − M 2 (p1 · p3 ) − m2 (p2 · p4 ) − 2m2 M 2 4 (p1 − p3 ) (7.98) 104 7. Théorie relativiste de l’électron où m est la masse de l’électron et M celle du muon. À partir de cette formule, on peut démontrer la formule de Mott pour la section différentielle de diffusion dans le repère du muon initial, en supposant que celui-ci est infiniment massif par rapport à l’électron : 2 2 e2 dσ = m + p2 cos2 θ/2 (7.99) 2 2 dΩ 2p sin (θ/2) où p est la quantité de mouvement de l’électron initial et θ est l’angle de diffusion. 1. Diffusion électron-électron ou Diffusion de Møller: 3 4 3 4 _ 1 (7.100) 2 1 2 Dans ce cas, l’identité des deux particules en cause nous force à considérer deux diagrammes qui diffèrent par une permutation des lignes sortantes. 1. Diffusion électron-positron ou Diffusion Bhabba: 3 4 3 4 + 1 (7.101) 1 2 2 1. Diffusion électron-photon ou Diffusion Compton: 3 4 3 4 + 1 2 (7.102) 1 2 Notons ici que deux diagrammes sont nécessaires, différant par une permutation des photons initial et final. 7.4.5 Corrections radiatives Pour un processus donné, les diagrammes à l’ordre le plus bas de la théorie des perturbations, comme ceux illustrés ci-haut, ne comportent aucune boucle, c.-à-d. qu’ils ont la topologie d’un arbre. Ces diagrammes sont tous relativement simples à calculer, en dépit d’un certain nombre de traces de matrices de Dirac à effectuer. Pour un processus donné, comme par exemple la diffusion électron-muon, les diagrammes contribuant à l’ordre suivant comportent tous une boucle, comme indiqué à la figure 7.2. On montre 7.4. L’électrodynamique quantique 105 Figure 7.2. Diagrammes contribuant à l’amplitude de diffusion électron-muon, à l’ordre 4 de la théorie des perturbations. que la présence d’une boucle entraı̂ne l’existence d’une quadri-impulsion libre, non déterminée par la conservation de la quadri-impulsion à chaque vertex. En fait, il est assez clair que la quadriimpulsion circulant dans une boucle insérée dans une ligne externe ou interne peut prendre une valeur arbitraire sans affecter la conservation de la quadri-impulsion le long de cette ligne. Le problème est que l’intégrale correspondante sur la quadri-impulsion est divergente. Ces divergences dans la théorie des perturbations sont apparues très tôt dans le théorie – avant qu’elle soit formulée à l’aide de diagrammes – et en ont retardé le développement pendant presque vingt ans. C’est le travail de Bethe, Feynman, Schwinger et Tomonaga à la fin des années 1940 qui a permit de contourner cette difficulté. Une procédure, appelée renormalisation, a été élaborée afin d’absorber des quantités formellement infinies – mais en pratique inobservables – dans une redéfinition de la charge e, des masses des particules et de la normalisation des champs (d’où le nom de renormalisation). Cette procédure est essentielle afin de donner un sens aux ordres plus élevés de la théorie des perturbations et permet dans quelques cas d’effectuer des calculs d’une remarquable précision. Les corrections aux ordres supérieurs de la théorie des perturbations portent généralement le nom de corrections radiatives. L’exemple le plus remarquable est le calcul du moment magnétique anormal de l’électron, le célèbre facteur g. Rappelons que le moment magnétique de l’électron est de grandeur gµB , où µB = e/2me est le magnéton de Bohr et g le facteur de Landé, communément appelé “facteur g”. Si l’électron se comportait comme une distribution de charge classique tournant sur elle-même comme une microscopique boule de billard, son facteur g serait l’unité. On montre que l’équation de Dirac mène à la valeur g = 2, ce qui constitue l’un des succès de cette équation. Par contre, la valeur mesurée de g est différente de 2, même si elle en est très proche. La valeur expérimentale acceptée, provenant d’expériences de résonances très précises, est la suivante : g = 2(1 + a) a = 0.001 596 521 884(43) (7.103) L’électrodynamique quantique permet de calculer a, c.-à-d. la déviation de g par rapport à 2. Cette déviation provient exclusivement de corrections radiatives. Le calcul a été mené jusqu’à l’ordre 8 en théorie des perturbations – correspondant à quatre boucles par diagrammes – et un total de près de 1000 diagrammes ont été calculés, la vaste majorité par des méthodes numériques, pour parvenir au résultat suivant (Kinoshita 1989) : a = C1 (α/π) + C2 (α/π)2 + C3 (α/π)3 + C4 (α/π)4 + δa (7.104) 106 7. Théorie relativiste de l’électron où les coefficients Ci sont le résultats d’intégrales cinématiques et le δa (∼ 4, 46 × 10−12 ) provient d’autres effets (boucles de muons, de taus, effets hadroniques et électrofaibles). La valeur numérique basée sur la valeur de α obtenue par l’effet Hall quantique est a = 0.001 596 521 92(17)(73)(108) (7.105) Les trois sources d’erreur proviennent respectivement de C3 , C4 et α. L’accord entre la théorie et l’expérience pour cette quantité est sans égal dans toute la physique théorique (10 chiffres significatifs). En fait, on peut utiliser cet accord pour redéfinir la constante de structure fine : α−1 = 137.035 991 4(11) (7.106) Problèmes Problme 7.1 Essayons maintenant d’arriver à l’équation de Dirac d’une manière différente de celle que nous avons utilisée en classe. Dans l’espace réciproque (impulsion et énergie), l’équation de Klein-Gordon prend la forme (g µν pµ pν − m2 )ψ = 0 où pµ = (E, −p) est le quadrivecteur d’énergie impulsion. Dans le but d’avoir une équation du premier ordre en dérivées – et donc linéaire en pµ – essayons de factoriser cette équation comme suit : (g µν pµ pν − m2 ) = (β µ pµ + m)(γ ν pν − m) où β µ et γ ν sont des quantités à déterminer. a) Démontrer que β µ et γ ν ne peuvent être des nombres ordinaires (réels ou complexes), c’est-à-dire que la factorisation ne peut pas fonctionner dans ce cas. b) Démontrez que la factorisation fonctionne si les β µ , γ ν sont des matrices telles que β µ = γ µ et γ µ γ ν + γ ν γ µ = 2g µν c) Démontrez qu’en quatre dimensions d’espace-temps, ces matrices sont au moins de dimension 4. d) Démontrez qu’en dimension 3 d’espace-temps (donc deux dimensions d’espace), on pourrait choisir une représentation des matrices de Dirac de dimension 2. 7.4. L’électrodynamique quantique 107 Problme 7.2 a) Étant donné un spineur de Dirac ψ, comment peut-on calculer la valeur des composantes (sx , sy , sz ) du spin dans cet état? b) Considérons en particulier un spineur associé à un électron de quantité de mouvement p = pẑ, mais dont l’orientation de spin est quelconque, c’est-à-dire une superposition αu1 + βu2 , où |α|2 + |β|2 = 1. Montrer que la projection du spin sur ẑ est 12 (|α|2 − |β|2 ), alors que les projections du spin le long de x̂ et ŷ sont m Re (α∗ β) Ep et m Im (α∗ β) Ep c) Que conclure de ceci pour un électron ultrarelativiste? Problme 7.3 On définit l’opération de parité – ou inversion de l’espace – par la transformation r → −r. L’effet de cette transformation sur le champ de Dirac est le suivant : ψ(r, t) → ψ 0 (r, t) = ηγ 0 ψ(−r, t) où η = ±1 est la parité intrinsèque du champ de Dirac. a) Partez de l’action associée au champ de Dirac : Z S= d4 x (iψ̄γ µ ∂µ ψ − mψ̄ψ) et démontrez que cette action est invariante lorsqu’on procède à une transformation de parité. b) Appliquez la transformation de parité à un spineur de Dirac représentant une particule au repos. Pourquoi, d’après ce calcul, affirme-t-on que la parité d’une antiparticule est l’opposée de la parité de la particule? c) Comment le champ de jauge électromagnétique Aµ se transforme-t-il lorsqu’on procède à une inversion de l’espace? Raisonnez de deux façons indépendantes: (a) à l’aide de ce que vous savez du caractère axial ou polaire des champs E et B. (b) à l’aide de la forme du couplage minimal entre le champ Aµ et un champ de matière comme le champ de Dirac. Problme 7.4 Nous allons étudier l’interaction des électrons et des positrons, décrits par le champ de Dirac, avec les bosons décrits par le champ scalaire. Il s’agit ici d’une version simplifiée de l’électrodynamique quantique (QED) où le photon a été remplacé par un boson sans polarisation. L’hamiltonien d’interaction Heφ entre le champ de Dirac et le champ scalaire doit, pour respecter l’invariance de Lorentz, avoir la forme suivante : Z Heφ = g d3 r ψ̄ψφ où ψ̄ = ψ † γ 0 . a) Écrivez une expression de l’hamiltonien d’interaction Heφ en fonction des opérateurs de création et d’annihilation des électrons (cp,j ), des positrons (dp,j ) et des bosons (aq ). Laissez les spineurs (u, ū, v, v̄) intacts dans l’expression. 108 7. Théorie relativiste de l’électron Considérons un processus de collision électron-positron au cours duquel l’électron annihile le positron pour donner deux bosons. Soit p1 et p2 les quantités de mouvement de l’électron et du positron, respectivement. Les quantités de mouvement des deux bosons de l’état final sont notées p3 et p4 . b) Montrez que l’amplitude de diffusion Mf i s’annule au premier ordre de la théorie des perturbations, mais pas au deuxième ordre et que quatre états intermédiaires y contribuent. Représentez graphiquement les termes correspondants, comme à l’éq. (6.88) des notes. c) Les quatre termes peuvent être groupés deux par deux : les deux derniers étant obtenus des deux premiers par un échange des deux bosons dans l’état final, de manière similaire à l’exemple discuté dans les notes (chap. 5). Montrez que les deux premiers termes peuvent être combinés de manière à obtenir 2πg 2 q·γ+m v̄p ,j up ,j √ V ω 3 ω 4 2 2 q 2 − m2 1 1 où q = p1 − p3 . Ici, pi désigne le quadrivecteur énergie-impulsion de la particule no i. L’expression q · γ signifie P q 0 γ 0 − 3i=1 q i γ i . Note : vous devrez utiliser les formule suivantes pour les sommes sur les spins : α β vq,j v̄q,j = 1 (q · γ − m)αβ 2εq (q 0 = εq ) uαq,j ūβq,j = 1 (q · γ + m)αβ 2εq (q 0 = εq ) X j=1,2 X j=1,2 Les deux derniers termes, quant à eux, sont obtenus en remplaçant q par q̃ = p1 − p4 . L’amplitude totale est donc donnée par l’expression Mf i = 2πg 2 v̄p ,j Aup1 ,j1 √ V ω3 ω4 2 2 où A = q · γ + m q̃ · γ + m + 2 q 2 − m2 q̃ − m2 Pour calculer la section efficace, nous devons mettre cette amplitude au carré. Si l’électron et le positron ne sont pas préparés dans des états précis de spin, il faut sommer le résultat sur les différentes valeurs possible du spin, c’est-à-dire sur j1 et j2 . d) Montrez que X j1 ,j2 |Mf i |2 = π2 g4 Tr ((p2 · γ − m)A(p1 · γ + m)A) V2 ω3 ω4 ε1 ε2 e) Placez-vous dans le référentiel du centre de masse de l’électron et du positron. Soit E l’énergie de chacune des particules incidentes et sortantes et posons p1 = pẑ, p3 = E(cos θẑ + sin θx̂). À l’aide de Mathematica, complétez le calcul et démontrez que la section différentielle de diffusion est dσ g 4 x2 20 + x2 − 12 cos 2θ − x2 cos 4θ = dΩ 64 E 2 (1 + x2 sin2 θ)2 x≡ p m Indice : définissez les matrices de Dirac dans Mathematica, ainsi que des quadrivecteurs et un tenseur métrique. f) Illustrez la dépendance angulaire de la section différentielle (i.e. un graphique en fonction de θ de θ = 0 à θ = π pour p/m = 0.1, 1 et 10. Que remarquez-vous? 7.4. L’électrodynamique quantique 109 Problme 7.5 Dessinez tous les diagrammes contribuant à la diffusion électron-photon (effet Compton) au quatrième ordre de la théorie des perturbations. Problme 7.6 a) Étant donné un spineur de Dirac ψ, on définit le spineur conjugué ψc par ψc = iγ 2 ψ ∗ Démontrez que le spineur conjugué obéit aussi à l’équation de Dirac, mais avec une charge opposée. Vous devez pour cela inclure le couplage à un potentiel électromagnétique Aµ dans l’équation de Dirac. Le spineur conjugué est ce qu’on obtient si on échange les rôles des particules et des antiparticules. b) On définit un opérateur unitaire de conjugaison de charge, C, tel que CψC † = ψc où maintenant ψ est le champ de Dirac quantifié. Avec la définition donnée ci-haut de ψc et l’expression explicite des spineurs de base up,j et vp,j , obtenez l’effet de cette transformation sur les opérateurs de création et d’annihilation. Autrement dit, calculez Ccp,j C † et Cdp,j C † Problme 7.7 Quelle sont les dimensions (au sens des unités) du champ de Dirac, du champ électromagnétique Aµ et du champ scalaire φ? Si un champ scalaire est couplé à un champ de Dirac par le lagrangien d’interaction suivant LI = gφψ ψ̄ quelle est la dimension de la constante de couplage g? Partez du fait que l’action est sans unités dans le système naturel. Problme 7.8 Démontrez les formules de complétude (7.93). Problme 7.9 Démontrez les formules de trace (7.95). Problme 7.10 Démontrez la formule de Casimir (7.94). Problme 7.11 Démontrez les formules (7.97), (7.98) et (7.99) concernant la diffusion électron-muon. CHAPITRE 8 Introduction à la théorie des groupes La théorie des groupes est l’un des outils les plus puissants de la physique mathématique. Ses applications sont nombreuses dans plusieurs branches de la physique, de la théorie des particules élémentaires à la physique des changements de phases, en passant par la physique du solide. Nous nous intéresserons ici aux groupes de Lie, qui interviennent plus particulièrement en physique des particules élémentaires dans deux contextes différents : (i) la classification des hadrons et (ii) les théories de jauge, qui décrivent les interactions fondamentales. Le but de ce chapitre est d’offrir une initiation relativement rapide à la théorie des groupes de Lie, en particulier à leurs représentations matricielles. Comme cette théorie se construit par généralisation de SU(2), familier à tous ceux qui ont étudié la théorie du moment cinétique en mécanique quantique, elle peut être exposée relativement rapidement. 8.1 Définitions et concepts de base 8.1.1 Définition d’un groupe Un ensemble G forme un groupe si une loi de composition (appelons-la multiplication) a été définie sur cet ensemble, telle que 1. L’ensemble est fermé par cette loi : si a ∈ G et b ∈ G, alors ab ∈ G. Dans ce qui suit, cette condition sera souvent appelée la règle de groupe. 2. La loi est associative : (ab)c = a(bc). 3. Il existe un élément neutre e, tel que ea = ae = a, pour tout élément a de G. 4. Tout élément a possède un inverse a−1 dans G tel que a−1 a = e. Si la multiplication est commutative (ab = ba), le groupe est dit abélien. Dans le cas contraire, plus intéressant de notre point de vue, le groupe est dit non-abélien. Un sous-ensemble H de G est appelé sous-groupe de G s’il est lui-même un groupe, avec la même loi de multiplication que G. Groupes finis, discrets et infinis Un groupe est dit fini s’il compte un nombre fini d’éléments. Il est infini dans le cas contraire. Il est dit discret si ses éléments sont clairement séparés, plus précisément s’ils sont dénombrables. Il est continu si ses éléments forment un espace ou la notion de continuité est définie. Plus précisément, un groupe de Lie est un groupe dont les éléments groupe peuvent être repérés par un système de coordonnées tiré de Rn (on dit alors que la dimension du groupe est n, le nombre de paramètres nécessaire pour spécifier un élément du groupe). 8.1. Définitions et concepts de base 111 8.1.2 Groupes définis par des matrices Il est plus simple à ce stade-ci de procéder directement à la définition des groupes de Lie qui nous intéresseront par la suite. Ceux-ci peuvent être définis par des matrices. La loi de multiplication du groupe est alors la loi de multiplication des matrices (réelles ou complexes). Les matrices formant le groupe doivent toutes être régulières (c.-à-d. avoir un inverse). Le groupe général de toutes les matrices régulières d’ordre n est appelé GL(n). Tous les groupes de Lie “classiques” sont des sous-groupes de GL(n). Il est évident que GL(n) est un groupe : la multiplication des matrices est associative et chaque matrice de GL(n) possède un inverse par définition. D’autre part, le produit de deux matrices régulières est encore une matrice régulière. Les groupes matriciels les plus importants sont : 1. Le groupe unitaire U(n), formé des matrices complexes unitaires d’ordre n. Bien entendu, le produit de deux matrices unitaires est encore unitaire et la règle de groupe est respectée. Le nombre de paramètres nécessaires pour spécifier une matrice complexe d’ordre n est 2n2 . L’unitarité U † U = 1 impose n + 2 12 n(n − 1) conditions supplémentaires, ce qui réduit le nombre de paramètres à n2 . La dimension du groupe U(n) est donc d = n2 . 2. Son sous-groupe SU(n), restreint par la condition det U = 1. Cette condition respecte la règle de groupe. Une condition supplémentaire est imposée et le nombre de paramètres est réduit à d = n2 − 1. 3. Le groupe orthogonal O(n), formé des matrices réelles orthogonales d’ordre n. Ici encore la règle de groupe est respectée, car le produit de deux matrices orthogonales est aussi une matrice orthogonale. Le nombre de paramètres est n2 , moins le nombre de contraintes indépendantes imposées par l’orthogonalité, soit 21 n(n + 1). Il reste d = 12 n(n − 1) paramètres. 4. Son sous-groupe SO(n), restreint par la condition det O = 1. Notons que cette condition ne change pas la dimension du groupe, car de toute manière det O = ±1 dans O(n). Topologiquement, elle restreint le groupe à une composante connexe. Autrement dit, tous les éléments de SO(n) peuvent être obtenus en procédant de manière continue à partir de l’identité, ce qui n’est pas le cas de O(n), puisque les matrices dites impropres (det O = −1) produisent une inversion de l’espace à n dimension sur lequel elles agissent. Le groupe des rotations en trois dimensions est précisément SO(3). Symbole R ou C Définition Dimension Rang U(n) C U †U = 1 n2 n † 2 SU(n) C U U = 1 , det U = 1 n −1 n−1 O(n) R Ot O = 1 n(n − 1)/2 [n/2] SO(n) R Ot O = 1 , det O = 1 n(n − 1)/2 [n/2] Remarques : 1. SO(n) est bien sûr un sous-groupe de SU(n). 2. SU(n − 1) est un sous-groupe de SU(n), comme SO(n − 1) de SO(n) et ainsi de suite. 112 8. Introduction à la théorie des groupes 8.2 Rotations en mécanique quantique L’étude des rotations constitue une introduction naturelle à la théorie des groupes de Lie. Une rotation est une transformation des coordonnées de l’espace, caractérisée par un axe n et un angle θ. Cette transformation des coordonnées peut être désignée par le symbole R(n, θ) et prend la forme d’une action matricielle sur le vecteur-position. L’action de cette matrice sur deux vecteurscolonnes quelconques X1 et X2 ne change pas leurs produit scalaire : 0 X1,2 = RX1,2 =⇒ X10 t X20 = X1t Rt RX2 = X1t X2 (8.1) ce qui entraı̂ne la condition Rt R = 1 (8.2) Autrement dit, les matrices de rotation sont orthogonales. Elles forment donc le groupe SO(3) (la condition de déterminant unité est imposée pour interdire les rotations qui contiennent une inversion de l’espace et qui correspondent à des matrices de déterminant −1). Par exemple, cos θ − sin θ 0 R(ẑ, θ) = sin θ cos θ 0 (8.3) 0 0 1 correspond à une rotation d’angle θ par rapport à l’axe des z. Notez que cette matrice diffère de la matrice équivalente définie en (7.6) par le signe de θ. C’est que la transformation ci-haut est une transformation active: le vecteur sur laquelle agit la matrice est transformé alors que les axes restent fixes. La matrice de rotation (7.6) définit plutôt comment les composantes d’un vecteur A fixe changent lors d’une rotation des axes, ce qu’on appelle une transformation passive. Les deux points de vue diffèrent en ce que les matrices de rotations correspondantes sont les inverses l’une de l’autre, mais l’invariance d’une théorie d’un point de vue actif est équivalente à son invariance du point de vue passif. En mécanique quantique, la rotation doit avoir un effet sur le vecteur d’état d’un système physique, si on la considère comme une véritable opération qui affecte le système. Cet effet, d’après Wigner, doit prendre la forme d’un opérateur unitaire R(n, θ) agissant sur l’espace de Hilbert : si le système se trouve dans un état |ψi avant la rotation, il se trouvera dans un état |ψ 0 i = R(n, θ)|ψi après la rotation. En particulier, si on considère les états propres |ri de la position, on doit trouver, par définition, R|ri = |R(n, θ)ri (8.4) Ceci a comme conséquence que la fonction d’onde de l’état transformé est ψ 0 (r) = hr|ψ 0 i = hr|Rψi = hR−1 r|ψi = hR−1 (n, θ)r|ψi = ψ(R−1 (n, θ)r) (8.5) Notons que la rotation inverse s’applique sur les coordonnées de la fonction d’onde, et que R−1 (n, θ) = R(n, −θ). Nous allons maintenant démontrer que l’opérateur de rotation s’obtient par exponentiation de l’opérateur du moment cinétique. Plus précisément, R(n, θ) = exp (−iθn · J) (8.6) Considérons pour cela une rotation infinitésimale, d’un angle δθ. L’effet sur la position d’une telle rotation est r0 = r + δθn ∧ r (8.7) 8.2. Rotations en mécanique quantique 113 Cette formule est une version différentielle de l’expression connue pour la vitesse d’un point en rotation avec une vitesse angulaire ω = θ̇n, soit v = ω ∧r. L’effet d’une telle rotation infinitésimale sur la fonction d’onde est ψ 0 (r) = ψ(r − δθn ∧ r) = ψ(r) − δθεijk nj xk ∂ ψ(r) ∂xi (8.8) Mais l’opérateur du moment cinétique orbital, en représentation des coordonnées, est justement ∂ ∂xi (8.9) ψ 0 (r) = ψ(r) − iδθnj Lj ψ(r) = (1 − iδθn · L) ψ(r) (8.10) L = R ∧ P = −iR ∧ ∇ ou Lj = −iεijk nj xk On peut donc écrire que Donc, dans le cas d’un système décrit par des coordonnées seulement (ce qui exclut le spin), on trouve R(n, δθ) = 1 − iδθn · L (8.11) au premier ordre en δθ. Pour exprimer une rotation d’angle θ fini, il suffit maintenant d’appliquer N fois une rotation d’angle θ/N , dans la limite N → ∞, de manière à pouvoir utiliser la formule ci-haut. On trouve alors N θ = exp (−iθn · L) (8.12) R(n, θ) = lim 1 − i n · L N →∞ N par définition de l’exponentielle. Cette équation se généralise par définition au cas d’un système avec spin, c’est-à-dire que l’opérateur de rotation sur un système de moment cinétique J général est défini par la relation (8.6). On dit que les composantes du moment cinétique sont les générateurs des rotations, justement parce que les rotations sont obtenues par application successives de Jx,y,z , à travers l’exponentielle (8.6). Revoyons le même raisonnement différemment. Considérons un opérateur unitaire de rotation très proche de l’opérateur identité (c’est-à-dire correspondant à un angle de rotation infinitésimal). On peut écrire un tel opérateur comme R = 1 − iδθH (8.13) La condition d’unitarité devient, dans ce cas, R† R = 1 =⇒ (1 + iδθH † )(1 − iδθH) = 1 =⇒ H† = H (8.14) en supposant qu’on néglige les termes en δθ2 , qui sont du deuxième ordre de petitesse. L’opérateur H doit donc être hermitique afin que R soit unitaire. Par exponentiation, on trouve encore une fois que R(θ) = e−iθH (8.15) L’opérateur H est justement la projection J · n. 114 8. Introduction à la théorie des groupes 8.3 Représentations du moment cinétique La relation (8.6) donne la forme explicite de l’opérateur de rotation agissant dans l’espace de Hilbert. Une action concrète de cet opérateur requiert donc de connaı̂tre précisément l’action de l’opérateur J du moment cinétique. Or, ce que la théorie du moment cinétique nous apprend, c’est que l’action de J est bien définie sur des ensembles finis d’états quantiques qui forment ce qu’on appelles des représentations du moment cinétique. Plus précisément, une représentation du moment cinétique est définie par un nombre j (entier ou demi-entier) et compte 2j + 1 états. L’action des trois opérateurs Jx,y,z est fermée sur ces 2j + 1 états, ce qui signifie que si on applique l’une des composantes de J sur l’un de ces états, on produit une combinaison linéaire des 2j + 1 états en question, sans sortir de ce sous-espace. Dit autrement, si on restreint l’espace de Hilbert à ce sous-espace fini de dimension 2j + 1, alors l’action des composantes du moment cinétique sur ce sous-espace est bien définie. Comme premier exemple, considérons toutes les fonctions d’ondes quadratiques, c’est-à-dire de la forme xi xj , où i et j prennent les valeurs 1 à 3 (ou x, y et z). Il y a six fonctions quadratiques linéairement indépendantes : x2 y2 z2 xy xz yz (8.16) Lorsqu’on procède à une rotation des axes, une fonction quadratique se transforme encore en fonction quadratique. Ainsi, suite à une rotation d’angle θ par rapport à l’axe des z, la fonction x2 devient x2 → (x cos θ − y sin θ)2 = x2 cos2 θ + y 2 sin2 θ − 2xy sin θ cos θ (8.17) ce qui illustre le fait que les fonctions quadratiques se transforment entre elles lors des rotations. Cependant, on peut écrire une fonction quadratique qui est en soi invariante par rotation; il s’agit bien sûr de r2 = x2 + y 2 + z 2 (8.18) C’est donc qu’il reste cinq autres fonctions qui doivent se transformées les unes dans les autres lors d’une rotation. Ces cinq fonctions correspondent en fait aux harmoniques sphériques associées à l=2: s s 15 15 1 2 Y2±2 = sin2 θe±2iϕ = (x + y 2 ± 2xy) 32π 32π r2 s s 15 15 1 (8.19) Y2±1 = ∓ sin θ cos θe±iϕ = ∓ (zx ± izy) 8π 8π r2 s s 15 15 1 0 2 Y2 = (3 cos θ − 1) = (2z 2 − x2 − y 2 ) 2 16π 16π r Or ces cinq fonctions forment un sous-espace sur lequel l’action des composantes du moment cinétique orbital L est bien définie. Comme deuxième exemple, considérons les deux états qui forment la représentation de spin 12 . Dans ce cas, les états sont de nature plus abstraite, c’est-à-dire qu’ils ne correspondent pas à des fonctions des coordonnées (le spin n’est pas défini en fonction des coordonnées). il est bien connu que, dans ce cas, la forme explicite des matrices de rotation est R(n, θ) = exp (−iθn · J) = cos θ/2 − in · σ sin θ/2 (8.20) 8.3. Représentations du moment cinétique 115 Rappelons la démonstration de cette relation. Dans le sous-espace des états de spin 12 , les composantes du moment cinétique ont la représentation matricielle J = 12 σ en fonction des matrices de Pauli. Les matrices de Pauli ont la propriété suivante : σa σb = δab + iεabc σc (8.21) (n · σ)2 = na nb σa σb = na na = n2 = 1 (8.22) et ceci entraı̂ne que de sorte que m (n · σ) = 1 (m pair) n·σ (m impair) (8.23) et donc que m m ∞ ∞ X X 1 −iθ 1 −iθ exp (−iθn · J) = + n · σ = cos θ/2 − in · σ sin θ/2 (8.24) m! 2 m! 2 m impair m pair 8.3.1 SU(2) Le groupe SU(2) des matrices unitaires 2 × 2 de déterminant unité est précisément décrit par l’ensemble des matrices de rotations associées au spin 12 . En fait, toute matrice unitaire de déterminant unité peut être représentée comme l’exponentielle d’une matrice hermitique sans trace : U = e−iH . Notons à cette fin que, pour une matrice générale A, Tr ln A = ln det A, ce qui entraı̂ne que si det A = 1, alors ln A est sans trace. Le fait que J · n soit un opérateur hermitique de trace nulle entraı̂ne donc nécessairement que R(n, θ) est unitaire et de déterminant unité. Il y a donc une relation étroite entre le groupe de rotation SO(3) et le groupe unitaire SU(2). Il se trouve que la distinction entre les deux groupes est de nature topologique.1 . En fait, à chaque élément de SO(3), donc à chaque rotation physique, correspondent deux éléments de SU(2). Plus explicitement, à une rotation (n, θ) de SO(3) on peut associer les matrices R(n, θ) et R(n, θ + 2π), qui diffèrent par leur signe, mais qui correspondent à la même opération physique. Comme les spineurs transformés par θ et par θ + 2π ne diffèrent que par leur signe, c’est-à-dire une phase globale, la distinction n’a pas de conséquences physiques. 8.3.2 Construction des représentations du moment cinétique Nous présentons dans cette section une revue de la construction explicite des représentations du moment cinétique. À l’aide des trois opérateurs Ja , on peut construire un opérateur quadratique en J qui commute avec tous les générateurs. Un tel opérateur porte le nom d’opérateur de Casimir en général, mais dans le cas de SU(2) il correspond simplement au carré du moment cinétique : J 2 = J12 + J22 + J32 (8.25) On vérifie sans peine que [J 2 , Ja ] = 0. Donc, par le lemme de Schur, cet opérateur est proportionnel à l’identité dans le module considéré. Nous désignerons la valeur propre de cet opérateur par j(j+1), sans présumer tout-de-suite de la valeur (entière ou non) de j. 1 Dans le jargon, SU(2) est simplement connexe, alors que SO(3) est doublement connexe. 116 8. Introduction à la théorie des groupes Ensuite, nous construisons des opérateurs d’échelle J± = J1 ± iJ2 tels que [J3 , J± ] = ±J± [J+ , J− ] = 2J3 Ces relations de commutation signifient que l’opérateur J+ , agissant sur un état propre |mi de J3 , produit un autre état propre de J3 avec valeur propre m + 1. Ceci se voit facilement à partir de la relation de commutation [J3 , J+ ] = J+ : J3 (J+ |mi) = (J+ J3 + J+ )|ri = (m + 1)J+ |mi (8.26) Autrement dit, on a des relations du genre J+ |mi = αm |m + 1i J− |mi = βm |m − 1i Pour déterminer ces constantes αm et βm , on utilise les relations de commutation pour écrire J 2 = J32 + 21 (J+ J− + J− J+ ) = J32 + J3 + J− J+ = J32 − J3 + J+ J− et on procède aux calculs suivants : 2 2 αm = J+ |mi = hm|J− J+ |mi = hm|(J 2 − J32 − J3 )|mi = j(j + 1) − m(m + 1) (8.27) (8.28) et 2 2 βm = J− |mi = hm|J+ J− |mi = hm|(J 2 − J32 + J3 )|mi = j(j + 1) − m(m − 1) (8.29) et donc J+ |mi = p j(j + 1) − m(m + 1)|m + 1i J− |mi = p j(j + 1) − m(m − 1)|m − 1i (8.30) On constate que J+ |m = ji = 0 et que J− |m = −ji = 0. La dimension de la représentation est donc finie, pourvu que m = j et m = −j soient toutes les deux des valeurs propres de J3 . Comme ces valeurs propres sont espacées de 1, il faut donc que 2j soit un entier. Dès lors, on peut construire explicitement les représentations possibles : à chaque valeur entière ou demi-entière de j correspond une représentation irréductible de SU(2). Les éléments de matrice des générateurs J3 et J± (et, par là, de J1 et J2 ) sont donnés par hm0 |J3 |mi = mδm0 ,m p j(j + 1) − m(m + 1) p 0 hm |J− |mi = δm0 ,m−1 j(j + 1) − m(m − 1) hm0 |J+ |mi = δm0 ,m+1 Par exemple, dans 1 J3 = 0 0 le cas j = 1, on trouve 0 0 0 1 1 0 0 J1 = √ 2 0 0 −1 1 0 1 0 1 0 0 1 J2 = √ i 2 0 (8.31) −i 0 0 −i i 0 8.4. Représentations : concepts généraux 117 8.4 Représentations : concepts généraux Le concept de représentation, que nous avons introduit de manière informelle dans la section précédente dans le cas du groupe des rotations, est central à la théorie des groupes. Nous allons maintenant le définir de manière plus générale. Une représentation de dimension n d’un groupe G (plus précisément, une représentation vectorielle) est un ensemble de matrices d’ordre n qui sont en correspondance avec les éléments du groupe (isomorphisme). Si on désigne par a et b des éléments de G et par R(a) et R(b) les matrices correspondantes, on doit avoir R(ab) = R(a)R(b) R(a−1 ) = R(a)−1 (8.32) Un même groupe a généralement plusieurs représentations de dimensions différentes. Les groupes de Lie définis plus haut ont une infinité de représentations différentes. Parmi toutes ces représentations, celle qui sert à définir le groupe est qualifiée de fondamentale. Par exemple, la représentation fondamentale de SU(2) est formée des matrices définies en (8.20). La représentation fondamentale de SO(3) serait plutôt donnée par les matrices de rotation 3 × 3 dont (8.3) est un cas particulier. L’espace vectoriel de dimension n sur lequel les matrices d’une représentation agissent est appelé le module de la représentation. Malheureusement, un abus de langage courant donne aussi à cet espace le nom de représentation; le contexte aide généralement à distinguer les deux concepts. C’est sur cet espace que résident les objets qui sont transformés par la représentation du groupe. Le module de la représentation fondamentale de SO(3) est simplement l’espace cartésien de dimension 3. En mécanique quantique, les modules sont des sous-espaces de l’espace des états. Par exemple, l’ensemble des états de moment cinétique orbital l dans un atome (oublions le spin pour le moment) forme le module associé à la représentation de dimension 2l + 1 de SO(3). Il ne faut pas confondre la dimension d’un groupe de Lie (le nombre de paramètres nécessaires pour repérer un élément du groupe) et la dimension d’une représentation du même groupe. Une représentation est dite réductible si le module V correspondant peut être divisé en une somme directe (V = V1 ⊕ V2 ) telle que V1 et V2 ne sont pas mélangés par l’action du groupe. Cela signifie qu’il est possible de choisir une base dans V telle que toutes les matrices de la représentation sont diagonales par blocs, c.-à-d. qu’un élément de V1 (ou de V2 ) demeure dans V1 (resp. V2 ) quand un élément du groupe agit sur lui. Dans le cas contraire, la représentation est dite irréductible. Ce sont ces dernières qui sont intéressantes, puisque les représentations réductibles peuvent être obtenues par somme directe de représentations irréductibles. 8.4.1 Lemme de Schur Un des résultats importants de la théorie des groupes est le lemme de Schur, qui stipule que si une matrice H commute avec tous les éléments d’une représentation irréductible, alors H est proportionnel à l’identité. Si H commute avec tous les éléments d’une représentation réductible, alors H est diagonal, et égal à un multiple de l’identité dans chaque sous-module irréductible, la constante de proportionnalité étant a priori différente dans chaque sous-module. L’application de ce lemme à la mécanique quantique est particulièrement utile : si, en raison d’une symétrie, le hamiltonien H commute avec tous les éléments d’un groupe de transformation, alors H est une constante dans chaque module irréductible du groupe, c’est-à-dire que tous les états appartenant à un même module irréductible ont la même énergie. C’est ici le principal avantage de la théorie des groupes en mécanique quantique : la classification des niveaux d’énergie. On voit comment la présence de symétries dans un système quantique est reliée à une dégénérescence des niveaux d’énergie : les n états indépendants d’une représentation (module) irréductible de 118 8. Introduction à la théorie des groupes dimension n d’un groupe de symétrie du hamiltonien ont tous la même énergie, par le lemme de Schur. Si un groupe est abélien, chaque élément du groupe commute avec tous les autres et le lemme de Schur s’applique à tous les éléments! On conclut que la seule représentation irréductible d’un groupe abélien est de dimension 1. Une représentation est dite unitaire si toutes ses matrices sont unitaires (ne pas confondre avec le groupe unitaire U(n)). En mécanique quantique on s’intéresse uniquement aux représentations de ce type. Deux représentations sont dite équivalentes si elles sont reliées par une transformation de similitude, provenant par exemple d’un simple changement de base sur le module. En clair, si A est un élément d’une représentation, alors la représentation formée des éléments SAS −1 est équivalente à la première, pourvu que la matrice S soit la même pour tous les éléments de la représentation. 8.4.2 Représentation projective Pour être plus précis, les représentations qui sont pertinentes à la mécanique quantiques ne sont pas les représentation vectorielles proprement dites, mais les représentations dites projectives, qui sont caractérisées par la relation D(a)D(b) = e(a, b)D(ab) où e(a, b) est une phase qui dépend des deux éléments a et b Ceci provient du fait que la propriété de groupe doit être satisfaite non pas par des matrices agissant sur des vecteurs, mais sur des états physiques, qui sont des vecteurs modulo une phase arbitraire. L’espace des états est en réalité un espace projectif, c.-à-d. un espace vectoriel sur lequel deux vecteurs qui ne diffèrent que par une constante multiplicative sont identifiés. La propriété de groupe s’énonce alors comme suit : les états D(a)D(b)|ψi et D(ab)|ψi doivent être équivalents, ce qui mène à la relation (8.32). Wigner a démontré qu’on pouvait toujours ramener une représentation projective à une représentation vectorielle, parfois multivoque. C’est ce qui se produit dans le cas du groupe SO(3) et des spins demi-entiers et qui explique l’équivalence de fait entre SO(3) et SU(2) en mécanique quantique. 8.5 SU(3) Le groupe SU(3) est défini par l’ensemble des matrices unitaires 3 × 3 de déterminant unité. Il intervient en physique des particules dans la classification des hadrons et, plus fondamentalement, dans la théorie des interactions fortes (la chromodynamique quantique). Nous allons esquisser comment les représentations de SU(3) sont construites, par analogie avec les représentations de SU(2). Il faut premièrement identifier l’analogue pour SU(3) des opérateurs du moment cinétique, c.-à-d. les générateurs du groupe. Comme toute matrice unitaire de déterminant unité peut s’exprimer comme l’exponentielle d’une matrice hermitique de trace nulle, les générateurs de SU(n) correspondent à toutes les matrices hermitiques de trace nulle possibles. Dans le cas n = 2, il y a trois matrices linéairement indépendantes de ce type, soit les trois matrices de Pauli, et leurs relations de commutation sont celles des composantes du moment cinétique (modulo un facteur multiplicatif de 2). Dans le cas n = 3, il y a n2 − 1 = 8 matrices hermitiques sans trace. La convention est d’utiliser les matrices suivantes, dites matrices de Gell-Mann : 8.5. SU(3) 119 0 λ1 = 1 0 0 λ4 = 0 1 0 λ6 = 0 0 1 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 −i λ2 = i 0 0 0 0 0 λ5 = 0 0 i 0 0 0 λ7 = 0 0 0 i 0 0 0 −i 0 0 0 −i 0 1 λ3 = 0 0 0 0 0 0 −1 0 1 1 λ8 = √ 0 3 0 0 1 0 0 0 −2 Ces matrices sont une généralisation des matrices de Pauli. Elles sont normalisées afin que Tr (λa λb ) = 2δab . Par analogie avec le moment cinétique, on définit les opérateurs (ou générateurs) Ta qui obéissent aux même relations de commutation que les matrices 12 λa , soit [Ta , Tb ] = ifabc Tc où f123 = 1 f147 = f246 = f257 = f345 = f516 = f637 = √ 3 f458 = f678 = 2 fijk = −fjik = −fikj fiij = fijj = 0 1 2 (8.33) Dans la représentation fondamentale de SU(3), les générateurs sont simplement donnés par Ta = 1 T3 de 2 λa , mais leur forme est différente dans les autres représentations. Notons que le générateur √ SU(3) est souvent noté I3 , et on introduit aussi l’opérateur d’hypercharge Y = (2/ 3)T8 . Deux des générateurs de SU(3) commutent entre eux : T3 et T8 . On peut donc désigner les états propres d’une représentation par les valeurs propres associées à ces deux opérateurs : T3 |m, yi = m|m, yi T8 |m, yi = y|m, yi Dans la représentation fondamentale, on peut lire les valeurs propres directement de la forme explicite de T3 et T8 en fonction des matrices de Gell-Mann (8.32) : (m, y) = ( 21 , 2√1 3 ) , (− 12 , 2√1 3 ) , (0, − √13 ) (8.34) En portant ces valeurs sur un plan cartésien, on forme un triangle équilatéral inversé. Cette représentation fondamentale est aussi désignée par la lettre 3 (un chiffre en caractères gras indiquant la dimension de la représentation). Une fois construite une représentation des générateurs Ta , les matrices du groupe SU(3) s’obtiennent simplement par exponentiation, exactement comme dans le cas des rotations et du moment cinétique. Huit paramètres ωa (a = 1, . . . , 8) sont requis pour spécifier précisément la combinaison requise ωa Ta des générateurs, et la matrice SU(3) correspondante est simplement l’exponentielle R(ω) = e−iωa Ta (8.35) Mais généralement nous nous intéressons plus aux modules des représentations qu’aux représentations proprement dites, de sorte que l’exponentiation ne sera pas calculée en pratique. 120 8. Introduction à la théorie des groupes 8.5.1 Représentations conjuguées Supposons que nous ayons une certaine représentation des générateurs Ta , de dimension quelconque, et obéissant donc aux relations de commutation [Ta , Tb ] = ifabc Tc . La représentation conjuguée à celle-ci est définie en appliquant la conjugaison complexe et un changement de signe (c) aux générateurs : Ta = −Ta∗ . Ces opérateurs conjugués forment aussi une représentation, car ils obéissent aux même relations de commutation; cela se vérifie en appliquant la conjugaison complexe : ([Ta , Tb ])∗ = −ifabc Tc∗ =⇒ [−Ta∗ , −Tb∗ ] = ifabc (−Tc∗ ) (8.36) Dans le cas de SU(2), la représentation conjuguée est équivalente à la représentation d’origine, et le concept n’est pas utile. Ce n’est plus le cas en général : la représentation conjuguée est vraiment distincte, autrement dit, elle n’est pas reliée à la représentation d’origine par un simple changement de base. En particulier, le changement de signe fait que les valeurs propres de (T3 , T8 ) associées à la représentation conjuguée sont opposées à celle de la représentation d’origine. Par exemple, la représentation conjuguée à la représentation fondamentale 3 de SU(3) est notée 3c , et les valeurs propres associées sont (m, y) = (− 12 , − 2√1 3 ) , ( 12 , − 2√1 3 ) , (0, √13 ) (8.37) qui forment un triangle équilatéral droit dans le plan cartésien. 3c 6 15 3 8 Figure 8.1. Quelques représentations de SU(3), représentées sur le plan (m, y) des valeurs propres de T3 et T8 . Un point encerclé désigne deux états dégénérés. 8.5.2 Représentation adjointe Le commutateur de deux générateurs est une combinaison linéaire des générateurs. C’est le sens de l’expression [Ta , Tb ] = ifabc Tc . Cette linéarité signifie qu’on pourrait représenter l’action d’un générateur Ta sur un autre générateur Tb par son commutateur avec lui, et former une matrice (Ta )cb = ifabc . Ces matrices forment une représentation du groupe qu’on appelle représentation adjointe. Les valeurs propres associées à cette représentation s’obtiennent en considérant les opérateurs d’échelle, définis comme suit : I± = T1 + iT2 V± = T4 + iT5 U± = T6 + iT7 (8.38) 8.6. Produits tensoriels 121 et qui sont des généralisations des composantes J± du moment cinétique. On calcule les relations de commutation suivantes avec T3 et T8 : [T3 , I± ] = ±I± [T3 , V± ] = [T8 , I± ] = 0 √ 3 V 2 ± √ 3 [T8 , U± ] = ± U 2 ± ± 12 V± [T8 , V± ] = ± [T3 , U± ] = ∓ 21 U± (8.39) Ces relations confirment le caractère “échelle” de ces opérateurs, et démontrent aussi que ces opérateurs sont des vecteurs propres de T3 et T8 dans la représentation adjointe. En effet, un opérateur A qui est vecteur propre de T3 et T8 dans cette représentation est tel que [T3 , A] = mA [T8 , A] = yA (8.40) par définition de l’action des générateurs dans cette représentation. On peut donc lire les valeurs propres (m, y) de cette représentation par les coefficients qui apparaissent dans (8.39) : √ √ (m, y) = ±(1, 0) , ±( 12 , 3/2) , ±(− 12 , 3/2) (8.41) sans oublier (m, y) = (0, 0) deux fois, c’est-à-dire une fois pour chacun des opérateurs T3 et T8 , qui commutent entre eux. Si on trace ces valeurs propres sur le plan cartésien, on trouve une figure hexagonale. La représentation ajdointe de SU(3) est de dimension 8 (car il y a 8 générateurs) et est notée 8. 8.6 Produits tensoriels Lorsqu’on réunit deux systèmes physiques en un seul, l’espace des états en mécanique quantique est le produit tensoriel des espaces associés aux deux systèmes qu’on réunit. De même, si on dispose dans chacun de ces espaces d’une représentation d’un groupe de symétrie, les opérateurs du groupe agissant sur l’espace-produit seront des produits tensoriels d’opérateurs : (1) R1 = e−iωa Ta et (2) R2 = e−iωa Ta (tot.) mènent à R1 ⊗ R2 = e−iωa Ta (8.42) où on a défini le générateur total Ta(tot.) = Ta(1) ⊗ 1 + 1 ⊗ Ta(2) (8.43) La théorie de l’addition des moments cinétiques est le prototype de la théorie plus générale du produit tensoriel des représentations. Dans le cas de SU(2), le produit tensoriel s’effectue simplement. Sans nous attarder à la question des coefficients de Clebsch-Gordan, ne nous attardons qu’aux valeurs propres de la somme des moments cinétiques. Supposons qu’on additionne deux moments cinétiques, dans les représentations j1 et j2 . Cette somme produira plusieurs représentation irréductibles de SU(2), avec des valeurs de j allant de j1 + j2 à |j1 − j2 |. On peut obtenir ce résultat en additionnant simplement les valeurs propres de T3 pour les deux représentations, comme indiqué à la figure 8.2. On procède de la même manière pour les produits tensoriel de SU(3). Un exemple est illustré à la figure 8.3. On peut, en procédant à des produits tensoriels répétés, générer toutes les représentations irréductibles de SU(3). Les diagrammes associés ont tous cette symétrie par rotation de 120◦ . Les représentations les plus simples sont appelées triangulaires, et ont dimension 12 n(n + 1), c’est-à-dire 3, 6, 10, 15, 21, etc. Les diagrammes correspondant ont une forme de triangle et aucune des valeurs 122 8. Introduction à la théorie des groupes m j=5/2 j=3/2 j=1/2 Figure 8.2. Addition des moments cinétiques, c’est-à-dire des générateurs du groupe, dans le cas de SU(2). On combine ici une représentation de spin j = 23 à une représentation de spin j = 1. On ajoute à chaque valeur propre de la première représentation les valeurs propres de la deuxième, ce qui produit un ensemble de 3 × 4 = 12 valeurs propres, la plupart dégénérées. On forme la représentation j = 52 à partir de la plus élevée de ces valeurs propres. Si on enlève les valeurs propres correspondantes, il ne reste qu’une copie de la valeur propre m = 23 , à partir de laquelle on sait qu’une représentation j = 23 existe dans la somme; si on enlève les valeurs propres correspondantes, il ne reste que les deux valeurs propres associée à la représentation j = 12 . Donc on sait, symboliquement, que ( 32 ) ⊗ (1) = ( 52 ) ⊕ ( 32 ) ⊕ ( 12 ) y m Figure 8.3. Combinaison de deux copies de la représentation fondamentale de SU(3). On constate que 3 ⊗ 3 = 6 + 3c . propres n’est dégénérée. En général, les représentations ont la forme de triangles tronqués (comme la représentation non triangulaire de dimension 15 ilustrée à la fig. 8.1) ou la représentation de dimension 42 illustrée à la figure 8.4). Si p + 1 est le nombre de points sur le côté supérieur du diagramme et q +1 le nombre de points sur le côté inférieur, alors on peut désigner la représentation par le couple (p, q). La figure 8.4, par exemple, illustre la représentation (2, 3). La représentation fondamentale est (1, 0), l’adjointe est (1, 1) et les représentation triangulaires sont de la forme (n, 0) où n = 1, 2, 3, . . .. La représentation conjuguée à (p, q) est (q, p). La dégénérescence des valeurs propres est déterminée par les règles suivantes : 1. Les valeurs propres situées sur la périphérie du diagramme sont non dégénérées. 2. La dégénérescence augmente de 1 à mesure qu’on pénètre dans le diagramme à partir de la périphérie, mais arrête d’augmenter dès qu’on rencontre une forme triangulaire à l’intérieur. Voir la figure 8.4 comme exemple. 8.6. Produits tensoriels 123 Figure 8.4. Représentation de dimension 42. Les valeurs propres représentées par les cercles simples sont non dégénérées. Celles représentées par les cercles doubles sont dégénérées deux fois, et celles représentées par les cercles triples sont dégénérées trois fois. Cette représentation est aussi notée (2, 3). On indique dans ce qui suit quelques produits tensoriels simples : 3 ⊗ 3 = 3c ⊕ 6 3 ⊗ 3c = 8 ⊕ 1 3 ⊗ 6 = 8 ⊕ 10 3c ⊗ 6 = 3 ⊕ 15 (8.44) 3 ⊗ 8 = 3 ⊕ 6c ⊕ 15 3 ⊗ 10 = 15 ⊕ 150 où par définition la représentation 150 est triangulaire et correspond à (4, 0). Ces produits s’écriraient plutôt comme suit dans la notation (p, q) : (1, 0) ⊗ (1, 0) = (0, 1) ⊕ (2, 0) (1, 0) ⊗ (0, 1) = (1, 1) ⊕ (0, 0) (1, 0) ⊗ (2, 0) = (1, 1) ⊕ (3, 0) (0, 1) ⊗ (2, 0) = (1, 0) ⊕ (2, 1) (1, 0) ⊗ (1, 1) = (1, 0) ⊕ (0, 2) ⊕ (2, 1) (1, 0) ⊗ (3, 0) = (2, 1) ⊕ (4, 0) (8.45) 124 8. Introduction à la théorie des groupes 8.7 Symétrie de saveur des quarks Considérons les trois quarks les plus légers : u, d et s. On peut considérer ces trois quarks comme trois composantes d’un même objet (u, d, s). Les interactions fortes traiteront ces trois quarks de la même manière, et si on néglige les différences de masses parmi ces trois quarks, alors la physique des interactions fortes devrait être identique pour les trois. Plus précisément, le lagrangien de ces trois quarks, en l’absence d’interaction, serait de la forme suivante : X L= ψ̄ α (iγ µ ∂µ − mα )ψα (8.46) α où le spineur de Dirac ψα représente les quarks (u, d, s) pour α = 1, 2, 3. Si les trois masses sont égales, alors ce lagrangien est invariant lorsqu’on procède à une rotation unitaire ψα → Uαβ ψβ ou, plus court, ψ → U ψ (8.47) Il s’agit d’une rotation dans l’espace des saveurs de quarks et le groupe de symétrie est SU(3). Les trois quarks (u, d, s) forment à eux trois la représentation fondamentale de SU(3), soit 3 = ¯ s̄), obtenus par conjugaison de charge, forment la représentation (1, 0). Les trois antiquarks (ū, d, c conjuguée 3 = (0, 1). Les mésons sont obtenus en assemblant un quark et un antiquark. Les représentations correspondantes viennent du produit tensoriel de 3 et de 3c , c’est-à-dire un octet 8 = (1, 1) et un singulet 1 = (0, 0). L’assignation des mésons à ces états est illustrée à la figure 8.5. K0 π– K+ K*0 π+ π0 _ K0 K– J=0 ρ– K*+ ρ+ ρ0 K*– _ K*0 J=1 Figure 8.5. La classification des mésons dans des multiplets du SU(3) de saveur. À gauche, les états de spin 0, à droite ceux de spin 1. Dans les deux cas, les octets sont illustrés. Il y a aussi un singulet η 0 de spin 0 et un singulet φ de spin 1. Les baryons sont obtenus en assemblant trois quarks. Les représentations correspondantes viennent du triple produit tensoriel de 3 avec lui-même, c’est-à-dire 3 ⊗ 3 ⊗ 3 = 3 ⊗ (3c ⊕ 6) = 1 ⊕ 8 ⊕ 8 ⊕ 10 Le décuplet et l’octet sont illustrés à la figure 8.6. 8.8. Symétrie de couleur 125 n Σ– ∆– p Σ0 Σ+ ∆0 ∆+ Σ *– Σ *0 ∆ ++ Σ *+ Λ Ξ– Ξ0 Ξ *– Ξ *0 Ω0 J=1/2 J=3/2 Figure 8.6. La classification des baryons dans des multiplets du SU(3) de saveur. À gauche, les états de spin 21 dans un octet; à droite ceux de spin 32 dans un décuplet. 8.8 Symétrie de couleur Les quarks possèdent aussi une “couleur”, c’est-à-dire que chaque saveur de quark existe dans des combinaisons linéaires de trois composantes ψi (i = 1, 2, 3). Les transformations de couleur sont donc formellement semblables aux transformations de saveur et appartiennent aussi à un groupe SU(3) – qu’on désigne souvent par SU(3)c pour le distinguer du groupe SU(3)s des saveurs. La différence importante est que la symétrie de couleur est exacte et a en plus rang de symétrie locale (voir le chapitre sur les théories de jauge), alors que la symétrie de saveur est approximative, de sorte que les différents états de saveurs appartenant à une même représentation n’ont pas en réalité la même masse. L’une des propriétés fondamentales de l’interaction forte, basée sur la couleur, est que seuls les singulets de couleurs sont des états physiques. Les représentations de dimensions plus grandes que l’unité sont, en quelque sorte, infiniment massives et n’apparaissent pas dans le spectre des états physiques. Ainsi, les quarks libres, qui appartiennent à la représentation fondamentale de SU(3), ne sont pas des états physiques. On peut tirer des produits tensoriels étudiés plus haut qu’il est possible de construire un singulet de couleur en combinant (i) un quark et un antiquark et (ii) trois quarks. En effet, les produits tensoriels 3⊗3c et 3⊗3⊗3 contiennent chacun un singulet, et donc un état physique possible. Ceci n’est pas vrai pour une combinaison de deux quarks (3 ⊗ 3) ou de quatre quarks (3 ⊗ 3 ⊗ 3 ⊗ 3). Il se trouve que l’état singulet à trois quarks est l’état complètement antisymétrique lors de l’échange de deux quarks. On peut l’écrire comme suit : 1 √ (|RGBi + |GBRi + |BRGi − |GRBi − |RBGi − |BGRi) 6 (8.48) où (R, G, B) désignent les trois états de couleur qui forment une base conventionnelle dans l’espace des couleurs. Dans le cas d’une combinaison quark-antiquark, la combinaison invariante est plutôt 1 √ |RR̄i + |GḠi + |B B̄i 3 (8.49) où (R̄, Ḡ, B̄) désignent les trois états de couleur pour les antiquarks. L’autre particule fondamentale des interactions fortes est le gluon, ou plutôt les gluons, car il y en a huit. Ils appartiennent à la représentation 8 = (1, 1) (l’octet) de SU(3). En soi, les gluons ne sont pas des états physiques, mais des combinaisons de deux gluons ou de trois gluons – appelées 126 8. Introduction à la théorie des groupes glueballs (ou boules de glue) – ne sont pas interdites par la règle de neutralité de couleur. En effet, on a le produits tensoriel suivant : 8 ⊗ 8 = 1 ⊕ 8 ⊕ 8 ⊕ 10 ⊕ 10c ⊕ 27 (8.50) et, à partir de ce produit tensoriel, on montre facilement que 8 ⊗ 8 ⊗ 8 contient aussi un singulet. La théorie du groupe SU(3)c sera abondamment utilisée dans le chapitre portant sur les théories de jauge. Problèmes Problme 8.1 Considérez le problème d’un oscillateur harmonique en trois dimensions, avec la même constante de ressort dans les trois directions. Les niveaux d’énergie de ce système sont Enmr = ω(n + m + r) + E0 où ω est la fréquence caractéristique de l’oscillateur, E0 est l’énergie du fondamental, et les entiers (n, m, r) sont les nombres quantiques entiers associés à chacune des directions de l’espace. a) Quels sont les quatre premiers niveaux d’énergie de ce systèmes, avec leur dégénérescence? Ces dégénérescences peuvent-elles être expliquées uniquement par l’invariance par rotation (c’est-à-dire par des multiplet de moment cinétique orbital l entier), ou existe-t-il une dégénérescence accidentelle? b) Montrez que ce système possède une symétrie SU(3). Cela est facile à voir lorsque l’hamiltonien est exprimé en fonction des opérateurs d’échelle. c) Dans cette optique, expliquez la dégénérescence des niveaux en fonction de représentations irréductibles de SU(3). Problme 8.2 Dressez un catalogue des hadrons construits à l’aide des quarks u, d et s en les classant selon leur spin, en supposant que le moment cinétique orbital est nul. Ignorez les degrés de liberté de couleur ainsi que le principe de Pauli. Autrement dit, remplissez les tableaux ci-contre, en spécifiant le symbole de chaque hadron, ainsi que sa masse. Vous pouvez bien sûr vous aider du livret de physique des particules (Table of particle properties). Notez que les mésons “diagonaux en saveur”, c’est-à-dire ceux situés le long de la diagonale du tableau, peuvent présenter des ambiguités sur le plan de leur composition. Y a-t-il des cases vides dans le tableau des baryons? Pourquoi? J=1/2 J=3/2 u d s uuu u uud d udd s ddd J=0 uus u d s uds u dds d uss s dss J=1 sss 8.8. Symétrie de couleur 127 Problme 8.3 On peut montrer que le seul état de couleur qui soit neutre lorsqu’on combine trois quarks est l’état complètement antisymétrique 1 |ψi = √ (|RGBi + |GBRi + |BRGi − |GRBi − |RBGi − |BGRi) 6 Supposons qu’au lieu de trois couleurs, il n’y en ait que deux, et que les baryons soient composés de deux quarks, au lieu de trois, ceci afin de simplifier les choses. Dans ce cas, quelle serait la combinaison complètement antisymétrique? Démontrez que ce serait aussi la seule combinaison neutre possible. Pour guider votre imagination, notons ces deux couleurs ↑ et ↓, de manière à profiter de l’analogie avec le spin que suggère la symétrie de couleur simplifiée. Cette symétrie est l’invariance par rapport à un mélange des couleurs via la multiplication par une matrice unitaire d’ordre 2. Problme 8.4 a) Démontrez la formule suivante pour une matrice carrée d’ordre 3 : εijk Uil Ujm Ukn = εlmn det U où une sommation sur les indices répétés est implicite. b) En vous servant de la formule démontrée en (a), démontrez maintenant que l’état de couleur complètement antisymétrique 1 |ψi = √ (|RGBi + |GBRi + |BRGi − |GRBi − |RBGi − |BGRi) 6 est invariant par rapport à toute transformation de couleur, c’est-à-dire que U |ψi ∝ |ψi pour toute matrice unitaire U d’ordre 3. c) Démontrez aussi que la combinaison suivante 1 |ψi = √ |RR̄i + |GḠi + |B B̄i 3 est invariante. Remarquez cependant que les antiparticules se transforment avec la matrice conjuguée complexe U ∗. Problme 8.5 a) Montrez que le produit tensoriel correspondant à la représentation réductible d’un ensemble de trois quarks est 3 ⊗ 3 ⊗ 3 = 1 ⊕ 8 ⊕ 8 ⊕ 10 b) Montrez par la même technique qu’un état neutre de couleur à 4 quarks est impossible. CHAPITRE 9 Théories de jauge 9.1 Symétrie de jauge non abélienne En 1954, Yang et Mills ont généralisé l’idée d’un symétrie de phase locale à une symétrie plus vaste impliquant des rotations unitaires de plusieurs champs. La théorie obtenue est appelée théorie de jauge non abélienne, car elle implique des transformations qui ne commutent pas entre elles (des transformations unitaires, par exemple) et que ces transformations forment un groupe noncommutatif, ou groupe “non-abélien”. Ces théorie forment maintenant la base du modèle standard des interactions fondamentales. Nous adopterons comme modèle la théorie dynamique de la couleur, ou chromodynamique, qui est la théorie fondamentale des interactions fortes entre quarks. Considérons donc un spineur ψ décrivant un quark dans ses trois couleurs, c’est-à-dire que le spineur ψin comporte un indice de Dirac (i = 1, 2, 3, 4) et un indice de couleur (n = 1, 2, 3). L’indice de Dirac sera toujours implicite, alors que l’indice de couleur sera implicite la plupart du temps. Les transformation de jauge agissant sur ce spineur sont en fait des rotations unitaires dans l’espace des couleurs, autrement dit ψn → ψn0 = Unm ψm ou ψ → ψ 0 = U ψ (9.1) où U est une matrice unitaire. Le lagrangien de Dirac L = ψ̄(iγ µ ∂µ − m)ψ (9.2) est certainement invariant lors d’une transformation de couleur globale. Autrement dit, si U est une matrice unitaire agissant dans l’espace des couleurs et indépendante de la position et du temps, alors le lagrangien est invariant lorsqu’on procède à la transformation ψ → ψ 0 = U ψ, car alors ψ̄ 0 = ψ̄U † et les deux facteurs U † et U se combinent pour former la matrice unité. Notons bien sûr que la matrice U agissant dans l’espace des couleurs seulement, commute avec toutes les matrices de Dirac, qui agissent dans l’espace des spineurs seulement. Cependant, le lagrangien n’est plus invariant si la matrice U dépend de la position ou du temps, en raison de la dérivée agissant sur ψ. Nous devons définir encore une fois une dérivée covariante Dµ = ∂µ + igAµ , où g est une constante de couplage (l’analogue dans les interactions fortes de la charge électrique). Il faut définir la transformation de jauge du champ Aµ de manière à ce que la dérivée covariante se transforme simplement, comme le champ ψ lui-même : Dµ ψ → D0µ ψ 0 = U (Dµ ψ) Dans le détail, ceci entraı̂ne que (∂µ + igA0µ )U ψ = (∂µ U )ψ + U ∂µ ψ + igA0µ U ψ (9.3) 9.2. Le tenseur de Faraday 129 doit être égal à U (∂µ ψ + igAµ )ψ et donc que ∂µ U + igA0µ U = igU Aµ =⇒ i A0µ = U Aµ U † + ∂µ U U † g (9.4) L’action de Dirac invariante de jauge est alors simplement obtenue par couplage minimal, c’est-àdire en remplaçant les dérivées ordinaires par des dérivées covariantes : L = ψ̄(iγ µ Dµ − m)ψ = ψ̄(iγ µ ∂µ − gAµ γ µ − m)ψ (9.5) Le champ Aµ est appelé champ de jauge et est une combinaison des générateurs du groupe SU(3). En effet, toute matrice U peut être représentée comme une exponentielle U = eiωa Ta . Dans ce cas, i i ∂µ U U † = (i∂µ ωa )Ta g g (9.6) et ce terme de la relation (9.4) est une combinaison linéaire des générateurs. Il en va de même du premier terme de la relation (9.4). En effet, en posant H = −iωa Ta et d’après la relation de Hausdorf, ce premier terme est e−H Aµ eH = A + [A, H] + 1 1 [[A, H], H] + [[[A, H], H], H] + · · · 2! 3! (9.7) Comme H est une combinaison des générateurs Ta et que le commutateurs deux combinaisons linéaires des Ta est encore une combinaison linéaire des Ta , toute l’expression ci-haut est encore une combinaison linéaire des générateurs. Ceci démontre la cohérence de la loi de transformation (9.4) avec la fait que le champ de jauge Aµ est une combinaison linéaire des générateurs du groupe. On écrit donc la décomposition suivante : Aµ = Aaµ Ta (9.8) où les champs Aaµ , qui sont au nombre des générateurs du groupe de jauge, sont maintenant des champs réels non matriciels. 9.2 Le tenseur de Faraday Une fois la symétrie de jauge accomplie pour le champ de Dirac et le champ de jauge Aµ introduit, il faut construire une théorie dynamique pour le champ Aµ lui-même, modelée sur la théorie électromagnétique. Il faut en fait construire une densité lagrangienne pour Aµ , en suivant autant que possible le modèle électromagnétique et en s’assurant que cette densité lagrangienne soit également invariante de jauge. La première étape consiste à construire le tenseur de Faraday Fµν = ∂µ Aν − ∂ν Aµ Malheureusement, cette expression est loin d’être invariante de jauge dans le cas non-abélien. La solution est de remplacer ici aussi les dérivées ordinaires par des dérivées covariantes : Fµν = Dµ Aν − Dν Aµ = ∂µ Aν − ∂ν Aµ + ig[Aµ , Aν ] (9.9) 130 9. Théories de jauge Voyons comment cette expression se comporte lors d’une transformation de jauge : 0 Fµν → Fµν = D0µ A0ν − D0ν A0µ (9.10) Calculons d’abord i † U Aν U + ∂ν U U = ∂µ + igU Aµ U − ∂µ U U g i = ∂µ U Aν U † + U ∂µ Aν U † + U Aν ∂µ U † + ∂µ ∂ν U U † g i i + ∂ν U ∂µ U † + igU Aµ Aν U † + U Aµ ∂ν U † − ∂µ U Aν U † + ∂µ U ∂ν U † g g D0µ A0ν † † † (9.11) où nous avons utilisé à deux reprises le fait que U † ∂µ U = ∂µ (U † U ) − ∂µ U † U = −∂µ U † U . Notons que le premier et huitième termes se compensent mutuellement. D’autre part, comme nous devons soustraire de cette expression une expression équivalente où les indices µ et ν sont échangés, nous pouvons éliminer de cette expression tous les termes qui sont symétriques lors de l’échange µ ↔ ν. Or, le troisième terme se combine avec le septième pour former une expression symétrique en (µ, ν). La même chose est vraie des cinquième et neuvième termes. Enfin, le quatrième terme est manifestement symétrique de lui-même. Il reste les deuxième et sixième termes : U ∂µ Aν U † + igU Aµ Aν U † En échangeant µ ↔ ν et en soustrayant, on trouve 0 Fµν = U (∂µ Aν − ∂ν Aµ )U † + igU [Aµ , Aν ]U † = U Fµν U † (9.12) Donc le tenseur de Faraday Fµν n’est pas invariant de jauge, mais se transforme de manière simple. 9.3 Le lagrangien de la QCD Le lagrangien du champ électromagnétique est Lem = − 1 F F µν 16π µν (9.13) Cette forme doit être adaptée au cas non-abélien, car en soi elle n’est pas invariante de jauge (en fait, ce n’est pas un scalaire, mais une matrice dans ce cas). La solution consiste à prendre la trace : LQCD = − 1 Tr (Fµν F µν ) 8π (9.14) Ce lagrangien est bel et bien invariant de jauge car L0QCD = − 1 1 1 0 Tr (Fµν F 0µν ) = − Tr (U Fµν U U † F µν U ) = − Tr (Fµν F µν ) 8π 8π 8π (9.15) en raison de la propriété cyclique de la trace d’un produit de matrices : Tr (ABC) = Tr (BCA) = Tr (CAB). En fonction des générateurs Ta , le tenseur de Faraday s’écrit Fµν = (∂µ Aaν − ∂ν Aaµ )Ta + igAbµ Acν [Tb , Tc ] (9.16) Comme [Tb , Tc ] = ifbca Ta , on peut écrire a Fµν = Fµν Ta a où Fµν = ∂µ Aaν − ∂ν Aaµ − gfbca Abµ Acν (9.17) 9.3. Le lagrangien de la QCD 131 Le lagrangien devient alors LQCD = − 1 a bµν F F Tr (Ta Tb ) 8π µν (9.18) La convention habituelle sur la normalisation des générateurs est de les choisir tels que Tr (Ta Tb ) = 12 δab (9.19) C’est le cas notamment des générateurs de SU(2) et de SU(3) introduits dans le chapitre portant sur la théorie des groupes. On trouve alors LQCD = − 1 a aµν F F 16π µν (9.20) a Dans la limite où la constante de couplage g tend vers zéro, Fµν devient simplement équivalent au tenseur de Faraday électromagnétique, et alors on se trouve en présence d’une théorie équivalente à N copies de l’électromagnétisme, N étant le nombre de générateurs (8 pour la QCD). Ainsi, N bosons, similaires au photon, apparaissent dans la théorie. En QCD, ces bosons sont appelés gluons, et ils transmettent l’interaction forte de la même manière que les photons transmettent l’interaction électromagnétique. Par exemple, les quarks pourraient diffuser l’un sur l’autre par l’échange d’un gluon virtuel, etc. Si g est non nul, cependant, les choses sont plus complexes. Le lagrangien comporte des termes cubiques et des termes quartiques en A, comme le montre l’expression explicite suivante : LQCD = − 1 ∂µ Aaν − ∂ν Aaµ − gfbca Abµ Acν ∂ µ Aaν − ∂ ν Aaµ − gfdea Adµ Aeν 16π (9.21) Les termes cubique en A sont d’ordre g, et les termes quartiques d’ordre g 2 . Ce lagrangien, ou le hamiltonien correspondant, est impossible à résoudre. Autrement dit, les états propres de cette théorie ne sont pas connus, et en tout cas ne correspondent pas à des bosons libres, comme dans le cas du champ électromagnétique. Bref, même en l’absence de quarks, la QCD est une théorie complexe. Si g était petit, alors on pourrait utiliser la théorie des perturbations (les diagrammes de Feynman) pour décrire les effets de termes cubiques et quartiques. Des vertex comme ceux illustrés ci-dessous seraient des ingrédients des diagrammes de Feynman de la QCD. (9.22) Notez qu’on représente la propagation d’un gluon par une ligne ayant l’apparence d’un ressort, pour symboliser l’intensité de l’interaction forte! Le lagrangien complet de la QCD comporte l’expression ci-haut (9.21), plus les termes décrivant les quarks et leur interaction avec les gluons, soit l’expression (9.5). 132 9. Théories de jauge 9.4 Propriétés de la QCD Terminons ce chapitre avec quelques remarques sur la QCD et les théories de jauge en général. Une propriété de la QCD, commune à toutes les théories de jauge, est la renormalisabilité. Une théorie quantique des champs, pour être utile et bien définie, doit être renormalisable. Expliquons brièvement. Si on applique la théorie des perturbations aux ordres plus élevés, on trouve des expressions infinies, divergentes. Ceci se produit pratiquement à chaque fois qu’un diagramme de Feynman comporte une ou plusieurs boucles fermées. Pour corriger ce problème, on doit supposer que l’espace n’est pas continu à une échelle très petite ou, ce qui est équivalent, supposer que les vecteur d’ondes ne peuvent pas prendre des valeurs arbitrairement grandes. Si une théorie des champs est renormalisable, on peut procéder à certains ajustements d’un nombre fini de paramètres (comme la masse, la constante de couplage, ou la normalisation du champ) afin d’éliminer ces infinités (ou plutôt, de les balayer sous le tapis). Par contre, si la théorie n’est pas renormalisable, un nombre infini de paramètres ajustables est nécessaire pour les éliminer, et la théorie perd tout son sens en tant que théorie fondamentale. Il se trouve que toutes les théories de jauge sont renormalisables. En fait, les théories de jauge sont les seules théories, avec celle d’un champ scalaire, qui ont cette propriété. L’un des effets de cette procédure de renormalisation est que la constante de couplage g n’est pas vraiment une constante. Elle dépend faiblement d’une échelle d’énergie q, échelle d’énergie caractéristique des phénomènes étudiés. Il se trouve que la constante αs = g 2 se comporte comme suit en fonction de l’échelle d’énergie q : αs = 12π (33 − 2Nq ) ln(q 2 /Λ) (9.23) où Λ est l’échelle d’énergie de la QCD, égale à 200 ± 100 MeV (la précision n’est pas énorme) et Nq est le nombre de saveurs de quarks, soit six. Ce résultat est obtenu par la théorie des perturbations (diagrammes de Feynman à une boucle) et n’est valable que si αs est petit, mais indique que la constante de couplage tend vers zéro aux très grandes énergies. Cette propriété porte le nom de liberté asymptotique. Les diagrammes de Feynman qui mènent à cette formule sont illustré à la figure 9.1. L’une des conséquences de la liberté asymptotique est que lors de processus impliquant un très grand transfert de quantité de mouvement, comme dans les expériences de diffusion inélastique profonde, la constante de couplage effective est petite et les quarks se comportent comme des particules quasi-libres. Figure 9.1. Diagrammes contribuant à la polarisation de couleur du vide en QCD. Celui du haut comporte l’émission de paires virtuelles quark-antiquarks et ceux du bas à l’émission de gluons virtuels. Les deux contributions (qq̄ et gluons) ont des signes opposés. Une façon de présenter la liberté asymptotique est de parler d’effet anti-écran. L’effet d’écran est bien connu en physique du solide : dans un milieu polarisable, la charge effective d’une source est 9.4. Propriétés de la QCD 133 de plus en plus grande lorsqu’on l’observe de plus en plus proche, car la polarisation du milieu entourant la charge tend à la masquer partiellement. Le vide aussi est polarisable, car des paires virtuelles électron-positron peuvent être créées, et donc la charge élémentaire, ou la constante de structure fine α = e2 , augmente avec la résolution spatiale, c’est-à-dire augmente avec l’échelle d’énergie associée au processus. C’est l’inverse de la liberté asymptotique. En QCD, la polarisation de couleur du vide par émission de paires virtuelles quark-antiquark agit dans le même sens qu’en électrodynamique, et donc contre la liberté asymptotique. Par contre, une polarisation de couleur dans le sens opposé (donc un anti-écrantage) est causée par les gluons (les deux diagrammes du bas de la figure 9.1), et la contribution des gluons domine. Au total, l’effet anti-écran domine et il y a liberté asymptotique. La contrepartie de la liberté asymptotique est l’augmentation présumée de g 2 quand l’échelle d’énergie diminue. On peut présumer que, en deça d’une certaine échelle d’énergie Λ, la théorie des perturbations perd toute son utilité et qu’il est vain de penser en termes de diagrammes de Feynman. D’autres approches théoriques, dites “non perturbatives”, sont requises. De telles méthodes, en particulier numériques, sont un sujet de recherche très actif en physique théorique des particules. Une conséquence présumée de cette augmentation de la constante de couplage est le confinement : le fait que seuls les états neutres de couleurs puissent exister. Problèmes Problme 9.1 Montrez que, dans une théorie de jauge non-abélienne, le tenseur de Faraday Fµν = Dµ Aν − Dν Aµ se transforme comme Fµν → U Fµν U −1 . Problme 9.2 Dans une théorie de jauge comme la chromodynamique (QCD), on peut en principe définir des champs chromo-électrique et chromo-magnétiques, Ea et Ba , qui figurent dans le tenseur de Faraday : 0 Exa Eya Eza −Exa 0 −Bza Bya a (a = 1, 2, . . . , 8) (9.24) Fµν : a a −E B 0 −B a y −Eza z −Bya x Bxa 0 a) Écrivez l’expression explicite de ces champs en fonction des potentiels Aa et Φa (la version “couleur” des potentiels vecteur et scalaire). b) L’équivalent des équations de Maxwell pour les champs de couleurs s’obtient en remplaçant les dérivées ordinaires par des dérivées covariantes. Écrivez l’équivalent de la loi de Gauss. En quoi diffère-t-elle de la loi de Gauss pour le champ électromagnétique? Qu’est-ce qui, selon vous, en rend la résolution difficile? CHAPITRE 10 Modèle standard des interactions électro-faibles 10.1 Interactions faibles Les interactions faibles ont les propriétés suivantes : 1. Elle affectent toutes les particules matérielles connues. 2. Leur portée est très courte, et leur intensité est très faible. 3. Elles peuvent changer la saveur des quarks. Par exemple, les particules comportant un quark s se désintègrent par interaction faible. 4. Elle ne respectent pas l’invariance par inversion de l’espace (parité). Cette dernière propriété (la brisure de la parité) est apparue premièrement dans la désintégration (faible) des kaons. Les kaons peuvent se désintégrer parfois en des produits ayant une parité paire, parfois en des produits ayant une parité impaire, ce qui contredit la loi de conservation de la parité. Lee et Yang ont proposé que l’interaction faible brisait peut-être la parité. Une expérience menée par Mme Wu en 1956 confirma cette hypothèse. S p2 I2 p1 I1 S p2 I2 p1 I1 Figure 10.1. Schéma de l’expérience de Wu sur la violation de la parité. À gauche, le schéma direct. À droite, celui obtenu par inversion de l’espace. 10.1. Interactions faibles 135 Dans cette expérience, on étudie la désintégration d’un noyau de magnétique : 60 Co → 60 Ni + e− + ν̄ 60 Co en présence d’un champ (10.1) Le champ magnétique permet d’imposer au noyau de cobalt une orientation fixe de son spin1 . On détecte ensuite les électrons émis dans des directions opposées, comme indiqué sur le schéma de la fig. 10.1 : deux détecteurs comptent les électrons et recoivent des intensités I1 et I2 (un seul électron est émis par désintégration, bien-sûr, mais on compte ici les électrons émis par un très grand nombre de désintégrations). Si on effectue une réflexion de l’espace (comme indiqué), alors les deux détecteurs sont échangés, alors que le spin reste inchangé. Si la parité était conservée, alors les deux détecteurs devraient recevoir la même intensité d’électrons (I1 = I2 ), car les deux situations seraient indiscernables. En pratique, on procède non pas à un échange des deux détecteurs, mais à une inversion du spin en changeant le sens du champ magnétique appliqué. En effet, si on procède à une rotation de 180◦ par rapport à un axe perpendiculaire à la fois à p1 et à S, on retrouve la situation originale, sauf que l’orientation du spin a été inversée. On trouve que l’intensité I1 n’est pas la même avant et après le changement de sens du champ magnétique. Donc la parité n’est pas conservée dans les interactions faibles. 10.1.1 Première théories des interactions faibles La première théorie des interactions faibles a été proposée par Fermi en 1933. Elle est basée sur le lagrangien d’interaction suivant : G (10.2) LI = √F (p̄γ µ n)(ēγµ ν) 2 où nous avons défini γµ = gµν γ ν . Dans cette expression, les symboles p, n, e et ν désignent des spineurs de Dirac décrivant respectivement un proton, un neutron, un électron et un neutrino. Cette théorie fut la première où le concept de création et d’annihilation de particules matérielles fit son apparition. Ce lagrangien d’interaction mène au vertex suivant (à gauche) : p e u e (10.3) n ν d ν ou, de manière équivalent, à celui de droite, si on remplace le proton par un quark u et le neutron par un quark d (les deux autres quarks du nucléon ne jouant aucun rôle dans le processus). La désintégration β s’explique dans cette théorie par un diagramme de Feynman simple avec un neutron comme état initial et un proton, un électron et un antineutrino dans l’état final. La constante de couplage GF , appelée constante de couplage de Fermi, a les unités d’une masse inverse au carré, et vaut GF = 1.166 × 10−5 GeV−2 (10.4) 1 Pourvu que la température soit suffisamment basse pour que l’orientation du spin ne soit pas désordonnée par les fluctuations thermiques. Ceci nécessite des températures de l’ordre de 10 mK et un processus de désaimantation adiabatique. 136 10. Modèle standard des interactions électro-faibles La théorie de Fermi, cependant, ne brise pas la parité et donc ne peut pas bien représenter tous les processus causés par l’interaction faible, en particulier les processus dans lesquels la polarisation des particules n’est pas moyennée. 10.1.2 Spineurs droit et gauche Feynman et Gell-Mann ont modifié la théorie de Fermi pour y ajouter un ingrédient qui brise explicitement la parité. Pour cela, ils ont utilisé la décomposition d’un spineur de Dirac en composantes droite et gauche (ou composantes chirales), que nous introduisons ici. Revenons pour cela aux spineurs à deux composantes ψR et ψL qui composent le champ de Dirac, telles qu’introduites à la section 7.1.1. Rappelons que, dans la représentation chirale, le spineur de Dirac à quatre composantes est formé des spineurs droit et gauche à deux composantes de la manière suivante : ψL ψ= (rep. chirale) (10.5) ψR Dans le but d’extraire ces composantes dans le cadre de spineurs à 4 composantes, on introduit la matrice suivante : γ 5 = iγ 0 γ 1 γ 2 γ 3 (10.6) La forme explicite de cette matrice est la suivante, dans les deux représentations utilisées des matrices de Dirac : −1 0 0 1 5 γ = (rep. chirale) (rep. de Dirac) (10.7) 0 1 1 0 On définit ensuite les composantes droite et gauche du spineur de Dirac comme ψR = 21 (1 + γ 5 )ψ ψL = 12 (1 − γ 5 )ψ (10.8) En effet, dans la représentation chirale, 1 2 (1 5 + γ )ψ = et 1 2 (1 5 − γ )ψ = 0 1 1 0 0 0 0 0 ψ= ψ= 0 ψR ψL 0 (10.9) (10.10) Notons qu’ici nous utilisons la même notation (ψR et ψL ) pour les spineurs droit et gauche à deux composantes, et pour les spineurs à quatre composantes correspondants. Notons aussi que la définition (10.8) est valable dans toutes les représentation des matrices de Dirac; c’est la forme matricielle précise de γ 5 qui change d’une représentation à l’autre. En fonction de ces spineurs chiraux, on vérifie facilement que l’action de Dirac a la forme suivante : LD = iψ̄ L γ µ ∂µ ψL + iψ̄ R γ µ ∂µ ψR − m(ψ̄ L ψR + ψ̄ R ψL ) (10.11) On constate que le terme de masse couple les spineurs gauches et droits, alors que le reste du lagrangien se sépare bien en deux termes, l’un gauche et l’autre droit. Dans le cas sans masse, les spineurs droit et gauche décrivent des particules d’hélicité bien définie, comme nous l’avons entrevu à la section 7.1.2. Dans ce cas, les spineurs droit et gauche peuvent être considérés séparément, c’est-à-dire qu’on peut définir une théorie ne comportant que la composante gauche ou que la composante droite, car les deux ne sont pas couplées par le terme de masse et donc sont indépendantes. Dans le cas massif, les composantes chirales ne décrivent plus des particules 10.1. Interactions faibles 137 d’hélicité bien définie, mais demeurent utiles dans la description d’interactions qui brisent la parité, comme nous le verrons dans les prochaines sections. Une inversion de l’espace a comme effet d’échanger les composantes droite et gauche d’un spineur de Dirac. Explicitement, dans la représentation chirale, la transformation de parité est ψL (r, t) ψR (−r, t) 0 ψ(r, t) = → ψ (r, t) = = γ 0 ψ(−r, t) (10.12) ψR (r, t) ψL (−r, t) Cette forme de la transformation de parité reste la même dans toutes les représentations des matrices de Dirac. Étant donnés deux spineurs de Dirac ψ1 et ψ2 , la matrice γ 5 nous permet de définir un pseudoscalaire et un pseudo-vecteur : ψ̄ 1 γ 5 ψ2 et ψ̄ 1 γ µ γ 5 ψ2 (10.13) Ces deux quantités se transforment respectivement comme un scalaire et un vecteur lors des transformations de Lorentz qui n’impliquent pas d’inversion de l’espace. On vérifie, à l’aide de la forme donnée ci-haut de la transformation de parité sur un spineur de Dirac, que la première quantité (ψ̄ 1 γ 5 ψ2 ) change de signe lors d’une réflexion de l’espace : ce qu’on appelle un pseudo-scalaire. De même, la partie spatiale de la deuxième quantité (ψ̄ 1 γ µ γ 5 ψ2 ) est un vecteur axial, c’est-à-dire un vecteur qui ne change pas de signe lors d’une inversion de l’espace, aussi appelé pseudo-vecteur. Rappelons que les vecteurs positions, quantité de mouvement, champ électrique sont des vecteurs polaires, qui changent de signe lors d’une inversion de l’espace, alors que les vecteurs moment cinétique et champ magnétique sont des pseudo-vecteurs. 10.1.3 Théorie V–A Feynman et Gell-Mann on formé les quadri-courants à caractère polaire et axial suivants : p̄γ µ n p̄γ µ γ 5 n et ēγ µ ν ēγ µ γ 5 ν (10.14) et ont proposé le lagrangien suivant pour les interactions faibles : G L = √F (p̄γ µ n − p̄γ µ γ 5 n)(ēγµ ν − ēγµ γ 5 ν) + c.h. 4 2 (10.15) appelé communément V–A, car il provient de la soustraction d’un vecteur axial (A) d’un vecteur polaire (V). Ce lagrangien peut aussi être vu comme un couplage de type Fermi, mais seulement avec la composante gauche du neutron et du neutrino : G L = √F (p̄γ µ nL )(ēγµ νL ) + c.h. 2 (10.16) Cette théorie de Feynman et Gell-Mann corrige les imperfections de la théorie de Fermi, c’est-à-dire qu’elle contient une brisure explicite de la parité, et est conforme à tous les phénomènes impliquant l’interaction faible connus à l’époque. Insuffisance de la théorie V–A La théorie V–A, comme la théorie de Fermi originale, ne peut pas être considérée comme une théorie fondamentale des interactions faibles. La raison en est qu’elle n’est pas renormalisable. Autrement dit, tous les calculs perturbatifs qui sont fait au-delà de l’ordre le plus bas n’ont pas de sens. L’une des conséquences de ce fait, assez simple à démontrer, est la violation de l’unitarité. Expliquons. Considérons la section efficace pour la diffusion par interaction faible entre un électron et un neutrino. Ce processus doit être très peu probable. Dans le référentiel du centre d’impulsion 138 10. Modèle standard des interactions électro-faibles des deux particules, la section efficace doit, au premier ordre de la théorie des perturbation, être proportionnelle à G2F (car GF apparaı̂t linéairement dans le diagramme de Feynman associé et donc dans l’amplitude de diffusion). Mais l’amplitude de diffusion est sans unités, alors que GF a les unités d’une masse inverse au carré. Il faut donc que l’amplitude de diffusion soit proportionnelle à une quantité ayant les unités de la masse au carré, soit la masse invariante de la réaction (la seule possibilité). Donc l’amplitude croı̂t comme le carré de la masse invariante, et cette dernière quantité est proportionnelle à l’énergie de l’électron incident. Ceci signifie que la section efficace va croı̂tre sans bornes avec l’énergie, ce qui est absurde. À un moment donné, la probabilité de collision d’un électron avec un neutrino sera plus grande que un! C’est ce qu’on appelle une violation de l’unitarité, en somme une non-conservation de la probabilité. Le problème est que les ordres supérieurs de la théorie des perturbations devraient être inclus, et qu’ils ne peuvent l’être parce que la théorie n’est pas renormalisable. 10.2 Théorie de jauge SU(2)× U(1) La solution proposée au problèmes de la théorie V–A est de la considérer comme une théorie effective, une approximation d’une théorie plus fondamentale qui serait, elle, renormalisable. Dès 1961, Glashow proposa une théorie incomplète qui unifiait l’interaction électromagnétique et l’interaction faible en une seule interaction électro-faible. En 1967, Weinberg et Salam proposèrent qu’il devait s’agir d’une théorie de jauge non abélienne, mais que l’état fondamental (le vide) ne serait pas invariant de jauge, ce qu’on appelle une brisure spontanée de la symétrie. En 1971, t’Hooft et Veltman démontrèrent que cette théorie compliquée est renormalisable. Glashow, Weinberg et Salam reçurent le prix Nobel en 1979 pour l’élaboration de cette théorie; t’Hooft et Veltman le reçurent une vingtaine d’années plus tard pour avoir démontré que la dite théorie était cohérente. Nous allons maintenant décrire cette théorie. La théorie électro-faible est une théorie de jauge basée sur le produit de groupes SU(2)×U(1). C’est donc qu’elle comporte trois champs de jauge pour SU(2) (le nombre de générateurs), qu’on notera Aaµ (a = 1, 2, 3) et un champ de jauge pour U(1), qu’on notera Bµ . Ce champ de jauge U(1) se comporte en principe de la même manière que le champ électromagnétique, sauf qu’il ne se couple pas à la charge électrique, mais à une autre quantité Y appelée hypercharge faible2 . Par analogie avec le spin, l’espace abstrait sur lequel agit le groupe SU(2) est appelé espace d’isospin faible. Les fermions fondamentaux qui se couplent à ces champs de jauge doivent occuper des représentations bien précises de SU(2) et avoir une valeur précise de l’hypercharge Y . Dans la théorie électrofaible, tous les fermions sont sans masse au départ (la masse est générée plus tard, par le mécanisme de Higgs décrit plus bas). Donc les composantes droites et gauches des fermions sont indépendantes à ce stade, et peuvent appartenir à des représentations différentes du groupe SU(2), ce qui permet d’introduire une violation maximale de la parité. Commençons par traiter le cas d’une seule famille de particules élémentaires, soit les quarks u et d, l’électron et le neutrino électronique. Les champs associés à ces particules sont agencés come suit : νL uL eR , uR , dR (10.17) `L = qL = eL dL où on remarque deux doublets d’isospin faible, formé des composantes gauches des leptons et des quarks, respectivement. Les composantes droites forment des singulets d’isospin faible, ce qui 2 Ne pas confondre avec l’hypercharge introduite dans la classification des hadrons, qui est une combinaison de l’étrangeté et de la charge électrique. 10.2. Théorie de jauge SU(2)× U(1) 139 signifie qu’ils n’interagissent pas avec le champ de jauge SU(2). Ces différent doublets et singulets ont les valeurs suivantes de l’hypercharge : champ Y `L = (ν, e)L −1 Q = 21 Y + T3 (0, −1) qL = (u, d)L 1 3 ( 32 , − 13 ) eR −2 −1 uR 4 3 2 3 dR − 23 − 31 On a aussi indiqué pour chaque champ la valeur de la charge électrique, qui est une combinaison de l’hypercharge et du troisième générateur de SU(2). Le lagrangien de la théorie est simple : l’action de Dirac s’applique à tous les champs, la dérivée covariante remplaçant la dérivée ordinaire : Dµ = ∂µ + igAaµ T a + ig 0 21 Y Bµ (10.18) où les T a sont les générateurs de SU(2) dans la représentation considérée, et où le facteur 21 devant Bµ est conventionnel : il affirme simplement que le champ Bµ se couple à l’hypercharge divisée par deux, et non à l’hypercharge directement. Les constantes de couplage g et g 0 sont distinctes, car elles n’ont pas besoin d’être identiques pour garantir l’invariance de jauge de la théorie. Par exemple, sur le doublet de leptons gauches, on a (10.19) Dµ `L = ∂µ + ig 12 Aaµ σ a − i 12 g 0 Bµ `L où les générateurs de SU(2) sont les matrices de Pauli (divisées par 2), alors que pour l’électron droit, on a simplement Dµ eR = ∂µ − ig 0 Bµ eR (10.20) où les générateurs de SU(2) sont nuls (correspondant à la représentation triviale de SU(2), où tous les éléments du groupe sont associés au nombre 1). Aux lagrangiens des fermions, on doit ajouter ceux des champs de jauge : LAB = − 1 a aµν 1 Fµν F − G Gµν 16π 16π µν (10.21) a où Fµν est le tenseur de Faraday du champ de jauge SU(2) Aaµ , alors que Gµν est celui du champ de jauge abélien Bµ : a Fµν = ∂µ Aaν − ∂ν Aaµ − gεabc Abµ Acν Gµν = ∂µ Bν − ∂ν Bµ (10.22) Notons que les constantes de structure de SU(2) sont simplement fabc = εabc d’après les relation de commutation des matrices de Pauli divisées par deux, qui sont celles des composantes du moment cinétique. Si cette théorie en restait là, alors nous aurions affaire à un ensemble de particules sans masses (oublions la QCD et le confinement pour le moment) interagissant via deux champs de jauge distincts associés à 4 bosons de spin 1 similaires au photon. La différence serait que les trois bosons associés aux champs SU(2) interagissent entre eux et forment ensemble une théorie non linéaire. 140 10. Modèle standard des interactions électro-faibles La réalité est plus complexe, car les interactions faibles ont une portée très courte et les trois bosons en questions n’ont été découverts qu’en 1983 et ont des masses de l’ordre de 80–90 GeV. C’est la brisure spontanée de l’invariance de jauge qui explique cet état de fait. 10.3 Brisure spontanée de la symétrie : mécanisme de Higgs Le mécanisme de Higgs modifie le contenu physique de la théorie électrofaible décrite ci-haut en conférant une masse à trois des quatre bosons de jauge et en donnant une masse non nulle aux fermions. Il se base sur la présence dans la théorie d’un champ scalaire Φ, en plus des fermions décrits plus haut et des champs de jauge. Ce champ scalaire représente un boson de spin zéro, qui forme cependant un doublet complexe d’isospin faible et qui possède une hypercharge Y = 1. On peut exprimer ce doublet comme + φ (10.23) Φ= φ0 où l’assignation des charges électriques des membres du doublet correspond bien à Q = 12 Y + T3 . Rappelons qu’un champ scalaire ordinaire, obéissant à l’équation de Klein-Gordon, est décrit par le lagrangien suivant : L = 21 ∂µ φ∂ µ φ − 12 m2 φ2 (10.24) Un tel champ, cependant, ne peut pas être incorporé à une théorie de jauge (abélienne ou non) car il n’admet aucune transformation de symétrie : il ne possède qu’une seule composante, réelle de surcroı̂t. Pour qu’un champ scalaire puisse se coupler au champ électromagnétique, il doit représenter une particule chargée et donc doit nécessairement être complexe (par opposition à réel). En effet, il doit pouvoir admettre une transformation de jauge, qui prend alors la forme φ → φ0 = eieξ φ (10.25) Un champ scalaire complexe peut être vu comme formé de deux champ scalaires √ réels (un pour√sa partie réelle, l’autre pour sa partie imaginaire), de sorte que φ = (φ1 + iφ2 )/ 2 (le facteur de 2 est conventionnel). Le lagrangien du champ scalaire complexe est alors X µ ∗ µ 2 2 1 1 2 2 L= (10.26) 2 ∂µ φi ∂ φi − 2 m φi = ∂µ φ ∂ φ − m |φ| i=1,2 Ce champ complexe peut se coupler au champ électromagnétique par couplage minimal, soit en remplaçant ∂µ φ par Dµ φ. On pourrait, raffinement supplémentaire, ajouter un terme en |φ|4 à ce lagrangien : L = (Dµ φ)∗ Dµ φ − m2 |φ|2 − λ|φ|4 (10.27) Dans ce cas, la théorie n’est plus soluble exactement. Le terme en |φ|4 correspond à une interaction du champ avec lui-même, un peu comme dans la théorie de Fermi des interactions faibles, sauf que les particules impliquées sont des bosons. Notons que la constante de couplage λ n’a pas d’unités, ce qui entraı̂ne que la théorie est renormalisable et qu’elle constitue donc une théorie physique acceptable en principe. Pour qu’un champ scalaire puisse aussi interagir avec les champs de jauge Aaµ de SU(2), il ne doit pas former un singulet de SU(2), mais appartenir à une représentation non triviale de SU(2). La possibilité la plus simple est le doublet décrit plus haut. 10.3. Brisure spontanée de la symétrie : mécanisme de Higgs 141 Le lagrangien de ce doublet, dit doublet de Higgs, est LH = (Dµ Φ)† (Dµ Φ) − V (Φ) V (Φ) = −µ2 Φ† Φ + λ(Φ† Φ)2 (10.28) Le premier terme du lagrangien est simplement le lagrangien d’un champ scalaire ordinaire, où les dérivées ordinaires ont été remplacées par des dérivées covariantes pour assurer l’invariance de jauge. Comme Φ est un doublet d’hypercharge 1, on a Dµ Φ = ∂µ Φ + 12 igAaµ σ a Φ + 12 ig 0 Bµ Φ (10.29) V(|Φ|) √ ν/ 2– |Φ| Figure 10.2. Le potentiel de Higgs V (|Φ|). Le deuxième terme du lagrangien est un potentiel V (Φ) qui ne dépend que de la grandeur Φ† Φ = |φ+ |2 + |φ0 |2 . Le potentiel V (|Φ|) associé a ceci de particulier que, en raison du signe négatif du terme quadratique, son minimum n’est pas situé à |Φ| = 0, mais à une valeur non nulle de |Φ| √ qu’on note v/ 2 (voir fig. 10.2). Ceci signifie √ que la valeur du champ Φ n’est pas nulle dans l’état fondamental, mais telle que |Φ| = v/ 2. Mais il faut voir le potentiel V dans un espace à 4 dimensions (Φ possède l’équivalent de 4 composantes réelles) dont seule une coupe dans une direction particulière est illustrée à la fig. 10.2. En effet, le potentiel, comme le reste du lagrangien, est invariant par transformation de jauge Φ → Φ0 = U eiθ Φ (10.30) où U est une matrice appartenant à SU(2) et θ est un facteur de phase associé à la symétrie de jauge U(1) de l’hypercharge. Dans l’état fondamental, le système choisit une direction dans cet espace quadri-dimensionnel. Il y a donc brisure de la symétrie de jauge dans l’état fondamental, même si le lagrangien est invariant. Ce phénomène porte le nom de brisure spontanée de la symétrie, et intervient couramment dans les théories d’unification des particules et, surtout, en physique de la matière condensée. La conséquence de cette brisure spontanée, c’est-à-dire de la valeur constante non-nulle de Φ, est que les champs de jauge qui interagissent avec ce champ constant deviennent massifs. Ils sont en quelque sorte “alourdis” par leur interaction avec un champ qui possède une valeur constante, comme nous allons maintenant le voir en détail. En première approximation, supposons que le champ de Higgs est exactement égal à sa valeur dans l’état fondamental, c’est-à-dire 0√ Φ= (10.31) v/ 2 et négligeons les fluctuations du champ Φ autour de cette valeur constante. Nous avons manifestement choisi une direction dans l’espace interne du doublet, en supposant que la valeur de φ+ dans le vide est nulle – ce qui signifie a posteriori que le vide n’est pas chargé électriquement et donc que l’invariance de jauge électromagnétique est préservée – et que la valeur de φ0 est réelle. 142 10. Modèle standard des interactions électro-faibles Voyons maintenant ce que produit le lagrangien du doublet de Higgs quand on substitue cette valeur de Φ. Toutes les dérivées sont nulles, bien sûr, mais il reste les couplages aux champs de jauge, qui deviennent 1 iv v 1 gAµ − igA2µ 0 a a 1 0 = √ (10.32) Dµ Φ → √ ( 2 igAµ σ + 2 ig Bµ ) 0 3 1 2 2 2 g Bµ − gAµ Le lagrangien du doublet devient alors † 1µ v 2 gA1µ − igA2µ gA − igA2µ LH → g 0 B µ − gA3µ 8 g 0 Bµ − gA3µ v 2 2 1 1µ = g (Aµ A + A2µ A2µ ) + (g 0 Bµ − gA3µ )(g 0 B µ − gA3µ ) 8 (10.33) On voit que des termes quadratiques dans les champs de jauge sont générés, ce qui correspond à conférer à ces champs une masse. En effet, un terme quadratique (de signe négatif) dans le lagrangien du champ scalaire est associé à une masse de ce champ. Ceci vaut aussi pour chacune des composantes d’un champ vectoriel, comme pour un champ scalaire. Mais ce ne sont pas tous les champs de jauge qui acquièrent une masse dans ce mécanisme. Il est pratique alors de définir les combinaisons suivantes : 1 Wµ± = √ A1µ ± iA2µ 2 −g 0 Bµ + gA3µ Zµ0 = p g 2 + g 02 gBµ + g 0 A3µ Aµ = p g 2 + g 02 (Wµ− = (Wµ+ )∗ ) (10.34) En fonction de ces combinaisons, les termes de masses du lagrangien deviennent LH → vg 2 2 (W +µ )∗ Wµ+ + 1 v2 2 (g + g 02 )Z 0µ Zµ0 2 4 (10.35) alors que la combinaison Aµ , qui est en fait le champ électromagnétique, demeure sans masse. On exprime souvent les combinaisons de champs A et Z en fonction de l’angle de Weinberg θW , défini par g0 g g0 sin θW = p cos θW = p tan θW = (10.36) g g 2 + g 02 g 2 + g 02 On écrit alors Zµ0 = cos θW A3µ − sin θW Bµ (10.37) Aµ = sin θW A3µ + cos θW Bµ D’après l’éq. (10.35), le rapport de masse du W ± au Z 0 est s mW g2 = cos θW = mZ g 2 + g 02 (10.38) et les valeurs observées sont : mW = 80.42 GeV mZ = 91.19 GeV sin2 θW ≈ 0.23 (10.39) 10.3. Brisure spontanée de la symétrie : mécanisme de Higgs 143 Note : Le champ complexe Wµ+ porte une charge électrique et son conjugué complexe est Wµ− . Ceci signifie que le boson W + interagit avec le photon (il peut en émettre et en absorber) et que le boson W − est son antiparticule. Le couplage du champ Wµ+ au photon est en fait un couplage au champ A3µ et résulte de la nature non-abélienne de la symétrie de jauge SU(2). 10.3.1 Courants chargés, neutres et électromagnétique En fonction des nouveaux champs de jauge W ± , Z 0 et A, le lagrangien d’interaction entre les fermions et les bosons de jauge a une apparence différente. Pour mieux l’exprimer, nous utilisons la notion de courant et écrivons les termes d’interaction comme où LI = gJ aµ Aaµ + g 0 J Y µ Bµ (10.40) J aµ = 12 `¯L γ µ σ a `L + 12 q̄L γ µ σ a qL X Yα f¯α γ µ fα J Y µ = 21 (10.41) α où la somme dans la deuxième équation est prise sur toutes les espèces de fermions fα présentes, droites et gauches, et Yα est l’hypercharge de chaque espèce. On voit facilement que les courant J 1 et J 2 peuvent être réorganisés en J ± = J 1 ± iJ 2 , ce qui mène à un premier terme d’interaction g LCC = √ J +µ Wµ+ + J −µ Wµ− (10.42) 2 Les courants J ± sont appelés courants chargés parce qu’ils sont couplés à des particules chargées et parce qu’en tant qu’opérateurs, ils ne sont pas invariants lors d’une transformation de jauge électromagnétique (d’où l’indice CC). Par ailleurs, on peut vérifier sans problème que les combinaisons linéaires suivantes de J 3 et J Y se couplent respectivement à A et Z 0 : J em = 21 J Y + J 3 J 0 = J 3 − sin2 θW J em c’est-à-dire que LCN = eJ emµ Aµ + (10.43) g J 0µ Zµ0 cos θW (10.44) où on a introduit la constante de couplage électromagnétique e = g sin θW , alors que le quotient g/ cos θW représente la constante de couplage faible. L’indice CN signifie courants neutres. d ν d W u ν u W e u ν Z0 e u ν Figure 10.3. Diagrammes typiques résultants des interactions des bosons W ± et Z 0 avec les courants chargés et neutres, respectivement. 144 10. Modèle standard des interactions électro-faibles Des diagrammes de Feynman typiques résultant des lagrangiens LCC et LCN et représentant des interactions faibles sont représentés à la figure 10.3. Notons que les courants neutres impliquent des fermions de la même espèce, car ils sont construits à partir de générateurs diagonaux. Par contre, les courants chargés impliquent un changement d’espèce de fermions, à l’intérieur d’un même doublet d’isospin faible. 10.3.2 Relation avec la théorie V–A Pourquoi les interactions faibles sont-elles faibles? Parce que les bosons de jauge associés sont massifs. Ainsi, dans un processus d’interaction comme ceux illustrés à la figure 10.3, la particule virtuelle émise (le boson) représente une énorme fluctuation d’énergie (en raison de sa grande masse) et doit donc exister pour un temps extrêmement court. Une façon plus exacte de traiter le problème est de se souvenir de notre traitement de la théorie des perturbations du champ de Schrödinger avec un champ scalaire relativiste. Nous avons alors calculé les diagrammes explicitement et les avons combinés de manière à faire ressortir un dénominateur de la forme 1/(ω 2 − q 2 ), où ω est l’énergie de la particule virtuelle (obtenue par conservation de l’énergie au vertex du diagramme) et q sa quantité de mouvement (obtenue de la même manière). Si la particule virtuelle avait été massive, un résultat légèrement différent aurait été obtenu et un facteur ω2 1 − q 2 − m2 (10.45) serait apparu, m étant la masse de la particule virtuelle. Dans le cas des bosons W ± et Z 0 , et de processus impliquant des transferts d’énergie et d’impulsion faibles devant m, ce facteur se réduit à 1/m2 . L’amplitude de diffusion obtenue du diagramme de Feynman est donc de l’ordre g 2 /m2W pour les courants chargés, et en fait identique pour les courants neutres. On pourrait en fait remplacer l’interaction de jauge par une interaction effective courant-courant qui aurait la forme suivante : Leff. CC = − g 2 + +µ J J 2m2W µ Leff. CN = − g 2 0 0µ J J 2m2Z µ (10.46) On vérifie que cette interaction (du moins la partie courants chargés) coı̈ncide avec l’interaction V–A. La relation entre les constantes de couplage est g2 GF √ = 8m2W 2 (10.47) La dimension (unités) de la constante GF et sa petite valeur trouvent ici une explication naturelle. En fait, les interaction faibles ne sont faibles qu’aux petites énergies. Dans les processus à très haute énergie, impliquant des transferts d’énergie et de quantité de mouvement de l’ordre de la masse mW ou plus grands, les interactions faibles sont d’une force comparable à l’interaction électromagnétique. En fait, à ces grandes énergies, les masses des bosons intermédiaires perdent de leur importance. La constante de couplage g 2 = e2 / sin2 θW ≈ 1/30 est en fait plus grande que la constante de structure fine électromagnétique, de sorte que ces interactions sont en fait plus intenses que l’interaction électromagnétique, mais restent tout de même dans le régime où la théorie des perturbations est applicable. 10.5. Réplication des familles et mélange des quarks 145 10.4 Génération des masses Jusqu’ic, dans notre traitement de la théorie électrofaible, les fermions sont toujours sans masse. Il est possible de leur conférer une masse par le mécanisme de Higgs, comme pour les bosons de jauge. Il suffit pour cela de postuler que le doublet de Higgs Φ est couplé aux fermions par un terme d’interaction simple, dit de Yukawa : Lf H = f (e) `¯L eR Φ + f (u) q̄L uR Φ̃ + f (d) q̄L dR Φ + c.h. (10.48) où les constantes de couplage f (e,u,d) sont des paramètres supplémentaires de la théorie électrofaible, et où Φ̃ = iσ 2 Φ∗ est le champ de Higgs conjugué. Ces interactions de Yukawa ne sont pas arbitraires : elles sont invariantes de Lorentz et invariantes de jauge (le doublet de Higgs est toujours apparié à √ un doublet d’isospin faible). Lorsque le doublet de Higgs a une valeur moyenne non nulle (0, v/ 2) dans le vide, ces couplages, en première approximation, deviennent des termes de masse pour les fermions : v v v Lf H → f (e) √ ēL eR + f (u) √ ūL uR + f (d) √ d¯L dR + c.h. (10.49) 2 2 2 et les masses des fermions sont simplement v v mu = f (u) √ me = f (e) √ 2 2 v md = f (d) √ 2 (10.50) Ainsi, tous les fermions – sauf les neutrinos, qui n’ont pas, dans ce modèle, de composante droite – acquièrent une masse par brisure spontanée de la symétrie de jauge. 10.5 Réplication des familles et mélange des quarks Une subtilité de la théorie électro-faible apparaı̂t lorsqu’on l’applique non seulement à une famille de particules élémentaire, mais aux trois familles. Rappelons l’agencement des particules élémentaires connues dans ces trois familles, en énumérant tous les doublets d’isospin faible : νe νµ ντ e µ τ (10.51) u d c s t b Chaque famille (i.e. colonne) de ce tableau est couplée aux champs de jauge exactement de la même manière. Cependant, les couplages de Yukawa peuvent être plus généraux, et mélanger des fermions de familles différentes : Combinons les trois familles dans une notation succintes pour les différents membres des doublets (a = 1, 2, 3) : ea = (e, µ, τ ) pa = (u, c, t) na = (d, s, b) (10.52) Les couplages de Yukawa généraux peuvent alors s’écrire comme (e) (p) (n) Lf H = fab `¯a,L eb,R Φ + fab q̄a,L ub,R Φ̃ + fab q̄a,L db,R Φ + c.h. Les termes de masse correspondants sont o v n (e) (p) (n) Lf H → √ fab ēa,L eb,R + fab ūa,L ub,R + fab d¯a,L db,R + c.h. 2 (10.53) (10.54) 146 10. Modèle standard des interactions électro-faibles Nous avons donc affaire à des matrices de masse (e,p,n) Mab v (e,p,n) = √ fab 2 (10.55) qu’il faut diagonaliser. Cette diagonalisation peut se faire à l’aide d’une transformation biunitaire M = SMd T † (10.56) où ls matrice Md est diagonale et les matrices S et T sont unitaires.3 La diagonalisation est nécessaire afin de pouvoir interpréter les interactions en fonction de particules bien définies. Il s’agit ici de l’équivalent des modes normaux dans un système d’oscillateurs. On doit d’abord identifier les modes normaux avant de traiter les effets non linéaires dans un tel système, c’est-à-dire l’équivalent ici des interactions. Adoptons maintenant un changement de notation : tous les champs considérés précédemment seront affublés d’un prime (0 ) et seront qualifiés d’états propres de jauge, en ce sens que les courants chargés et neutres sont diagonaux en fonction de ces champs. Les termes de masses, cependant, ne le sont pas, et ont la structure ψL0 M ψR0 , où ψ 0 désigne e0 , p0 ou n0 . Après diagonalisation, on trouve ψL0 M ψR0 = ψL0 SMd T † ψR0 = ψL Md ψR (10.57) où on a défini les champs diagonaux (états propres de la masse) ψL = S † ψL0 et ψR = T † ψR0 . Ceci implique que les courants chargés et neutres ne sont pas diagonaux dans les nouveaux champs e, p et n et donc que les interactions faibles peuvent effectuer des transitions entre les différentes familles. Voyons comment cela fonctionne : la contribution des quarks au courant chargé J +µ devient, en fonctions des états propres de la masse, J +µ = q̄L0 γ µ σ + qL0 = p̄0L γ µ n0L = p̄L S (p)† γ µ T (n) nL = p̄L γ µ U nL (10.58) où la matrice U = S (p)† T (n) est unitaire, et caractérise un mélange des quarks (d, c, b) se couplant au quark u dans le courant chargé. Ceci signifie, par exemple, que dans les diagrammes de la fig. 10.3, le quark d devrait être remplacé par la combinaison Udd d + Uds s + Udb b, et donc que des processus sont possibles par lesquels un quark s se désintègre en quark u et en leptons. On pourrait reprendre le même raisonnement avec les courants neutres. La matrice U porte le nom de matrice de Cabibbo-Kobayashi-Masakawa (matrice CKM), et ses éléments forment aussi des paramètres du modèle standard (en fait, seuls 4 paramètres sont vraiment indépendants dans la spécification de cette matrice). Qu’en est-il des leptons? Les neutrinos n’ayant pas de masse (en raison de l’absence des neutrinos droits νR de la théorie), la contribution des leptons au courant chargés s’écrit plutôt J +µ = `¯0L γ µ σ + `0L = ν̄L0 γ µ e0L = ν̄L0 γ µ T (e) eL (10.59) Mais les neutrinos n’ayant pas de masse, les trois espèces sont dégénérées. Donc on peut sans peine définir ν = T (e)† ν 0 sans affecter les masses (nulles) des neutrinos : ν 0 et ν représentent tous les deux des états propres de la masse. Le courant chargé leptonique reste donc diagonal en fonction des familles de leptons : J +µ = ν̄L γ µ eL (10.60) 3 On peut montrer relativement facilement – ce que nous ne prenons pas le temps de faire ici – que toute matrice M peut être diagonalisée de cette façon. Si M est diagonalisable au sens habituel du terme, c’est que S = T ; c’est le cas si M est hermitique. 10.6. La symétrie CP et sa brisure 147 10.5.1 Angle de Cabibbo Le cas de deux familles est plus simple, et a été étudié plus tôt. Dans ce cas, la matrice CKM est 2 × 2 et ne comporte comme paramètre indépendant qu’un angle θc appelé angle de Cabibbo : cos θc sin θc (10.61) U= − sin θc cos θc ce qui donne le courant neutre hadronique suivant : cos θc +µ µ µ J = p̄L γ U nL = ( ūL c̄L ) γ − sin θc sin θc cos θc dL sL (10.62) = cos θc ūL γ µ dL + sin θc ūL γ µ sL − sin θc c̄L γ µ dL + cos θc c̄L γ µ sL De cette manière, on conclut que l’amplitude du processus de désintégration s → ueν est tan θc fois l’amplitude correspondante pour la désintégration du quark d. La valeur observée de l’angle de Cabibbo est θc = 0.222. Mais gardons à l’esprit que la matrice CKM est en réalité 3 × 3 et que d’autres angles et phases interviennent. Mais le mélange entre la première et la deuxième famille est le plus important. 10.6 La symétrie CP et sa brisure Les interactions faibles brisent la parité, car seuls les fermions gauches interviennent dans la symétrie de jauge SU(2). Cette violation est maximale, en ce sens qu’elle n’est pas caractérisée par un petit paramètre, mais est aussi grande qu’elle pourrait l’être. Cette brisure de la parité P s’accompagne d’une brisure correspondante de la conjugaison de charge C. En effet, lorsqu’on applique l’opérateur de conjugaison de charge sur un spineur droit, on obtient un spineur gauche : CψR = iγ 2 ψR∗ = 21 iγ 2 ((1 + γ 5 )ψ)∗ = 21 (1 − γ 5 )iγ 2 ψ ∗ = (ψc )L (10.63) parce que γ 5 anticommute avec γ 2 . En clair, l’opération de conjugaison de charge remplace la composante droite d’une particule par la composante gauche de son antiparticule. Or, dans la théorie électrofaible, on trouve des neutrinos gauches et des antineutrinos gauches, mais pas de neutrinos et d’antineutrinos droits. Donc cette théorie n’est pas invariante par conjugaison de charge. Notons cependant qu’elle est invariante sous l’action combinée de la parité et de la conjugaison de charge. L’opération de parité échange les composantes droite et gauche, de sorte que l’opération CP change un neutrino droit en un antineutrino droit, et la théorie est bel et bien invariante par cette opération. On dit alors qu’elle conserve CP. L’une des conséquences de cette conservation de CP est le mélange des kaons neutres, expliqué par Gell-Man et Pais en 1955. Les kaons neutres K 0 et K̄ 0 sont les antiparticules l’une de l’autre. Leur contenu en quarks est K 0 = s̄d K̄ 0 = sd¯ (10.64) Ces particules sont, en quelque sorte, des états propres des interactions fortes, qui les crée sous cette forme lors de réactions hadroniques. Par contre, ces particules ne sont pas des états propres de C, car, symboliquement, C|K 0 i = |K̄ 0 i et C|K̄ 0 i = |K 0 i. Ce sont cependant des états propres de P , avec une parité intrinsèque η = −1. Comme la désintégration des ces particules est gouvernée 148 10. Modèle standard des interactions électro-faibles par les interactions faibles, il est normal de chercher à les décrire par des états propres de CP, qui est conservé par les interactions faibles. On construit donc les combinaisons linéaires suivantes : 1 |K2 i = √ |K 0 i + |K̄ 0 i 2 1 |K1 i = √ |K 0 i − |K̄ 0 i 2 (10.65) qui sont des états propres de CP avec valeurs propres +1 et −1 respectivement. Par exemple, 1 1 1 CP |K1 i = √ CP |K 0 i − CP |K̄ 0 i = √ η C|K 0 i − C|K̄ 0 i = √ η |K̄ 0 i − |K 0 i = |K1 i 2 2 2 (10.66) Les deux états K1 et K2 ne se désintègrent pas de la même façon. K1 peut se désintégrer en deux pions : K1 → π + π − ou K1 → π 0 π 0 . En effet, plaçons-nous dans le référentiel du kaon; l’état initial et l’état final on un spin nul et le moment cinétique orbital des deux pions est donc nul. La parité de la fonction d’onde des deux pions est donc +1. Lorsqu’on applique une inversion de l’espace, les deux pions, qui s’en vont dans des directions opposées, sont échangés, et ils sont échangés de nouveau losrqu’on applique la conjugaison de charge, car ils sont l’antiparticule l’un de l’autre (le π 0 est, quant à lui, sa propre antiparticule, ce qui revient au même). Donc l’état final est invariant par CP, c’est-à-dire qu’il est un état propre de CP avec valeur propre +1. La désintégration est donc permise, en vertu de la conservation de CP dans les interactions faibles. Par contre, K2 ayant CP = −1, ne peut pas se désintégrer en deux pions, mais il peut se désintégrer en trois pions : K2 → πππ. Comme l’énergie cinétique disponible dans l’état final est moindre dans ce cas, l’espace des phases est plus restreint et le taux de désintégration est plus faible, menant à des vies moyennes différentes : τ1 = 0.9 × 10−10 s τ2 = 0.5 × 10−7 s (10.67) Le K2 vie en moyenne 550 fois plus longtemps que le K1 . 1 0.8 0.6 K0 0.4 0.2 _ K0 2 4 6 8 10 12 t/τ1 Figure 10.4. Évolution dans le temps de la probabilité de trouver un kaon K 0 et un antikaon K̄ 0 dans un faisceau ne contenant initialement que des k 0 . Nous pouvons caractériser la propagation de ces particules en spécifiant leur masse et leur vie moyenne inverse Γ = τ −1 . En fonction, du temps, l’état |K1 i évolue de la manière suivante : |K1 (t)i = a1 (t)|K1 i où a1 (t) = a1 (0)e−im1 t−Γ1 t/2 (10.68) 10.6. La symétrie CP et sa brisure 149 et pareillement pour K2 . Les conditions initiales font que seuls les K0 sont produits à t = 0. En effet, ¯ simplement la production associée de quarks s et s̄ fait que l’état s̄d est formé, mais pas l’état sd, ¯ parce qu’il n’y a pas de quark d dans la cible frappée par le faisceau de l’accélérateur. Le s̄ se combine à d (ou à u) pour former un kaon, et le s au reste des quarks pour former un baryon. Comme 1 1 K̄ 0 = √ (|K1 i − |K2 i) (10.69) K 0 = √ (|K1 i + |K2 i) 2 2 √ Les conditions initiales sont a1 (0) = a2 (0) = 1/ 2, et la probabilité de trouver un K 0 ou un K̄ 0 au temps t dans le faisceau de kaons ainsi créé est I(K 0 ) = 21 |a1 (t) + a2 (t)|2 = 14 e−Γ1 t + e−Γ2 t + 2e−(Γ1 +Γ2 )t/2 cos(∆mt) (10.70) I(K̄ 0 ) = 21 |a1 (t) − a2 (t)|2 = 14 e−Γ1 t + e−Γ2 t − 2e−(Γ1 +Γ2 )t/2 cos(∆mt) où ∆m = |m1 − m2 |. Ce comportement est illustré à la fig. 10.4. On a mesuré que ∆mτ1 = 0.477 ± 0.002. Ceci équivaut à une différence de masse ∆m = 3.49 × 10−12 MeV. Nous avons vu que les K 0 sont produits par impact d’un faisceau de protons sur un cible, alors que les K̄ 0 ne peuvent être produits de cette façon, car ils contiennent un quark d¯ qui n’existe pas dans la cible. Ce quark est généré par les interactions faibles au cours de la propagation du kaon. Lorsque le faisceau de kaons frappe une cible, la situation est inversée : l’antikaon K̄ 0 peut réagir facilement avec la matière de la cible, car le quark anti-d qu’il contient peut facilement s’annihiler avec les quarks d de la cible, alors que le quark s du kaon ne peut pas s’annihiler avec un antis, absent de la cible. Donc les anti-kaons réagiront facilement avec la cible pour produire d’autre chose alors que les kaons seront beaucoup moins affectés par la cible et pourront la traverser intacte (ce sont toutes les deux des particules neutres et donc seules les interactions fortes les affectent d’une manière importante dans la cible). Ce phénomène est appelé regénération, même si en réalité les kaons ne sont pas regénérés : ce sont les anti-kaons qui sont éliminés du faisceau qui traverse la cible. En mesurant le flux de kaons sortant de la deuxième cible, en fonction de la distance entre la première cible (qui produit les kaons en premier lieu) et la deuxième, on arrive à mesurer l’amplitude |a1 (t) + a2 (t)|2 et à confirmer les prédictions de la fig. 10.4. La physique des kaons est une application particulièrement frappante de la mécanique quantique d’un système à deux niveaux, et illustre très bien la notion de particule en mécanique quantique, avec les superpositions possibles qu’elle implique. 10.6.1 Brisure de CP Les kaons neutres existent donc en deux espèces, qu’on a appelé K1 et K2 , mais qu’on devrait de manière plus prudente appeler KS0 et KL0 (S et L pour short et long) désignant respectivement les états à vie moyenne courte et longue. Si la symétrie CP est exacte, alors KS coı̈ncide avec K1 et KL avec K2 . En 1964, les équipes de Cronin et Fitch ont montré que le kaon KL , qui en principe ne devrait pas se désintégrer en deux pions en raison de la conservation de CP, parvient quand même à se désintégrer dans ce canal, avec un rapport d’embranchement toutefois assez petit : KL0 → π + π − KL0 → modes chargés = 0.002 (10.71) Donc KL0 , un état propre des interactions faibles, n’est pas un état propre parfait de CP; il y a une petite déviation. Cette révélation créa une onde de choc dans le monde de la physique des particules, comparable à celle qu’avait créé la découverte de la brisure de la parité en 1957. 150 10. Modèle standard des interactions électro-faibles Un théorème très robuste de la physique théorique des particules stipule que la combinaison des opérations C, P, et T doit vraiment laisser l’univers invariant. En clair, selon ce théorème CPT, notre univers est entièrement équivalent à un autre univers obtenu en inversant l’espace, en inversant le cours du temps et en remplaçant la matière par l’antimatière. Il découle de ce théorème, par exemple, que la masse des particules doit être rigoureusement identique à celle des antiparticules. Pratiquement personne ne met en doute la conservation de CPT. La violation de CP entraı̂ne donc que la symétrie T est violée également, c’est-à-dire que les lois microscopiques de la physique ne sont pas invariantes par inversion du temps. Cette asymétrie ne se manifeste que dans les interactions faibles, et de manière assez petite, mais elle existe tout de même. En fait, les kaons neutres sont à ce jour le seul système physique où cette brisure de CP (ou de T) a été observée. On présume qu’elle devrait l’être de manière plus importante dans les mésons formés de quarks b, et pour cette raison on pousse pour la construction d’accélérateurs spéciaux dédiés à la productions de mésons B (on appelle de telle machine des “usines de B” ou B-factories). L’importance de la brisure de CP vient de la cosmologie. Notre univers comporte, heureusement, un excédent de matière sur l’antimatière. Le nombre de nucléons dans l’univers est environ un milliard de fois plus petit que le nombre de photons. Si on suppose que ces photons sont venus de l’annihilation des quarks avec les antiquarks (et des électrons avec les positrons), on doit supposer qu’à l’époque où le rayonnement était en équilibre avec la matière (c’est-à-dire qu’il y avait autant de créations de paires particule-antiparticule que d’annihilations), l’excédent de quarks sur les antiquarks devrait être de l’ordre d’un milliardième : nq − nq̄ ∼ 10−9 nq + nq̄ (10.72) Cette petite différence a permis à la matière de survivre; autrement, l’univers ne contiendrait que des photons. En 1967, le physicien russe A. Sakharov – plus connu en tant que père de la bombe H soviétique et plus tard comme le plus célèbre des dissidents russes – a énoncé trois conditions qui, ensemble, peuvent expliquer l’excédent de matière sur l’antimatière dans notre univers : 1. Une brisure de l’inversion du temps dans les lois fondamentales. 2. Une phase dans l’évolution de l’Univers, peu après le big bang, où l’équilibre thermodynamique était rompu. 3. Un mécanisme, dans les interactions fondamentales, qui viole la conservation du nombre de baryons, i.e., qui peut changer le nombre net de quarks. La première condition est remplie par les interactions faibles, même si on ne connaı̂t pas explicitement la cause profonde de cette brisure.4 La deuxième est acquise aussi, car il suffit que l’expansion de l’univers après le big bang soit, à un moment donné, plus rapide que le temps moyen d’une réaction importante. La troisième nécéssite d’aller au-delà du modèle standard, vers un modèle d’unification des forces fondamentales. 4 On sait cependant comment la paramétriser : un élément complexe de la matrice CKM suffit. Mais cela n’explique pas comment une telle phase dans la matrice CKM est apparue. 10.7. L’unification des forces 151 10.7 L’unification des forces Depuis les années 1970, plusieurs théories ont été proposées dans le but d’unifier les interactions électro-faible et forte dans une même théorie de jauge. Aucune de ces théories n’a été retenue définitivement, car leur prédictions sont très difficiles à vérifier. De telles théories portent le nom de théories de grande unification, ou GUTs (grand unified theories). L’idée de base est de supposer qu’un groupe de jauge supérieur G gouverne toutes les forces également. Les groupes de jauge de la QCD et de la théorie électrofaible sont des sous-groupes de G : SU (3) × SU (2) × U (1) ⊂ G (10.73) La théorie de jauge basée sur G subit un mécanisme de brisure spontanée de la symétrie, semblable au mécanisme de Higgs, mais à une échelle d’énergie beaucoup plus élevée, appelée “échelle de grande unification”. La constante de couplage unique gu de cette théorie, qui dépend de l’échelle d’énergie comme dans toute théorie des champs, se sépare en trois constantes gs , g et g 0 pour les parties forte et électro-faible de la théorie résultant de la brisure spontanée, et ces trois constantes de couplage évoluent différemment en fonction de l’échelle d’énergie, comme illustré à la figure 10.5. L’échelle d’énergie à laquelle se produit cette unification, c’est-à-dire l’échelle d’énergie au-delà de laquelle les interactions deviennent toutes équivalentes, est de l’ordre de 1014 GeV, une énergie cent milliards de fois plus grande que celle que peut produire le plus puissant des accélérateurs présentement en fonction. C’est donc dire que la physique des interactions unifiées est loin de nos capacités expérimentales. gs g g′ gu log q Figure 10.5. Évolution schématique, en fonction de l’échelle d’énergie, des constantes de couplages de la QCD (gs ) et de la théorie électro-faible (g et g 0 ). Les trois constantes convergent à peu près à une échelle d’énergie appelée échelle de grande unification, et qui vaut environ 1014 GeV, après quoi une seule constante de couplage gu émerge. Nous allons décrire brièvement la plus connue d’entre elles, basée sur le groupe de jauge SU(5). Dans cette théorie, les quarks des trois couleurs et les leptons sont intégrés, famille par famille, dans des représentations du groupe SU(5). La plus simple de ces représentations est la représentation fondamentale, de dimension 5, et on y agence les quarks d et les leptons comme suit : 5 : (d1 , d2 , d3 , ec , −ν c )R 5c : (dc1 , dc2 , dc3 , e, −ν)L (10.74) où l’indice 1,2,3 des quarks désigne la couleur, et le symbole c désigne l’antiparticule (i.e. ec = e+ ). SU(5) possède aussi une représentation de dimension 10, sous la forme d’une matrice anti- 152 10. Modèle standard des interactions électro-faibles symétrique. Les fermions restant y sont agencés comme suit : 0 uc3 −uc2 uc1 d1 0 uc1 u2 d2 0 u3 d3 10 : 0 ec 0 L (10.75) Notons que (uci )L contient en fait uiR , et donc le contenu de ces trois représentations est exaustif. Les champs de jauge de la théorie SU(5) sont au nombre de 52 − 1 = 24. De ce nombre, 8 sont les précurseurs des gluons et 4 les précurseurs des bosons W ± , Z 0 et du photon. Il reste 12 bosons de jauge qui acquièrent, présumément, une masse de l’ordre de 1014 GeV lors de la brisure spontanée de SU(5). Ces douze bosons de jauge sont notés Xα± et Yα± et forment des doublets d’isospin faible (X, Y ) et des triplets de couleur (X1 , X2 , X3 ) et (Y1 , Y2 , Y3 ). Les bosons X portent en outre un charge électrique ± 43 et les bosons Y une charge ± 13 . uc e+ uc X νc uc e+ Y u d d Y d d u Figure 10.6. Diagrammes de Feynman impliquant les bosons X et Y de la théorie de grande unification SU(5). Notez qu’une antiparticule entrante, comme uc , équivaut à une particule sortante, de sorte que les processus illustrés ici ne conservent pas la nombre baryonique (ou le nombre de quarks). L’une des caractéristiques intéressantes des théorie d’unification est qu’elles expliquent la quantification de la charge électrique. La théorie SU(5) explique naturellement que la charge des quarks doit être en multiples de 31 et celle des leptons en multipes de 1. Une autre caractéristique est que cette théorie fournit un mécanisme pour la non conservation du nombre baryonique. Autrement dit, il existe des processus qui permettent la transformation d’un quark en lepton, par émission ou absorption d’un boson de jauge X. Les diagrammes de Feynman typiques impliquant les bosons X et Y sont illustré à la fig. 10.6. En particulier, un processus possible est la désintégration du proton, qui pourrait s’effectuer par l’intermédiaire d’un boson X, comme illustré ci-dessous : e+ u p u d X d (10.76) π0 d La vie moyenne estimée du proton par ce processus est située entre 1028 et 1032 années. L’estimation expérimentale de la vie moyenne du proton dans le processus p → e+ π 0 est supérieure à un valeur 10.7. L’unification des forces 153 allant de 1031 et 1033 années. La prédiction de la théorie SU(5) est donc marginalement rejetée par l’expérience. Mais les incertitudes sont énormes tant que la masse des hypothétiques bosons X et Y n’est pas estimée avec plus de précision. Problèmes Problme 10.1 a) Démontrez, à partir de la transformation de parité (10.12), que l’expression ψ̄ 1 γ 5 ψ2 est un pseudo-scalaire. ψ1 et ψ2 sont deux spineurs de Dirac quelconques. b) De même, démontrez que la partie spatiale du quadri-vecteur ψ̄ 1 γ 5 γ µ ψ2 est un vecteur axial, ou pseudovecteur. Problme 10.2 a) Démontrez que ψ̄ L , défini comme étant ψL† γ 0 , est en fait égal à 1 2 ψ̄(1 + γ 5 ). De même, montrez que ψ̄ R = 21 ψ̄(1 − γ 5 ). b) Démontrez que la conjugaison de charge échange les composantes droite et gauche. Autrement dit, (ψ c )R = (ψL )c et vice-versa. Problme 10.3 Dans la théorie de Fermi des interactions faibles, l’hamiltonien d’interaction est donné par l’expression suivante : Z GF HI = − √ d3 r (p̄γ µ n)(ēγ µ ν) (10.77) 2 où p, n, ν, et e sont les spineurs décrivant respectivement le proton, le neutron, le neutrino et l’électron. Considérez que l’état initial |ii du système est un neutron au repos, et que l’état final |f i contient un proton, un électron et un antineutrino. Supposons que le proton, l’électron et le neutrino sont respectivement dans des états de spineur up (pp ), ue (pe ) et vν (pν ), et que le neutron d’origine a un spin ‘up’. Utilisez la règle d’or pour calculer l’amplitude associé à ce processus de désintégration. Problme 10.4 Exprimez comment les doublets d’isospin faible `L et qL se couplent au bosons de jauge W ± . Partez du lagrangien d’interaction de ces doublets avec les champs A1µ et A2µ et de la définition Wµ± = A1µ ± iA2µ . Problme 10.5 Démontrez explicitement, dans le lagrangien, qu’un terme de masse pour les leptons ou les quarks viole la symétrie de jauge SU(2). Problme 10.6 D’après la forme de l’interaction entre le champ de Higgs et les leptons et quarks, comment se désintègrerait la particule de Higgs? 154 10. Modèle standard des interactions électro-faibles Problme 10.7 À l’aide d’un diagramme de flot de particules (quarks ou autres), illustrez comment peut se désintégrer les particules suivantes : Essayez de donner plusieurs possibilités là où c’est possible et consultez le livret des particules pour vérifier que les désintégrations peuvent se produire comme vous le suggérez, et notez le rapport d’embranchement ainsi que la vie moyenne. a) Le neutron b) Le muon c) Le lepton tau (τ ) d) Le méson lourd Υ (bb̄) e) Le pion π + f) Le pion neutre π 0 Table des Matières 1. Processus élémentaires . . . . . . . . 1.1. Probabilité de transition . . . . . . . . . . . . . 1. Règle d’or de Fermi . . . . . . . . . . . . 1.2. Normalisation des états et espace des phases . . . . 1.3. Désintégration et espace des phases . . . . . . . . 1. Forme générale du taux de désintégration . . 2. Exemple : désintégration à deux corps . . . . 3. Loi exponentielle de désintégration . . . . . 1.4. Collisions et section efficace . . . . . . . . . . . 1. Diffusion par un potentiel . . . . . . . . . 2. Interprétation de la section efficace . . . . . 3. Longueur d’atténuation . . . . . . . . . . 4. Formule de Rutherford . . . . . . . . . . . 5. Forme relativiste générale de la section efficace 1.5. Résonances et masse invariante . . . . . . . . . . Problèmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 4 5 7 7 8 9 10 10 12 12 12 14 15 17 . . . . . . . . . . . 2.1. Composition des noyaux . . . . . . . . . . . . . . . . . . . . . 1. Terminologie . . . . . . . . . . . . . . . . . . . . . . . 2.2. Taille des noyaux . . . . . . . . . . . . . . . . . . . . . . . . 2.3. Masse des noyaux . . . . . . . . . . . . . . . . . . . . . . . 1. Les noyaux stables . . . . . . . . . . . . . . . . . . . . 2. Énergie de liaison . . . . . . . . . . . . . . . . . . . . . 3. Modèle de la goutte liquide et formule semi-empirique des masses 2.4. Le modèle en couches des noyaux . . . . . . . . . . . . . . . . . 1. La force nucléaire . . . . . . . . . . . . . . . . . . . . . 2. Fondements du modèle en couches dans les atomes . . . . . . 3. Les nombres magiques . . . . . . . . . . . . . . . . . . . 4. Forme du potentiel nucléaire . . . . . . . . . . . . . . . . 2.5. Annexe : L’addition des moments cinétiques et l’interaction spin-orbite Problèmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 21 23 23 25 25 26 27 29 29 30 31 32 34 35 2. Modèles élémentaires du noyau iii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3. Instabilités nucléaires . . . . . . . . . . 3.1. Processus alpha, bêta et gamma . . . . . . . . . . 1. Émission gamma . . . . . . . . . . . . . . 2. Émission bêta . . . . . . . . . . . . . . . 3. Émission alpha . . . . . . . . . . . . . . . 3.2. Séquences radioactives . . . . . . . . . . . . . . 1. Stabilité des nuclides par émission bêta . . . . 2. Séquences d’émission alpha et bêta . . . . . . 3. Équilibre séculaire . . . . . . . . . . . . . . 3.3. Théorie de l’émission alpha . . . . . . . . . . . . 1. Mécanisme de l’émission alpha . . . . . . . . 2. Calcul élémentaire du taux de désintégration . . 3. Traitement plus rigoureux de la barrière sphérique 4. Relation entre l’énergie et le taux d’émission . . Problèmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 38 38 39 41 42 42 42 43 45 45 46 46 47 48 4. Réactions nucléaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 50 51 53 53 55 55 56 56 57 57 58 58 . 5.1. Le modèle standard . . . . . . . . . . . . . . . . 5.2. Classification des particules élémentaires . . . . . . 5.3. Plan du reste du cours . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 61 62 64 6. Quantification du champ et interactions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 65 65 66 67 68 68 69 71 71 73 76 77 77 79 . . . . . . 4.1. Modèle du noyau composé . . . . . . . . 4.2. Fission induite . . . . . . . . . . . . . 1. Réaction en chaı̂ne . . . . . . . . 2. Les réacteurs nucléaires . . . . . . 4.3. Nucléogenèse . . . . . . . . . . . . . . 1. Nucléogenèse primordiale . . . . . 2. Le cycle du proton . . . . . . . . 3. Combustion de l’hélium . . . . . . 4. Combustion du carbone et de l’oxygène 5. Combustion du silicium et au-delà . . 6. La fusion nucléaire sur Terre . . . . Problèmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5. Particules élémentaires : généralités 6.1. Ondes électromagnétiques . . . . . . . . . . . . . 1. Équations de Maxwell et transformées de Fourier 2. champs transverses et longitudinaux . . . . . . 3. Variables normales . . . . . . . . . . . . . 6.2. Quantification du champ électromagnétique . . . . . 1. Hamiltonien du champ . . . . . . . . . . . . 2. Photons . . . . . . . . . . . . . . . . . . 6.3. Fermions . . . . . . . . . . . . . . . . . . . . 1. Électrons non relativistes : champ de Schrödinger 2. Interaction électrons-photons . . . . . . . . . 3. Théorie du champ scalaire . . . . . . . . . . 6.4. Théorie des perturbations et diagrammes de Feynman . 1. Diffusion des électrons par un champ scalaire . . 2. Calcul de l’amplitude de diffusion complète . . . iv . . . . . . . . . . . . . . 6.5. Équation de Klein-Gordon . . . . . . . . . 1. Le champ scalaire massif . . . . . . . 2. Théorie de Yukawa de l’interaction forte 6.6. Formulation lagrangienne . . . . . . . . . 1. Rappels de mécanique de Lagrange . . 2. Densité lagrangienne . . . . . . . . 3. Action du champ scalaire . . . . . . Problèmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 81 82 83 84 84 85 86 . . 7.1. Spin et transformations de Lorentz . . . . . . . 1. Spineurs droits et gauches . . . . . . . . 2. hélicité . . . . . . . . . . . . . . . . 7.2. Équation de Dirac . . . . . . . . . . . . . . 1. Propriétés des matrices de Dirac . . . . . 2. Solution de l’équation de Dirac . . . . . . 7.3. Deuxième quantification du champ de Dirac . . . 1. Antiparticules . . . . . . . . . . . . . 7.4. L’électrodynamique quantique . . . . . . . . . 1. Transformations de jauge et couplage minimal 2. Hamiltonien d’interaction électron-photon . 3. Règles de Feynman . . . . . . . . . . . 4. Exemples de processus . . . . . . . . . . 5. Corrections radiatives . . . . . . . . . . Problèmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 88 91 92 93 94 94 96 97 98 98 100 101 103 104 106 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . du moment cinétique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 110 110 111 112 114 115 115 117 117 118 118 120 120 121 124 125 126 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 128 129 130 132 133 7. Théorie relativiste de l’électron . . . . . 8. Introduction à la théorie des groupes 8.1. Définitions et concepts de base . . . 1. Définition d’un groupe . . . . 2. Groupes définis par des matrices 8.2. Rotations en mécanique quantique . 8.3. Représentations du moment cinétique 1. SU(2) . . . . . . . . . . . 2. Construction des représentations 8.4. Représentations : concepts généraux 1. Lemme de Schur . . . . . . 2. Représentation projective . . 8.5. SU(3) . . . . . . . . . . . . . . 1. Représentations conjuguées . . 2. Représentation adjointe . . . 8.6. Produits tensoriels . . . . . . . . 8.7. Symétrie de saveur des quarks . . . 8.8. Symétrie de couleur . . . . . . . . Problèmes . . . . . . . . . . . . . . 9. Théories de jauge . . 9.1. Symétrie de jauge non abélienne 9.2. Le tenseur de Faraday . . . . 9.3. Le lagrangien de la QCD . . 9.4. Propriétés de la QCD . . . . Problèmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10. Modèle standard des interactions électro-faibles 10.1. Interactions faibles . . . . . . . . . . . . . . . . 1. Première théories des interactions faibles . . . . 2. Spineurs droit et gauche . . . . . . . . . . . 3. Théorie V–A . . . . . . . . . . . . . . . . 10.2. Théorie de jauge SU(2)× U(1) . . . . . . . . . . 10.3. Brisure spontanée de la symétrie : mécanisme de Higgs 1. Courants chargés, neutres et électromagnétique . 2. Relation avec la théorie V–A . . . . . . . . . 10.4. Génération des masses . . . . . . . . . . . . . . 10.5. Réplication des familles et mélange des quarks . . . 1. Angle de Cabibbo . . . . . . . . . . . . . . 10.6. La symétrie CP et sa brisure . . . . . . . . . . . 1. Brisure de CP . . . . . . . . . . . . . . . 10.7. L’unification des forces . . . . . . . . . . . . . . Problèmes . . . . . . . . . . . . . . . . . . . . . . vi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 134 135 136 137 138 140 143 144 145 145 147 147 149 151 153