physique subatomique

Transcription

physique subatomique
David Sénéchal
PHYSIQUE SUBATOMIQUE
NOTES DE COURS
(PHQ-636)
Université de Sherbrooke
Faculté des Sciences
Avril 2005
PHYSIQUE SUBATOMIQUE
NOTES DE COURS
(PHQ-636)
par
David Sénéchal
Professeur
Département de physique
Faculté des Sciences
Université de Sherbrooke
Avril 2005
c 2005, David Sénéchal, Faculté des Sciences, Université de Sherbrooke.
Tous droits réservés.
CHAPITRE 1
Processus élémentaires
Notre connaissance du monde subatomique est tirée d’expériences et d’observations faisant intervenir des processus de désintégration et de collisions. Ces processus sont gouvernés par la mécanique
quantique, et sont donc essentiellement probabilistes. C’est en mesurant, de manière statistique,
les probabilités de ces processus et en identifiant leurs produits, qu’on parvient à imaginer et corroborer les différentes théories sur la composition de la matière et sur les interactions fondamentales.
Il est donc important de bien comprendre comment les probabilités de ces différents processsus
sont reliées aux produits, à l’énergie disponible, et ainsi de suite. C’est ce que veux présenter ce
chapitre.
Note importante : système d’unités naturelles
Nous utiliserons dans ce cours un système d’unités naturelles, dans lequel h̄ = 1 et c = 1. Ainsi,
nous ne distinguerons plus l’impulsion du vecteur d’onde, ou l’énergie de la fréquence et de la masse.
Dans ce système d’unités, il n’y a qu’une seule unité fondamentale, soit l’énergie. La longueur n’est
qu’une énergie inverse, tout comme le temps. Une fois en présence d’une expression en unités
naturelles, il est toujours possible de revenir au système d’unités usuel par analyse dimensionnelle.
Un facteur de conversion très utile dans ce cas est le produit h̄c = 197 MeV fm.
1.1 Probabilité de transition
Les processus de désintégration et de collision (ou diffusion) sont illustrés schématiquement cidessous :
N
N
1
…
…
1
3
désintégration
2
4
2
collision
(1.1)
3
Les particules (ou objets) en jeu sont numérotés de 1 à N , et le temps s’écoule de gauche à droite.
Une désintégration implique au moins trois objets : la particule instable (1) et au moins deux
produits de désintégration (numérotés de 2 à N ). On parle d’une désintégration à deux corps, à
trois corps, etc, selon le nombre de produits. Une collision implique au moins quatre objets : deux
réactants (1 et 2) et au moins deux produits (numérotés de 3 à N ).
D’un point du vue quantique, ces processus sont un passage d’un état quantique initial |ii vers
un état quantique final |f i différent. On suppose que les particules en cause, à l’état libre, sont
4
1. Processus élémentaires
décrites par un certain hamiltonien H0 . Par exemple, dans le cas non relativiste, ce hamiltonien
est simplement
X P2
i
(1.2)
H0 =
2m
i
i
où Pi est l’opérateur de qantité de mouvement de la particule i et mi est la masse correspondante. Si
H0 était le hamiltonien total du système, alors les particules seraient stables et aucune interaction
(ou collision) ne serait possible. Les processus de désintégration et de collision sont donc attribuables
à un hamiltonien supplémentaire, noté V et qualifié d’interaction, qui porte les particules à se
transformer : on décompose donc le hamiltonien total en H = H0 + V . Par exemple, si une
particule se désintègre, c’est que son état de particule n’est pas un état propre du hamiltonien
total H, mais de H0 seulement. Ainsi, un état excité de l’atome d’hydrogène est un état propre
du hamiltonien de l’atome d’hydrogène lui-même, mais n’est pas un état propre du hamiltonien
complet qui comprend l’interaction entre l’atome et le champ électromagnétique. C’est donc pour
cela que les états excités sont instables, et qu’ils se “désintègrent” en un atome d’hydrogène à l’état
fondamental et un photon.
1.1.1 Règle d’or de Fermi
Si, dans un certain sens, le terme d’interaction V est “petit” devant H0 , alors il ne se manifeste
que par des processus, comme la désintégration et les collisions, qui se produisent suffisamment
rarement pour que les particules isolées soient concevables. Autrement, les états de particules libres
seraient si éloignés des véritables états propres du hamiltonien, que la notion même de particule
n’aurait pas beaucoup de sens. Il est alors raisonnable de traiter V comme une perturbation,
d’autant plus que la résolution du hamiltonien complet est impossible. On applique alors la théorie
des perturbations dépendantes du temps, via la fameuse règle d’or de Fermi :
ωi→f = 2π|Mf i |2 δ(Ef − Ei )
(1.3)
où ωi→f est la probabilité par unité de temps (ou taux de transition) pour que l’état initial |ii se
transmute en état final |f i. L’énergie étant conservée, la fonction delta δ(Ei − Ef ) nous assure que
les énergies des deux états sont les mêmes. Enfin, Mf i est l’amplitude de transition entre les états
initial et final, donné au premier ordre de la théorie des perturbations par l’élément de matrice de
la perturbation V entre ces deux états :
Mf i = hf |V |ii
(1.4)
Il s’agit bien sûr d’une approximation, au premier ordre en V . Aux ordres suivants, l’amplitude
comporte en plus une sommation sur des états intermédiaires :
Mf i = hf |V |ii +
X hf |V |nihn|V |ii
n
Ei − En +
i0+
+
X
n,m
hf |V |nihn|V |mihm|V |ii
+ ···
(Ei − En + i0+ )(Ei − Em + i0+ )
(1.5)
Le deuxième terme est une somme sur les états propres |ni du hamiltonien non perturbé H0 , dont
les énergies sont En . Le troisième terme comporte deux sommations sur des états intermédiaires,
et ainsi de suite. La partie imaginaire infinitésimale au dénominateur sert parfois à résoudre des
ambiguités analytiques lors de la sommation sur les états intermédiaires. Le deuxième terme doit
être considéré si le premier s’annule, ou afin d’améliorer la précision du calcul (nous allons nous
limiter au premier terme dans ce qui suit, mais le deuxième ordre interviendra dans un chapitre
ultérieur, lors de l’introduction des diagrammes de Feynman).
1.2. Normalisation des états et espace des phases
5
1.2 Normalisation des états et espace des phases
Les états de particules libres sont caractérisés par un certaine impulsion p. La normalisation de
ces états est matière à convention. Trois de ces conventions seront utilisées ici : une normalisation
discrète (ND), une normalisation continue (NC) et une normalisation relativiste (NR) invariante
de Lorentz.
Dans la normalisation discrète, on suppose que l’espace physique est contenu dans une boı̂te rectangulaire dont les côtés sont de longueurs Lx , Ly et Lz , et on impose des conditions aux limites
périodiques aux fonctions d’onde. Une onde plane a alors la forme (non normalisée)
ψ(r) = eip·r = eipx x eipy y eipz z
(1.6)
La condition de périodicité restreint les valeurs possibles de l’impulsion. Il faut en effet que la
translation x → x + Lx (ou l’équivalent en y et z) n’affecte pas la fonction d’onde. Donc,
eipx Lx = 1
=⇒
px =
2πnx
Lx
où nx est un entier. Les impulsions possibles sont donc
nx ny nz
,
,
p = 2π
Lx Ly Lz
(1.7)
(1.8)
où nx , ny et nz peuvent prendre toutes les valeurs entières possibles (∈ Z). Une seule valeur de px
est admise dans une intervalle ∆px = 2π/Lx , correspondant à ∆nx = 1. Il y a donc un seul état
(une seule valeur possible des entiers) dans un élément de volume donné par
∆px ∆py ∆pz =
(2π)3
V
(1.9)
où V = Lx Ly Lz est le volume de l’espace physique. Le nombre d’états dans un élément de volume
d3 p est donc simplement le rapport
V 3
dp
(1.10)
(2π)3
Exprimé autrement, le nombre d’états d’onde plane par élément de volume d3 p de l’espace des
implusions est
d3 n
V
=
(1.11)
3
dp
(2π)3
Notons qu’on peut aussi exprimer ce résultat comme un nombre d’états par unité de volume dans
l’espace des phases, c’est-à-dire l’espace décrit par les positions (r) et les impulsions (p) :
1
d3 n
=
d3 pd3 r
(2π)3
ou
=
1
h3
(1.12)
si on retourne aux unités usuelles. C’est sous cette forme que le résultat est le plus simple à
mémoriser : une cellule d’espace des phases de volume h3 (ou (2π)−3 en unités naturelles) contient
exactement un état quantique.
Les états d’impulsion donnée, dans cette normalisation, forment un ensemble discret : les valeurs
de p sont nettement séparées. Les états sont donc normalisables et on peut imposer la condition
X
hp0 |pi = δp,p0 et
|pihp| = 1
(ND)
(1.13)
p
6
1. Processus élémentaires
La fonction d’onde associée est
1
hr|pi = √ eip·r
V
(1.14)
L’avantage de cette normalisation est sa clarté du point de vue du décompte des états, qui sont
discrets. Son désavantage est la référence au volume V de l’espace physique, qui est artificiel (la
limite V → ∞ doit être prise à la fin des calculs, et le résultat final ne doit pas dépendre de V).
Un autre désavantage de cette normalisation
pest qu’elle n’est pas invariante de Lorentz : en effet,
le volume est contracté d’un facteur γ = 1/ 1 − β 2 lorsqu’on passe d’un référentiel où le volume
est au repos, à un référentiel où il est en mouvement à une vitesse β. Comme l’invariance de
Lorentz est une symétrie fondamentale de la Nature, particulièrement visible dans le domaine de
particules élémentaires, il est souhaitable d’adopter une autre normalisation des états d’impulsion,
sans référence à un volume fini de l’espace.
À cette fin, notons premièrement que la somme sur les vecteurs d’onde peut être remplacée par
une intégrale, dans la limite où le volume V est grand :
Z
X
d3 p
(1.15)
→V
(2π)3
p
Ceci provient directement de (1.11). En conséquence, le delta de Kronecker δp,p0 peut être remplacé
par une fonction delta de Dirac :
δp,p0 →
(2π)3 3
δ (p − p0 )
V
Il suffit, pour s’en convaincre, de constater l’équivalence de
Z
X
d3 p (2π)3 3
δ (p − p0 )
δp,p0 avec V
3
(2π)
V
p
(1.16)
(1.17)
Une première modification à la normalisation ND serait de supprimer le facteur de volume, c’està-dire de considérer des états d’impulsion dans le spectre continu tels que
Z
d3 p
0
3 3
0
hp |pi = (2π) δ (p − p ) et
|pihp| = 1
(NC)
(1.18)
(2π)3
La fonction d’onde associée est alors
hr|pi = eip·r
(1.19)
Cependant, cette normalisation continue (appelons-la NC) n’est toujours pas invariante de Lorentz.
En effet, la mesure d’intégration d3 p n’est pas invariante : il s’agit d’un élément de volume dans
l’espace des impulsions. Lors d’un changement de référentiel, cet élément de volume est contracté
d’un facteur γ.
Par contre, un élément de volume dans l’espace des quadri-impulsions
d4 p = d3 p dp0
(1.20)
où p0 = E est l’énergie de la particule, est invariant. En effet, la transformation de Lorentz implique
une contraction des longueurs d’un facteur γ et une dilatation du temps d’un même facteur, de
sorte que l’élément de volume d’espace-temps d3 rdt est invariant. Il en est de même pour tout
quadri-vecteur, en particulier pour l’élément de volume de la quadri-impulsion. Nous ne pouvons
1.3. Désintégration et espace des phases
7
cependant pas remplacer d3 p par d4 p sans autre forme de procès, car l’énergie p0 est déterminée
par la quantité de mouvement p, en vertu de la relation
p
(p0 )2 − p2 = E 2 − p2 = m2 ou E = p2 + m2
(1.21)
On impose donc cette relation par une fonction delta supplémentaire, c’est-à-dire qu’on adopte la
mesure d’intégration suivante :
Z
Z
d3 p
d4 p
→
δ((p0 )2 − p2 − m2 )θ(p0 )
(1.22)
(2π)3
(2π)3
oùpla fonction de Heaviside θ(p0 ) s’assure qu’on ne conserve que la racine positive, soit p0 =
+ p2 + m2 . Notons que cette mesure d’intégration est manifestement invariante de Lorentz, car
(i) la mesure d4 p est invariante, comme noté ci-haut; (ii) l’argument de la fonction delta est un
invariant de Lorentz et (iii) comme le quadrivecteur (p0 , p) est toujours de genre temps, si p0 > 0
dans un référentiel, il le sera dans tous les référentiels et donc θ(p0 ) est un invariant. On montre
dans ce qui suit que cette mesure peut aussi d’exprimer comme
Z
Z
d3 p
d4 p
0 2
2
2
0
δ((p
)
−
p
−
m
)θ(p
)
=
(1.23)
(2π)3
(2π)3 2E
En effet, la fonction delta peut s’écrire comme
δ((p0 )2 − p2 − m2 ) = δ((p0 − E)(p0 + E)) où E =
p
p2 + m2
(1.24)
En intégrant sur p0 , seule la racine p0 = E est considérée en raison du facteur θ(p0 ). Au voisinage
de cette racine, on peut remplacer p0 + E par 2E et la fonction delta se réduite à
δ((p0 − E)(p0 + E)) → δ(2E(p0 − E)) =
1
δ(p0 − E)
2E
(1.25)
On intègre ensuite sur p0 pour retrouver le résultat annoncé, en remplaçant partout p0 par E.
Une normalisation relativiste des états d’impulsion est donc fixée par les conditions
Z
d3 p
0
3 3
0
|pihp| = 1
(NR)
hp |pi = 2E(2π) δ (p − p ) et
(2π)3 2E
p
où E = p2 + m2 .
(1.26)
1.3 Désintégration et espace des phases
1.3.1 Forme générale du taux de désintégration
Lors d’une désintégration, il existe un très grand nombre (en pratique, un continuum) d’états
finaux possibles. Ces états ont la même énergie que l’état initial, mais sont caractérisés par des
impulsions différentes des particules émises. La quantité pertinente est la probabilité totale par
unité de temps pour qu’un transition se produise vers l’un des états finaux appartenant à un
ensemble expérimentalement identifiable.
Considérons un processus dans lequel une particule de masse m1 se désintègre en N −1 particules, de
masses mi (i = 2, . . . , N ). Les énergies des états initial et final sont Ei = E1 et Ef = E2 + · · · + EN ,
respectivement. Le taux de transition de l’état initial vers un ensemble d’états finaux compris dans
8
1. Processus élémentaires
un élément d’espace des phases d3 p2 d3 p3 · · · d3 pN est (nous adoptons la normalisation NC des états
d’impulsions, éq. (1.18))
dω = 2π|Mf i |2
d3 p2 d3 p3
d3 pN
·
·
·
δ(E1 − E2 − E3 − · · · − EN )
(2π)3 (2π)3
(2π)3
(1.27)
En général, le hamiltonien d’interaction V conserve la quantité de mouvement totale, de sorte
que l’amplitude de transition n’est non nulle que si les impulsions respectent la condition p1 =
p2 + p3 + · · · + pN . On peut donc écrire l’amplitude comme
Mf i = Mf i δp1 −p2 −p3 −···−pN
(1.28)
dans la normalisation discrète ND, éq. (1.13) Cette relation définit en fait Mf i , qu’on appelle aussi
amplitude de transition. Au carré, cette relation est simplement
|Mf i |2 = |Mf i |2 δp1 −p2 −p3 −···−pN
(1.29)
car le carré du delta de Kronecker est encore un delta de Kronecker. Notons ici que la normalisation
discrète des états (ND) est la plus sûre quand vient le temps de compter les états ou de calculer le
carré d’un delta de Kronecker. Par contre, quand vient le temps d’effectuer un calcul pratique, on
lui préfère la normalisation continue NC, éq. (1.18). Avec cette nouvelle définition de l’amplitude,
le taux de désintégration devient
dω = |Mf i |2
d3 p2 d3 p3
d3 pN
·
·
·
(2π)4 δ 4 (p1 − p2 − p3 − · · · pN )
(2π)3 (2π)3
(2π)3
(1.30)
où pi dénote le quadrivecteur (Ei , pi ).
Dans la normalisation relativiste NR, éq. (1.26), cette formule devient plutôt
dω = |Mf i |2
1
d3 p2
d3 p3
d3 pN
·
·
·
(2π)4 δ 4 (p1 − p2 − p3 − · · · pN )
2E1 (2π)3 2E2 (2π)3 2E3
(2π)3 2EN
(1.31)
Notons que dans ce cas, un facteur 2E1 a été introduit pour tenir compte du changement de
normalisation de l’état initial, qui affecte l’amplitude Mf i . Cette dernière est alors une quantité
invariante de Lorentz, qui a les dimensions (unités) de l’énergie.
1.3.2 Exemple : désintégration à deux corps
Appliquons le résultat général (1.31) au cas d’une désintégration à deux corps. La formule est, dans
ce cas,
1
d3 p2
d3 p3
dω = |Mf i |2
(2π)4 δ 4 (p1 − p2 − p3 )
(1.32)
2E1 (2π)3 2E2 (2π)3 2E3
p
p
où E2 = p22 + m22 et E3 = p23 + m23 . Plaçons-nous dans le référentiel de la particule instable,
de sorte que E1 = m1 et p1 = 0. Le taux de désintégration total est obtenu en intégrant sur les
états finaux possibles :
Z
d3 p2
d3 p3 |Mf i |2
ω=
(2π)4 δ 4 (p1 − p2 − p3 )
(1.33)
(2π)3 2E2 (2π)3 2E3 2E1
Utilisons la fonction delta pour intégrer sur p3 :
p
p
Z 3
d p2 |Mf i |2 (2π)δ(m1 − p2 + m22 − p2 + m23 )
p
p
ω=
(2π)3 8m1
p2 + m22 p2 + m23
(1.34)
1.3. Désintégration et espace des phases
9
où on a utilisé le fait que p23 = p22 et où on pose simplement p = |p2 |. Il est clair, par symétrie, que
l’amplitude ne peut pas dépendre de la direction de p2 . On peut donc intégrer sur les angles et on
trouve
p
p
Z
|Mf i |2 δ(m1 − p2 + m22 − p2 + m23 )
2
p
p
ω = p dp
(1.35)
8πm1
p2 + m22 p2 + m23
La dernière intégrale se fait facilement si on procède au changement de variable suivant : on pose
q
q
E = p2 + m22 + p2 + m23
(1.36)
alors
dE
p
Ep
p
p
p
p
+
=
=p
dp
p2 + m22
p2 + m23
p2 + m22 p2 + m23
(1.37)
On trouve ensuite
Z
ω=
dE p
|Mf i |2
δ(m1 − E)
8πm1 E
= |p2 |
|Mf i |2
8πm21
(1.38)
en autant que les impulsions des deux produits permettent à leur énergie totale E d’être égale à
m, c’est-à-dire que la désintégration soit énergétiquement possible. Dans cette formule |p2 | est la
quantité de mouvement de l’un ou l’autre des produits de la désintégration, dans le référentiel de la
particule instable. Ce résultat est très simple et pourtant très général, car nous n’avons pas besoin
de connaı̂tre la forme détaillée de l’amplitude Mf i pour le démontrer.
1.3.3 Loi exponentielle de désintégration
Le résultat essentiel du calcul précédent est que la présence d’une interaction qui met en contact une
particule et un continuum d’états rend cette particule instable, et mène à un taux de désintégration
fixe, c’est-à-dire une probabilité par unité de temps pour qu’une désintégration ait lieu. Ceci mène
directement à la loi exponentielle de désintégration : Si N (t) représente la population de particules
se désintégrant à un instant t, alors le nombre de désintégration ayant lieu entre les temps t et
t + dt est ωdt. Donc on trouve l’équation différentielle suivante :
N (t + dt) = N (t) − ωN dt
=⇒
dN
= −ωN
dt
(1.39)
dont la solution est la loi exponentielle
N (t) = N (0)e−ωt
(1.40)
où N (0) est le nombre de particules au temps t = 0.
Quelques définitions :
1. vie moyenne : τ = 1/ω. Durée moyenne de la vie d’une particule.
2. Demi-vie : t1/2 = τ ln 2, temps au bout duquel la moitié de la population initiale s’est désintégrée.
Remarques :
1. La loi exponentielle est statistique. Il s’agit de probabilités. Lorsque la population de particules
n’est pas très grande, les fluctuations peuvent être importantes. Ces fluctuations sont gouvernées
par la loi de Poisson (voir Williams, section 2.11).
2. L’activité I (ou intensité) d’une source est définie simplement comme le nombre de désintégrations par unité de temps. Dans le cas d’un échantillon ne contenant qu’une espèce de particule
10
1. Processus élémentaires
instable, I = ωN = −dN/dt. L’activité se mesure fondamentalement en secondes inverses : un
Becquerel (Bq) est l’activité d’une source qui produit une désintégration par seconde. Un Curie
(Ci) est l’activité d’un gramme de radium pur, soit 3.7 × 1010 Bq.
3. La loi exponentielle suppose qu’aucun processus de regénération n’existe. En général, un noyau
instable est lui-même le fruit de la désintégration d’un autre noyau. Les équations de population
d’espèces sont dans ce cas plus complexes, mais impliquent toujours des fonctions exponentielles.
Par exemple, si un noyau 1 se désintègre en un noyau 2 avec un taux ω1 , et que le noyau 2 se
désintègre en autre chose avec un taux ω2 , les populations N1 et N2 des deux espèces seraient
régies par les équations différentielles suivantes :
dN1
= −ω1 N1
dt
dN2
dN1
= −ω2 N2 −
= −ω2 N2 + ω1 N1
dt
dt
(1.41)
et des modèles plus complexes sont possibles.
4. La loi exponentielle est étroitement liée à l’existence du continuum d’états finaux. S’il n’y
avait qu’un seul état final de même énergie que l’état initial, il n’y aurait pas décroissance
exponentielle de l’état initial, mais plutôt oscillation entre les deux états (les oscillations de
Rabi).
5. L’élément de matrice Mf i dépend en général de l’énergie E. Mais abstraction faite de cette
dépendance, on constate que le taux de désintégtation augmente avec l’énergie disponible, plus
précisément de manière proportionnelle à p. Plus p est élevé, plus le nombre d’états finaux
possibles est grand et plus la probabilité totale est grande. En contrepartie, la désintégration
ne peut pas se produire si aucun état d’onde plane n’est disponible, c’est-à-dire si la masse des
produits est plus grande que celle de la particule initiale (m1 < m2 + m3 ).
6. Une particule ou noyau instable peut avoir plusieurs modes de désintégration, c’est-à-dire
plusieurs types de produits. Dans ce cas, chaque mode est caractérisé par son propre taux
de désintégration. Par exemple, si deux modes sont possibles, deux taux (ω1 et ω2 ) existent et
le taux total de désintégration en est la somme : ω = ω1 + ω2 . Dans un intervalle de temps
donné, le rapport des nombres N1 et N2 de désintégrations des deux types et N1 /N2 = ω1 /ω2 .
1.4 Collisions et section efficace
1.4.1 Diffusion par un potentiel
Considérons le problème d’un projectile de masse m qui entre en collision avec une cible qu’on
suppose fixe. L’état initial du projectile est une onde plane d’impulsion p1 , et son état final, après
la collision, est une onde plane d’impulsion p2 . Une quantité de mouvement q = p2 − p1 a été
transférée à la cible, mais nous allons négliger l’énergie cinétique associée, comme si la cible était
infiniment massive. Dans un premier temps, nous supposerons aussi que l’état de la cible ne change
pas, de sorte que la collision est élastique et que l’effet de la cible puisse être compris par un potentiel
diffuseur V (r). Il s’agit en somme d’un problème à un corps. Nous traiterons ce problème dans le
régime non relativiste, et adopterons la normalisation continue des états (1.18).
La probabilité de transition d’un état |p1 i du projectile vers un état |p2 i, par unité de temps, est
donnée par la règle d’or de Fermi :
ωi→f = 2π|Mf i |2 δ(E1 − E2 )
(1.42)
1.4. Collisions et section efficace
11
Le taux de transition vers un ensemble d’états finaux compris dans un élément de volume d3 p2 est
dω = 2π|Mf i |2
d3 p2
δ(E1 − E2 )
(2π)3
(1.43)
En coordonnées polaires, d3 p2 = dΩ p22 dp2 où dΩ = sin θ dθ dϕ = d cos θ dϕ. La probabilité de
transition par unité de temps vers un ensemble d’états d’impulsions comprises dans un angle solide
dΩ est donc
dω
1
=
|M |2 p2 dp δ(E1 − E2 )
(1.44)
dΩ
(2π)2 f i 2 2
Comme d|p2 |/dE2 = E2 /|p2 |,
dω
1
|M |2 p E dE δ(E1 − E2 )
=
dΩ
(2π)2 f i 2 2 2
(1.45)
L’intégrale sur E2 peut maintenant se faire grâce à la fonction delta et
1
dω
=
|M |2 pE
dΩ
(2π)2 f i
(1.46)
où maintenant E = E1 = E2 et p = |p1 | = |p2 |.
Calculons maintenant l’élément de matrice, au premier ordre en théorie des perturbations :
Z
Mf i = hp2 |V |p1 i = d3 r hp2 |riV (r)hr|p1 i
Z
(1.47)
= d3 r e−i(p2 −p1 )·r V (r)
= Ṽ (q)
où Ṽ (q) désigne la transformée de Fourier du potentiel V (r), évaluée au vecteur d’onde q. On
trouve donc le taux de transition suivant :
1
dω
=
|Ṽ (q)|2 pE
(1.48)
dΩ
(2π)2
Cette quantité en soi n’est pas directement reliée à l’expérience, car en pratique on n’envoie pas
un projectile à la fois, mais un faisceau de projectiles. Ce faisceau possède un certain flux Φ,
c’est-à-dire un nombre de projectiles par unité de temps et par unité de surface. Le flux Φ est
égal à la densité de courant de projectiles, soit la vitesse v multipliée par la densité ρ. Dans notre
normalisation, ρ = |hr|ki|2 = 1 et la vitesse est égale à p/E, donc Φ = p/E. La quantité étudiée
en pratique est la section différentielle de diffusion, soit le taux de transition divisé par le flux
incident de projectiles :
dσ
1 dω
E2
(1.49)
=
=
|Ṽ (q)|2
dΩ
Φ dΩ
4π 2
Dans le domaine non relativiste, on peut remplacer E par m (l’énergie de repos) et cette formule
devient
dσ
m2
=
|Ṽ (q)|2
(1.50)
dΩ
4π 2
La section efficace, elle, est l’intégrale de la section différentielle sur les angles solides :
Z
dσ
σ = dΩ
(1.51)
dΩ
12
1. Processus élémentaires
1.4.2 Interprétation de la section efficace
D’après la définition donnée ci-haut, la probabilité que le projectile soit dévié (par unité de temps
et dans n’importe quelle direction) est σΦ, le produit de la section efficace par le flux Φ associé
à un seul projectile. Si N projectiles identiques et indépendants sont impliqués, le flux incident
est multiplié par N , de même que le taux de probabilité de collision, mais la section efficace reste
la même : c’est une caractéristique d’une collision individuelle entre un projectile et la cible. Or,
dans le cas d’une interaction de contact entre des projectiles classiques ponctuels et une cible (ou
diffuseur), ceux-là ne sont diffusés que s’ils entrent en contact direct avec la cible. Le nombre
de projectiles dans cette situation (par unité de temps) est précisément Φ, multiplié par l’aire
transversale A de l’objet. Donc, dans ce cas, on trouve σ = A, d’où le nom de section efficace.
En somme, dans un problème plus général (sans interaction de contact), la section efficace nous
indique la capacité d’une cible à dévier les projectiles, en donnant la superficie équivalente d’un
objet qui diffuserait uniquement par contact.
1.4.3 Longueur d’atténuation
Considérons maintenant un milieu comportant une densité % de cibles (nombre par unité de volume), ainsi qu’un faisceau de projectiles incident sur ce milieu. Après avoir traversé une épaisseur
dx du milieu, la fraction de projectiles diffusés sera %σdx. On peut le voir comme suit : considérons
une aire A transversale au flux incident. Dans le volume délimité par cette aire et par l’épaisseur dx
il y a %Adx cibles. La probabilité qu’un projectile soit diffusé par une cible en particulier en passant
dans cette aire A est σ/A. Donc la probabilité qu’il soit diffusé par l’une des cibles présentes est
%Adx ×
σ
= %σdx
A
(1.52)
Le flux Φ(x) du faisceau décroı̂t en rapport avec la proportion de particules diffusées entre les
positions x et x + dx :
Φ(x + dx) = Φ(x) − Φ(x)%σdx
=⇒
dΦ
= −Φ%σ
dx
(1.53)
Il s’ensuit que l’intensité du faisceau incident diminuera de façon exponentielle en fonction de x:
Φ(x) = Φ(0)e−%σx
(1.54)
On peut aussi décrire cette atténuation par une longueur caractéristique ξ = (%σ)−1 .
1.4.4 Formule de Rutherford
Étudions le cas particulier de la collision entre une particule chargée (masse m, charge e1 ) et une
cible massive (masse M m, charge e2 ), sous l’effet de la seule force électrique entre les deux
particules. Le potentiel associé est1
ee
V (r) = 1 2
(1.55)
r
1
Nous adoptons le système d’unités cgs pour l’électromagnétisme. Plusieurs formules SI équivalentes peuvent
s’obtenir simplement en remplaçant e2 par e2 /4πε0 , où e est la charge élémentaire.
1.4. Collisions et section efficace
13
Le problème, mathématiquement parlant, est de calculer la transformée de Fourier de ce potentiel.
On procède comme suit, en coordonnées sphériques :
Z
1
Ṽ (q) = e1 e2 r2 dr sin θ dθ dϕ e−iqr cos θ
r
Z 1
Z ∞
e−iqzr
(1.56)
dz
= e1 e2 2π
dr r2
(z = cos θ)
r
−1
0
Z
4πe1 e2 ∞
=
dr sin qr
q
0
Malheureusement, cette dernière intégrale est mal définie. Ce problème est lié au fait que le potentiel
de Coulomb a un rayon d’action infini et que sa section efficace est, strictement parlant, infinie.
Pour remédier à cette situation, modifions le potentiel de Coulomb pour lui donner un rayon
d’action fini (ce qu’on appelle le potentiel de Yukawa) :
e−µr
e1 e2
→ e1 e2
r
r
(1.57)
Ici µ−1 est une longueur caractéristique (on fera tendre µ vers 0 à la fin du calcul). Sa transformée
de Fourier est alors
Z
4πe e
4πe1 e2 ∞
dr e−µr sin qr = 2 1 22
(1.58)
Ṽ (q) =
q
q +µ
0
On peut ensuite prendre la limite µ → 0 pour trouver
Ṽ (q) =
4πe1 e2
q2
(1.59)
La section différentielle associée est donc
dσ
1
= 4m2 e21 e22 4
dΩ
q
(1.60)
En posant p = pẑ et p0 = pr̂ (coordonnées sphériques), on calcule que
q 2 = p2 (2 − 2 cos θ) = 4p2 sin2 θ/2
(1.61)
dσ
m2 e21 e22
θ
=
cosec4
dΩ
4p4
2
(1.62)
On peut donc écrire
En fonction de l’énergie cinétique non relativiste T = p2 /2m, ceci s’exprime comme
e2 e2
θ
dσ
= 1 22 cosec4
dΩ
16T
2
(1.63)
Il s’agit ici de la célèbre formule de Rutherford. La diffusion est maximale quand l’angle est faible.
De plus, on constate que la section efficace σ est infinie, ce qui est encore dû au rayon d’action
infini du potentiel de Coulomb. En pratique, le potentiel de Coulomb est écranté par d’autres
charges et son rayon d’action effectif est fini, ce qui élimine ce problème. Par exemple, lors de
la diffusion d’une particule α par un atome d’or, la charge électronique entourant le noyau rend
l’atome effectivement neutre sur une distance d’environ 10−10 m, ce qui élimine le caractère non
intégrable de la singularité à θ = 0.
14
1. Processus élémentaires
1.4.5 Forme relativiste générale de la section efficace
Allons maintenant au-delà du problème à un corps. Considérons le processus illustré à droite
de (1.1), où deux particules d’impulsions p1 et p2 se transforment en N − 2 autres particules
d’impulsions p3 , . . . , pN . Le taux de transition associé est, toujours dans la normalisation NC et
par analogie avec la relation (1.30),
dω = |Mf i |2
d3 p3 d3 p4
d3 pN
·
·
·
(2π)4 δ 4 (p1 + p2 − p3 − · · · pN )
(2π)3 (2π)3
(2π)3
(1.64)
Plaçons-nous dans le référentiel du laboratoire, tel que p2 = 0. La section différentielle s’obtient,
dans cette normalisation (NC) en divisant par la vitesse du projectile, soit par |p1 |/E1 :
dσ = |Mf i |2
E1 d3 p3 d3 p4
d3 pN
·
·
·
(2π)4 δ 4 (p1 + p2 − p3 − · · · pN )
|p1 | (2π)3 (2π)3
(2π)3
(1.65)
Passons maintenant à la normalisation relativiste (1.26), ce qui implique un changement dans la
mesure d’intégration, ainsi que de diviser par 2E1 2E2 = 4E1 m2 , pour tenir compte du changement
de normalisation des états initiaux :
dσ =
|Mf i |2
d3 p3
d3 pN
·
·
·
(2π)4 δ 4 (p1 + p2 − p3 − · · · pN )
4m2 |p1 | (2π)3 2E3
(2π)3 2EN
(1.66)
Cette expression n’est valable que dans le référentiel du laboratoire. Pour la généraliser à un
référentiel quelconque, on doit trouver une expression manifestement invariante de Lorentz qui se
réduise à la forme ci-haut dans le repère du laboratoire. En effet, la section efficace est un invariant
de Lorentz, car elle est une aire transversale à la direction de l’impulsion du projectile, et donc n’est
pas affectée par une transformation de Lorentz effectuée dans cette direction. Vu différemment, la
section efficace est une probabilité par unité de temps, divisée par un flux, qui est un nombre de
particules par unité de temps de de surface. Le fait de procéder à une transformation de Lorentz
dans la direction de l’impulsion apporte certainement un facteur de dilatation du temps, mais de
manière égale au numérateur et au dénominateur, sans par ailleurs affecter les aires transversales
à la quantité de mouvement. Dans l’expression (1.66), la mesure d’intégration est invariante de
Lorentz, de même que l’amnplitude (car nous avons adopté une normalisation des états qui est
aussi invariante de Lorentz). Il reste l’expression m2 p1 du dénominateur qui ne l’est pas. Mais
cette
p expression est un cas particulier dans le référentiel du laboratoire de l’expression invariante
(p1 ·2 )2 − (m1 m2 )2 . En effet, dans ce référentiel, p1 = (E1 , p1 ) et p2 = (m2 , 0), donc p1 ·p2 = E1 m2
et
(p1 · p2 )2 − (m1 m2 )2 = E12 m22 − m21 m22 = (E12 − m21 )m22 = |p1 |2 m22
(1.67)
p
Donc (p1 · p2 )2 − (m1 m2 )2 → |p1 |m2 . L’expression générale de la section différentielle est donc,
dans la normalisation relativiste et dans un référentiel quelconque,
|Mf i |2
d3 p3
d3 pN
dσ = p
·
·
·
(2π)4 δ 4 (p1 + p2 − p3 − · · · pN )
3 2E
3 2E
2
2
(2π)
(2π)
4 (p1 · p2 ) − (m1 m2 )
3
N
(1.68)
1.5. Résonances et masse invariante
15
1.5 Résonances et masse invariante
Le processus de collision de deux particules peut en principe mener à la création de nouvelles
particules. L’apparition d’une particule de masse m est possible d’un point de vue énergétique
si l’énergie totale des particules entrant en collision est au moins égale à m dans le référentiel du
centre d’impulsion. En fait, quel que soit le référentiel utilisé, l’énergie disponible peut être obtenue
en calculant la masse invariante associée aux impulsions et énergies des particules impliquées.
Expliquons de quoi il s’agit. Si E1 et E2 désignent les énergies des deux particules, et p1 et p2
leurs impulsions, alors on appelle masse invariante M l’invariant associé au quadrivecteur (E1 +
E2 , p1 + p2 ), soit
M 2 = (E1 + E2 )2 − (p1 + p2 )2
(1.69)
Dans le référentiel du centre d’impulsion, p1 + p2 = 0 et la masse invariante est simplement la
somme des énergies des particules, soit l’énergie disponible pour la création d’une particule de
masse M (en supposant que les particules 1 et 2 sont annihilées). L’invariant M 2 est aussi noté s
et appelé première variable de Mandelstam.
S’il est possible de créer une particule de masse m en annihilant deux particules de masses m1 et
m2 , alors la section efficace σ, si on la considère comme une fonction de la masse invariante M ,
devrait comporter un maximum évident à M = m, car à cette énergie une nouvelle possibilité de
transition quantique apparaı̂t, qui n’existait pas à plus faible énergie. Cette possibilité s’ajoute à la
possibilité de diffusion élastique, où les produits de la collision sont les particules initiales, quoique
dans des états différents. D’autre part, la possibilité de création de cette nouvelle particule n’existe
qu’à cette valeur de M et à aucune autre, car elle ne peut pas avoir d’autre énergie que m dans
son propre référentiel. Donc, si cette particule était stable, un pic delta apparaı̂trait dans la section
efficace σ à une valeur de l’énergie incidente telle que la masse invariante M vaut m.
Or, la particule ainsi créée ne peut être stable. En effet, s’il est possible de la créer, il est également
possible qu’elle se désintègre, par le processus inverse qui a mené à sa création, à savoir l’émission
de deux particules. Cette particule possède donc une vie moyenne τ = Γ−1 , Γ étant le taux de
désintégration (noté ω dans la section 1.3).
Par le principe d’incertitude temps-énergie, cela implique que son énergie dans son propre référentiel
n’est pas bien définie, mais comporte une incertitude ∆E ∼ Γ. On montre plus bas que la densité
d’états ρ(E) associée n’est plus une fonction delta δ(E − m), mais plutôt une lorentzienne :
ρ(E) =
1
Γ
2π (E − m)2 + (Γ/2)2
(1.70)
Il est donc possible, par une mesure de la largeur du pic lorentzien apparaissant dans la section
efficace, de mesurer le temps de vie d’une particule créée lors d’un processus de collision. Ces
considérations sont à la base de toutes les découvertes expérimentales de la physique des particules,
mais s’appliquent aussi à des domaines en apparence aussi éloignés que la physique du solide, car
les même principes de base sont en jeu (exception faite de l’invariance relativiste).
Justifions maintenant la forme lorentzienne de la courbe. Si un état quantique |ψi est instable, c’est que sa
projection sur sa valeur initiale décroı̂t exponentiellement. Autrement dit,
hψ(0)|ψ(t)i = e−iE0 t e−Γt/2
(1.71)
où E0 est l’énergie approximative de l’état. En effet, la probabilité de trouver le système au temps t dans le
même état où il était au temps t = 0 est
|hψ(0)|ψ(t)i|2 = e−Γt
(1.72)
16
1. Processus élémentaires
ce qui correspond bien à la notion de vie moyenne τ = Γ−1 . Introduisons ici le concept de fonction spectrale
A(E) associée à l’état |ψi. Si on désigne par |ni les véritables états stationnaires du système physique étudié
(donc les états propres du hamiltonien complet), la fonction spectrale A(E) est la probabilité qu’une mesure
de l’énergie dans l’état |ψi donne E :
X
A(E) = hψ|δ(E − H)|ψi =
δ(E − En )|hψ|ni|2
(1.73)
n
La fonction spectrale est reliée à la résolvente G(z), définie comme suit :
G(z) = hψ|
1
|ψi
z−H
(1.74)
où z est une variable complexe. En effet, on montre sans peine que
A(E) = −
1
lim Im G(E + iη)
π η→0+
(1.75)
Il suffit pour cela d’exprimer la résolvente en fonction de la base des états |ni :
G(z) =
X
|hψ|ni|2
n
1
z − En
(1.76)
et de constater que
η
1
1
1
− Im
=
π
E − En + iη
π (E − En )2 + η 2
(1.77)
η
1
2
π x + η2
(1.78)
Or, la fonction
tend vers la fonction δ(x) quand η → 0+ . Donc, dans cette limite, on retrouve bien la fonction spectrale.
D’autre part, si on calcule la fonction d’autocorrélation
Z ∞
S(E) =
eiEt−ηt hψ(0)|ψ(t)i
(η → 0+ )
(1.79)
0
on trouve
S(E) =
X
n
i
|hψ|ni|2 = iG(E + iη)
E − En + iη
(1.80)
Donc on peut retrouver la fonction spectrale A(E) en calculant S(E). Pour un état en décroissance exponentielle, on a justement
Z ∞
i
S(E) =
e−iE0 t−Γt/2 eiEt−ηt =
(1.81)
E − E0 + iΓ/2
0
Notons que nous avons pu prendre la limite η → 0 dès à présent, car Γ joue le même rôle que η dans
l’intégration, et donc le facteur de convergence e−ηt n’est plus nécessaire. Ceci correspond à une résolvante
1
z − E0 + iΓ/2
(1.82)
Γ
1
2π (E − E0 )2 + (Γ/2)2
(1.83)
G(z) =
et donc à une fonction spectrale
A(E) =
ce qui est bien le résultat cherché.
La notion de masse invariante est utilisée dans l’analyse des produits d’une réaction, afin de
déterminer si une particule instable n’aurait pas été produite lors de la réaction, même si elle
1.5. Résonances et masse invariante
17
n’est pas détectée dans les produits finaux en raison de sa désintégration subséquente. Par exemple, considérons une réaction où deux particules (1 et 2) donnent lieu à trois produits (3, 4 et 5)
détectés. Les techniques de détection nous donnent accès àp
la quantité de mouvement et à l’énergie
des produits et on peut former la masse invariante M = (E4 + E5 )2 − (p4 + p5 )2 . Si la section
efficace, portée en fonction de M , présente un pic significatif à une valeur précise (appelons-la m∗ ),
c’est qu’on peut interpréter la réaction comme donnant naissance à deux particules, de masses m3
et m∗ . Cette réaction particulière ne peut se produire que si la masse invariante M est égale à
m∗ (modulo l’incertitude reliée au temps de vie de la particule de masse m∗ ). Par contre, dans un
canal de réaction différent, les particules 4 et 5 pourraient être produites directement (sans passer
par la résonance m∗ ) et alors la section efficace ne serait pas piquée à M = m∗ , mais affecterait
une forme étendue (appelée “fond d’espace de phase”). En réalité, on assiste à une superposition
de ces deux processus.
Problèmes
Problme 1.1
Le positronium est un atome instable formé d’un électron et d’un positron. Il se désintègre rapidement en
deux photons. Dans son état singulet (c’est-à-dire quand le spin total des deux particules est nul), sa vie
moyenne inverse, calculée en électrodynamique quantique, est donnée par la formule τ −1 = 12 mα5 , où m est
la masse de l’électron et α est la constante de structure fine. (i) Exprimez τ en restaurant les constantes h̄ et
c et (ii) évaluez sa valeur numérique en secondes.
Problme 1.2
Le méson π − (masse 139,569 MeV) se désintègre par interaction faible en un muon µ− (masse 105,659 MeV)
et un antineutrino ν̄µ (masse nulle). En supposant que le pion est initialement au repos, calculez la vitesse
du muon produit par sa désintégration. Indice : la solution à ce problème est particulièrement simple dans le
langage des quadri-vecteurs.
Problme 1.3
Une particule A, de masse mA et d’énergie E, est incidente sur une particule B au repos, de masse mB . La
collision est inélastique et produit N particules dans l’état final. On définit l’énergie de seuil comme la valeur
minimale de E en-deça de laquelle la réaction est impossible. Exprimez l’énergie de seuil en fonction seulement
de mA , de mB et de la masse totale M des produits de la réaction. Notez que ce calcul est particulièrement
simple dans le langage des quadrivecteurs, en utilisant la notion de masse invariante, surtout si on se place
dans le référentiel du centre d’impulsion dans l’analyse des produits.
Appliquez ensuite la formule obtenue pour évaluer numériquement l’énergie de seuil (en MeV) de la réaction
p + p → p + p + π0
où p désigne le proton (masse 938.280 MeV) et π 0 le pion neutre (masse 134.964 MeV).
Problme 1.4
Considérons un processus de collision élastique 1 + 2 → 3 + 4 comme dans le devoir no 1, où m1 = m3 et
m2 = m4 . Nous nous plaçons dans le référentiel du laboratoire, où la particule 2 est initialement au repos.
La particule 1 est déviée d’un angle θ (l’angle de diffusion) par rapport à sa direction initiale. Expliquer
comment déterminer l’énergie E3 du projectile après la collision en fonction de l’énergie incidente E1 et de
l’angle θ. Indice: Appliquez la conservation de l’énergie et de la quantité de mouvement et calculez l’invariant
p24 = (p1 + p2 − p3 )2 .
18
1. Processus élémentaires
Problme 1.5
214
214
L’isotope 210
83 Bi se désintègre par émission β en 84 Po avec une vie moyenne de 7.2 jours. À son tour, le 84 Po
206
se désintègre en 82 Pb par émission α avec une vie moyenne de 200 jours. Si la source ne contient que du
210 Bi initialement, après combien de jours le taux de production de particules α est-il maximum? (rép. : 24.8
83
jours).
Problme 1.6
Le potassium naturel a un poids atomique de 39.089 et contient une proportion égale à 1.18×10−4 de l’isotope
40 K. Cet isotope est instable et comporte deux modes de désintégration :
19
40
19 K
−
→ 40
20 Ca + e + ν̄e
et
40
−
19 K + e
→ 40
18 Ar + γ + ν̄e
Le premier est une désintégration β − (émission d’un électron), le deuxième une capture d’électron atomique.
L’intensité de la désintégration β − est de 2.7 × 104 kg−1 s−1 (par kilogramme de potassium naturel). De plus,
en moyenne, 12 rayons γ sont émis pour chaque centaine de rayons β. À partir de ces données, calculez la vie
moyenne du 40
19 K.
(réponse : 1.9 × 109 années)
Problme 1.7
Une météorite, soumise à l’analyse chimique, se révèle contenir 1g de potassium et 10−5 g d’argon. En supposant
que tout cet argon provient de la désintégration du 40
19 K, qu’aucune partie de l’argon ne s’est échappé, et que
le potassium n’est pas renouvelé par la désintégration d’autres éléments, calculez l’âge de cette météorite
(c’est-à-dire le temps écoulé depuis que les hypothèses ci-dessus sont valables). Servez-vous des données du
problème précédent.
(réponse : 1.1 × 109 années)
Problme 1.8
La forme générale de la section différentielle est
|Mf i |2
d3 pN
d3 p3
dσ = p
···
(2π)4 δ 4 (p1 + p2 − p3 − · · · pN )
3
(2π)3 2EN
4 (p1 · p2 )2 − (m1 m2 )2 (2π) 2E3
Considérons maintenant une collision à deux réactants et deux produits. Plaçons-nous dans le référentiel du
centre d’impulsion des réactants, de sorte que p1 + p2 = 0.
a) Démontrez que, dans ce référentiel,
q
(p1 · p2 )2 − (m1 m2 )2 = |p1 |(E1 + E2 )
b) Démontrez que la section différentielle dans ce référentiel est
|Mf i |2 pf 1
dσ
=
dΩ
(8π)2 pi E 2
où pi est la grandeur de l’impulsion d’un des réactants, et pf celle de l’un des produits, et E l’énergie totale
des réactants.
1.5. Résonances et masse invariante
19
Problme 1.9
Considérons une collision 1 + 2 → 3 + 4, dans le référentiel du laboratoire (particule 2 au repos) et supposons
que les produits sont les mêmes que les réactants (m3 = m1 et m4 = m2 ).
a) En partant de la relation (1.68), démontrez que la section différentielle de diffusion (par unité d’angle solide
de la particule 3, c’est-à-dire du projectile diffusé) est
p23 |Mf i |2
dσ
1
=
2
dΩ
(8π) m2 |p1 | (|p3 |(E1 + m2 ) − |p1 |E3 cos θ)
où Ei désigne l’énergie de la particule i. Notez qu’un changement de variable semblable à celui effectué en
(1.36) est requis.
b) Montrez que, dans le cas d’un projectile de masse nulle (m1 = 0), comme dans l’effet Compton, on a la
relation
1
1
1
=
+
(1 − cos θ)
E3
E1
m2
et que la formule ci-haut se réduit à
dσ
= |Mf i |2
dΩ
E3
8πE1 m2
2
Problme 1.10
Dans ce problème nous allons étudier la cinématique de l’émission β par un noyau. On considère un noyau
instable (masse M ) qui se désintègre en émettant un électron (masse me ), un neutrino (masse mν qu’on
suppose non nulle dans les calculs) et un noyau de masse M 0 . Les masses des noyaux sont très grandes par
rapport à me ou mν . Une énergie E est libérée par la désintégration, c’est-à-dire que
E = (M − M 0 )c2
Cette énergie sert à créer l’électron, le neutrino et à donner de l’énergie cinétique aux trois produits (électron,
neutrino et noyau). On suppose que E M c2 .
Établissons d’abord la notation. Si n représente le nombre d’états finaux possibles, alors dn/dE représente
le nombre d’états par intervalle d’énergie libérée, ce qu’on appelle habituellement la densité d’états finaux et
qu’on note ρ(E). Mais des distributions plus fines peuvent être considérées : par exemple,
d3 n
d2 ρ
=
d|pe |dΩe dE
d|pe |dΩe
représente le nombre d’états finaux par unité d’énergie libérée, par unité d’angle solide de l’électron et par
unité d’impulsion |pe | de l’électron. En effet, comme l’énergie de l’électron n’est pas fixe dans ce problème
(parce qu’il y a trois produits de désintégration et non deux), on peut s’intéresser au spectre en impulsion
des électrons produits.
a) Expliquer pourquoi on peut négliger l’énergie cinétique du noyau produit, par rapport à celle donnée au
neutrino et à l’électron. Autrement dit, l’électron et le neutrino se partagent l’énergie E.
b) Pour une énergie libérée E fixe, quel est l’intervalle de valeurs possibles pour l’énergie de l’électron?
c) Montrez que l’élément de matrice associé au processus est proportionnel au volume de l’espace, ce qui
signifie qu’on peut l’écrire comme suit :
hf |V |ii = Mf i V−1
20
1. Processus élémentaires
où Mf i est indépendant du volume dans la limite V → ∞. On supposera par la suite que Mf i ne dépend pas
de la direction d’émission des particules.
d) Montrez que
d2 n
1
= V2 4 6 2 p2e Eν pν
d|pe |dEν
4π h̄ c
où E et p désignent respectivement l’énergie (de repos et cinétique) et la grandeur de la quantité de mouvement;
les indices e et ν réfèrent à l’électron et au neutrino.
e) Montrez que le taux d’émission par unité de quantité de mouvement de l’électron est
v
u
u
dω
1
2 2
2t
=
|M
|
p
(E
−
E
)
1−
e
fi
e
d|pe |
2π 3 h̄7 c3
mν c2
!2
E − Ee
f) Si N (|pe |)d|pe | est le nombre de désintégrations, dans un intervalle de temps donné (et assez long), pour
lesquelles l’impulsion
pde l’électron est comprise entre |pe | et |pe |+d|pe |, alors il découle de la partie précédente
qu’un graphique de N (|pe |)/|pe | porté en ordonnée et de (E −Ee ) porté en abcisse est une droite (dite droite
de
p Kurie*) si la masse du neutrino est nulle. Faites un graphique (par exemple,2 à l’aide de Mathematica) de
N (Ee )/|pe | en fonction de E − Ee pour les paramètres suivants : E = 1,1 me c et mν /me = 0, 0,01 et 0,05.
L’analyse des droites de Kurie obtenues expérimentalement a permis d’obtenir une limite supérieure de 60 eV
à la masse des neutrinos.
* Oui, c’est un ‘K’. Rien à voir avec Curie.
CHAPITRE 2
Modèles élémentaires du noyau
2.1 Composition des noyaux
En 1912, peu après la proposition du modèle nucléaire de l’atome, Frederick Soddy découvre que
les atomes d’un même élément ne sont pas tous identiques. Un même élément comporte parfois
plusieurs variétés d’atomes, appelés isotopes, qui ont des masses différentes. L’abondance relative
de chaque isotope pour un élément donné est inscrite au tableau 2.1. La masse de chaque isotope
est très proche d’un multiple entier de la masse de l’hydrogène. On note A ce multiple, qu’on
appelle le nombre de masse, alors que la charge de chaque isotope est un multiple Z de la charge
élémentaire, où Z est le numéro atomique. Chaque isotope est alors représenté symboliquement
par la notation
A
Z Sy
(2.1)
où Sy est le symbole chimique de l’élément associé. La masse quasi-entière des isotopes suggère
naturellement que les noyaux ne sont pas élémentaires, mais constitués d’un nombre entier A de
protons (comme on appelle le noyau de l’isotope courant de l’hydrogène). Pour assurer la bonne
valeur de la charge, on a supposé assez tôt que le noyau contenait également A − Z électrons. Cette
hypothèse fut renforcée lors de l’observation, par le groupe de Rutherford, de la première réaction
nucléaire, en 1919. On découvrit en effet que l’impact des particule α sur les noyaux d’azote de
l’atmosphère produisait des protons, selon la réaction suivante :
4
2 He
+ 147 N → 178 O + 11 H
(2.2)
Cette réaction est naturellement interprétée comme une fusion de la particule α avec le noyau
d’azote, suivie de l’éjection d’un proton surnuméraire. Le fait que le noyau contienne des électrons
expliquait la désintégration bêta, au cours de laquelle des électrons sont émis par des noyaux
instables. Par contre, on s’explique mal pourquoi les électrons atomiques jouiraient d’une certaine
indépendance, alors que d’autres seraient perpétuellement prisonniers du noyau. Cette hypothèse
sur la composition du noyau fut en vogue jusqu’en 1932, année de la découverte du neutron. On
comprit alors que le noyau (A, Z) comporte Z protons et N = A − Z neutrons, et ne comporte pas
d’électrons. Le neutron est une particule neutre, de masse légèrement supérieures à celle du proton,
et instable à l’état isolé; sa désintégration produit un proton, un électron et un antineutrino.
22
2. Modèles élémentaires du noyau
Abondance relative des isotopes, recommandée par l'IUPAC
P. De Bievre and P.D.P. Taylor, Int. J. Mass Spectrom. Ion Phys. 123, 149 (1993).
Isotope
Abondance
1
H
2
H
99.985
0.015
3
He
He
0.000137
99.999863
6
7.5
92.5
4
Li
Li
7
9
Be
10
100
B
B
19.9
80.1
C
C
98.90
1.10
11
12
13
14
N
15
N
99.634
0.366
16
O
17
O
18
O
99.762
0.038
0.200
19
100
20
Ne
21
Ne
22
Ne
90.48
0.27
9.25
23
100
F
Na
24
Mg
Mg
26
Mg
25
27
Al
78.99
10.00
11.01
100
Isotope
Fe
56
Fe
57
Fe
58
Fe
5.8
91.72
2.2
0.28
55
100
Mn
58
Ni
60
Ni
61
Ni
62
Ni
64
Ni
68.077
26.223
1.140
3.634
0.926
59
100
63
Cu
65
Cu
69.17
30.83
64
Zn
Zn
67
Zn
68
Zn
70
Zn
48.6
27.9
4.1
18.8
0.6
69
60.108
39.892
Co
66
Ga
Ga
71
70
Ge
72
Ge
73
Ge
74
Ge
76
Ge
21.23
27.66
7.73
35.94
7.44
74
Se
Se
Se
78
Se
80
Se
82
Se
0.89
9.36
7.63
23.78
49.61
8.73
75
100
78
Kr
80
Kr
82
Kr
83
Kr
84
Kr
86
Kr
0.35
2.25
11.6
11.5
57.0
17.3
Br
81
Br
50.69
49.31
84
0.56
9.86
7.00
82.58
76
77
28
Si
Si
Si
92.23
4.67
3.10
31
P
100
32
S
33
S
34
S
36
S
95.02
0.75
4.21
0.02
35
Cl
37
Cl
75.77
24.23
36
Ar
38
Ar
40
Ar
0.337
0.063
99.600
79
39
93.2581
0.0117
6.7302
86
96.941
0.647
0.135
2.086
0.004
0.187
85
29
30
K
40
K
41
K
40
Ca
42
Ca
43
Ca
44
Ca
46
Ca
48
Ca
45
100
46
8.0
7.3
73.8
5.5
5.4
Sc
Ti
47
Ti
48
Ti
49
Ti
50
Ti
50
V
V
0.250
99.750
Cr
Cr
53
Cr
54
Cr
4.345
83.789
9.501
2.365
51
50
52
Abondance
54
As
Sr
Sr
87
Sr
88
Sr
Rb
87
Rb
72.165
27.835
89
100
90
51.45
11.22
17.15
17.38
2.80
Y
Zr
91
Zr
92
Zr
94
Zr
96
Zr
92
Mo
Mo
95
Mo
96
Mo
97
Mo
98
Mo
100
Mo
94
93
Nb
14.84
9.25
15.92
16.68
9.55
24.13
9.63
100
Isotope
96
Ru
98
Ru
99
Ru
100
Ru
101
Ru
102
Ru
104
Ru
102
Abondance
5.52
1.88
12.7
12.6
17.0
31.6
18.7
Pd
Pd
105
Pd
106
Pd
108
Pd
110
Pd
1.02
11.14
22.33
27.33
26.46
11.72
103
100
106
1.25
0.89
12.49
12.80
24.13
12.22
28.73
7.49
104
Rh
Cd
Cd
110
Cd
111
Cd
112
Cd
113
Cd
114
Cd
116
Cd
108
107
Ag
Ag
109
112
51.839
48.161
Sn
Sn
115
Sn
116
Sn
117
Sn
118
Sn
119
Sn
120
Sn
122
Sn
124
Sn
0.97
0.65
0.34
14.53
7.68
24.23
8.59
32.59
4.63
5.79
113
In
115
In
4.3
95.7
120
Te
Te
Te
124
Te
125
Te
126
Te
128
Te
130
Te
0.096
2.603
0.908
4.816
7.139
18.95
31.69
33.80
121
57.36
42.64
114
122
123
Sb
Sb
123
124
Xe
126
Xe
128
Xe
129
Xe
130
Xe
131
Xe
132
Xe
134
Xe
136
Xe
127
I
130
0.10
0.09
1.91
26.4
4.1
21.2
26.9
10.4
8.9
100
Ba
Ba
Ba
135
Ba
136
Ba
137
Ba
138
Ba
0.106
0.101
2.417
6.592
7.854
11.23
71.70
133
100
132
134
Isotope
136
0.19
0.25
88.48
11.08
138
0.0902
99.9098
La
La
139
Isotope
100
142
Nd
143
Nd
144
Nd
145
Nd
146
Nd
148
Nd
150
Nd
27.13
12.18
23.80
8.30
17.19
5.76
5.64
144
Sm
Sm
148
Sm
149
Sm
150
Sm
152
Sm
154
Sm
3.1
15.0
11.3
13.8
7.4
26.7
22.7
151
Eu
153
Eu
47.8
52.2
152
Gd
154
Gd
155
Gd
156
Gd
157
Gd
158
Gd
160
Gd
0.20
2.18
14.80
20.47
15.65
24.84
21.86
156
Dy
158
Dy
160
Dy
161
Dy
162
Dy
163
Dy
164
Dy
0.06
0.10
2.34
18.9
25.5
24.9
28.2
159
100
Pr
W
182
W
183
W
184
W
186
W
0.13
26.3
14.3
30.67
28.6
184
Os
Os
187
Os
188
Os
189
Os
190
Os
192
Os
0.02
1.58
1.6
13.3
16.1
26.4
41.0
185
37.40
62.60
Re
Re
187
190
147
Pt
Pt
194
Pt
195
Pt
196
Pt
198
Pt
0.01
0.79
32.9
33.8
25.3
7.2
191
37.3
62.7
192
Ir
Ir
193
196
Hg
Hg
199
Hg
200
Hg
201
Hg
202
Hg
204
Hg
198
Tb
162
Er
Er
166
Er
167
Er
168
Er
170
Er
0.14
1.61
33.6
22.95
26.8
14.9
165
100
168
Yb
170
Yb
171
Yb
172
Yb
173
Yb
174
Yb
176
Yb
0.13
3.05
14.3
21.9
16.12
31.8
12.7
169
100
164
Ho
Tm
174
Hf
176
Hf
177
Hf
178
Hf
179
Hf
180
Hf
0.162
5.206
18.606
27.297
13.629
35.100
175
Lu
Lu
97.41
2.59
Ta
Ta
0.012
99.988
176
181
Abondance
180
186
141
180
Cs
Abondance
Ce
138
Ce
140
Ce
142
Ce
0.15
9.97
16.87
23.10
13.18
29.86
6.87
197
100
203
Tl
205
Tl
29.524
70.476
204
1.4
24.1
22.1
52.4
Au
Pb
Pb
207
Pb
208
Pb
206
209
Bi
100
232
Th
100
234
0.0055
0.7200
99.2745
U
U
238
U
235
Tableau 2.1 Abondance relative des isotopes de tous les éléments, en pourcent.
2.2. Taille des noyaux
23
2.1.1 Terminologie
Définissons maintenant quelques termes utilisés dans la classifications des noyaux, ou rappelons
des définitions déjà connues :
Nucléon : désigne un proton ou un neutron
Nuclide : Une espèce de noyaux, avec Z et N fixe.
Isobares : Nuclides ayant le même nombre de masse A, mais des numéros atomiques Z différents.
Isotones : Nuclides ayant le même nombre de neutrons N , mais des numéros atomiques Z différents.
Isotopes : Nuclides ayant le même nombre de protons, mais des N différents.
Isomères : Nuclides de même Z et N mais dans un états nucléaire excité, identifiable par une vie
moyenne suffisamment longue (par exemple τ > 10−6 s).
2.2 Taille des noyaux
En 1911, Rutherford, Geiger et Marsden réalisèrent une série d’expériences qui démontrèrent que
l’essentiel de la masse de l’atome est concentrée dans un noyau de rayon inférieur à 10−14 m, alors
que le rayon de l’atome est de l’ordre de 10−10 m. Ces expériences consistaient à diffuser un faisceau
de particules α (en fait, des noyaux d’hélium) sur une mince feuille d’or, dans une enceinte évacuée,
et à mesurer la section différentielle de diffusion dσ/dΩ. Le résultat observé était compatible avec
la section différentielle de Rutherford
dσ
e2 e2
θ
= 1 22 cosec4
dΩ
16T
2
(2.3)
où e1 = 2e et e2 = Ze, Z étant le numéro atomique de l’or. Rien n’indique à cette époque que le
noyau est non ponctuel.
Les expériences de diffusion seront plus tard effectuées à l’aide d’électrons, à des énergies beaucoup plus grandes, qui permettront une résolution spatiale supérieure. La section différentielle observée n’est plus compatible avec une cible ponctuelle, mais plutôt avec une distribution de charge
nucléaire étendue. Voyons comment la section différentielle de Rutherford doit être modifiée en
conséquence.
Premièrement, la grande énergie des électrons utilisés comme projectiles rend nécessaire l’emploi
d’une version relativiste de la formule de Rutherford, que nous ne démontrerons pas ici. Il s’agit
de la formule de Mott, donnée simplement par
dσ dσ 2
2 θ
1 − β sin
=
(2.4)
dΩ Mott.
dΩ Ruth.
2
où θ est l’angle de diffusion et β la vitesse de l’électron (en rapport à celle de la lumière).
Deuxièmement, l’effet d’une charge non ponctuelle est représentée par un autre facteur multiplicatif, appelé facteur de forme. Supposons à cet effet qu’une charge ponctuelle (comme l’électron,
e1 = −e) soit diffusée sur une charge e2 = Ze caractérisée par une distribution de probabilité ρ(r),
telle que
Z
d3 r ρ(r) = 1
Le potentiel électrostatique créé par cette distribution est
Z
ρ(r0 )
2
V (r) = −Ze
d3 r0
|r − r0 |
(2.5)
(2.6)
24
2. Modèles élémentaires du noyau
car un élément de volume d3 r0 situé à r0 contient une charge dq = Zeρ(r0 )d3 r0 et cause une énergie
potentielle −edq/|r − r0 |. D’après la règle d’or de Fermi, La section différentielle de diffusion est
proportionnelle à la transformée de Fourier du potentiel diffuseur. Or, le potentiel (2.6) a justement
la forme d’une convolution :
Z
Ze2
V (r) = d3 r0 ρ(r0 )U (r − r0 )
U (r) = −
(2.7)
|r|
et donc
Ṽ (q) = Ũ (q)ρ̃(q)
(2.8)
En somme, la section différentielle a la forme suivante :
dσ
dσ =
|ρ̃(q)|2
dΩ
dΩ ponc.
(2.9)
où |ρ̃(q)|2 est appelé facteur de forme, et contient l’information relative à la forme du noyau.
1
˜ |
|ρ(q)
2
0.1
0.01
0.001
0.0001
0
5
10
qa
15
20
Figure 2.1. Facteur de forme associé au modèle de la sphère dure, en échelle logarithmique. Notons l’annulation quasi périodique, conséquence de la forte oscillation présente
dans ρ̃(q), attribuable à la discontinuité dans ρ(r).
Considérons, comme exemple, une distribution de charge uniforme (et normalisée) à l’intérieur
d’une sphère de rayon a :
(
−1
4
πa3
(r < a)
3
ρ(r) =
(2.10)
0
(r > a)
On calcule sans trop de peine que
sin x − x cos x
(x = qa)
(2.11)
x3
Le facteur de forme associé est illustré à la figure 2.1. Il comporte de fortes oscillations en fonction
de q, en raison de la discontinuité dans la densité à r = a.
ρ̃(q) = 3
Une forme plus réaliste de la densité nucléaire comporterait une transition plus douce entre les
régions de densité nulle et celles de densité non nulle. Un modèle phénoménologique souvent utilisé
utilise la forme dite de Saxon-Woods :
ρ0
ρ(r) =
(2.12)
1 + e(r−a)/d
2.3. Masse des noyaux
25
Figure 2.2. Facteur de forme associé à la diffusion d’électrons de 450 MeV sur des
noyaux de 58
28 Ni. Les points (avec barres d’erreur) sont les résultats expérimentaux. La
courbe pleine est le facteur de forme théorique associé au modèle de densité illustré à
droite, proche du modèle de Saxon-Woods. Notons que le facteur de forme a été mesuré
sur 11 ordres de grandeur! Tiré de Sick et al., Phys. Rev. Lett. 35, 910 (1975).
où a est encore le rayon de la distribution, mais où la surface est floue, caractérisée par une épaisseur
d. La figure 2.2 illustre (i) le facteur de forme obtenue expérimentalement de la diffusion d’électrons
de haute énergie (450 MeV) sur des noyaux de 58
28 Ni et (ii) le facteur de forme théorique associés à
un modèle proche de celui de Saxon-Woods (à droite sur la figure). Ceci démontre l’utilité réelle
des expériences de diffusion dans la détermination de la dimension des noyaux. Il se trouve que la
taille des noyaux est assez bien représentée par la valeur
a = (1.18A1/3 − 0.48)fm
d = 0.55fm
(2.13)
Le fait capital qui ressort de cette étude est que la densité nucléaire est à peu près constante. En
effet, le rayon du noyau se comporte comme la racine cubique du nombre de nucléons, sauf pour
une correction qui est de moins en moins importante au fur et à mesure que A augmente. Donc,
dans la limite ou A est grand, chaque nucléon occupe un volume à peu près identique pour tous
les noyaux.
2.3 Masse des noyaux
2.3.1 Les noyaux stables
On doit distinguer les noyaux stables, qui ne se désintègrent jamais, des noyaux instables. Ces
235
derniers ont des vies moyennes variables, allant du milliard d’années (comme 238
92 U ou 92 U) jusqu’au
milliardième de seconde. Il est bien-sûr impossible de dire qu’un noyau est absolument stable : il
suffit de dire qu’aucune désintégration de ce noyau n’a jamais été observée. Les noyaux stables sont
répartis étroitement autour d’une courbe dans le plan Z − N , appelée courbe de stabilité, comme
illustré à la figure 2.3. On note que cette courbe tend vers la droite Z = N pour les petites valeurs de
26
2. Modèles élémentaires du noyau
Z, mais s’en écarte pour les Z plus élevés, et que le nombre de neutrons peut alors être jusqu’à 50%
plus élevé que le nombre de protons. L’un des problèmes fondamentaux de la physique nucléaire est
de comprendre justement pourquoi certains noyaux sont stables – en particlier pourquoi le long de
cette courbe – et de comprendre les différents mécanismes de désintégration des noyaux instables.
N
120
100
80
60
N=Z
40
20
0
0
20
40
60
80
Z
Figure 2.3. Répartition des noyaux stables sur le plan Z − N .
2.3.2 Énergie de liaison
Soit M (A, Z) la masse d’un noyau (et non d’un atome) de nombre de masse A et de numéro
atomique Z. Si mp et mn désignent respectivement la masse du proton et du neutron, alors on
définit l’énergie de liaison B(A, Z) comme
B(A, Z) = Zmp + (A − Z)mn − M (A, Z)
(2.14)
(souvenons-nous que nous travaillons en unités naturelles et que c = 1). L’énergie de liaison est
l’énergie qu’il faudrait fournir pour dissocier complètement un noyau en ces constituants, protons
et neutrons.
La figure 2.4 illustre l’énergie de liaison par nucléon (B(A, Z)/A) en fonction de A, pour une
série de noyaux représentatifs. Cette quantité (B/A) est pertinente, car elle permet d’identifier
les noyaux les plus stables, situés autour de A ∼ 60. En principe, il serait avantageux pour un
noyau plus lourd (A 60) de se scinder en fragments plus petits (de l’ordre de A ∼ 60), comme
il serait avantageux pour des noyaux plus petits (A 60) de se fusionner en noyaux plus grands.
Comme les noyaux illustrés sont stables, aucun mécanisme naturel n’est à l’oeuvre pour effectuer
ces transformations, au moins dans l’environnement terrestre.
2.3. Masse des noyaux
27
12 C
56 Fe
16 O
énergie de liaison par nucléon B(A,Z)/A
4 He
0
50
100
150
nombre de masse A
200
250
Figure 2.4. Énergie de liaison par nucléon, pour quelques noyaux représentatifs, sur une
échelle allant de 0 à 10 MeV.
2.3.3 Modèle de la goutte liquide et formule semi-empirique des masses
Dans les années 1930, un modèle phénoménologique fut proposé pour comprendre comment
l’énergie de liaison des noyaux dépend de Z et de A. Le fait que la densité nucléaire soit à peu près
la même pour tous les noyaux porte naturellement à comparer la matière nucléaire à un liquide
incompressible. La cohésion d’un liquide est due à des forces intermoléculaires de courte portée.
Ces forces n’agissent efficacement que d’une molécule vers une molécule voisine et ne se transmettent pas “à travers” une molécule vers d’autres molécules plus éloignées. En conséquence, chaque
molécule du volume de la goutte est liée à un nombre donné de molécules, c’est-à-dire ses voisines
immédiates, en nombre fixe si le liquide est incompressible. C’est donc dire que l’énergie de liaison
d’une goutte de liquide est en première approximation proportionnelle au nombre de molécules
qui la composent. Cependant, les molécules qui forment la surface de la goutte ont un nombre
de voisines plus petit (environ la moitié) et donc on doit soustraire de l’énergie de liaison une
contribution proportionnelle à la surface pour tenir compte de cet effet. On écrirait donc l’énergie
de liaison de la goutte ainsi, si n est le nombre de molécules de la goutte :
B = αn − βn2/3
(2.15)
où α et β sont des constantes, car n1/3 est proportionnel au rayon de la goutte et n2/3 à sa surface.
Par analogie, l’énergie de liaison d’un noyau aurait la forme suivante en première approximation :
B(A, Z) = av A − as A2/3
(2.16)
Ces deux termes sont respectivement appelés terme de volume et terme de surface. On voit que,
d’après cette formule, le terme dominant de l’énergie de liaison par nucléon B/A est une constante
(av ), ce qui est grosso modo conforme aux observations (fig. 2.4).
Cependant, comme les noyaux sont chargés, l’énergie de liaison doit aussi être diminuée par l’énergie
potentielle électrostatique. Par exemple, une sphère uniformément chargée de charge q et de rayon
28
2. Modèles élémentaires du noyau
a créé un champ électrique donné par
 qr
 3
(r < a)
a
E=
 q
(r > a)
r2
et l’énergie emmagasinée dans ce champ dans tout l’espace est
Z
1
q2
U=
d3 r E2 = 53
8π
a
(2.17)
(2.18)
De toute manière, quelle que soit la distribution de charge à l’intérieure de la sphère, cette énergie
doit être proportionnelle au carré de la charge et inversement proportionnelle au rayon de la
sphère (ou à une taille caractéristique), ne serait-ce que pour des raisons dimensionnelles. Cette
énergie électrostatique est l’énergie nécessaire pour assembler la distribution de charge à partir de
constituants initialement infiniment éloignés. On ajoute donc un terme électrostatique à l’énergie
de liaison nucléaire, dit terme de Coulomb, proportionnel à la charge au carré (Z 2 ) et inversement
proportionnel au rayon (A1/3 ) du noyau :
B(A, Z) = av A − as A2/3 − ac
Z2
A1/3
(2.19)
Les trois contributions à l’énergie de liaison que nous avons identifiées jusqu’ici proviennent toutes
d’une forme ou l’autre d’énergie potentielle. Or l’énergie cinétique des constituants des nucléons va
aussi diminuer l’énergie de liaison. Cette contribution doit être évaluée en mécanique quantique.
Le modèle utilisé à cette fin est celui d’un gaz de fermions dégénéré. Un calcul soigné, dans le cadre
de ce modèle, montre que l’énergie de liaison doit être diminuée encore d’un terme proportionnel
à (N − Z)2 /A. On peut intuitivement comprendre le nécéssité de ce terme par l’argument suivant.
En supposant qu’on puisse représenter les états quantiques d’un noyau comme ceux d’un atome,
c’est-à-dire par un ensemble de niveaux d’énergie occupés par des particules obéissant au principe
d’exclusion de Pauli, on arrive à la conclusion que, pour une valeur fixe de A, ce sont les noyaux
qui ont N = Z qui ont la plus basse énergie. En effet, les protons et les neutrons sont des fermions
de spin 12 qui obéissent au principe d’exclusion. On ne peut donc placer plus de deux protons (de
spins opposés) dans un même niveau, ou plus de deux neutrons, mais les protons et les neutrons
ne s’excluent pas mutuellement. Un niveau d’énergie donné peut donc contenir au plus 2 protons
et 2 neutrons. Si un noyau contient trop de protons par rapport au nombre de neutrons, alors le
dernier niveau occupé est plus élevé, en raison de l’accumulation des protons et de leur exclusion
mutuelle dans les niveaux. La même chose se dit des noyaux qui contiennent un nombre trop élevé
de neutrons. La modélisation quantitative de cette effet se fait dans le cadre d’un modèle très
simple où les nucléons sont traités comme des particules libres dans un volume restreint (celui du
noyau). L’énergie de ce gaz de nucléons comporte deux termes (en supposant que N − Z n’est
pas trop grand) : (i) un terme de volume proportionnel à A et qui s’ajoute au terme de volume
déjà obtenu plus haut et (ii) une correction en (N − Z)2 /A, qui définit ce qu’on appelle le terme
d’asymétrie.
Enfin, on ajoute un dernier terme à l’énergie de liaison, lié à l’observation que cette énergie est
toujours plus grande quand le nombre de protons ou le nombre de neutrons est pair. On note cette
contribution

(Z et N impairs, cas impair-impair)

− 12 MeV
1/2
δ(A, Z) = ap /A
où ap =
0
(Z + N impair, cas pair-impair ou impair-pair)


12 MeV
(Z et N pairs, cas pair-pair)
(2.20)
2.4. Le modèle en couches des noyaux
16
29
terme de
surface as
14
B(Z,A)/A
12
terme de
Coulomb ac
10
terme dʼasymétrie
a
8
a
6
terme de
volume av
4
Énergie de
liaison nette
2
50
100
A
150
200
Figure 2.5. Contribution de chaque terme dans la formule de Bethe-Weizsäcker pour
l’énergie de liaison par nucléon. Les paramètres utilisés sont ceux de l’éq. (2.22), et la
valeur de Z choisie pour chaque valeur de A est celle qui maximise B/A.
On écrit enfin une formule complète pour l’énergie de liaison des noyaux, dite formule de BetheWeizsäcker :
B(A, Z) = av A − as A2/3 − ac
Z2
(A − 2Z)2
−
a
+ δ(A, Z)
a
A
A1/3
(2.21)
On l’appelle aussi la formule semi-empirique des masses nucléaires (car l’énergie de liaison
détermine la masse des noyaux). Les paramètres de cette formule empirique ont été déterminés par
un lissage sur les données observées :
av = 15.56 MeV
as = 17.23 MeV
ac = 0.697 MeV
aa = 23.285 MeV
(2.22)
et leur rôles sont illustrés à la figure 2.5.
Il est clair que la formule de Bethe-Weizsäcker n’est pas dérivée d’un modèle fondamental du noyau.
Elle n’est qu’une formule empirique qui repose sur un modèle vaguement collectif du noyau, c’està-dire un modèle où les nucléons n’agissent pas de manière quasi-indépendante, mais comme un
ensemble. Cette formule a le mérite de faire ressortir certaines caractéristiques physiques importantes mais simples du noyau et de bien représenter les masses observées. La figure 2.6 démontre
à quel point elle s’approche de la réalité. Les déviations entre les énergies de liaison observées et la
formule de Bethe-Weizsäcker sont l’un des arguments en faveur du modèle en couches du noyau,
étudié plus bas.
2.4 Le modèle en couches des noyaux
2.4.1 La force nucléaire
Étant donné le succès de la mécanique quantique dans l’explication de la structure atomique
et moléculaire, on pourrait s’attendre au même succès dans l’étude de la structure des noyaux.
Malheureusement, on ne connait pas bien la nature de la force nucléaire, contrairement à la force
30
2. Modèles élémentaires du noyau
Figure 2.6. Comparaison entre l’énergie de liaison par nucléon décrite par la formule
de Bethe-Weizsäcker et les observations, pour les noyaux à A impair (ce qui permet
d’exclure le terme d’appariement). Notons les déviations occasionnelles autour de ce
qu’on appelle les “nombres magiques”.
électromagnétique. On sait que (i) cette force est de courte portée et (ii) qu’elle comporte une
composante attractive plus intense que la répulsion électrique, de sorte que les charges positives à
l’intérieur du noyau forment une structure stable. Cependant, cette force nucléaire ne se manifeste
pas à de grandes échelles de longueur, contrairement à la force électrique, de sorte qu’elle est
beaucoup moins bien comprise. De plus, depuis les années 1970, on accepte le fait que les nucléons ne
sont pas des particules élémentaires, mais plutôt qu’ils sont composés d’éléments plus fondamentaux
appelés quarks, et que la force nucléaire est en quelque sorte une force effective, dérivée d’une
interaction plus fondamentale. La situation est analogue à celle des forces interatomiques à courte
portée qui lient des objets neutres entre eux, mais qui dérivent fondamentalement de la force
électrique. Il n’est d’ailleurs pas clair que cette force nucléaire peut se prêter à une description non
relativiste, en fonction d’un potentiel d’interaction qui ne dépend que de la distance entre deux
nucléons.
Cependant, des signes existent qu’un modèle des noyaux analogue au modèle en couches utilisé en
physique atomique possède un fond de vérité. Expliquons d’abord en quoi consiste le modèle en
couches usuel.
2.4.2 Fondements du modèle en couches dans les atomes
L’équation de Schrödinger pour un atome à plusieurs électrons n’admet pas de solution exacte
connue. On doit donc avoir recours à des méthodes approximatives. La plus usitée consiste à
remplacer l’énergie potentielle mutuelle des électrons, qui dépend des positions de tous les électrons
simultanément, par une énergie potentielle moyenne. Autrement dit, on suppose qu’un électron
donné se déplace dans le potentiel moyen créé par tous les autres électrons, plutôt que dans le
potentiel instantané créé par les autres électrons dans une configuration précise de leurs positions.
On se trouve alors à remplacer un problème à N corps par un problème à un corps. Cependant, le
potentiel moyen V̄ (r) doit être calculé en connaissant les fonctions d’ondes des autres électrons, car
2.4. Le modèle en couches des noyaux
31
on se doit de connaı̂tre la densité de charge qui en résulte afin de déterminer V̄ . On fait donc face
à un problème auto-cohérent (on doit connaı̂tre V̄ pour calculer les fonctions d’ondes, et on doit
connaı̂tre les fonctions d’onde pour calculer V̄ ). Ce type de problème se résout de manière itérative.
L’important est que, dans un problème à un corps, les électrons sont effectivement indépendants,
de sorte que les états propres d’un système à plusieurs électrons sont simplement des produits
tensoriels des états à un électron. Autrement dit, il suffit de déterminer les états propres à un
électron, et les états à plusieurs électrons sont obtenus en “remplissant des niveaux”, tout en
veillant à respecter le principe d’exclusion de Pauli qui interdit l’occupation d’un état par plus
d’un électron (on doit considérer que l’orientation du spin est comprise dans la description d’un
état, de sorte que des orbitales identiques associées à des orientations de spin différentes définissent
des états différents).
Comme le potentiel moyen ne dépend que de la coordonnée radiale de l’électron, le moment
cinétique de l’électron est conservé et les états propres à un électron sont caractérisés par une
valeur donnée de L2 et de Lz , soit par des nombres quantiques orbital l et magnétique m, en plus
d’un nombre quantique principal n. Tous les états associés à une même valeur de n forment une
couche électronique. À l’intérieur d’une couche, les états associés à des valeurs différentes de l forment des sous-couches d’énergies différentes. Les électrons peuplent des sous-couches électroniques
successives, en ordre croissant d’énergie. Cette description est cependant trop simpliste, car elle
néglige les effets importants de l’interaction spin-orbite, qui sera discutée plus bas dans le contexte
nucléaire.
2.4.3 Les nombres magiques
Le modèle en couche des atomes prédit qu’un atome est plus stable et son énergie d’ionisation plus
élevée si toutes les couches occupées sont remplies à pleine capacité. Des maximums dans l’énergie
d’ionisation sont observés aux valeurs suivantes de Z :
2 (He), 10 (Ne), 18 (Ar), 36 (Kr), 54 (Xe), 80 (Hg), 86 (Rn)
(2.23)
Ce sont tous des gaz rares, sauf le mercure. Les configurations électroniques correspondantes comportent des sous-couches complètement remplies. En particlier, les gaz rares correspondent à des
couches s et p complètement remplies.
Des nombres magiques sont aussi observés dans les noyaux, par exemple en observant l’énergie
nécessaire pour faire passer le noyau à un état excité, ou pour extraire un neutron. Ces nombres
magiques nucléaires sont différents des nombres magiques atomiques, et appartiennent à la liste
suivante :
2, 8, 20, 28, 50, 82, 126
(2.24)
De plus, ils s’appliquent séparément aux neutrons et aux protons, car ces deux espèces ne sont
pas identiques et le principe de Pauli qui régit le remplissage des couches ne s’applique qu’entre
protons ou entre neutrons. Un noyau qui comporte à la fois un nombre magique de protons et de
neutrons est qualifié de “doublement magique”.
Les évidences expérimentales appuyant l’existence des nombres magiques dans les noyaux sont les
suivantes :
1. L’énergie de liaison montre des déviations par rapport à la formule de Bethe-Weizsäcker quand
N ou Z est magique.
2. L’énergie de séparation des protons a un maximum local aux nombres magiques; l’énergie de
séparation est l’énergie requise pour enlever un proton au noyau. La même remarque s’applique
à l’énergie de séparation des neutrons.
32
2. Modèles élémentaires du noyau
3. Les éléments à Z magique possèdent plus d’isotopes que la moyenne. De même, les nuclides à
N magique possèdent plus d’isotones que la moyenne.
4. Les éléments à Z magique ont une abondance plus grande que celle des éléments voisins dans
le tableau périodique.
5. Les nuclides à N magique ont une section d’absorption de neutrons plus petite que la normale.
Autrement dit, ils ont une probabilité plus faible d’absorber un neutron qui passe.
6. Les premiers états excités de spin-parité 2+ ont une énergie d’excitation anormalement élevée
si Z ou N est magique.
2.4.4 Forme du potentiel nucléaire
Nous allons présenter un argument semi-quantitatif en faveur d’un potentiel nucléaire impliquant
une interaction spin-orbite, en se basant sur les nombres magiques observés. Considérons à cet effet
la figure 2.7.
À gauche, on indique la position des niveaux d’énergie d’une particule dans un potentiel harmonique
tridimensionnel. Remarquons que les niveaux d’énergie sont espacés de manière uniforme. Chaque
niveau, sauf les deux premiers, comptent des états de plusieurs valeurs différentes du nombre
quantique orbital l : les états à l pairs alternent avec les états à l impair.1 On indique à côté de
chaque niveau le nombre de protons (ou de neutrons) associé à un remplissage complet de ce niveau
et des niveaux qui lui sont inférieurs, en comptant 2 particules par état, en raison du spin- 12 des
nucléons.
Au milieu, on indique les niveaux correspondant à un potentiel nucléaire réaliste, différent du
potentiel quadratique de l’oscillateur harmonique. Ce potentiel ressemble à celui de l’oscillateur
harmonique, sauf qu’il est tronqué à une valeur a du rayon, correspondant à la portée courte du
potentiel nucléaire moyen. L’effet de cette troncature est de diminuer l’énergie de tous ls états,
à des degrés variables. Plus la fonction d’onde s’étale sur les grandes valeurs de r, plus l’énergie
est diminuée. En particulier, plus l est élevé, plus le potentiel centrifuge est important et plus la
fonction d’onde est déplacée vers l’extérieur, et donc plus l’énergie du niveau est abaissée. Ceci a
comme conséquence immédiate de lever la dégénérescence des niveaux de l’oscillateur harmonique
tridimensionnel, comme indiqué sur la figure. On a ici aussi indiqué le nombre de nucléons d’une
espèce donnée (proton ou neutron) associé à un remplissage complet d’un niveau et de ceux qui
lui sont inférieurs. Cependant, il y a maintenant des “sous-couches”.
Les nombres magiques doivent correspondre à des différences d’énergie importantes entre des
niveaux successifs, de sorte qu’il coûte une énergie anormalement élevée pour ajouter un nucléon
de l’espèce considérée au noyau. On voit que les trois premiers nombres magiques (2, 8 et 20) se
comprennent facilement à la fois dans le potentiel harmonique comme dans le potentiel nucléaire
réaliste. Cependant, les nombres magiques plus élevés ne peuvent pas être observés dans le potentiel
nucléaire réaliste simple.
Ils peuvent cependant être compris si on ajoute au potentiel réaliste une interaction spin-orbite :
on suppose que le potentiel nucléaire total a la forme
V (r) + W (r)L · S
1
(2.25)
Nous verrons, dans un chapitre ultérieur, comment cette dégénérescence est reliée à une symétrie plus
grande que la seule invariance par rotation, caractérisée par le groupe SU(3).
2.4. Le modèle en couches des noyaux
4s, 3d, 2g, 1i 168
3p, 2f, 1h
3s, 2d, 1g
2p, 1f
2s, 1d
112
70
40
20
8
1p
2
1s
Oscillateur
harmonique
33
1j
198
4s
3d
2g
168
166
156
1i
138
3p
112
2f
106
1h
92
3s
2d
70
68
1h11/2
3s1/2
1g
58
1g7/2
2p
40
1f
34
2s
20
1d
1p
8
1s
2
Potentiel
réaliste
4s1/2
3d3/2
2g7/2
3d
1j15/2 5/2
1i
2g9/2 11/2
126
3p1/2
2f
3p3/2 5/2
1i13/2
1h9/2 2f7/2
82
2d3/2
2d5/2
1g9/2
1f5/2 2p1/2
2p3/2
1f7/2
2s1/2 1d3/2
1d5/2
1p1/2
1p3/2
1s1/2
50
28
20
8
2
Potentiel
réaliste et interaction
spin-orbite
Figure 2.7. Schéma des niveaux d’énergie et des couches dans trois modèles : (I)
l’oscillateur harmonique 3D, (II) un oscillateur harmonique tronqué (modèle réaliste) et
(III) le modèle réaliste additionné d’une interaction spin-orbite.
Comme expliqué dans l’annexe qui suit, ce potentiel prend des formes différentes selon la valeur
du moment cinétique total j du nucléon :

l

 V (r) + W (r)
2
V (r) + W (r)L · S =
l

 V (r) − + 1 W (r)
2
(j = l + 12 )
(j = l −
1
2)
(2.26)
34
2. Modèles élémentaires du noyau
En supposant que W (r) < 0, il cause un diminution supplémentaire de l’énergie des états à j = l+ 12 ,
et une augmentation chez les états à j = l − 12 . L’effet global est illustré sur la troisième colonne de
la figure 2.7 : les niveaux à l donné sont séparés en sous-niveaux à j et l donnés, et plus l est grand,
plus la séparation des sous-niveaux est grande. Ceci fait qu’un sous-niveau peut se rapprocher d’un
groupe de niveaux initialement éloigné, et changer du tout au tout les nombres magiques. C’est
ainsi qu’on retrouve les nombres magiques observés et indiqués sur la figure.
2.5 Annexe : L’addition des moments cinétiques et l’interaction
spin-orbite
Considérons une particule (par exemple un électron autour du noyau, ou encore un nucléon dans
le potentiel nucléaire moyen) possédant un moment cinétique orbital L et un moment cinétique
de spin S. Ces deux moments cinétiques agissant dans des espaces différents, ils commutent :
[La , Sb ] = 0, où a, b = x, y, z. Le moment cinétique total de la particule est la somme vectorielle
J=L+S
(2.27)
Les composantes de J agissent dans l’espace global (orbital + spin), et obéissent aussi aux règles
de commutation générales du moment cinétique.
Si le hamiltonien commute avec toutes les composantes de L et de S, il est alors utile d’utiliser une
base des états propres communs à L2 , Lz , S2 et Sz . Comme S2 est une constante pour une particule
donnée, sa valeur n’est pas nécessaire pour spécifier un état, de sorte qu’on peut paramétriser un
état par trois nombres quantiques : l, lz et sz . Cependant, dans certains cas, le hamiltonien de
commute pas avec L et S séparément, mais seulement avec le moment cinétique total J. Autrement
dit, le moment cinétique de spin et le moment cinétique orbital ne sont pas séparément conservés;
seul le moment cinétique total l’est. C’est le cas notamment d’une interaction spin-orbite, c’est-àdire d’un potentiel qui a la forme suivante :
W (r)L · S
(2.28)
Dans ce cas, il est préférable d’utiliser une base des états propres de J2 et de Jz . On remarque
cependant que L2 et S2 commutent aussi avec J, et donc que les quatre opérateurs
L2
S2
J2
Jz
(2.29)
commutent mutuellement. On peut donc choisir une base dont les états propres sont spécifiés par
les nombres quantiques (l, s, j, jz ) associés aux opérateurs ci-dessus (dans le même ordre).
On constate que
J2 = (L + S)2 = L2 + S2 + 2L · S
=⇒
L·S=
1 2
J − L2 − S2
2
(2.30)
et donc que les valeurs propres de l’opérateur L · S sont
1
[j(j + 1) − l(l + 1) − s(s + 1)]
2
(2.31)
Il reste à voir quelles sont les valeurs possibles de j pour des valeurs données de l et de s. C’est
le fameux problème de la composition des moments cinétiques, que nous n’expliquerons pas ici en
détail. Contentons-nous de donner le résultat principal : Les valeurs possibles de j vont de |l − s|
à l + s, par pas entier, et un seul multiplet existe pour une valeur donnée de j (c’est-à-dire qu’il
2.5. Annexe : L’addition des moments cinétiques et l’interaction spin-orbite
35
n’y a qu’une série d’états avec un j donné). En particulier, pour un spin 12 , les deux valeurs de j
possibles sont j = l − 21 et j = l + 12 , pourvu que l ≥ 1. Si l = 0, alors j ne peut prendre que la
valeur j = s. Résumons différemment : le nombre d’états de spin 21 associés à un moment cinétique
orbital l est 2(2l+1). Parallèlement, le nombre d’états associés à un moment cinétique j est 2j + 1.
Le nombre total d’états associés à j = l − 21 et j = l + 12 est donc
[2(l − 12 ) + 1] + [2(l + 12 ) + 1] = [2l] + [2l + 2] = 4l + 2 = 2(2l + 1)
(2.32)
soit exactement le même nombre d’états, comme il se doit.
L’opérateur L · S peut prendre deux valeurs différentes, selon j :
 1
l


(l + 12 )(l + 32 ) − l(l + 1) − 34 =
2
2
L·S=

 1 (l − 1 )(l + 1 ) − l(l + 1) − 3 = − l + 1
2
2
4
2
2
(j = l + 12 )
(2.33)
(j = l − 12 )
Ainsi, les 2l + 2 états associés à j = l + 12 ont une valeur positive de L · S et correspondent à des
valeurs de L et de S qui sont dans le même sens. Par contre, les 2l états associés à j = l − 12 ont
une valeur négative de L · S et correspondent à des valeurs de L et de S orientées dans des sens
opposés.
Signalons enfin la notation utilisée pour spécifier un état de nombres quantiques l et j :
nLj
où n est le nombre quantique principal (caractérisant la partie radiale de la fonction d’onde), L est
la lettre associée au nombre quantique orbital (s, p, d, f, h, i, etc.) et j est le nombre quantique du
moment cinétique total. Par exemple, on écrit1p1/2 , 2d3/2 , etc.
Problèmes
Problme 2.1
Si ρ(r) représente la densité de charge dans un noyau de numéro atomique Z, alors le facteur de forme F (q 2 )
est défini comme
Z
1
F (q 2 ) =
d3 r e−iq·r ρ(r)
Ze
On suppose ici que la densité ρ ne dépend que de la distance au centre du noyau et non de la direction dans
l’espace.
a) Montrez que
F (q 2 ) =
1 4π
Ze q
Z
∞
dr rρ(r) sin qr
0
b) Montrez que
dF (q 2 ) 1
= − hr2 i
dq 2 q2 =0
6
où hr2 i représente la valeur moyenne de r2 dans la distribution de charge du noyau. Indice : un développement
limité de résultat de (a) en puissances de q peut être la voie à suivre, mais ce n’est pas la seule.
36
2. Modèles élémentaires du noyau
c) Calculez le facteur de forme dans le modèle I :
ρ(r) =
et dans le modèle II :
ρ(r) =
ρ0
0
ρ0
1 + exp
(r ≤ a)
(r > a)
r−a
d
avec les paramètres a = 7fm et d = 0.5fm (le paramètre a s’applique aux deux modèles). Notez que ρ0 est
ajusté de manière à ce que F (0) = 1. Faites le calcul analytiquement pour le modèle I et numériquement
(avec Mathematica) pour le modèle II. Faites un graphique de q 2 F (q 2 ) en fonction de q dans l’intervalle
q ∈ [0, 4]fm−1 , pour les deux modèles (superposez les graphiques) et commentez sur la différence entre les
deux modèles.
Problme 2.2
Le muon est une particule élémentaire, cousin massif de l’électron avec les mêmes propriétés que celui-ci, sauf
pour sa masse (105.7 MeV) et le fait qu’il soit instable (vie moyenne dans le vide de 2.197 µs). Les muons
sont un produit secondaire des rayons cosmiques, et peuvent être également produits copieusement par des
faisceaux de protons incidents sur la matière.
Un muon qui pénètre dans un matériau sera ralenti par ses collisions successives avec les électrons et finira
souvent, avant même de se désintégrer, par être capturé par un atome. Il tombe alors dans une orbite, comme
l’électron, sauf qu’il n’est pas exclu des orbitales basses par le principe de Pauli (n’étant pas identique à
l’électron) et que le rayon de son orbite (c’est-à-dire la dimension de son orbitale) est beaucoup plus petit
en raison de sa plus grande masse. On utilise couramment ces atomes “muoniques” pour déterminer plus
précisément la taille et la forme des noyaux.
a) Quel est le rayon caractéristique (l’équivalent du rayon de Bohr pour l’atome d’hydrogène) de l’orbitale 2s
du muon en présence d’un noyau de 126 C ? Exprimez votre réponse en fm. Supposez que le noyau est ponctuel.
b) Quelle est l’énergie de liaison de cet état 2s, en eV?
Si le noyau n’est plus ponctuel, mais de rayon a, avec une distribution de charge uniforme, l’énergie de cet état
2s est légèrement modifiée. La théorie des perturbations stationnaires dicte que le changement d’énergie d’un
état |ψi attribuable à une perturbation V est ∆E = hψ|V |ψi. Dans le cas qui nous occupe, la perturbation
V est la différence entre le potentiel d’une charge ponctuelle et celui d’une distribution de charge uniforme
dans une sphère de rayon a :
Z
ρ0
1
V (r) = −Ze2
d3 r0
−
|r − r0 | r
4
3
où l’intégrale est prise dans la sphère de rayon a et ρ−1
0 = 3 πa . Cette perturbation, naturellement, s’annule
si r > a, car le champ électrique en dehors d’une sphère uniformément chargé est le même que celui d’une
charge ponctuelle.
c) Calculez le déplacement du niveau d’énergie de l’état 2s du muon dû au caractère étendu de la distribution
de charge du noyau. Vous pouvez supposer que a est beaucoup plus petit que le rayon de Bohr du muon,
de sorte que la fonction d’onde du muon est pratiquement constante à l’intérieur de la sphère. Vous pouvez
utiliser une connaissance préalable du rayon de Bohr et de la forme explicite de la fonction d’onde de l’état
2s. Il est en fait pratique de faire ce calcul en fonction des transformées de Fourier et d’utiliser le résultat des
notes pour le facteur de forme associé à la distribution de charge. Exprimez votre réponse en fonction de Z,
e, a et mµ (la masse du muon). Réponse partielle : pour 126 C et a = 2.75 fm, le déplacement est d’environ 42
eV.
2.5. Annexe : L’addition des moments cinétiques et l’interaction spin-orbite
37
Problme 2.3
La plupart des termes qui sont motivés par le modèle de la goutte liquide sont des termes d’énergie potentielle.
Il faut aussi tenir compte de l’énergie cinétique, qui donne naissance au terme d’asymétrie. Pour cela, nous
adoptons ici le modèle du gaz de Fermi, qui traite les nucléons comme des particules libres dans un volume
restreint égal au volume du noyau, soit V = 34 πr03 A, où r0 est le “rayon” d’un nucléon. Les neutrons et les
protons obéissent séparément au principe de Pauli, mais pas ensemble, et ont chacun un spin 21 . Le modèle
s’applique strictement au cas où N et Z sont grands. Pour les fins du problème, on négligera la différence de
masse entre proton et neutron.
a) Montrer que l’énergie de Fermi dans un gaz de N neutrons, soit l’énergie du dernier neutron ajouté au
gaz, est
1
9πN 2/3
EF =
4A
2mr02
Que vaut cette énergie numériquement, si r0 = 1.2 fm et N = A/2?
b) Montrez que l’énergie cinétique totale du gaz de nucléons (protons et neutrons) est
E = 35 (N EF (n) + ZEF (p))
où EF (n) est l’énergie de Fermi du gaz de neutrons et EF (p) celle du gaz de protons.
c) En posant ε = N − Z, montrez que l’énergie cinétique totale du gaz de nucléons est approximativement
(pour ε petit)
3
1
ε2
E(A) = EF A + EF
5
3
A
Ceci justifie le terme d’asymétrie (le permier terme ci-haut contribue au terme de volume de la formule
semi-empirique).
Problme 2.4
Jouons avec la formule de Bethe-Weizsäcker.
a) À l’aide des coefficients de cette formule donnés dans les notes et en ne considérant que les noyaux à
A impair, tracez un graphique sur le plan Z − N sur lequel on retrouve (i) la courbe de stabilité, (ii) la
courbe d’émission de protons (proton drip line) et (iii) la courbe d’émission de neutrons (neutron drip line).
Rappelons que la courbe de stabilité est fixée par la valeur de Z qui, pour un A donné, maximise l’énergie de
liaison. La courbe d’émission de protons est le lieu géométrique dans le plan Z − N où l’émission d’un proton
est tout juste favorable énergétiquement, et pareillement pour la courbe d’émission de neutrons. Utilisez
Mathematica pour faire les calculs et les graphiques. La fonction Mathematica FindRoot sera utile pour
solutionner numériquement les conditions énergétiques requises.
b) Toujours avec les même outils informatiques, trouver la valeur de Z sur la courbe de stabilité à partir de
laquelle l’émission d’une particule alpha est énergétiquement favorable. L’énergie de liaison de la particule
alpha est de 28.3 MeV.
CHAPITRE 3
Instabilités nucléaires
3.1 Processus alpha, bêta et gamma
On sait depuis le tout début du XXe siècle que les substances radioactives émettent trois types
de particules (ou rayons, comme on les appelait à l’époque) : alpha, bêta et gamma. Les rayons
alpha sont des noyaux d’hélium (42 He), les rayons bêta sont des électrons et les rayons gamma
sont des photons de haute énergie. Ces trois types de rayonnement sont associés à trois types de
désintégrations très différents, impliquant trois interactions fondamentales distinctes.
4+
3+
6,01 MeV
5,24
2+
4+
4,24
4,12
(28%)
γ
2+
(72%)
γ
α
4,983 MeV
4,938
4,835
4,676
242
94
Pu
74%
26%
0,11%
1,5x10−3%
1,37
γ
0
0
+
+
24
12Mg
(a)
6+
4+
2++
0
238
92
U
4307,2 keV
148,4
44,9
0
(b)
Figure 3.1. (a) diagramme de transition entre différents états d’un nuclide, par émission
gamma. On indique le spin et la parité de chaque état. (b) La même chose, pour une
émission alpha.
3.1.1 Émission gamma
L’émission d’un rayon gamma par un noyau est comparable en principe à celle d’un photon par un
atome dans un état excité. Cette émission n’entraı̂ne aucun changement dans la composition du
noyau, mais seulement en changement dans son état. Le modèle en couche explique cette émission
comme le fruit de la désexcitation d’un nucléon d’une couche supérieure vers une couche inférieure.
Indépendamment du modèle utilisé pour décrire le noyau, il s’agit en fait d’un passage du noyau
3.1. Processus alpha, bêta et gamma
39
∗
d’un état excité, souvent indiqué par un astérisque (A
Z Sy ), vers l’état fondamental du noyau, ou
vers un autre état excité, d’énergie plus basse :
A
∗
Z Sy
→A
Z Sy + γ
Cependant, comme c’est un photon qui est émis, le processus de transition est nécessairement gouverné par l’interaction électromagnétique, même si les états initial et final du noyau sont déterminés
en majeure partie par l’interaction forte. Les vies moyennes associés à ces processus peuvent varier
énormément, en fonction de l’énergie du photon émis et du spin de l’état excité. La figure 3.1a illustre un diagramme de transition entre différents états d’un noyau de 24
12 Mg. Chaque état nucléaire
est caractérisé par une énergie, une valeur du moment cinétique total du noyau et une parité (+
ou −).1 Plusieurs transitions gamma possibles sont indiquées.
3.1.2 Émission bêta
La forme élémentaire d’émission bêta est la désintégration du neutron libre :
n → p + e− + ν̄e
(τ = 886 s)
(3.1)
Il s’agit d’une désintégration à trois corps. Le neutrino, cependant, est difficilement détectable.
L’hypothèse de son existence a été formulée par Pauli (1930) afin d’expliquer l’apparente non
conservation de l’énergie, de la quantité de mouvement et du moment cinétique dans l’émission
bêta si on admet qu’il n’y a que deux particules dans l’état final. Ce processus est gouverné par
l’interaction faible. Les vies moyennes relativement longues (par rapport à l’émission gamma)
s’expliquent justement par la faiblesse de l’interaction.
La désintégration du neutron est un processus impliquant 4 particules : le neutron, le proton,
l’électron et le neutrino. Un processus équivalent peut se produire lors d’une réaction, par exemple
p + e− ↔ n + νe
Nous verrons plus tard comment la plupart des particules élémentaires peuvent aussi exister sous
la forme d’une antiparticule, ayant les mêmes propriétés que la particule en ce qui a trait à la masse
et aux interactions, sauf pour l’inversion de la charge électrique (ou des autres “charges” reliées
aux interactions fondamentales). Ainsi, l’anti-électron est appelé positron et noté e+ . Le neutrino
νe possède aussi une antiparticule, notée ν̄e . Une règle fondamentale de la théorie des particules
élémentaires stipule que lorsqu’une particule participe à un processus dans un état initial, un autre
processus est possible dans lequel l’antiparticule existe dans l’état final, ou vice-versa. Ainsi, la
réaction n + νe → p + e− correspond à la désintégration n → p + e− + ν̄e , où le neutrino initial est
devenu un antineutrino dans l’état final. De même, ce pourrait être l’électron qui change de rôle
et on pourrait en principe observer la désintégration du proton
p → n + e+ + νe
(3.2)
sauf, évidemment, que la masse du neutron est plus élevée que celle du proton et donc ce processus
est impossible par conservation de l’énergie.
Cependant, le bilan énergétique peut être différent dans un noyau. L’émission bêta peut alors
prendre trois formes :
1
Rappelons que la parité d’un état est son comportement, pair ou impair, face à une inversion des coordonnées.
40
3. Instabilités nucléaires
1. L’émission par le noyau d’un électron et d’un antineutrino, accomagnée de la conversion d’un
neutron en proton :
(A, Z) → (A, Z − 1) + e− + ν̄e
émission β −
(3.3)
2. L’émission par le noyau d’un positron et d’un neutrino, accompagnée de la conversion d’un
proton en neutron :
(A, Z) → (A, Z + 1) + e+ + νe
émission β +
(3.4)
3. La capture, par un proton du noyau, d’un électron atomique dans un état s, suivi de leur
conversion en neutron et neutrino :
(A, Z) + e− → (A, Z − 1) + νe
capture d’électron (EC)
(3.5)
On désigne par la lettre Q l’énergie cinétique disponible dans l’état final, soit la différence entre
les masses des constituants initiaux et les constituants finaux. Il faut bien sûr que Q > 0 pour que
le processus se réalise. En clair,
Qβ − = M (A, Z) − M (A, Z + 1) − me
Qβ + = M (A, Z) − M (A, Z − 1) − me
(3.6)
QEC = M (A, Z) − M (A, Z − 1) + me
Il peut être utile d’exprimer ces conditions non pas en fonction des masses nucléaires M (A, Z),
mais des masses atomiques
M(A, Z) = M (A, Z) + Zme
(3.7)
où nous avons ajouté les masses des Z électrons de l’atome. Nous avons négligé ici l’énergie de
liaison des atomes, de l’ordre de quelques eV, très petite en comparaison de l’énergie de liaison
nucléaire. En fonction des masses atomiques, les valeurs de Q deviennent
Qβ − = M(A, Z) − M(A, Z + 1)
Qβ + = M(A, Z) − M(A, Z − 1) − 2me
(3.8)
QEC = M(A, Z) − M(A, Z − 1)
L’émission bêta, lorsqu’elle est énergétiquement possible, va se produire inévitablement. Ce processus change Z sans affecter A, et permet typiquement à des nuclides éloignés de la courbe de
stabilité de s’en rapprocher.
De plus, l’émission bêta est généralement suivie d’un émission gamma. Les noyaux produits par
l’émission bêta ne sont pas dans leur état fondamental, et émettent un ou plusieurs photons avant
d’y accéder. Les deux processus (bêta et gamma) sont donc étroitement liés en pratique.
3.1. Processus alpha, bêta et gamma
41
3.1.3 Émission alpha
L’émission alpha est un processus d’éjection d’un noyau d’hélium par un noyau instable. Ce processus est gouverné par l’interaction forte, principalement, quoique l’interaction électrique joue un
rôle important, comme nous allons le voir. L’émission alpha est en principe possible si Qα > 0, où
Qα = M (A, Z) − M (A − 4, Z − 2) − M (4, 2)
(3.9)
Un calcul rapide basé sur la formule de Bethe-Weizsäcker montre que le bilan énergétique est
favorable à l’émission alpha le long de la courbe de stabilité si A > 150 environ. Cependant, dans
le domaine A ≥ 144, seuls 7 émetteurs alpha existent parmis les nuclides “naturels”.
En fait, le plus frappant dans l’ensemble des émissions alpha possibles est la variation des vies
moyennes d’un processus à l’autre. Le plus lent des processus observés est
232
90 Th
→ 228
88 Ra + α
(τ = 2.03 × 1010 y)
(3.10)
→ 208
82 Pb + α
(τ = 4.3 × 10−7 s)
(3.11)
alors que le plus rapide est
212
84 Po
22 ordres de grandeurs séparent ces deux vies moyennes. Nous verrons que cette diversité de vies
moyennes se comprend par une théorie de l’émission alpha basée sur l’effet tunnel.
238
La figure La figure 3.1b illustre un diagramme de transitions alpha entre le 242
94 Pu et le 93 U. Les
238
différentes émissions correspondent à des états différents du nuclide 93 U, et sont suivies, sauf
pour la plus énergétique, par une émission gamma. Les différentes énergies des particules alpha
impliquées sont indiquées, ainsi que les rapports d’embranchements, c’est-à-dire les probabilités
relatives de transition.
93080
masse atomique (MeV)
94005
93075
EC,β +
EC,β +
94000
93070
β–
β–
β–
EC,β +
93995
β–
41
42
β–
43
44
Z
EC,β
45
EC,β +
93065
EC
+
93060
46
47
40
41
42
EC,β +
β–
43
44
45
46
Z
Figure 3.2. À Gauche : Diagramme de masse atomique des nuclides associé à A = 101.
À droite : la même chose, pour les nuclides associés à A = 100.
47
42
3. Instabilités nucléaires
3.2 Séquences radioactives
3.2.1 Stabilité des nuclides par émission bêta
Considérons la partie gauche de la figure 3.2. Elle indique les masses atomiques des isobares à
A = 101. Les cercles noirs sont obtenus de la formule de Bethe-Weizsäcker (BW), alors que les
cercles vides sont les valeurs réelles. En raison de la dépendance quadratique en Z de l’énergie de
liaison dans la formule de Bethe-Weizsäcker, les cercles noirs tombent sur une parabole. Le nuclide
ayant la plus petite masse atomique est le 101
44 Ru. Tous les nuclides situés à sa gauche peuvent se
−
convertir en 101
Ru
par
émissions
β
successives,
et tous les nuclides situés à droite peuvent subir le
44
même sort par captures électroniques successives, car les conditions Q > 0 sont toujours satisfaites
d’après l’éq. (3.8), à la fois pour les valeurs prédites par la formule de Bethe-Weizsäcker et pour les
valeurs réelles des masses atomiques. De plus, tous les nuclides situés à droite (Z > 44) peuvent se
convertir par émissions β + successives, d’après les valeurs données par la formule semi-empirique.
En réalité, l’émission β + n’est pas énergétiquement possible entre Z = 45 et z = 44, mais la capture
électronique l’est. Conclusion : le seul nuclide stable est le 101
44 Ru. En général, la même conclusion
s’applique à tous les isobares à A impair, en raison de l’absence du terme d’appariement :
Il n’y a au plus qu’un seul isobare stable pour les valeurs impaires de A.
Cette règle est vérifiée par l’observation. Le “au plus” est ajouté pour laisser la porte ouverte à
d’autres formes d’instabilité, par émission alpha par exemple.
Considérons maintenant la partie droite de la figure 3.2. Elle indique maintenant les masses atomiques des isobares à A = 100. Les masses atomiques tirées de la formule de Bethe-Weizsäcker sont
situées sur deux paraboles, en alternance, en raison du terme d’appariement qui distingue les nuclides pair-pair des nuclides impair-impair. Cette alternance fait que la chaı̂ne de désintégrations
bêta peut être interrompue par une condition énergétique défavorable, et donc que plus d’un isobare stable peuvent coexister. En fait, la formule de Bethe-Weizsäcker nous pousse à émettre les
hypothèses suivantes :
1. Il n’y a pas de nuclide impair-impair stable.
2. Les nuclides pair-pair peuvent avoir plus d’un isobare stable.
La deuxième hypothèse est vraie. La première est presque vraie : les exceptions sont rares. Parmis
14
les nuclides légers, quatre nuclides impair-impair stables existent : 11 H, 63 Li, 10
5 B et 7 N. Seule180
ment deux autres nuclides impair-impair sont stables : 50
23 V et 73 Ta; en fait, la désintégration est
énergétiquement possible dans ces deux cas, mais les taux de transitions sont trop petits pour être
observés.
3.2.2 Séquences d’émission alpha et bêta
L’émission alpha, lorsqu’elle est possible, diminue A par 4 et Z par deux. Dans le plan Z −
N , elle procède par sauts de (∆Z, ∆N ) = (−2, −2). Typiquement, l’émission alpha d’un nuclide
lourd donnera naissance à une séquence radioactive, tel qu’illustré à la figure 3.3. Dans une telle
séquence, émissions alpha et bêta se succèdent afin de ramener les produits le plus près possible de
la courbe de stabilité. Bien entendu, toutes ces transmutations sont ponctuées d’émissions gamma
(non indiquées) car les noyaux produits ne sont pas toujours dans leur état fondamental. Si une
telle séquence est observée aujourd’hui, c’est que le début de cette séquence est un processus
extrêmement lent, avec une vie moyenne excédant le milliard d’années. En supposant que des
nuclides très massifs aient un jour existé, ils seraient disparus de longue date par émission alpha,
dans une séquence radioactive qui aurait trouvé son goulot d’étranglement dans une transition
particulièrement lente, comme la désintégration du 238
92 U. Comme l’émission alpha change A par
3.2. Séquences radioactives
43
τ
Qα (MeV)
238
92 U
234
90Th
234
91 Pa
4,27
6.45×109 a
4,86
3.53×105 a
4,77
1.12×105 a
4,87
2 310 a
5,59
5.51 j
6,11
4.40 m
(a) 5,62
94 j
237 µs
234
92 U
230
90Th
226
88 Ra
222
86 Rn
218
84 Po
214
82 Pb
214
83 Bi
214
84 Po
(a)
210
81Tl
(b)
210
82 Pb
210
83 Bi
210
84 Po
206
82 Pb
Figure 3.3. Séquence radioactive issue de
(b) 7,83
5,41
200 j
238 U.
92
4, on pourrait s’attendre à 4 séquences distinctes. En fait, trois sont observées, car une émission
alpha particulièrement lente les empêche de se vider dans un temps comparable à l’âge du système
solaire. Les points de départ et les aboutissements de ces trois séquences sont :
238
92 U
→ 206
82 Pb
235
92 U
→ 207
82 Pb
232
90 Th
→ 208
82 Pb
(3.12)
3.2.3 Équilibre séculaire
Le caractéristique fondamentale d’une telle séquence est la lenteur de la première émission alpha :
sa vie moyenne excède le milliard d’années. Tous les autres processus sont beaucoup plus rapides,
allant de 300 000 ans à 10−4 s. Même si certains processus de la séquence sont extrêmement rapides,
on peut en observer tous les chaı̂nons, car ils sont constamment alimentés par la désintégration
des éléments supérieurs de la séquence. Ainsi, même si le 226
86 Ra a une vie moyenne de 2 300 ans
seulement, on en retrouve encore dans les minéraux d’uranium, en faible concentration cependant.
Voyons comment les populations des différents nuclides de la séquence sont reliées. Numérotons
les nuclides d’une séquence de 1 jusqu’à n, et soit N1 , N2 , etc. les populations des différents
nuclides dans un échantillon naturel. Pour simplifier, supposons que chaque nuclide se désintègre
vers le suivant, selon un seul canal (ou chemin) de désintégration. Si on note ω1 , ω2 , etc les taux
de désintégration, les populations des différents nuclides sont gouvernées par le système suivant
44
3. Instabilités nucléaires
d’équations différentielles :
dN1
= −ω1 N1
dt
dN2
= −ω2 N2 + ω1 N1
dt
dN1
= −ω3 N3 + ω2 N2
dt
···
On peut représenter ce système en notation matricielle, comme suit :
 −ω
0
0
N 
1
1
0
 ω1 −ω2
 N2 

dN
−ω
0
ω



2
3
= W N où N =  N  et W = 
3
dt
0
0
ω

3
..
..
..
..
.
.
.
.
La solution générale à un tel système d’équations est de la forme
X
Na (0)eλa t
N (t) =
(3.13)
0
0
0
−ω4
..
.
···
···

···

···
..
.
(3.14)
(3.15)
a
où les valeurs propres de la matrice W sont notées λa (a = 1, 2, 3, . . .). Comme la matrice W est
nulle au-dessus de sa diagonale, ses valeurs propres sont justement ses éléments diagonaux. On a
donc
X
N (t) =
Na (0)e−ωa t
(3.16)
a
On suppose maintenant que ω1 ωa (a > 1), c’est-à-dire que la première désintégration de
la séquence est beaucoup plus lente que toutes les autres. Comme le temps initial remonte à la
formation même des éléments (lors d’une explosion de supernova), on peut négliger tous les facteurs
e−ωa t sauf le premier, et ne rechercher que la première de ces solutions, soit celle qui décroı̂t dans
le temps comme e−ω1 t . Cette solution est telle qu’on peut remplacer, dans le système d’équations,
toutes les dérivées temporelles par −ω1 et on obtient l’équation du vecteur propre associé à la
valeur propre −ω1 :
−ω1 N1 = −ω1 N1
−ω1 N2 = −ω2 N2 + ω1 N1
(3.17)
−ω1 N3 = −ω3 N3 + ω2 N2
···
En négligeant maintenant ω1 devant ω2 , ω3 , etc., on trouve la condition
ω1 N1 = ω2 N2 = ω3 N3 = · · ·
(3.18)
qui caractérise un équilibre séculaire des populations, c’est-à-dire des valeurs presque constantes,
en fait variant très lentement dans le temps. Ainsi, la population d’un nuclide dans un échantillon
naturel (qu’on peut supposer avoir été composé exclusivement du nuclide initial de la séquence
dans un passé lointain) est inversement proportionnelle à son taux de désintégration.
3.3. Théorie de l’émission alpha
45
3.3 Théorie de l’émission alpha
3.3.1 Mécanisme de l’émission alpha
La caractéristique la plus frappante de l’émission alpha est la grande variation dans les taux de
désintégration observés, comme mentionné plus haut. Ceci mène à l’hypothèse que l’émission alpha
est le résultat d’un effet tunnel, car il est bien connu que le taux de pénétration d’une barrière par
effet tunnel dépend de manière très sensible de la hauteur de de la largeur de la barrière.
V (r)
E
α
R
b
r
ppnn
Figure 3.4. Formation d’une particule alpha dans un noyau et diagramme énergétique
contrôlant son émission par effet tunnel.
On peut comprendre l’émission alpha à peu près de cette manière. Considérons deux protons
et deux neutrons du noyau, dans la couche occupée la plus élevée. Si ces quatre nucléons formaient, à l’intérieur du noyau, une particule alpha, l’énergie de liaison gagnée par ce processus
(28.3 MeV) pourrait propulser la particule vers une énergie supérieure à zéro à l’intérieur du noyau
(voir fig. 3.4).2 Cependant, cette particule ne peut pas s’échapper du noyau, car le potentiel V (r)
qu’elle subit, dominé par l’interaction forte, comporte tout-de-même une barrière électrostatique
considérable. Cette barrière, bien-sûr, peut empêcher une particule alpha provenant de l’extérieur
de pénétrer dans le noyau, comme dans l’expérience de Rutherford. Mais elle joue aussi le rôle
inverse. Classiquement, la particule alpha est donc prisonnière du noyau. Lord Kelvin, au début
du siècle, avait émis l’hypothèse que la radioactivité, en particulier l’émission de particules alpha,
était un phénomène d’activation thermique, par lequel certaines parties de l’atome (c’est-à-dire
du noyau) étaient éjectées par-dessus une barrière de potentiel. Rutherford a clairement démontré
la fausseté de cette interprétation, en remarquant que l’énergie des particules alpha émises par
les sources courantes était trop faible pour pénétrer à l’intérieur des noyaux (car celles-ci étaient
diffusées par la répulsion coulombienne). Elle n’avaient donc pas l’énergie nécessaire pour traverser
cette barrière de potentiel. C’est donc par effet tunnel qu’elles doivent s’échapper.
2
Plus précisément, on peut affirmer que la fonction d’onde des quatre nucléons (ppnn) dans le noyau
comporte une projection non nulle vers la fonction d’onde de l’état fondamental du noyau d’hélium. Il n’y
a donc pas “formation” de particule alpha, mais la particule alpha est toujours présente, avec une certaine
amplitude de probabilité.
46
3. Instabilités nucléaires
3.3.2 Calcul élémentaire du taux de désintégration
L’effet tunnel est le plus souvent étudié dans le contexte d’un problème simple : celui d’une barrière
de potentiel en une dimension. Considérons donc une telle barrière, de largeur ` et de hauteur V0 .
Supposons que cette barrière s’étend de x = 0 à x = ` et considérons une particule dans un état
d’onde plane d’énergie cinétique E, incidente sur la barrière en provenance de la gauche. Dans les
trois régions de l’espace, la fonction d’onde de cette particule a les formes suivantes :

ikx
−ikx

(x < 0)
 e + Ae
p
√
−qx
qx
(3.19)
ψ(x) = Be
k = 2mE , q = 2m(V − E)
+ Ce
(0 < x < `)


ikx
De
(x > `)
La probabilité que la particule franchisse la barrière est T = |D|2 et porte le nom de coefficient de
transmission. Les constantes A, B, C, D sont déterminées en imposant la continuité de la fonction
d’onde et de sa dérivée à x = 0 et x = `. On montre que
−1 2
4qk
(k 2 + q 2 )2
2
≈
[cosh(2q`) − 1]
e−2q` si (eq` 1)
(3.20)
T = |D| = 1 +
8q 2 k 2
k2 + q2
Essentiellement, si le coefficient de transmission
est petit, c’est qu’il décroı̂t exponentiellement avec
p
la largeur de la barrière et avec q = 2m(V0 − E).
La situation présente n’est pas tout-à-fait équivalente, car la particule alpha à l’intérieur du noyau
n’est pas dans un état d’onde plane en provenance d’un point éloigné. Un traitement élémentaire et
intuitif de la probabilité d’émission suppose que la particule alpha fait des aller-retour à l’intérieur
du noyau, à une fréquence v/2R, où v est sa vitesse, et qu’à chaque fois qu’elle frappe la paroi
elle tente une percée par effet tunnel, réussie avec une probabilité T . Pour une barrière de forme
quelconque (et non simplement carrée), le coefficient de transmission aurait la forme suivante :
Z b p
−G
dr 2m(V (r) − E)
T ∼e
où G = 2
(3.21)
R
où r = R et r = b sont les bornes de la barrière de potentiel (voir fig. 3.4), soit les points où le
vecteur d’onde de la particule alpha redevient réel. Cette expression est l’extension naturelle
du
R
coefficient p
de transmission d’une barrière carrée, où q` est remplacé par une intégrale dr q(r)
et q(r) = 2m(V (r) − E). Bref, on peut présumer que la probabilité d’émission aura la forme
suivante :
Z b
p
v
ω=
D exp −2
dr 2m(V (r) − E)
(3.22)
2R 0
R
où D0 est un nombre sans dimensions dépendant de k et de la forme du potentiel, mais dont la
valeur est de l’ordre de l’unité, en tout cas pas très différente de cet ordre de grandeur.
3.3.3 Traitement plus rigoureux de la barrière sphérique
Le traitement élémentaire de l’émission alpha donné ci-haut est certainement insatisfaisant pour
les esprits épris de rigueur. En voici donc un autre, plus rigoureux. On suppose que la particule
alpha est dans un état quasi-stationnaire, c’est-à-dire que sa fonction d’onde a la forme suivante :
ψ(r, t) = ψ(r)e−iEt
(3.23)
où E est l’énergie de l’état. Cependant, à la différence d’un état stationnaire ordinaire, cette
énergie comporte une petite partie imaginaire : E = E0 − iω/2. Ainsi, l’évolution temporelle de
3.3. Théorie de l’émission alpha
47
l’état est réellement e−iE0 t e−ωt/2 , et la probabilité que la particule reste à l’intérieur d’un rayon
donné décroı̂t comme le carré de la fonction d’onde, soit comme e−ωt . On peut donc identifier ω au
taux de désintégration de la particule.
Supposons que l’état quasi-stationnaire est un état s, donc indépendant des angles en coordonnées
sphériques. Pour simplifier le problème, supposons que la barrière de potentiel s’annule exactement
pour une valeur suffisamment grande de r, de sorte que la forme de la fonction d’onde dans cette
région est celle d’une onde sortante :
eikr
ψ(r) = C
(3.24)
r
Le courant de probabilité associé à cette forme est
k |C|2
1
∗ ∂ψ
r̂ ≈
r̂
(3.25)
J = Im ψ
m
∂r
m r2
Le flux de ce courant de probabilité à travers une sphère de rayon r est précisément la probabilité
par unité de temps que la particule s’échappe à l’infini, et est précisément
ω=
4πk 2
|C|
m
(3.26)
La perte de probabilité de présence à l’intérieur de la barrière sphérique est directement reliée au
flux sortant de probabilité, à l’extérieur de la barrière. En pratique, il est plus simple de calculer
la partie imaginaire de l’énergie que de calculer C. C’est ce qui est fait dans le problème 3.1. Ce
problème est conseillé à tous ceux qui désirent approfondir le sujet. On y traite d’une barrière
sphèrique de hauteur V0 et de largeur `, située entre r = R et r = R + `. On montre que le taux
d’émission est
2
4kq
qR −2q`
v
e
(3.27)
ω=
2
2
2R k + q
1 + qR
où v = k/m et k et q sont définis comme plus haut, dans l’exemple de la barrière unidimensionnelle.
Ce résultat suppose cependant que e−2q` 1.
3.3.4 Relation entre l’énergie et le taux d’émission
Appliquons la relation (3.22) au cas spécifique d’une barrière coulombienne autour d’un noyau de
numéro atomique Z :
Z b p
G=2
dr 2m(V (r) − E)
R
Z b s
√
1 1
2
= 4 mZe
−
dr
(3.28)
r
b
R
!
r
r
2
√
R
R
R
−1
−
− 2
= 4 mZe2 b cos
b
b
b
Supposons maintenant que R b, ce qui est raisonable étant donné la petitesse de R en comparaison
p de la distance d’approche d’une particule alpha de E = 1 MeV. On peut alors poser que
cos−1 R/b ≈ π/2 et que R/b (R/b)2 . De plus, l’énergie cinétique de la particule alpha à l’infini
est égale à son énergie potentielle au point d’émergence b de la barrière : Q = 2Ze2 /b. En exprimant
b en fonction de l’énergie de la particule alpha, on trouve donc
r
√
2m
2
G ≈ 2πZe
− 4 mRZe2
(3.29)
Q
48
et
3. Instabilités nucléaires
r
√
v
2m
2
2
exp − −2πZe
+ 4 mRZe
ω=
2R
Q
(3.30)
En fonction du logarithme, on écrit
√
v
− 4 mRZe2 + 2πZe2
ln ω = ln
2R
r
2m
Q
(3.31)
Nous avons jusqu’ici négligé le recul du noyau. Pour en tenir compte, nous devons passer du
problème à un corps au problème à deux corps, en remplaçant la masse m de la particule alpha par
la masse réduite µ = mM/(m + M ), où M est la masse du noyau. L’essentiel est cependant que
le logarithme du taux d’émission varie comme Q−1/2 . Ceci est à peu près confirmé par l’expérience
et tend à confirmer la théorie de l’émission alpha par effet tunnel.
Effet de la barrière de moment cinétique
Il arrive que le noyau produit par l’émission alpha n’ait pas le même spin que le noyau initial.
Comme la particule alpha a un spin nul, ceci implique nécessairement que le moment cinétique
orbital entre la particule alpha émise et le noyau produit est non nul. Le potentiel ressenti par
la particule alpha dans un état de moment cinétique orbital l n’est plus simplement le potentiel
électrostatique, mais comporte aussi un potentiel centrifuge L2 /2mr2 :
V (r) =
l(l + 1) 2Z 2 e2
+
2mr2
r
(3.32)
Ceci contribue à augmenter la vie moyenne (diminuer le taux d’émission) dans ce cas.
Problèmes
Problme 3.1
Dans ce problème, nous cherchons à calculer le taux de désintégration d’un état quasi-stationnaire formé
d’une particule prisonnière d’un puits de potentiel sphérique simple. On considère une particule de masse m
dans un potentiel sphérique ayant la forme suivante :

(r < R)
0
V (r) = V0
(R < r < R + `)

0
(r > R + `)
Autrement dit, la particule est confinée par une barrière sphérique de hauteur V0 et d’épaisseur `.
On pose ici que la fonction d’onde de la particule se factorise comme
ψ(r, t) = ψ(r)e−iEt
où E = E0 − iω/2 et on considère un état s, de sorte que ψ(r) ne dépend que de la coordonnée radiale r. On
peut supposer que ω E0 . On définit aussi, comme c’est habituellement le cas dans les problèmes sphériques,
u(r) = rψ(r).
a) Établissez les équations différentielles obéies par u dans les trois régions d’intérêt : (i) r < R, (ii) R < r <
R + `, (iii) r > R + `. Exprimez vos solutions en fonction de
p
√
k = 2mE et q = 2m(V0 − E)
3.3. Théorie de l’émission alpha
49
b) En appliquant les conditions de continuité approrpiées à r = R et r = R + `, montrez qu’une solution à
l’équation de Schrödinger n’est possible que si la contrainte suivante est respectée :
k
k q + ik
tan(kR) + = e−2q` tan(kR) −
q
q q − ik
c) Supposons maintenant que ` → ∞, de sorte que la particule est prisonnière à jamais du puits, c’est-à-dire
que ω = 0. Quelle est la valeur minimum de V0 afin qu’il y ait au moins un état lié dans le puits? Que sont k
et E0 à cette valeur de V0 ?
d) Supposons maintenant que V0 est assez grand pour qu’au moins un état lié existe dans le puits. Supposons
maintenant que ` est fini, mais que e−2q` est tout-de-même très petit. En posant que k0 est la valeur de k
associée à un état stationnaire dans la limite e−2q` → 0 et que, en dehors de cette limite, on puisse poser
k = k0 + δk où δk k0 , montrez que le taux de désintégration est
2
4kq
qR −2q`
v
e
ω=
2R k 2 + q 2
1 + qR
où v est la vitesse de la particule dans le puits.
CHAPITRE 4
Réactions nucléaires
4.1 Modèle du noyau composé
N. Bohr est à l’origine non seulement du modèle de la goutte liquide, mais aussi d’une idée qui
lui est étroitement reliée : le noyau composé. L’idée de base est qu’un projectile qui entre en
collision avec un noyau forme avec celui-ci un noyau composé, qui a une existence propre pendant
un bref laps de temps avant de se désintégrer. Plus précisément, les nucléons du noyau cible se
comportent de manière collective face au projectile – comme dans le modèle de la goutte liquide
– et les interactions du projectile se font avec l’ensemble du noyau et non avec un nucléon en
particulier dans le noyau. Il existe plusieurs canaux de désintégration, qui peuvent être en principe
autant de canaux de formation du noyau composé. L’important est que le noyau composé n’a pas
la mémoire de la manière dont il a été formé, de sorte qu’il se désintègre selon les différents canaux
dans des proportions (les rapports d’embranchement) qui sont les mêmes quelle que soit le canal
de formation du noyau (voir Fig. 4.1).
α+
60
28 Ni
(1)
p+n+
(5)
62
29 Cu
(4) n + n +
62
30 Zn
64
30 Zn
p+
63
29 Cu
(2)
(3)
n+
63
30Zn
Figure 4.1. Exemple d’application du modèle du noyau composé. Les 3 canaux de
désintégration du 64
30 Zn (numérotés de 3 à 5) ont des rapports d’embranchement sont
les mêmes quel que soit le canal de formation (1 ou 2). De plus, cette relation a été
observée pour chaque énergie incidente (Goshal, 1950).
La validité du modèle du noyau composé n’est pas universelle, mais est corroborée dans un très
grand nombre de cas. Les exceptions sont appelées réaction directes et correspondent à la situation
4.2. Fission induite
51
où le projectile interagit directement avec l’un des nucléons (présumément à la surface du noyau)
sans affecter l’ensemble des nucléons.
4.2 Fission induite
L’une des réactions nucléaires les plus importantes en pratique est l’absorption d’un neutron par
un noyau, suivi de la fission de ce noyau en fragments. C’est la fission induite. Cette réaction
libère une quantité d’énergie importante (variable selon la nature précise des fragments) en plus
de libérer des neutrons (généralement 2 ou 3). Ces neutrons secondaires peuvent à leur tour réagir
avec d’autres noyaux, induire une fission et libérer d’autres neutrons, etc. Il s’ensuit une réaction
en chaı̂ne qui peut soit s’atténuer, devenir explosive, ou être contrôlée.
La fission peut aussi se produire spontanément, mais c’est un processus très rare. En principe,
ce processus est énergétiquement permis, mais il nécessite une déformation transitoire du noyau
coûteuse en énergie de surface. Il y a donc une barrière de potentiel à franchir – la barrière de fission
– ce qui peut se faire par effet tunnel, mais entraı̂ne d’ordinaire des temps caractéristiques très
8
longs. Par exemple, la fission spontanée du 238
92 U est 1.6 × 10 fois plus rare que sa désintégration
alpha, qui pourtant ne se produit qu’avec une vie moyenne de 6.45 milliards d’années.
La capture d’un neutron par un noyau produit un état excité qui peut grandement accélérer le
passage de la barrière de fission. Les nuclides qui peuvent subir une fission par absorption d’un
239
neutron lent sont qualifiés de fissiles. 235
92 U et 94 Pu sont les nuclides fissiles par excellence. Ils
possèdent un nombre impair de neutrons et pair de protons, de sorte que l’absorption d’un neutron
supplémentaire mène à un état excité d’un noyau pair-pair. Comme les noyaux pair-pair sont
plus liés que les autres, l’énergie de cet état excité, par rapport à celle de l’état fondamental, est
particulièrement élevée, et cette énergie peut être suffisante pour faire franchir au noyau la barrière
de fission.
La fission induite est cependant en concurrence avec d’autres processus, en particulier l’absorption
radiative, par laquelle le noyau excité émet un rayon gamma plutôt que de se fissioner. La possibilité
d’une réaction en chaı̂ne de fission dépend de l’importance relative de l’absorption radiative et de
la fission, ce qui dépend de la composition isotopique du milieu et de l’énergie des neutrons. La
figure 4.2 illustre la probabilité d’absoprtion d’un neutron dans un micron d’uranium naturel (cette
probabilité est proportionnelle à la section efficace et à la densité de l’uranium), pour les processus
décrits par
1.
2.
A
A
92 U(n,γ) : capture d’un neutron par le 92 U, suivie d’une émission gamma (A = 235
A
A
92 U(n,f) : capture d’un neutron par le 92 U, suivie d’une fission (A = 235 ou 238).
ou 238).
On notera les caractéristiques suivantes de ces courbes :
1. La capture radiative est très importante entre 5 eV et 1 keV et comporte un très grand nombre
de résonances, associées aux états excités des noyaux. Cependant, la capture radiative par
l’U238 mène à la formation de plutonium, aussi une substance fissile, par la séquence suivante :
238
92 U
+ n −→ 239
92 U + γ
34m 239
93 Np
+ e− + ν̄e
81j 239
94 Pu
+ e− + ν̄e
239
92 U
−→
239
93 Np
−→
(4.1)
2. La fission induite de l’U238 possède un seuil élevé (environ 1 MeV), mais devient après cela le
processus le plus probable.
52
4. Réactions nucléaires
Figure 4.2. Probabilité d’absorption d’un neutron dans un micron d’uranium naturel
235
(composé à 99.3% de 238
92 U et de 0.7% de 92 U) menant soit à la fission ou à l’absorption
radiative. Notez l’échelle logarithmique des deux axes.
3. La fission induite de l’U235 est le processus dominant dans l’uranium naturel (et a fortiori dans
l’uranium enrichi) pour des neutrons de basse énergie (< 500 meV). Notez que la température
ambiente (293 K) est indiquée sur l’échelle.
Pourquoi la section de capture des neutrons augmente-t-elle autant à basse énergie? Remarquons
d’abord l’évidence : le neutron ne fait pas face à une barrière de Coulomb et son absorption par
le noyau est relativement directe, voire géométrique. En fait, étant donné l’intensité de la force
nucléaire et sa courte portée, la section efficace pourrait être purement géométrique. Cependant,
ce raisonnement classique sous-estime la section efficace. La taille du neutron à considérer est plutôt
donné par sa longueur d’onde de de Broglie, et la section géométrique associée est
2
2π
2.5 × 109 2
2
=
πλ = π
fm
(4.2)
p
Tn (eV)
où p est la quantité de mouvement du neutron et Tn son énergie cinétique. La section efficace
observée est une fraction de cette section géométrique, mais la section géométrique se comporte
comme l’inverse de l’énergie cinétique, ce qui la rend très importante aux basses énergies.
4.2. Fission induite
53
4.2.1 Réaction en chaı̂ne
La fission d’un noyau entraı̂ne l’éjection, parmi les fragments plus massifs, de deux ou trois neutrons
secondaires : en moyenne 2.47 pour l’U235 et 2.89 pour Pu239. Appelons k le nombre moyen de
neutrons secondaires qui causent aussi une fission induite. Bien-sûr, k n’est pas égal à 2 ou 3,
car en général des neutrons s’échappent du matériau, ou encore leur capture ne mène pas à une
fission, mais à un émission gamma. Si k est supérieur à l’unité cependant, une réaction en chaı̂ne
se produit. On dit que la réaction est critique si k = 1, sur-critique si k > 1 et sous-critique si
k < 1.
Les neutrons secondaires possèdent au départ une énergie comprise entre 0.1 et 1 MeV. Dans de
l’U235 pur ou dans le l’uranium suffisamment enrichi (∼ 20% d’U235), le sort le plus probable de
ces neutrons est la capture par un noyau d’U235, suivie d’une autre fission. Il est donc possible
d’obtenir un k > 1 dans ce cas, si la géométrie de l’échantillon le permet. En clair, il faut assembler
une masse critique d’U235, afin que les neutrons secondaires aient une probabilité suffisante d’être
absorbés avant de s’échapper de l’échantillon. Les bombes atomiques sont basées sur ce principe.
Dans l’uranium naturel, ou insuffisamment enrichi, les neutrons secondaires subiront préférablement
une capture radiative par l’U238 et la réaction s’arrêtera. Afin de maintenir la réaction en chaı̂ne
dans un réacteur nucléaire, il faut donc ralentir les neutrons à l’aide d’un modérateur. Un
modérateur est un matériau qui fait subir des collisions élastiques aux neutrons, donc sans les
absorber. Plus le nuclide modérateur est léger, plus grande est la part de l’énergie du neutron qui
lui est cédée à chaque collision: on montre sans peine que lors d’une collision élastique, le neutron
perd en moyenne une fraction 2A/(1 + A)2 de son énergie cinétique. Le neutron finit par être thermalisé, c’est-à-dire que son énergie cinétique est décrite par la distribution de Maxwell-Boltzmann,
à la température ambiante (∼ 300K). Les modérateurs les plus utilisés sont le carbone (sous forme
de graphite) et l’eau lourde (D2 O, où D symbolise le deutérium, dont le noyau est le deutéron 21 H).
4.2.2 Les réacteurs nucléaires
Un réacteur nucléaire est un dispositif de conversion d’énergie nucléaire en chaleur, basé sur une
réaction en chaı̂ne contrôlée. Il s’agit en fait d’une machine thermique, qui alimente une turbine à
gaz, sauf pour le fait que la source de chaleur est une réaction de fission contrôlée plutôt qu’une
réaction de combustion ordinaire. La fission d’un noyau d’U235 peut produire environ 200 MeV
d’énergie cinétique pour les produits, soit environ 107 fois ce que produit une réaction chimique
typique. Plus précisément, un gramme de matière fissile produit 7 × 1010 J, alors qu’un gramme de
charbon produit, par combustion, 3.3 × 104 J. On distingue les éléments suivants d’un réacteur :
1. Le combustible : il contient un matériau fissile, mais en faible pourcentage. Par exemple :
l’uranium naturel (0.7% d’U235), l’uranium enrichi (jusqu’à 3%) ou même un mélange contenant
du thorium ou du plutonium.
2. Le modérateur : du graphite, de l’eau lourde, ou même de l’eau ordinaire.
3. Le caloporteur : le fluide qui circule entre le réacteur pour en évacuer la chaleur. Dans la plupart
des cas, ce fluide circule dans un circuit primaire, et un échange thermique a lieu avec un autre
fluide (de l’eau, typiquement) qui circule dans un circuit secondaire et qui est transformée en
vapeur au contact de l’échangeur de chaleur. C’est cette vapeur qui alimente la turbine à gaz
qui fournit le travail mécanique et génère la puissance électrique. Certains types de réacteurs
ne comportent qu’un circuit : c’est le caloporteur qui alimente directement la turbine dans ces
cas. Le gaz est alors recyclé : condensé et recirculé dans le réacteur.
4. Le contrôleur : le matériau qui sert à contrôler la criticalité de la réaction en chaı̂ne. Typiquement
des barres de cadmium ou de bore qu’on peut mécaniquement introduire dans le réacteur afin
d’absorber des neutrons.
54
4. Réactions nucléaires
De plus, comme un réacteur est une machine thermique, son fonctionnement requiert un réservoir
chaud (le réacteur lui-même) et un réservoir froid, fourni par un circuit de refroidissement alimenté
typiquement par un cours d’eau situé à proximité.
Il existe plusieurs technologies nucléaires ou filières, qui diffèrent notamment par le type de combustible utilisé, le modérateur et le caloporteur. Le tableau 4.1 résume les caractéristiques principales de chacune des filières. Elles ont chacune leurs avantages et inconvénients, à la fois techniques et économiques. Les réacteurs fonctionnement à l’uranium naturel ont l’avantage de diminuer les coûts en combustible, mais aussi de contourner les difficiles technologies d’enrichissement
de l’uranium (avantage notable pour les pays qui n’ont pas accès à ces technologies). Par contre, la filière CANDU, la seule encore en fonction qui utilise l’uranium naturel, requiert de l’eau
lourde comme modérateur et caloporteur, et la séparation isotopique de l’hydrogène, même si elle
est moins coûteuse que celle de l’uranium, est toute de même dispendieuse. L’utilisation de l’eau
lourde (plutôt que l’eau ordinaire) comme caloporteur dans de CANDU est nécessaire car la plus
faible concentration en matière fissile demande un caloporteur qui absorbe très peu les neutrons.
La filière la plus répandue dans le monde est celle du réacteur à eau sous pression (REP) qui forme
le gros de la puissance nucléaire française et une bonne partie de la puissance américaine. La France
et la Belgique sont les pays où la fraction de la puissance électrique d’origine nucléaire est la plus
élevée (environ 70%).
Tableau 4.1 Liste abrégée des principales filières nucléaires.
Filière
combustible
modérateur
caloporteur
remarque
UNGG
U naturel
graphite
gaz
Royaume-Uni, France.
Abandonné depuis
1969.
eau lourde
U naturel
D2 O
D2 O sous pression
CANDU (CANada
Deutérium Uranium)
REP
U enrichi 3%
eau
eau sous pression
France, USA. 50%
de la puissance mondiale installée.
BWR
U enrichi
eau
eau & vapeur
USA, Suède, Allemagne, Japon
HTR
U enrichi + thorium
graphite
hélium (1 circuit)
expérimental (USA,
Allemagne)
RBMK
U enrichi 1.8%
graphite
eau (1 circuit)
45% de l’ex URSS,
dont Tchernobyl
Stabilité du réacteur
Un réacteur nucléaire doit être conçu de sorte que le facteur de multiplication k soit contrôlable
et stable. Les barres de contrôle en cadmium ou en bore sont essentielles, mais insuffisantes :
l’insertion mécanique requiert un temps de l’ordre de la seconde, alors que l’échelle de temps
caractéristique de la réaction en chaı̂ne est de l’ordre de la milliseconde. Une réaction surcritique par
1% seulement (k = 1.01) pourrait doubler un intensité en 30 ms et la situation serait catastrophique.
La situation est sauvée par l’émission retardée de neutrons : parmi les produits de la fission,
plusieurs sont des émetteurs bêta avec des vies moyennes de plusieurs secondes, et les produits
secondaires de ces émetteurs peuvent émettre des neutrons. Ces neutrons contribuent au bilan
4.3. Nucléogenèse
55
général des neutrons, mais ont un effet temporisateur en raison du temps caractéristique plus long
qui gouverne leur émission. Ces neutrons retardés représentent 0.7% des neutrons dans un réacteur
à l’uranium, mais permettent de garder le réacteur sous contrôle si k n’excède pas l’unité de plus
d’un millième, environ. D’autre part, il faut concevoir le réacteur de manière à ce que le gradient de
k en température soit négatif (dk/dT < 0), de sorte qu’un emballement du réacteur provoque une
diminution de k. La filière RBMK, dont le réacteur de Tchernobyl, avait au contraire un dk/dT
positif; mais la situation a semble-t-il été corrigée après l’accident de 1986.
4.3 Nucléogenèse
L’univers foisonne de réacteurs nucléaires, car les étoiles ne sont autre chose que des machines
nucléaires contrôlées par la pression gravitationnelle. Nous allons brièvement décrire les principales
réactions qui ont lieu dans les étoiles, en commençant par les réactions qui ont formé la plus grande
partie de l’hélium existant, bien avant que les étoiles ou les galaxies soient formées.
4.3.1 Nucléogenèse primordiale
Nous ne décrirons pas en détail ici la théorie du big bang, selon laquelle l’univers connu est le fruit
d’une expansion qui a commencé il y a 13.7 milliards d’années. Dans son évolution, le rayon de
l’univers a augmenté en même temps que diminuait sa densité et sa température. Environ 225 s
après le big bang, l’univers est constitué principalement de protons, de neutrons, d’électrons, de
neutrinos et de photons. Les neutrons existent non seulement parce que leur vie moyenne est plus
longue (∼ 900s), mais aussi parce que leur désintégration par émission bêta est compensée par le
processus inverse, également probable à cette température.
À partir de ce moment, la réaction suivante est en rupture d’équilibre :
n + p → d + γ + 2.22 MeV
(4.3)
Ceci signifie que la réaction de photodésintégration du deutéron (c’est-à-dire la réaction inverse)
s’effectue moins rapidement que la réaction directe, de sorte que le deutéron vit assez longtemps
pour être impliqué dans les réactions suivantes :
p + d → 32 He + γ + 5.49 MeV
n + d → t + γ + 6.26 MeV
(4.4)
où t symbolise le tritium (31 H), un isotope d’hydrogène avec une vie moyenne d’envrion 18 ans.
Comme ces deux réactions sont plus exothermiques que la première, les réactions inverses (photodésintégration) sont moins probables. Une fois cette étape franchie, les réactions suivantes ont
lieu :
t + p → α + γ + 19.81 MeV
3
2 He
+ n → α + γ + 20.58 MeV
t + d → α + n + 17.59 MeV
(4.5)
d + d → α + γ + 23.85 MeV
De l’hélium est alors formé, et les modèles cosmologiques prévoient que la quasi-totalité de l’hélium
existant dans l’univers (soit environ 24%) provient de cette nucléogenèse primordiale.
Après 30 minutes d’existence, ces réactions cessent : la température et la densité ont trop diminué
pour les soutenir. Les réactions nucléaires ne reprendront qu’une fois les étoiles formées, un million
d’années plus tard. . .
56
4. Réactions nucléaires
Notons qu’après environ un million d’années, la température de l’univers sera suffisamment basse
pour que les atomes se forment. Les photons, qui sont environ un milliard de fois plus nombreux
que les électrons, se découplent en majeure partie de la matière et subissent un décalage vers le
rouge, en fait vers les micro-ondes qui constituent le rayonnement fossile observable aujourd’hui.
4.3.2 Le cycle du proton
Une fois les étoiles formées, d’autres réactions nucléaires se produisent au coeur des étoiles, là où
la densité et la température sont suffisantes. La condensation du plasma stellaire, causée par la
gravité, est freinée par la pression de dégénérescence électronique, provenant du principe d’exclusion
de Pauli : toute réduction du volume dans lequel évoluent les électrons cause une augmentation de
l’énergie du gaz d’électrons, comme dans la matière condensée. Si la masse de l’étoile est supérieure
à 0.1M (M est la masse du soleil), alors la température du coeur peut atteindre 107 K et la
combustion de l’hydrogène peut commencer.1 L’effet net de cette combustion est :
4p + 2e− → α + 2ν̄e + 26.7 MeV
(4.6)
Dans le détail, ceci est produit par les quatre réactions suivantes :
p + p → d + e+ + νe + 0.42 MeV
(a)
3
2 He
(b)
(c)
e + e → 2γ + 1.02 MeV
(d)
p+d →
3
3
2 He + 2 He
+
−
+ γ + 5.49 MeV
→ p + p + α + 12.86 MeV
(4.7)
La réaction (a) est causée par l’interaction faible. Sa section efficace est infime, de l’ordre de
10−21 fm2 . C’est donc cette réaction qui contrôle la vitesse de toutes les autres. On montre que
la vie moyenne d’un proton dans cet environnement est de 1010 années. C’est la lenteur de cette
réaction qui fait que les étoiles ne sont pas des bombes thermonucléaires et que leur combustion
est suffisamment lente, entre autres, pour permettre à la vie d’apparaı̂tre et d’évoluer sur Terre.
Les réactions catalytiques
La production d’hélium à partir de protons peut aussi se faire dans deux cycles de réactions qui
comportent un catalyseur, c’est-à-dire un nuclide qui participe à la chaı̂ne de réaction, mais qui
est produit en quantité égale à la quantité consommée. Il s’agit de la chaı̂ne catalysée à l’hélium,
et de la chaı̂ne CNO (carbone-azote-oxygène). Voir Williams pour plus de détails.
4.3.3 Combustion de l’hélium
Lorsque la combustion d’hydrogène s’achève par épuisement du combustible, le destin de l’étoile
dépend de sa masse. Se celle-ci est inférieure à 0.25M , l’étoile s’éteint progressivement et devient
une naine blanche. Sinon, la contraction gravitationnelle, qui était contenue par la pression de
rayonnement résultant de la combustion de l’hydrogène, peut parvenir à augmenter la température
jusqu’à 108 K au coeur de l’étoile.2 À ce stade, la combustion de l’hélium commence. L’effet net
est le suivant :
3α → 126 C + 7.27 MeV
(4.8)
1
On emploie librement le mot “combustion” dans ce contexte, mais il s’agit bien sûr de réaction nucléaire
sans aucun rapport avec la combustion chimique.
2
La densité est fixée par la température, via l’équation d’état de l’étoile.
4.3. Nucléogenèse
57
Les réactions séparées sont les suivantes :
α + α → 84 Be − 0.09 MeV
α + 84 Be → 126 C + 2γ + 7.37 MeV
(4.9)
La première de ces réactions est endothermique et le 84 Be est très instable, avec une vie moyenne
de 10−16 s. Fort heureusement, la deuxième réaction possède une section efficace considérable en
raison de la présence d’une résonance à 287 keV d’énergie relative. Sans cette résonance, la suite des
réactions ne pourrait avoir lieu et l’univers serait encore composé d’éléments légers; la vie ne serait
pas apparue. Le soleil n’a pas encore atteint ce stade de combustion : il devrait l’atteindre dans
environ 5 milliards d’années. Les étoiles plus massives franchissent cette étape plus rapidement.
4.3.4 Combustion du carbone et de l’oxygène
Une fois terminée la combustion de l’hélium, un autre processus s’ensuit après contraction et
augmentation de la température si M > 4M : la combustion du carbone, qui nécessite une
température de l’ordre de 6 × 108 K. La température requise est plus élevée, parce que les réactions
impliquées doivent vaincre des barrières coulombiennes de plus en plus élevées au fur et à mesure
que les noyaux participants sont plus gros. Les réactions particulières sont :
12
6C
+ 126 C → 20
10 Ne + α + 4.62 MeV
→ 23
11 Na + p + 2.24 MeV
→ 23
12 Mg + n − 2.61 MeV
→
→
(4.10)
24
12 Mg + γ + 13.93 MeV
16
8 O + 2α − 0.114 MeV
Lorsque la température atteint 2 × 109 K, un cycle de combustion de l’oxygène se produit :
16
8O
+ 168 O → 24
12 Mg + 2α − 0.393 MeV
→ 28
14 Si + α + 9.59 MeV
→ 31
15 P + p + 7.68 MeV
→
→
31
16 S
32
16 S
(4.11)
+ n + 1.46 MeV
+ γ + 16.54 MeV
4.3.5 Combustion du silicium et au-delà
Une température encore plus grande pourrait en principe favoriser la combustion d’éléments comme
le silicium selon un schéma similaire à celui du carbone ou de l’oxygène. Mais une température
plus élevée favorise aussi une photodésintégration (endothermique) du silicium :
27
γ + 28
14 Si → 13 Al + p − 11.58 MeV
24
γ + 28
14 Si → 12 Mg + α − 9.98 MeV
(4.12)
Cette photodésintégration permet aux noyaux déjà présent de capturer les protons et particules
alpha ainsi produites et de construire peu à peu des noyaux plus lourds. Ce processus se poursuit
jusqu’à l’obtention des noyaux les plus stables, autour du fer. On appelle ce processus la combustion
du silicium.
Les éléments plus lourds que le fer sont formés par capture progressive de neutrons. Ces processus
ne sont pas énergétiquement favorables, mais possible à haute température. Ces captures sont
58
4. Réactions nucléaires
suivies d’une émission bêta, qui ramène les nuclides vers la courbe de stabilité. On distingue deux
chaı̂nes de processus :
1. le processus lent : le taux de capture de neutrons (ωn ) est inférieur au taux d’émission bêta
(ωn ωβ ). Dans ce cas, les nuclides produits se rapprochent de la courbe de stabilité avant
d’absorber d’autres neutrons, et l’évolution se produit essentiellement le long de la courbe de
stabilité. La source de neutrons pour ce processus n’est pas encore clairement élucidée.
2. Le processus rapide : dans le cas contraire (ωn ωβ ), la capture de neutrons est rapide et les
nuclides évoluent vers des valeurs élevée de A un peu au-dessous de cette courbe. La source de
neutrons pour ce processus est probablement l’explosion d’une supernova. Il est possible donc
que les éléments plus lourds que le fer ne soient formés que lors de l’explosion de supernovas.
Le système solaire serait alors un système de deuxième génération, fruit de la condensation des
reste d’une étoile primitive, plus lourde, qui aurait explosé il y a environ 6 milliards d’années.
4.3.6 La fusion nucléaire sur Terre
La réaction de fusion est possible sur Terre, mais pas sous la forme du cycle proton-proton, qui est
beaucoup trop lent en raison de la réaction (4.7a). Les bombes thermonucléaires (ou “bombes H”)
sont basées sur les deux réactions suivantes :
d + t → α + n + 17.6 MeV
6
3 Li
+ n → α + t + 4.79 MeV
(4.13)
Le deutérium et le tritium sont donc des éléments essentiels (combustible) de ces engins de destruction. Ils entrent sous la forme des composés chimiques LiD et LiT. La chaleur nécessaire pour
initier la réaction (pour vaincre la barrière de coulomb) est fournie par une explosion atomique
ordinaire qui fait office de détonateur et qui produit une quantité énorme de rayons X. Cet effet
est amplifié en entourant le combustible de matière plastique qui émet des rayons X suite à sa destruction par le détonateur atomique. C’est le schéma dit de Teller-Ulam. La puissance des bombes
H est illimitée. La plus puissante jamais testée (par les soviétiques) faisait 58 mégatonnes de TNT
équivalent, soit 4 000 fois la puissance de la bombe d’Hiroshima.
La fusion contrôlée est un domaine de recherche très actif (et très couteux). Plusieurs pays mettent maintenant leurs ressources en commun afin de réaliser un plasma contrôlé, confiné dans un
tokamak, qui pourrait peut-être produire plus d’énergie qu’il en consomme; c’est le projet ITER.
Problèmes
Problme 4.1
Imaginons un savant fou cherchant à assembler une masse critique de matière fissile de manière à provoquer
une réaction en chaı̂ne explosive (eh oui, une arme de destruction massive). Il est certain que cette masse
minimale doit être assemblée en forme de sphère, car c’est la forme qui minimise la surface en rapport avec
le volume, et que les neutrons secondaires qui s’échappent par la surface ne peuvent plus contribuer à la
réaction en chaı̂ne. Considérons une sphère de rayon R et possédant une densité ρ de matière fissile (nombre
de noyaux fissiles par unité de volume). On note la section efficace d’absorption des neutrons par ces noyaux (à
une énergie qui est celle des noyaux secondaires) par σ. On appelle ξ le nombre moyen de neutrons secondaires
émis à chaque fission (entre 2 et 3) et λ le rapport d’embranchement de la fission sur la capture radiative
suite à l’absorption d’un neutron.
4.3. Nucléogenèse
59
a) Montrez que la probabilité qu’un neutron s’échappe de la sphère s’il est émis à une distance r du centre
est
Z
h
i
p
1 1
f (r, R) =
dz exp −ρσ(rz + z 2 r2 + R2 − r2 )
2 −1
Calculez cette intégrale dans les cas limites suivants : (i) r = 0 et (ii) r = R. Le résultat est-il raisonnable
dans ces cas?
b) Démontrez une condition approximative (en vous servant de la fonction f (r, R) sans l’expliciter) qui puisse
nous aider à déterminer le rayon critique Rc de la sphère.
Problme 4.2
La réaction la plus lente du cycle proton-proton à l’intérieur du soleil est
p + p → d + e+ + νe + 0.42 MeV
où d représente le deutéron.
a) Démontrez que le taux de la réaction (le nombre de réactions par unité de temps et de volume) est
R = n2 hσvi, où n est la densité (nombre par unité de volume) des protons, v leur vitesse relative et σ
la section efficace de la réaction. La notation h· · ·i désigne une valeur moyenne sur les différents protons.
Démontrez aussi que la vie moyenne d’un proton dans cet environnement, c’est-à-dire le temps moyen avant
que le proton ne participe à la réaction, est τ = (nhσvi)−1 .
b) Adoptons un modèle naı̈f de cette réaction. Supposons que les deux protons doivent surmonter classiquement la barrière de potentiel électrostatique qui les sépare avant de pouvoir réagir. Supposons donc que le
rayon d’un proton est de a = 1 fm, qu’en deça de cette distance la barrière ne joue plus mais que l’interaction
forte est en jeu. Calculez l’énergie de seuil E0 (en keV) de cette réaction dans le référentiel du centre de masse
et la température associée.
c) Supposons que la section efficace soit nulle si l’énergie est inférieure au seuil E0 , et égale à la section
géométrique proton-proton (4πa2 ) si E > E0 . Supposons aussi que l’énergie des protons est répartie selon
la distribution de Boltzmann. Supposons enfin que la température du plasma est celle qu’on suppose exister
au coeur du soleil, soit T = 1.6 × 107 K. Démontrez que dans un tel modèle, la vie moyenne d’un proton est
impossiblement longue, incompatible avec une évolution stellaire se produisant sur une échelle de milliards
d’années. La densité au coeur du soleil est approximativement de 105 kg/m3 .
d) Supposons, à l’opposé, que la barrière électrostatique n’est pas franchie classiquement, mais par effet
tunnel. Expliquez pourquoi nous sommes justifiés de poser comme hypothèse que la section efficace a la forme
suivante en fonction de la vitesse relative des protons :
σ = σ0 exp −
2πe2
v
e) Sachant que la vie moyenne d’un proton dans le soleil est de 1010 années et que la température est celle
donnée ci-haut, estimez la valeur correspondante de σ0 . Réponse : 2.5 × 10−21 f m2 .
Note : les calculs nécessaires dans ce problème sont bien évidemment des ordres de grandeurs. Inutile de
conserver 4 chiffres après la virgule partout! Les facteurs de conversion nécessaires se trouvent dans plusieurs
livres, en particulier au début du Particle Physics booklet.
60
4. Réactions nucléaires
Problme 4.3
La chaı̂ne de réactions de fusion qui se produisent au coeur du Soleil peut se résumer par la réaction nette
4p → 42 He + 2e+ + 2νe + 26.72 MeV
La luminosité du Soleil est de 3.83×1026 W. On suppose que 2% de l’énergie émise par le soleil est indétectable
(c’est-à-dire sous forme de neutrinos).
a) D’après ces données, quel devrait être le flux de neutrinos sur Terre (en nombre de neutrinos par seconde
par m2 )? La distance Terre-Soleil est de 1.49 × 1011 m.
b) Un détecteur de neutrinos en opération en 1968 était formé de 600 tonnes de C2 Cl4 (perchloréthylène, le
solvant utilisé dans l’industrie du nettoyage à sec). Le chlore naturel est composé à 24.47% de
neutrinos participent à la réaction
37
−
37
17 Cl + νe → e + 18 Ar
37 Cl,
17
et les
(4.14)
Cependant, le seuil de cette réaction est de 5.8 MeV et la vaste majorité des neutrinos solaires ne peuvent
convenir. Le seuls neutrinos ayant assez d’énergie sont ceux qui proviennent de la désintégration
8
5B
→ 84 Be∗ + e+ + νe + 14.02 MeV
(4.15)
et le nombre de neutrinos produits par cette désintégration représente un dix-millième (10−4 ) du nombre total
de neutrinos émis par le soleil. La section efficace de la réaction (4.14) (moyennée sur les énergies possibles du
neutrino provenant de la désintégration (4.15)) est de 1 × 10−46 m2 . À combien de réactions comme celle-ci
doit ont s’attendre par jour, dans le détecteur en question?
CHAPITRE 5
Particules élémentaires : généralités
L’objectif de ce cours chapitre est de servir de transition entre la première partie du cours, qui traite
de la physique nucléaire de manière relativement descriptive et phénoménologique, et la deuxième
partie, qui traite de la description théorique des particules élémentaires et de leurs interactions
fondamentales. Plusieurs concepts evoqués dans cette courte introduction seront décrits en détail
dans les chapitres suivants.
5.1 Le modèle standard
Toute explication scientfique, simple ou complexe, repose sur ce qu’on appelle un “paradigme”,
c’est-à-dire un modèle avec ses hypothèses et concepts fondamentaux. Une “super-théorie”, en
quelque sorte. La physique subatomique repose sur un tel paradigme, couramment appelé le modèle
standard1 .
Ce modèle standard est provisoirement considéré comme la théorie correcte des phénomènes subatomiques. “Provisoirement” signifie depuis la fin des années 1970, et jusqu’à ce qu’une théorie
plus satisfaisante soit proposée, ce qui n’est toujours pas le cas trente années après.
À la base du modèle standard est un outil théorique fondamental : la théorie quantique des champs
(TQC). La TCQ est une description quantique d’objets qui s’étendent dans tout l’espace, comme
le champ électromagnétique, qui en est l’exemple le plus ancien. La TCQ doit aussi être formulée
dans le cadre de la relativité restreinte, car toute description des particules élémentaires se doit de
respecter le principe de relativité.
Le développement historique qui a mené au modèle standard à partir des premières théories quantiques des particules élémentaires à la fin des années 1920 est long et tortueux. Ses jalons les plus
importants sont :
1. La quantification du champ électromagnétique et la compréhension de la nature du photon
(nom proposé en 1926) comme quantum du champ électromagnétique.
2. L’équation de Dirac (1929) pour décrire les particules relativistes de spin 12 .
3. La première théorie des interactions faibles de Fermi (1933), et la notion de champ de fermions
qui l’accompagnait.
4. 1934 : L’hypothèse de Yukawa sur l’existence de bosons associés à l’interaction forte.
5. 1947 : La théorie de la renormalisation (Feynman, Schwinger, Tomonaga et, avant, Stückelberg)
qui donne un sens à la théorie des perturbations dans l’électrodynamique quantique en particulier et dans la TQC en général. Les diagrammes dit “de Feynman” sont introduits.
1
ou, plus longuement, modèle standard des particules élémentaires, pour le distinguer d’autres modèles
standards qui prévalent dans d’autres disciplines comme la cosmologie ou la biologie moléculaire. . .
62
5. Particules élémentaires : généralités
6. 1964 : Le modèle des quarks, proposé par Gell-Mann et Zweig.
7. La théorie électrofaible, construite dans les années 1960 par Glashow (1961), Weinberg et Salam
(1967).
8. La théorie de l’interaction forte (QCD) proposée au début des années 1970 par Gross, Wilceck
et Politzer.
Le modèle standard offre une description des phénomènes subatomiques compatible avec essentiellement toutes les données expérimentales, exception faite des oscillations de neutrinos soupçonnées
depuis les années 1980 et confirmées plus solidement au début des années 2000. Il décrit les interaction forte, faible et électromagnétique à l’aide de ce qu’on appelle des “théories de jauge”. Ces
interactions agissent sur des particules de matière, des fermions, qui sont rangées en trois familles
semblables et comptent quarks et leptons (voir classification ci-dessous).
5.2 Classification des particules élémentaires
photon
(inter. électromagnétique)
W±
Z0
bosons intermédiaires
Q
famille 1
famille 2
famille 3
0
νe
νµ
ντ
(neutrino µ)
(neutrino τ)
µ
τ
c
t
s
b
(neutrino e)
–1
e
2
3
u
– 13
d
(électron)
(muon)
(tauon)
(inter. faible)
g
gluons
(inter. forte)
H
Higgs ?
bosons (interactions)
quarks
bosons de jauge
γ
leptons
Le concept fondamental de la théorie quantique des champs est que les particules élémentaires sont
considérées comme des quanta, c’est-à-dire comme des oscillations ou fluctuations quantifiées de
champs. Ces particules (et par extension, les champs correspondants) sont soit des bosons ou des
fermions. Les champs de bosons peuvent être formulés plus intuitivement dans la limite classique,
comme par exemple le champ électromagnétique; ils correspondent à aux interactions fondamentale.
les champs de fermions n’ont pas de limite classique; ce sont des objets purement quantiques qui
correspondent aux particules de matière (quarks et leptons).
(up)
(down)
(charm)
(strange)
fermions (matière)
Figure 5.1. Tableau des particules élémentaires dans le modèle standard.
(top)
(bottom)
5.2. Classification des particules élémentaires
63
Fermions
Commençons par les fermions, tous de spin 12 comme l’électron. Ils sont organisés en trois familles
distinctes, semblables dans la manière avec laquelles ils interagissent (comme par exemple la charge
électrique Q) mais très différentes dans leurs masses (les familles sont numérotées dans l’ordre
croissant des masses). On distingue les leptons, qui ne ressentent pas l’interaction forte, des quarks,
qui la ressentent et qui, par une propriété singulière des interactions forte appelée confinement,
ne peuvent être observées en tant que particules libres. Chaque quark, de surcroı̂t, existe en trois
couleurs, c’est-à-dire trois exemplaires équivalents (non répété sur le tableau). En tenant compte
de ce fait, on voit que la charge électrique totale de chaque famille est nulle.
Les fermions élémentaires ont tous un spin 12 et sont tous décrits par l’équation de Dirac (c’est-àdire que les champs correspondants sont des “champs de Dirac”, mathématiquement décrits par
des spineurs à 4 composantes). Ils ont tous des antiparticules (non inscrites sur le tableau), qu’on
note généralement par une barre au-dessus du symbole (par exemple, ē désigne l’anti-électron, ou
positron).
Les quarks, qui ne sont pas observables individuellement, forment des particules composites de
deux types : les mésons sont formés d’un quark et d’un antiquark (on écrirait q q̄, q signifiant un
quark quelconque) et les baryons, formés de trois quarks (qqq). Les mésons sont des bosons, car ils
sont formés de deux fermions, mais ne sont pas élémentaires. Les baryons, dont les plus connus sont
le proton (uud) et le neutron (udd) sont des fermions. Les baryons et les mésons sont collectivement
appelés hadrons, terme qui désigne toutes les particules sensibles à l’interaction forte.
La nature fermionique des quarks et des leptons, c’est-à-dire le fait qu’ils obéissent au principe de
Pauli, donne justement à la matière la propriété de solidité, d’impénétrabilité qui la distingue des
ondes électromagnétiques et, par extension, des objets formés de bosons élémentaires seulement.
Bosons
Les bosons sont associés aux interactions. Ceci signifie que les fermions n’interagissent pas directement entre eux, mais uniquement par l’intermédiaire des bosons. Un concept important qui
survient dans la théorie des perturbations appliquée à la TCQ est celui de particule virtuelle. Une
particule virtuelle n’est pas observable et ne constitue pas un objet se propageant librement, mais
constitue plutôt un objet transitoire, une fluctuation du champ correspondant, dont l’existence se
définit sur un temps très court. On dit que les fermions interagissent en échangeant (c’est-à-dire
en émettant et absorbant) des bosons virtuels.
Les trois interactions fondamentales décrites dans le modèle standard (celui-ci ignore la gravité)
sont :
1. L’électromagnétisme. La particule correspondante est le photon (γ). Ceci signifie que les oscillations quantifiées du champ électromagnétique forment des objets détectables qu’on appelle
des photons et que les particules chargées peuvent échanger des photons virtuels.
2. L’interaction faible. Les particules correspondantes n’ont pas de nom, mais sont notées W ± et
Z0 . La faiblesse de l’interaction faible aux basses énergies est liée à la masse très grande de ces
particules (de l’ordre de 100 GeV). En fait, l’interaction faible et l’interaction électromagnétique
sont intimement reliées et forment ensemble l’interaction dite électrofaible.
3. L’interaction forte. La particule correspondante est le gluon (g). Ceux-ci (car il y en a huit) sont
inobservables comme les quarks car ils sont soumis à la règle du confinement. En principe, des
objets composées de deux gluons ou de trois gluons (les boules de glue ou glueballs) ne sont pas
interdits par cette règle, mais aucun n’a été observé. Cependant, l’existence des gluons laisse
des traces dans les expériences de diffusion de protons à haute énergie.
Ces trois interactions reposent sur un principe théorique important appelé invariance de jauge. En
somme, les théories de ces interactions sont modelées sur l’interaction électromagnétique, quoique
64
5. Particules élémentaires : généralités
la théorie électrofaible et la théorie des interactions fortes (appelée chromodynamique quantique
ou QCD) soient plus complexes.
L’un des ingrédients de la théorie électrofaible est le mécanisme de Higgs qui explique entre autre
pourquoi les particules W ± et Z0 sont massives alors que le photon est sans masse. Ce mécanisme
requiert l’existence d’un bosons supplémentaire, dit boson de Higgs (noté H), qui n’a pas à ce jour
été observé. Le boson de Higgs aurait une spin zéro, alors que les bosons de jauge ont nécessairement
un spin unité.
De tous ces bosons et fermions élémentaires, seuls l’électron, le photon et les trois espèces de neutrino existent de manière stable en tant que particules individuelles. Tous les autres sont instables
ou n’existent qu’à l’intérieur d’objet composites. La proton est le seul baryon stable. Aucun méson
stable n’existe. Bien sûr, des neutrons existent à l’intérieur des noyaux, car leur environnement
immédiat change les conditions de stabilité. De même, de la matière “étrange” (c.-à-d. comportant
des particules composées en partie de quarks s) existe vraisemblablement dans le coeur des étoiles
à neutron, là encore parce que les canaux de désintégration de ces objets sont “obstrués” par la
pré-existence des produits de désintégration dans l’environnement.
5.3 Plan du reste du cours
Dans le chapitre 6, on abordera la théorie quantique des champs en procédant à la quantification
du champ électromagnétique. Le concept de quantum du champ sera introduit avec le photon. De
plus, on introduira le champ scalaire décrivant un boson de spin 0 et le champ de Schrödinger,
décrivant des fermions non relativistes, dans le but d’introduire les diagrammes de Feynman. Enfin,
le formalisme lagrangien sera utilisé, car c’est dans ce langage que les théories des champs sont
habituellement décrites.
Le chapitre 7 est consacré à l’équation de Dirac. La notion d’antiparticule y est aussi introduite.
Le couplage au champ électromagnétique, et donc l’électrodynamique quantique (ou QED), y est
aussi décrit, ainsi que les règles de Feynman correspondantes.
Le chapitre 8 est de nature plus mathématique et peut être survolé plus rapidement si nécessaire.
Il s’agit d’une introduction à la théorie des groupes, préalable à la discussion des théories de jauge.
La classification des hadrons formés des trois quarks (u,d,s) y est aussi abordée.
Le chapitre 9 décrit les théories de jauge non abéliennes, en particulier la chromodynamique quantique (QCD). L’accent est mis sur l’invariance de jauge et la forme du lagrangien que cela implique.
Les propriétés de la QCD sont (très) sommairement discutées.
Enfin, le chapitre 10 décrit les premières théorie de l’interaction faible ainsi que la théorie
électrofaible du modèle standard, incluant le mécanisme de Higgs. Il se conclut par une discussion de la violation de la symétrie CP dans les systèmes de kaons neutres.
CHAPITRE 6
Quantification du champ et interactions
Le but de ce chapitre est d’introduire la notion de champ quantique, un concept fondamental dans
la théorie des particules élémentaires. Nous commençons pas une révision de l’électromagnétisme
(équations de Maxwell), pour démontrer que le champ électromagnétique classique peut être considéré comme un ensemble continu d’oscillateurs harmoniques. La quantification de ces oscillateurs
mène au concept de photon ou, plus généralement, de quantum du champ. Ensuite, nous faisons
interagir ce champ avec de la matière non relativiste, décrite par le champ de Schrödinger et nous
introduisons les diagrammes de Feynman, qui sont une représentation graphique des termes de la
théorie des perturbations. En chemin, nous remplaçons le champ électromagnétique par un champ
scalaire simple, dans le but de simplifier quelque peu la discussion.
6.1 Ondes électromagnétiques
6.1.1 Équations de Maxwell et transformées de Fourier
Rappelons les équations de Maxwell dans le système gaussien (mais dans les unités naturelles
c = 1):
∂B
=0
∇·E = 4πρ
∇∧E +
∂t
(6.1)
∂E
∇·B = 0
∇∧B −
= 4πJ
∂t
où ρ est la densité de charge et J la densité de courant.
Ces équations peuvent aussi s’écrire en fonction des transformées de Fourier spatiales des champs.
Adoptons pour ce faire un espace de volume fini V avec des conditions aux limites périodiques.
Placer le système physique dans une telle “boı̂te” présente l’avantage de quantifier les vecteurs
d’ondes possibles et donc de discrétiser les modes de vibrations du champ électromagnétique. Les
transformées de Fourier s’expriment alors comme suit :
Z
1X
ik·r
E(r) =
Ek e
Ek = d3 r E(r)e−ik·r
(6.2)
V
k
et de même pour toute autre quantité (B, J, ρ, etc.). Il est sous-entendu ici que E(r) et Ek
dépendent du temps. Comme le champ électrique est réel (par opposition à complexe), on voit
aisément que
E∗k = E−k
(6.3)
66
6. Quantification du champ et interactions
et il en est de même de la transformée de Fourier de tout champ réel. Notons enfin qu’on peut
toujours retourner à un volume infini à la fin des calculs en remplaçant la somme sur les vecteurs
d’ondes par une intégrale :
Z
1X
d3 k
→
(6.4)
V
(2π)3
k
La traduction des équations de Maxwell dans l’espace réciproque (i.e. en fonction des transformées
de Fourier) se fait par la substitution ∇ → ik, de sorte que
∇·E(r) → ik · Ek
et
∇∧E(r) → ik ∧ Ek
(6.5)
Les équations de Maxwell prennent donc la forme suivante :
k · Ek = −4πiρk
k ∧ Ek − iḂk = 0
k · Bk = 0
k ∧ Bk + iĖk = −4πiJk
(6.6)
où un point (˙) désigne la dérivée par rapport au temps. L’avantage de cette formulation dans
l’espace réciproque est que les équations associées à des valeurs différentes de k sont découplées.
Autrement dit, nous avons réduit le problème d’un système d’équations différentielles aux dérivées
partielles à un systèmes d’équations différentielles ordinaires.
6.1.2 champs transverses et longitudinaux
Un champ vectoriel F(r) est qualifié de transverse si ∇·F = 0. Il est qualifié de longitudinal si
∇∧F = 0. Dans l’espace réciproque, ces conditions sont respectivement
k · Fk = 0
et k ∧ Fk = 0
(6.7)
Autrement dit, la transformée de Fourier d’un champ transverse est perpendiculaire au vecteur
d’onde, alors que celle d’un champ longitudinal y est parallèle. Mais tout vecteur Fk peut être écrit
comme la somme d’une composante parallèle à k et d’une composante perpendiculaire à k :
k
k
Fk = Fk + F⊥
k
k
Fk = (Fk · k̂)k̂ , F⊥
k = Fk − Fk
(6.8)
où k̂ est le vecteur unitaire dans la direction de k. Ceci démontre, par les transformées de Fourier,
que tout champ est la somme d’un champ transverse et d’un champ longitudinal :
F(r) = Fk (r) + F⊥ (r)
(6.9)
De plus, on montre facilement que la partie transverse est le rotationnel d’un autre champ de
vecteur, alors que la partie longitudinale est le gradient d’une fonction :
Fk (r) = ∇φ
F⊥ (r) = ∇∧G(r)
(6.10)
En effet, il suffit de contempler ces relations dans l’espace réciproque :
k
Fk = ikφk
F⊥
k = ik ∧ Gk
(6.11)
et de voir qu’elles peuvent être satisfaites si on choisit
i
φk = − k̂ · Fk
k
Gk =
i
k̂ ∧ F⊥
k
k
(6.12)
6.1. Ondes électromagnétiques
67
Les équations de Maxwell séparent nettement les composantes transverses et longitudinales des
champs :
k
k · Ek = −4πiρk
(6.13a)
⊥
Ḃ⊥
k = −ik ∧ Ek
k
k
· Bk
Ė⊥
k
k
Ėk
(6.13b)
=0
(6.13c)
⊥
= ik ∧ B⊥
k − 4πJk
(6.13d)
=
k
−4πJk
(6.13e)
La troisième de ces équations (c) nous dit que le champ magnétique est purement transverse :
Bk = 0. Nous ne ferons donc plus la distinction entre B et B⊥ . La première et la dernière de
ces équations gouvernent la partie longitudinale de E. En les combinant, on retrouve la loi de
conservation de la charge : en effet,
∂
k
k
k · Ek = −4πk · Jk = −4πiρ̇k
∂t
(6.14)
ce qui revient à écrire
ik · Jk + ρ̇k = 0
=⇒
∇·J +
∂ρ
=0
∂t
(6.15)
ce qui est l’équation de continuité. La partie longitudinale de E est de fait complètement déterminée
par la densité de charge :
4πi
k
Ek = −
k̂ρk
(6.16)
k
ce qui signifie que le problème de résolution des équations de Maxwell est résolu en ce qui concerne
cette composante.
6.1.3 Variables normales
Nous allons maintenant formuler les équations de Maxwell pour les composantes transverses des
champs (les seules qui nous restent à étudier) en fonction de nouvelles variables qui permettent de
découpler les équations (6.13b) et (6.13d). On définit le vecteur
i ⊥
Ek − k̂ ∧ Bk
2Ck
ak = −
(6.17)
où Ck est une constante de normalisation à déterminer (on supposera qu’elle est réelle et qu’elle ne
dépend que de la grandeur k du vecteur d’onde). Ce vecteur n’est pas réel dans l’espace ordinaire,
de sorte que a∗−k 6= ak . En fait,
a∗−k =
i ⊥
Ek + k̂ ∧ Bk
2Ck
(6.18)
On peut exprimer E⊥
k et Bk en fonction de a, à partir des deux équations précédentes :
∗
E⊥
k = iCk ak − a−k
Bk = iCk k̂ ∧ ak + a∗−k
(6.19)
68
6. Quantification du champ et interactions
L’avantage de la nouvelle variable a est la simplicité de son évolution temporelle. En effet, d’après
les équations (6.13),
i ⊥
ȧk = −
Ėk − k̂ ∧ Ḃk
2Ck
1 ⊥
k ∧ Bk + 4πiJ⊥
+
k̂
∧
(k
∧
E
)
=
k
k
2Ck
(6.20)
1
⊥
=
−k(E⊥
−
k̂
∧
B
)
+
4πiJ
k
k
k
2Ck
2πi ⊥
= −ikak +
J
Ck k
En définissant la fréquence ωk = k = |k|, on peut enfin écrire
ȧk + iωk ak =
2πi ⊥
J
Ck k
(6.21)
Il s’agit d’une simple équation différentielle linéaire du premier ordre, à coefficients constants. Elle
est inhomogène, cependant.
Dans le cas d’un champ sans source (J = 0), la solution est immédiate :
ak (t) = ak (0)e−iωk t
(6.22)
Comme le vecteur a est transverse, on peut l’exprimer en fonction d’une base orthonormée de deux
vecteurs ejk (j = 1, 2) perpendiculaires à k :
ak = a1,k e1,k + a2,k e2,k
(6.23)
Ces deux vecteurs correspondent aux deux polarisations possibles d’une onde électromagnétique.
6.2 Quantification du champ électromagnétique
6.2.1 Hamiltonien du champ
En toute rigueur, nous devrions dériver le hamiltonien du champ électromagnétique à partir de
son lagrangien et trouver par la même occasion les variables canoniques qui y figurent. L’approche
que nous suivons ici est un raccourci qui nous mènera au même point d’arrivée. Nous poserons que
le hamiltonien du champ est donné par son énergie totale (ce qui est naturel). L’énergie du champ
est (voir à cet effet les notes de cours de PHQ-420)
Z
1
H=
d3 r (E2 + B2 )
(6.24)
8π
On peut récrire ce résultat en fonction des transformées de Fourier, en utilisant le théorème de
Parseval :
1 1 X
H=
|Ek |2 + |Bk |2
(6.25)
V 8π
k
Exprimons maintenant cette énergie en fonction de la variable normale a. Notons tout d’abord que
seul E⊥ contribue à l’énergie dans ce cas, car en l’absence de sources Ek est nul. Après un court
calcul, on trouve
X C2
X C2
k ∗
k
H=
a∗k · ak =
a a
(6.26)
2πV
2πV jk jk
k
j,k
6.2. Quantification du champ électromagnétique
69
Trouver le hamiltonien n’est pas tout. Il faut aussi connaı̂tre le statut des variables ajk du point
de vue canonique, c’est-à-dire leur crochet de Poisson. Comme la méthode des crochets de Poisson
n’est peut-être pas familière, nous pouvons directement passer à la version quantique du problème,
car la quantification canonique procède par le remplacement des crochets de Poisson par les commutateurs. La variable normale ajk devient alors un opérateur, et le conjugué complexe devient
l’opérateur conjugué hermitique a†jk . Le hamiltonien est alors
H=
X C2 †
k
a a
2πV jk jk
(6.27)
j,k
et ce hamiltonien doit mener aux équations de Maxwell, c’est-à-dire à l’équation d’évolution
ȧjk = −iωk ajk
(6.28)
On constate ici la similitude avec la théorie de l’oscillateur harmonique. Dans ce cas, le hamiltonien
est H = ωa† a et le commutateur des opérateurs d’échelle est [a, a† ] = 1, ce qui mène à l’équation
d’évolution
ȧ = i[H, a] = iω[a† a, a] = iω(a† aa − aa† a) = −iωa
=⇒
a(t) = a(0)e−iωt
(6.29)
Dans le cas qui nous occupe, on retrouve la forme habituelle du hamiltonien de l’oscillateur harmonique en posant
p
(6.30)
Ck = 2πωk V
et alors
H=
X
ωk a†jk ajk
(6.31)
j,k
Si on pose ensuite que
[ajk , a†j 0 ,k0 ] = δjj 0 δk,k0
(6.32)
alors, exactement comme dans l’oscillateur harmonique, on retrouve l’évolution temporelle correcte
des variables ajk , ce qui est en principe équivalent aux équations de Maxwell. Nous avons donc
réalisé la quantification du champ électromagnétique : le champ électromagnétique libre de sources
est en fait une collection d’oscillateurs harmoniques, un pour chaque vecteur d’onde et chaque
polarisation.
Résumons maintenant comment exprimer les champs E et B en fonction des opérateurs d’échelle
(ex variables normales); nous combinons pour cela les équations (6.2), (6.19) et (6.30) :
r
r
X 2πω
X 2πω k
k
ik·r
E(r) = i
ajk êjk e − c.h.
B(r) = i
ajk k̂ ∧ êjk eik·r − c.h.
V
V
j,k
j,k
(6.33)
6.2.2 Photons
Nous avons établi que le hamiltonien du champ électromagnétique sans sources est celui d’une
collection d’oscillateurs harmoniques découplés, un pour chaque vecteur d’onde et polarisation, de
fréquences ωk = k. Rappelons que, dans le cas d’un oscillateur harmonique simple, les états propres
du hamiltonien sont notés |ni (n un entier positif ou nul), avec les propriétés :
√
√
a|ni = n|n − 1i
a† |ni = n + 1|n + 1i
a† a|ni = n|ni
(6.34)
70
6. Quantification du champ et interactions
L’état fondamental est |0i et l’énergie de l’état |ni est nω, par rapport à celle de l’état fondamental.
L’opérateur N = a† a prend des valeurs propres entières et est appelé l’opérateur du nombre. Le
hamiltonien s’exprime ensuite comme H = ωN (modulo une constante additive).
Dans le cas d’une collection d’oscillateurs découplés, l’état fondamental est le produit tensoriel
des états fondamentaux de tous les oscillateurs. On le note encore |0i. L’interprétation physique
fondamentale du champ électromagnétique quantifié est que l’opérateur
Njk = a†jk ajk
(6.35)
représente le nombre de photons de vecteur d’onde k et de polarisation j. Ainsi, l’énergie du champ
est la somme des énergies des photons :
X
H=
ωk Njk
(6.36)
j,k
Il est également simple de démontrer que la quantité de mouvement du champ, définie comme
Z
1
P=
d3 r E ∧ B
(6.37)
4π
s’exprime ainsi en fonction des opérateurs de nombre :
X
kNjk
P=
(6.38)
j,k
Donc les quantités physiques (énergie, quantité de mouvement) sont quantifiés, et Njk représente
le nombre de ces quantas associés à un vecteur d’onde et une polarisation donnés, donc le nombre
de photons.
Comme l’opérateur a†jk augmente de 1 la valeur propre de ce nombre, on dit qu’il crée un photon
et on l’appelle opérateur de création. De même, l’opérateur ajk diminue de 1 la valeur de Njk et
est appelé opérateur d’annihilation ou de destruction de photons.
L’état fondamental |0i, qui ne contient aucun photon puisque h0|Njk |0i = 0, est appelé vide. Les
états quantiques qui ne contiennent qu’un seul photon sont obtenus par application sur le vide de
l’opérateur de création :
a†jk |0i
(6.39)
Les photons sont des bosons : il est possible d’en mettre autant qu’on veut dans un mode de vecteur
d’onde et de polarisation donné : l’état suivant
1
√ (a†jk )n |0i
n!
(6.40)
représente un état où n photons occupent le mode de vecteur d’onde k et de polarisation j. D’autre
part, comme les opérateurs de création et d’annihiliation associés à des modes différents commutent
entre eux, l’état quantique obtenu par application des opérateurs de création ne dépend pas de
l’ordre dans lequel les opérateurs sont appliqués (i.e. le signe est le même dans tous les cas).
6.3. Fermions
71
6.3 Fermions
6.3.1 Électrons non relativistes : champ de Schrödinger
Voyons maintenant comment notre traitement du champ électromagnétique peut être généralisé
au cas de particules matérielles, comme les électrons. L’équivalent des équations de Maxwell pour
les ondes de matière est l’équation de Schrödinger :
i
1 2
∂ψ
=−
∇ ψ
∂t
2m
(6.41)
(nous considérons ici le cas des électrons libres). On ne voit plus ici la fonction d’onde ψ comme
associée à une seule particule, mais on la considère comme un champ, le champ de Schrödinger,
dont les oscillations quantifiées sont les électrons, de la même manière que les oscillations quantifiées
du champ électromagnétique sont les photons. On peut ainsi traiter le cas d’un nombre arbitraire
d’électrons, et non seulement celui d’un seul électron.
En fonction de la transformée de Fourier du champ ψ, l’équation de Schrödinger prend la forme
iψ̇ k =
k2
ψ
2m k
(6.42)
dont la solution est
k2
(6.43)
2m
Par analogie avec ce qui a été fait ci-haut, on cherche à exprimer le hamiltonien du champ
de Schrödinger comme une combinaison d’oscillateurs. Ce hamiltonien n’est autre que la valeur
moyenne de l’énergie cinétique :
Z
−1 2
1 X ∗ k2
H = d3 r ψ ∗
∇ ψ=
ψk
ψ
(6.44)
2m
V
2m k
ψ̇ k (t) = ψ̇ k (0)e−iεk t
où εk =
k
Le passage à un formalisme quantique se fait en remplaçant le champ ψ ∗ par un opérateur ψ † et
on trouve ainsi le hamiltonien
1X
εk ψk† ψk
(6.45)
H=
V
k
Pour mettre à profit l’analogie avec les oscillateurs, on introduit les opérateurs de création et
d’annhiliation d’électrons ayant la bonne normalisation :
1
ck = √ ψk
V
1
c†k = √ ψk†
V
et enfin
H=
X
(6.46)
εk c†k ck
(6.47)
k
Mais attention! Les électrons sont des fermions : on ne peut pas en mettre plus d’un dans un mode
de vecteur d’onde donné (nous ignorons le spin pour le moment). Donc les opérateurs ck et c†k ne
peuvent pas se comporter comme les opérateurs d’échelle de l’oscillateur harmonique. L’opérateur
du nombre Nk = c†k ck ne peut prendre que les valeurs 0 et 1. De plus, dans un état comportant
plus d’un électron, il doit y avoir un changement de signe lorsque deux électrons sont échangés.
Ces contraintes importantes peuvent être respectées si on impose aux opérateurs de création et
d’annhiliation des relations d’anticommutation :
ck c†k0 + c†k0 ck = δk,k0
ck ck0 + ck0 ck = 0
c†k c†k0 + c†k0 c†k = 0
(6.48)
72
6. Quantification du champ et interactions
On utilise couramment la notation suivante pour l’anticommutateur de deux opérateurs A et B :
{A, B} = AB + BA
(6.49)
et on écrit les relations de commutation ci-dessus comme
{ck , c†k0 } = δk,k0
{ck , ck0 } = 0
{c†k , c†k0 } = 0
(6.50)
Dans le cas k = k0 , ces relation assurent que
(c†k )2 = 0
(ck )2 = 0
(6.51)
ce qui signifie qu’il est impossible de créer (ou détruire) plus d’un électron dans un mode donné.
D’autre part, un état à deux électrons est antisymétrique lors de l’échange des deux électrons, tel
que prescrit par la statistique de Fermi-Dirac :
c†k c†k0 |0i = −c†k0 c†k |0i
(6.52)
Les relations d’anticommutation nous assurent donc que la nature fermionique des électrons est
bien représentée, mais il faut aussi que la dynamique le soit : vérifions donc que l’équation de
Heisenberg s’applique correctement à l’opérateur d’annihilation :
ċk = i[H, ck ]
= iεk [c†k ck , ck ]
= iεk c†k ck ck − ck c†k ck
(6.53)
= −iεk ck c†k ck
= −iεk ck (c†k ck + ck c†k )
= −iεk ck
ce qui est bien la bonne équation d’évolution (la même que pour ψk ).
Résumons. Les électrons libres non relativistes peuvent être conçus comme les excitations quantifiées d’un champ ψ(r) qui se développe ainsi en fonction des opérateurs de création et d’annihilation :
1 X
ψ(r) = √
ck eik·r
(6.54)
V k
Le hamiltonien correpondant est une somme de termes découplés, un pour chaque mode d’oscillation
(i.e. chaque vecteur d’onde) :
X
H=
εk c†k ck
(6.55)
k
et les opérateurs de création et d’annihilation obéissent aux relations d’anticommutation (6.50).
On montre également que la quantité de mouvement associée au champ de Schrödinger, soit la
valeur moyenne de la quantité de mouvement
Z
P = d3 r ψ ∗ (−i∇ψ)
(6.56)
devient l’expression suivante en fonction des opérateurs de nombre :
X
P=
kNk
k
(6.57)
6.3. Fermions
73
Remarque : deuxième quantification et limite classique
Nous avons traité le champ de Schrödinger comme un champ classique qu’on quantifie, comme
pour le champ électromagnétique. Comment est-ce possible? L’équation de Schrödinger n’est-elle
pas fondamentalement quantique? En fait, la procédure que nous avons suivi porte le nom de
deuxième quantification, ce qui encourage l’équivoque. Pour résoudre ce paradoxe, il faut réfléchir
à la limite classique. Dans le cas de bosons, cette limite est atteinte quand le nombre moyen de
quanta (i.e. de photons, dans notre cas) dans un mode donné est grand. Plus précisément encore, il
est bon de réfléchir à la limite classique de l’oscillateur harmonique, car c’est précisément de quoi
il s’agit ici. Dans la limite classique, l’oscillateur harmonique n’est pas typiquement dans un état
propre du hamiltonien, mais plutôt dans un état cohérent, sorte de superposition d’états propres,
de paquet d’onde, qui se rapproche de la description d’un objet en oscillation. Par contre, dans le
cas des fermions, ces états n’existent pas, du fait que le nombre de quanta dans chaque mode ne
peut être supérieur à un. Donc la limite classique du champ de Schrödinger n’existe pas vraiment,
du moins pas au sens habituel. il n’y a pas vraiment de “deuxième quantification”, car la “première
quantification” ne correspond pas à la limite classique du champ de Schrödinger, mais plutôt à la
restriction de ce champ quantique aux états qui ne comportent qu’un seul électron.
6.3.2 Interaction électrons-photons
Tout l’intérêt du formalisme de deuxième quantification vient du traitement des interactions entre
les électrons et le champ électromagnétique quantifié. Rappelons ici le hamiltonien d’un électron
en présence d’un champ électromagnétique :
H=
1
(P − eA)2 + eΦ
2m
(6.58)
L’important ici est que ce sont les potentiels électromagnétiques qui interviennent dans le hamiltonien, et non les champs électrique et magnétique directement.
L’une des propriétés fondamentales du champ électromagnétique est l’invariance de jauge. Les
champs électrique et magnétique sont dérivés de potentiels électromagnétiques A et Φ de la manière
suivante :
∂A
E = −∇Φ −
B = ∇∧A
(6.59)
∂t
Ces potentiels ne sont pas définis de manière unique : on peut procéder à une transformation de
jauge, par laquelle les potentiels sont modifiés de la manière suivante :
A → A + ∇ξ
Φ→Φ−
∂ξ
∂t
(6.60)
où ξ est une fonction quelconque des coordonnées et du temps. Cette transformation n’affecte pas
du tout les champs E et B. Exprimons ces relations dans l’espace réciproque :
Ek = −ikΦk − Ȧk
Bk = ik ∧ Ak
(6.61)
et
Ak → Ak + ikξk
Φk → Φk − ξ˙k
(6.62)
Le fait que les potentiels électromagnétiques ne soient pas définis de manière unique nous permet
de leur imposer des conditions supplémentaires, appelées conditions de jauges. Celle que nous
utiliserons est la jauge de Coulomb, également appelée jauge transverse, car elle impose l’annulation
de la partie longitudinale du potentiel vecteur :
∇·A = 0 ou k · Ak = 0
(6.63)
74
6. Quantification du champ et interactions
Il est clair d’après la relation (6.62) qu’on peut toujours choisir une fonction ξ de manière à
annuler Ak . Dans ce cas, la partie longitudinale de E est entièrement fixée par le potentiel scalaire
Φ. Le champ B de toute manière n’est pas affecté par la partie longitudinale de A. Comme A est
dorénavant transverse, la relation entre B et A peut également s’écrire
Ak =
i
k̂ ∧ Bk
k
(6.64)
ce qu’on vérifie comme suit :
Bk = ik ∧ Ak = −k̂ ∧ (k̂ ∧ Bk ) = Bk
(6.65)
On tire donc de cette équation et de (6.33) une expression du potentiel vecteur en fonction des
opérateurs de création et d’annihilation :
s
A(r) =
X
j,k
2π
ajk êjk eik·r + c.h.
ωk V
(6.66)
Cette expression sera utile pour exprimer le hamiltonien d’interaction entre électrons et photons.
À cette fin, écrivons le hamiltonien du champ de Schrödinger en interaction avec le champ
électromagnétique comme la valeur moyenne de le hamiltonien (6.58) dans le cas Φ = 0 :
Z
1
H=
d3 r ψ ∗ (P − eA)2 ψ
2m
Z
1
=
d3 r ψ ∗ P2 ψ − eψ ∗ (P · A + A · P)ψ + e2 ψ ∗ ψA2
(6.67)
2m
Z
1
=
d3 r ψ ∗ P2 ψ − 2eψ ∗ A · Pψ + e2 ψ ∗ ψA2
2m
Dans la troisième équation, nous avons utilisé le fait que
P · A = A · P − i∇·A = A · P
(jauge transverse)
En introduisant les hamiltoniens d’interaction suivants
Z
Z
e2
e
H1 = −
d3 r ψ ∗ A · Pψ
H2 =
d3 r ψ ∗ ψA2
m
2m
(6.68)
(6.69)
Le hamiltonien global (photons et électrons) s’écrit donc comme
H = Hem + He + H1 + H2
(6.70)
où Hem est le hamiltonien du champ électromagnétique libre donné par l’éq. (6.31) et où He
est le hamiltonien des électrons libres. Le deuxième terme (He ) est le hamiltonien du champ de
Schrödinger étudié précédemment. Les troisième et quatrième termes (H1 et H2 )) représentent
l’interaction du champ de Schrödinger (donc des électrons) avec le champ électromagnétique.
Afin de comprendre en détail le mécanisme d’interaction associé au hamiltonien H1 , exprimons-le
en fonction des opérateurs de création et d’annihilation des photons et des électrons, en utilisant
les développements (6.66) et (6.54) :
Z
1 X ir·(k−k0 +q) †
e
H1 = −
d3 r 2
e
ck0 k · Aq ck
(6.71)
m
V
0
k,k ,q
6.3. Fermions
75
L’intégrale sur les coordonnées produit un delta de Kronecker Vδk0 ,k+q et on trouve
e 1X †
ck+q k · Aq ck
mV
(6.72)
2πV X
(ajq êjq + a†j−q ê∗j,−q )
ωq j
(6.73)
H1 = −
k,q
D’autre part,
s
Aq =
On trouve donc finalement
e X
H1 = −
m
k,q,j
s
2π (êjq · k)ajq c†k+q ck + (ê∗jq · k)a†jq c†k−q ck
Vωq
(6.74)
Le hamiltonien H2 a lui-aussi son expression en fonction des opérateurs de création et d’annhiliation,
mais nous allons nous concentrer dans ce qui suit sur H1 seulement. Remarquons premièrement
que H1 , contrairement à Hem , ne conserve pas le nombre de photons. Autrement dit, l’opérateur
du nombre total de photons
X †
Nγ =
ajq ajq
(6.75)
q,j
ne commute pas avec H1 . Par contre, H1 commute avec l’opérateur du nombre total d’électrons
X †
Ne =
(6.76)
ck ck
k
Donc, au total, le nombre d’électrons est conservé, mais pas le nombre de photons. Le premier
terme dans H1 représente un processus au cours duquel un photon d’impulsion q est absorbé par
un électron d’impulsion k qui se retrouve par la suite avec une impulsion k + q. Plus précisément,
l’électron d’impulsion k est détruit et un électron d’impulsion k + q est créé à sa place (le nombre
total d’électrons est conservé). Le deuxième terme de H1 représente un processus au cours duquel
un électron d’impulsion k émet un photon d’impulsion q et se retrouve après avec une impulsion
k − q.
Graphiquement, on représente ces deux termes par les diagrammes suivants :
k+q
k–q
q
(6.77)
k
q
k
Dans ces diagrammes, on représente les particules de matière (les électrons, par exemple) par des
traits pleins, et les photons par des lignes ondulées. Chaque ligne porte une quantité de mouvement
précise, et le point de rencontre de ces lignes représente un terme dans le hamiltonien. On peut
imaginer, à cette étape, que les particules annihilées apparaissent en bas du diagramme, et les
particules créées en haut.
76
6. Quantification du champ et interactions
6.3.3 Théorie du champ scalaire
Dans le but de simplifier au maximum notre discussion des diagrammes de Feynman, nous allons
remplacer le champ électromagnétique par une théorie plus simple, celle du champ scalaire. Dans
cette théorie, il n’existe qu’une seule “polarisation” et le champ associé, noté φ, n’est pas de nature
vectorielle (on peut penser, pour fixer les idées, à des ondes longitudinales). Le hamiltonien de ce
champ, en fonction des opérateurs de création et d’annihilation, est
X
Hφ =
ωk a†k ak
(6.78)
k
L’équivalent de la relation (6.66) est
s
φ(r) =
X
k
2π
ak eik·r + c.h.
ωk V
(6.79)
Il s’agit en somme d’une simplification de l’électrodynamique, où l’aspect vectoriel a été supprimé.
Les photons sont alors remplacés par une autre sorte de bosons, sans spin. L’opérateur du nombre
de ces bosons est alors
X †
N=
(6.80)
ak ak
k
et l’opérateur de la quantité de mouvement est
X †
kak ak
P=
(6.81)
k
L’équivalent du hamiltonien H1 ci-haut est
Z
Heφ = g
d3 r φψ ∗ ψ
(6.82)
où g est une constante, appelée constante de couplage. En fonction des opérateurs de création et
d’annihilation, ce hamiltonien d’interaction devient
s
X
2π †
Heφ = g
aq ck+q ck + a†q c†k−q ck
(6.83)
Vωq
k,q
Nous retrouvons en fait le hamiltonien (6.74), mais sans les références à la polarisation. Les termes de ce hamiltonien on exactement la même interprétation, en fonction de particules créées ou
annihilées, que ceux du hamiltonien (6.74) et sont représentés par les mêmes symboles graphiques,
sauf qu’on remplace généralement les lignes ondulées par une ligne pointillée lorsqu’on traite du
champ scalaire :
k+q
k–q
q
(6.84)
k
q
k
6.4. Théorie des perturbations et diagrammes de Feynman
77
6.4 Théorie des perturbations et diagrammes de Feynman
Comme il est impossible de résoudre exactement le hamiltonien global (6.70), on a recours à la
théorie des perturbations, d’autant plus que H1 , dans un certain sens, est petit devant Hem et
He , comme nous le verrons par la suite. La théorie des perturbations nous permet de calculer une
probabilité de transition par unité de temps d’un état initial |ii vers un état final |f i, tous deux états
propres du hamiltonien non perturbé, soit He +Hφ dans le cas qui nous occupe (celui d’un champ de
Schrödinger en interaction avec un champ scalaire). En particulier, nous pouvons ainsi calculer une
section différentielle de diffusion. Cependant, la théorie des perturbations n’est pas adéquate pour
déterminer, par exemple, les états liés d’électrons sous l’influence de la force coulombienne, ou de
la force associée au champ scalaire. Le problème des états liés est essentiellement non perturbatif.
La théorie des perturbation utilisée ici est la version dépendante du temps, en l’occurence la règle
d’or de Fermi, sauf qu’il faut aller au-delà de l’ordre le plus bas. Rappelons cette règle, qui donne
le taux de transition d’un état initial |ii vers un état final |f i :
ωi→f = 2π|Mf i |2 δ(Ef − Ei )
(6.85)
où l’amplitude Mf i est, aux deux ordres les plus bas de la théorie des perturbations,
Mf i = hf |V |ii +
X hf |V |nihn|V |ii
n
Ei − En
+ ···
(6.86)
où V est la perturbation étudiée (ici V = Heφ ) et où le deuxième terme est une somme sur les états
propres |ni du hamiltonien non perturbé, qualifiés d’états virtuels, dont les énergies sont En . Le
deuxième terme doit être considéré si le premier s’annule. Dans le cas qui nous occupe (V = H1 ),
le premier terme s’annule toujours, car H1 change le nombre de bosons, alors que les états propres
de Hφ + He ont un nombre fixe de bosons. Il faut donc toujours effectuer une somme sur des
états virtuels. Chacun des termes de Mf i peut être représenté par un diagramme illustrant l’état
intermédiaire impliqué. Un exemple détaillé est discuté ci-après.
6.4.1 Diffusion des électrons par un champ scalaire
Comme exemple fondamental d’application de la théorie des perturbations, considérons la collision
de deux électrons. Les quantités de mouvement initiales des deux électrons sont k1 et k2 , et les
quantités de mouvement finales (après la collision) sont k3 et k4 . Les états initial et final sont donc
|ii = c†k1 c†k2 |0i
|f i = c†k3 c†k4 |0i
(6.87)
Les états intermédiaires possibles contiennent forcément un boson, car les termes d’interactions
(6.83) changent le nombre de bosons par 1 ou −1. Nous ne sommes intéressés que par les états
intermédiaires |ni tels que hf |Heφ |nihn|Heφ |ii est non nul. Quatre possibilités existent. Deux de
ces possibilités sont illustrées graphiquement ci-dessous :
k3
k4
q
k1
k2
(i)
|f
|f
|n
|n
|i
|i
k3
k4
q
k1
(6.88)
k2
(ii)
78
6. Quantification du champ et interactions
Les deux autres sont obtenues en échangeant k3 et k4 . Expliquons, en commençant par le diagramme de gauche (cas (i)). Dans ce cas, les trois états (initial, intermédiaire et final) sont
représentés successivement de bas en haut. Un sommet (ou vertex) du diagramme correspond à
l’action du hamiltonien d’interaction Heφ , qui nous fait passer successivement de l’état |ii à l’état
|ni = c†k3 c†k2 a†q |0i, à l’état |f i. Le premier vertex représente l’action du terme a†q c†k3 ck1 de Heφ , qui
détruit l’électron de vecteur d’onde k1 et le remplace par un électron de vecteur d’onde k3 , en
créant un boson de vecteur d’onde q = k1 − k3 . On associe à ce vertex l’élément de matrice
s
2π
q = |k1 − k3 |
(6.89)
hn|Heφ |ii = g
Vωq
Le deuxième vertex représente l’action du terme aq c†k4 ck2 de Heφ , qui détruit l’électron de vecteur
d’onde k2 et le remplace par un électron de vecteur d’onde k4 , tout en annihilant le boson de
vecteur d’onde q = k1 − k3 = k4 − k2 . On associe à ce vertex l’élément de matrice
s
2π
(6.90)
hf |Heφ |ni = g
Vωq
En ajoutant le dénominateur figurant dans l’amplitude (6.86), ce diagramme a la valeur numérique
suivante :
diagramme (i)
=
g2
2π
2π 1
1
= g2
Ei − En Vωq
V ω q ε1 − ε3 − ω q
q = |k1 − k3 |
(6.91)
où ε1 = ε(k1 ) et ainsi de suite.
Le diagramme de droite (ii) diffère de (i) en ce que l’état intermédiaire est maintenant |ni =
c†k4 c†k1 a†q |0i et q = k2 − k4 , soit l’opposé de la valeur correspondante dans le diagramme (i); notons
cependant que ωq est le même dans les deux cas. La valeur numérique du diagramme (ii) est plutôt
diagramme (ii)
= g2
1
2π 1
1
2π 1
= g2
V ω q ε2 − ε4 − ω q
V ω q ε3 − ε1 − ω q
(6.92)
(on a utilisé la conservation de l’énergie ε1 + ε2 = ε3 + ε4 ). En notant ε13 = ε1 − ε3 , il est d’usage
de combiner les deux contributions (i) et (ii) en une seule expression :
2π 1
1
1
4π
1
−
= g2
(6.93)
g2
V ωq ε13 − ωq
ε13 + ωq
V ε231 − ωq2
et de l’associer à un seul diagramme, dit diagramme de Feynman :
k3
k4
(6.94)
q
k1
k2
Ce diagramme ne comporte plus un état intermédiaire bien défini, car il est la combinaison de
deux termes associés à des états intermédiaires différents. Cependant, il comporte un boson virtuel,
6.4. Théorie des perturbations et diagrammes de Feynman
79
auquel on attribue une énergie ω = ε1 − ε3 et un vecteur d’onde q = k1 − k3 . Cette énergie et ce
vecteur d’onde résultent de la conservation de l’énergie et de la quantité de mouvement appliquée
à chaque vertex. La valeur du diagramme est alors
g2
4π
4π
1
1
= g2
2
2
2
V ω − ωq
V ω − q2
(6.95)
Ce boson virtuel est émis par l’électron 1 et absorbé par l’électron 2, qui tous deux voient leur
énergie et leur quantité de mouvement changer en conséquence. Le boson est virtuel, et non réel :
son énergie et sa quantité de mouvement ne respsectent pas la condition ω = |q|. On dit aussi qu’il
n’est pas sur la “couche de masse”.
6.4.2 Calcul de l’amplitude de diffusion complète
Terminons maintenant le calcul de l’amplitude Mf i . Nous devons ajouter au diagramme ci-haut
celui associé à l’échange des deux particules finales, qui est aussi une possibilité. Ce diagramme
comprend les deux autres états intermédiaires possibles évoqués ci-haut.
k3
k4
k3
q
k4
(6.96)
q
k1
k2
k1
k2
Le signe − entre les deux diagrammes tient au fait que le deuxième se calcule exactement comme
le premier si on échange les indices 3 et 4, sauf pour le fait que l’état final, lui ne change pas,
et que changer les indices 3 et 4 dans l’état final revient à en changer le signe (antisymétrie par
échange de deux fermions). L’amplitude totale, d’où on a factorisé le delta de Kronecker assurant
la conservation de la quantité de mouvement, est
)
(
1
1
4π
−
(6.97)
Mf i = g 2
V ω 2 − q2 q=k1 −k3 ω 2 − q2 q=k1 −k4
Calculons la section différentielle de diffusion dans le référentiel du centre de masse. Posons donc
k1 = kx̂
k2 = −kx̂
k3 = kn
k4 = −kn
(6.98)
où n est le vecteur unitaire dans la direction de la particule diffusée, faisant un angle θ avec l’axe
des x. Dans le premier terme de l’amplitude,
q = k1 − k3 = k(x̂ − n)
=⇒
q 2 = k 2 (2 − 2 cos θ) = 4k 2 sin2 θ/2
(6.99)
=⇒
q 2 = k 2 (2 + 2 cos θ) = 4k 2 cos2 θ/2
(6.100)
alors que, dans le second,
q = k1 − k4 = k(x̂ + n)
Dans le deux cas, ω = 0, car ε1 = ε2 = ε3 = ε4 dans ce référentiel. On calcule que (voir problème
1.8) que
dσ
1 |Mf i |2 |p3 | 1
=
(6.101)
dΩ
2 (8π)2 |p1 | E 2
80
6. Quantification du champ et interactions
où E est l’énergie totale des deux électrons incidents, énergie de masse comprise, soit 2m. Le
préfacteur 21 devant la première expressions de dσ/dΩ tient compte de l’identité des particules :
il faut éviter, dans le décomtpe des états finaux, de compter comme deux états distincts les configurations qui s’obtiennent l’une de l’autre par échange de particules identiques. Ce résultat est
cependant obtenu dans la normalisation relativiste des états. Pour adapter l’amplitude que nous
venons de calculer à cette normalisation, nous devons la multiplier par 4E1 E2 = 4m2 et supprimer
les facteurs de volume :
1
1
2 2
−
Mf i = 16πg m
4k 2 sin2 θ/2 4k 2 cos2 θ/2
(6.102)
16πg 2 m2 cos θ
=
k 2 sin2 θ
La section différentielle est alors
dσ
1 |Mf i |2 1
1
=
=
dΩ
2 (8π)2 4m2
4
2g 2 m
k 2 sin θ tan θ
2
1
=
4
g2
T sin θ tan θ
2
(6.103)
où T est l’énergie cinétique de chacune des particules incidente. Notons que cette formule est la
même si θ est remplacé par π − θ, ce qui équivaut à échanger les deux particules de l’état final. Ceci
est la conséquence de l’identité des particles, qui se manifeste par la somme sur les deux termes de
l’éq. (6.97). La section différentielle est piquée autour de θ = 0 et θ = π, et chute comme le carré
de l’énergie cinétique des particules incidentes, comme la section de Rutherford.
6.5 Équation de Klein-Gordon
L’équation de Schrödinger habituelle pour les particules libres
i
1 2
∂ψ
=−
∇ ψ
∂t
2m
(6.104)
n’est pas compatible avec la théorie de la relativité restreinte. Elle décrit des particules dont
l’énergie et la quantité de mouvement sont reliées par E = p2 /2m. Cela se constate immédiatement
par la correspondance entre énergie, quantité de mouvement et les opérateurs différentiels, soit
E→i
∂
∂t
p → −i∇
(6.105)
Une version relativiste de l’équation d’onde pour les ondes de matière a été proposée par Klein et
Gordon (1927) et suit de près les idées originales de Louis de Broglie. En appliquant la relation
relativiste entre énergie et quantité de mouvement, soit E 2 = p2 +m2 , à la correspondance ci-dessus,
on écrit l’équation suivante :
∂2ψ
∂2
− 2 = −∇2 ψ + m2 ψ ou
∇ 2 − 2 − m2 ψ = 0
(6.106)
∂t
∂t
habituellement appelée équation de Klein-Gordon. Cette équation est très semblable à l’équation
d’onde ordinaire, sauf pour un terme supplémentaire impliquant la masse. Si on substitue dans
cette équation une solution en forme d’onde plane
ψ(r, t) = ei(p·r−Et)
(6.107)
(−p2 + E 2 + m2 )ψ = 0
(6.108)
on trouve la contrainte évidente :
6.5. Équation de Klein-Gordon
81
L’une des raisons pour lesquelles Schrödinger proposa une équation différente pour décrire les ondes
de matière est que l’équation de Klein-Gordon est du deuxième ordre dans
p le temps, et donc que
l’énergie de la particule peut être à la fois négative ou positive : E = ± p2 + m2 . On ne savait
pas, à l’époque, comment interpréter ces solutions à énergie négative. La raison fondamentale pour
laquelle cette équation ne peut s’appliquer aux électrons est un peu plus subtile : cette équation,
pour être fondamentale, ne peut décrire que des bosons.
6.5.1 Le champ scalaire massif
Revenons à la théorie du champ scalaire, introduite plus haut comme modèle-jouet dans le but
de simplifier la discussion de l’interaction entre électrons et photons. Comme le potentiel vecteur,
dans la jauge de Coulomb, obéit à l’équation d’onde :
∂2
2
(6.109)
∇ − 2 A=0
∂t
le champ scalaire, qui correspond en fait à une sorte de champ électromagnétique duquel on aurait
retranché l’aspect vectoriel, devrait lui-aussi obéir à cette équation :
∂2
2
(6.110)
∇ − 2 φ=0
∂t
Une conséquence de cette équation est que les quanta du champ φ, créés par les opérateurs a†k , ont
la relation de dispersion suivante : E = |p| (ou ωk = k, comme écrit ci-haut).
Une autre conséquence est que la force que ce champ représente décroı̂t comme l’inverse du carré
de la distance. En effet, en présence de matière, le potentiel vecteur électromagnétique obéit à une
équation inhomogène :
∂2
2
∇ − 2 A = −4πJ
(6.111)
∂t
où J est la densité de courant. Par analogie, le champ scalaire, obtenu en élimimant la nature
vectorielle du potentiel vecteur, doit obéir à l’équation inhomogène suivante :
∂2
2
(6.112)
∇ − 2 φ = −4πgρ
∂t
où ρ est la densité de particules de matière (nous avons extrait de cette densité la constante g,
l’équivalent de la charge élémentaire pour le champ scalaire, au lieu d’utiliser une “densité de
charge”). Si on place une particule de matière fixe à l’origine, le champ scalaire créé par cette
particule ne dépend pas du temps et obéit à l’équation
∇2 φ = −4πgδ(r)
(6.113)
C’est l’équation de Poisson, la même qui régit le potentiel électrique en présence d’une charge
ponctuelle. La solution est donc la même :
φ(r) =
g
r
(6.114)
et la force correspondante, soit F = −∇φ, décroı̂t comme l’inverse du carré de la distance.
Supposons maintenant que les quantas du champ φ ont une masse m, au lieu d’être sans masse
comme les photons. Le champ devrait alors obéir à l’équation de Klein-Gordon et l’équation (6.112)
82
6. Quantification du champ et interactions
devrait être modifiée de la manière suivante : En coordonnées sphériques, cette équation a la forme
suivante :
∂2
2
2
∇ − 2 − m φ = −4πgρ
(6.115)
∂t
Pour une source ponctuelle fixe à l’origine, cette équation devient
∇2 − m2 φ = −4πgδ(r)
(6.116)
En coordonnées sphériques, cette équation est
1 ∂2
(rφ) − m2 φ = 0
r ∂r2
(r > 0)
(6.117)
en autant qu’on ne soit pas exactement à l’origine (r = 0). Si on définit la variable u = rφ, cette
équation devient
u00 − m2 u = 0 =⇒ u(r) = Ae−mr + Bemr
(6.118)
où A et B sont des constantes à déterminer. On peut immédiatement affirmer que B = 0, car
une solution exponentiellement croissante n’est pas physiquement acceptable. La solution pour φ
a donc la forme suivante :
A
φ(r) = e−mr
(6.119)
r
La valeur de la constante A peut être tirée de la solution connue dans la limite m → 0, soit A = g,
et donc
e−mr
φ(r) = g
(6.120)
r
La forme de ce champ en fonction de r est appelée potentiel de Yukawa. La force tirée de ce potentiel
décroı̂t exponentiellement, avec une distance caractéristique r0 = m−1 , la portée du potentiel.
Autrement dit, si des particules de matière interagissent par l’intermédiaire d’un champ scalaire
de masse m (au lieu d’interagir en échangeant des photons), leur force mutuelle va décroı̂tre exponentiellement, avec une portée égale à la longueur d’onde de Compton des bosons intermédiaires.
6.5.2 Théorie de Yukawa de l’interaction forte
Le physicien japonais Hideki Yukawa propossa, en 1935, que la force nucléaire devait sa très courte
portée au fait qu’elle était transmise par des particules massives, décrites par le champ scalaire cihaut. On appela ces particules hypothétiques mésons. En supposant que la portée de l’interaction
forte est de 1 à 2 fm, on conclut que la masse des mésons doit être située entre 100 et 200 MeV.
Notons qu’il doit y avoir trois type de mésons, de charges électriques ±e et zéro, qu’on note
respectivement π ± et π 0 . Le méson neutre π 0 est échangé lors de collisions entre protons ou entre
neutrons, comme illustré à l’éq. (6.96). Ce processus mène alors à une section différentielle de
diffusion semblable à celle que nous avons calculée à l’éq. (6.103), avec une diffusion prononcée
quand l’angle de diffusion est proche de zéro ou proche de π.
C’est effectivement ce qui est observé. Mais on observe la même dépendance angulaire lors de la
diffusion de neutrons sur des protons, ce qui peut laisser perplexe, car les protons et neutrons
ne sont pas des particules identiques, et que le fait que la section différentielle soit piquée à θ =
π provient justement de l’indiscernabilité des particules diffusantes, tel que représentée par le
deuxième diagramme de (6.96). La solution à ce paradoxe est que des processus d’échange de
6.6. Formulation lagrangienne
83
mésons chargés ont aussi lieu, qui permettent de convertir un neutron en proton ou vice-versa. Les
diagrammes de Feynman contribuant à la diffusion neutron-proton sont donc de la forme suivante :
n
p
+
π0
n
p
p
n
(6.121)
π+
n
p
Le diagramme de droite joue alors le même rôle que dans le diagramme (6.96) : il donne à la section
différentielle une symétrie par rapport à l’échange θ → π − θ. Notons que nous avons affublé la
ligne du champ π + d’une flèche, mais pas celle du champ π 0 . Ceci est lié au fait que le champ π 0
est sa propre antiparticule, alors que l’antiparticule du méson π + est le méson π − . Ceci sera clarifié
plus loin.
Découverte des mésons
La découverte, en 1937, parmi les rayons cosmiques, de particules de masse ∼ 105 MeV, fit penser
que la particule hypothétique de Yukawa était enfin révélée. On se rendit compte très rapidement
que cette particule n’avait pas les propriétés voulues. C’était en fait le muon, qu’on appelait initialement le méson-µ. Le véritable méson, le méson-π ou pion, fut découvert en 1947. Le méson
neutre (π 0 ) a une masse de 135.0 MeV et le méson chargé une masse de 139.6 MeV. En fait,
une pléthore de particules analogues au méson furent découvertes dans les années qui suivirent.
La théorie de Yukawa n’est manifestement pas une théorie fondamentale de l’interaction forte,
quoiqu’elle représente bien certaines de ses propriétés. Fondamentalement, les mésons sont formés
de quarks, comme les nucléons. Plus précisément, les mésons sont formés d’un quark lié à un
antiquark, et l’échange de mésons entre deux nucléons peut être vu comme la manifestation de
l’échange de quarks entre deux nucléons. Nous reviendrons sur ce sujet dans le chapitre portant
sur la classification des hadrons, les particules qui interagissent par l’interaction forte.
6.6 Formulation lagrangienne
La mécanique quantique est habituellement formulée en termes d’opérateurs agissant sur des états
appartenant à un espace de Hilbert. L’opérateur le plus important est le hamiltonien H, qui décrit
comment les états évoluent dans le temps, par l’équation de Schrödinger :
i
∂
|ψi = H|ψi
∂t
(6.122)
Cette formulation de la mécanique quantique porte le nom de “formalisme canonique”, car elle est
en correspondance directe avec la mécanique classique dans le formalisme canonique de Hamilton.
Cette formulation est très pratique dans le traitement des problèmes non relativistes, mais elle
souffre d’un défaut important : elle n’est pas manifestement invariante de Lorentz. En effet, le
temps, à travers l’opérateur de Hamilton H, joue ici un rôle privilégié par rapport aux autres
coordonnées. Il est difficile de juger, à partir de la forme du hamiltonien, si la théorie est invariante
de Lorentz ou non. Jusqu’ici, nous avons jugé de l’invariance de Lorentz à partir des équations
d’ondes associées, comme l’équation de Klein-Gordon ou l’équation de Dirac.
84
6. Quantification du champ et interactions
6.6.1 Rappels de mécanique de Lagrange
Les symétries d’une théorie sont beaucoup plus explicites dans le formalisme lagrangien. Rappelons
que, pour une théorie décrite par N coordonnées généralisées qi , le lagrangien L(qi , q̇i ) est une
fonction des coordonnées et de leurs dérivées par rapport au temps et que les équations classiques
du mouvement, dites équations de Lagrange, ont la forme suivante :
d ∂L
∂L
−
=0
dt ∂ q̇i
∂qi
(6.123)
Ces équations proviennent d’un principe variationnel, dit principe de la moindre action, qui stipule
que le mouvement réel (classique) du système qi (t) est celui qui rend l’action stationnaire, où
l’action est l’intégrale sur le temps du lagrangien :
Z
S[q] = dt L(qi , q̇i )
(6.124)
En effet, la variation de l’action qui accompagne une variation δqi (t) du mouvement entre les temps
initial et final considérés est
Z
Z
∂L
∂L
d ∂L
∂L
(6.125)
δS[q] = dt
δq +
δ q̇ = dt
−
δqi
∂qi i ∂ q̇i i
∂qi
dt ∂ q̇i
où on a supposé que la variation δqi s’annule aux temps initial et final et où on a intégré par
parties le deuxième terme. Si on demande que la variation δS soit nulle pour toute variation δqi (t)
possible, on doit admettre que l’expression entre accolades s’annule en tout temps et donc que les
équations de Lagrange s’appliquent.
Le passage de la formulation lagrangienne à la formulation hamiltonienne se fait premièrement en
définissant les variables conjuguées
∂L
pi =
∂ q̇i
et la fonction de Hamilton, qui est simplement la transformée de Legendre du lagrangien par
rapport à la variables q̇i (sommation sur i implicite) :
H = pi q̇i − L
(6.126)
Les N équations de Lagrange, du deuxième ordre dans le temps, sont alors équivalentes aux 2N
équations de Hamilton, du premier ordre dans le temps :
q̇i =
∂H
∂pi
ṗi = −
∂H
∂qi
(6.127)
6.6.2 Densité lagrangienne
Dans un théorie des champs, le nombre de degrés de libertés N tend vers l’infini. Pour fixer les
idées, considérons un champ scalaire φ. L’équivalent des coordonnées généralisées dans ce cas est
constitué de la valeur du champ φ(r) à chaque position de l’espace. La fonction de Lagrange est
alors l’intégrale sur l’espace d’une fonction L(φ, ∂µ φ) qu’on appelle la densité lagrangienne ou, par
abus de langage, lagrangien tout simplement :
Z
L = d3 r L(φ, ∂µ φ)
(6.128)
6.6. Formulation lagrangienne
85
Cette fonction dépend de la valeur du champ φ à un endroit donné et de ses dérivées spatiales et
temporelle, regroupées sous le symbole covariant ∂µ φ. Le même principe variationnel s’applique :
le champ φ(r, t) doit évoluer dans le temps et varier dans l’espace de manière à ce que l’action
Z
Z
S[φ] = dt L = d3 rdt L(φ, ∂µ φ)
(6.129)
soit stationnaire. On voit facilement que la variation de l’action associée à une variation δφ(r, t)
est
Z
Z
∂L
∂L
∂L
∂ ∂L
3
3
δφ +
δ∂ φ = d rdt
− µ
δφ
(6.130)
δS[φ] = d rdt
∂φ
∂∂µ φ µ
∂φ
∂x ∂∂µ φ
où nous avons intégré par parties sur tout l’espace et tout le temps pour obtenir la deuxième
égalité, en supposant que les termes aux frontières (à l’infini de l’espace-temps) sont nuls, en raison
de la décroissance suffisamment rapide du champs dans l’espace et dans le temps. Pour que l’action
soit stationnaire pour toute variation δφ, il faut que la quantité entre parenthèses s’annule en tout
temps et en tout lieu, et donc que l’équation suivante soit satisfaite :
∂L
∂ ∂L
− µ
=0
∂φ
∂x ∂∂µ φ
(6.131)
6.6.3 Action du champ scalaire
Appliquons ce raisonnement au champ scalaire et à l’équation de Klein-Gordon. Montrons que
dans ce cas la densité lagrangienne est simplement donnée par
Lφ =
1
1
∂µ φ∂ µ φ − m2 φ2
2
2
(6.132)
Une application directe de l’équation (6.131) donne
∂Lφ
= −m2 φ ,
∂φ
∂Lφ
= ∂µφ
∂∂µ φ
=⇒
−m2 φ − ∂µ ∂ µ φ = 0
(6.133)
ce qui n’est rien d’autre que l’équation de Klein-Gordon.
Notons tout de suite que l’invariance de Lorentz de cette équation est une conséquence de
l’invariance de Lorentz de la densité lagrangienne : si la densité lagrangienne est invariante, alors
l’action S, qui est son intégrale sur l’espace-temps, l’est aussi; si l’action est stationnaire dans un
référentiel, elle le sera donc dans tous les référentiels et l’équation d’onde correspondante devra
être satisfaite dans tous les référentiels. On doit pour cela supposer que le champ scalaire φ est
invariant de Lorentz. Ceci s’exprime par l’équation de transformation suivante :
φ0 (x0 ) = φ(x)
(6.134)
où les quantités primées sont définies dans un référentiel S 0 et les quantités non primées dans
le référentiel S (x sert d’abréviation pour les composantes xµ du quadrivecteur position). Étant
donné que le champ φ est un invariant de Lorentz, alors ∂µ φ forme un quadrivecteur covariant et
la densité lagrangienne ci-haut est manifestement invariante.
Ceci est un principe général très important. Les théories qui décrivent les particules fondamentales
sont toutes des théories de champs. Elles peuvent toutes être définies par une densité lagrangienne
qui doit être invariante de Lorentz. Dans le prochaine section, nous verrons comment définir une
théorie des électrons relativistes en se basant sur ce principe.
86
6. Quantification du champ et interactions
Problèmes
Problme 6.1
a) La densité d’impulsion du champ électromagnétique est proportionnelle au vecteur de Poynting :
π=
1
E∧B
4π
Démontrer comment passer de cette relation à la relation suivante pour l’impulsion du champ électromagnétique :
X †
P=
kajk ajk
j,k
b) Faites de même pour l’impulsion totale des électrons. À partir de l’expression de l’impulsion du champ de
Schrödinger, montrez que
X †
P=
kck ck
k
c) Étant donné l’expression de la densité d’impulsion du champ électromagnétique, il est naturel de poser que
le moment cinétique du champ est donné par l’expression suivante :
Z
1
d3 r r ∧ (E ∧ B)
L=
4π
Dans la jauge de Coulomb, on montre que cette expression est équivalente à l’expression suivante :
)
(
Z
X
1
3
L=
d r E∧A+
Ei (r ∧ ∇)Ai
4π
(6.135)
i
On associe le dernier terme au moment cinétique orbital du champ, alors que le premier terme est le moment
cinétique intrinsèque. Exprimez le premier terme en fonction des opérateurs de création et d’annihilation.
Utilisez à cette fin une base de polarisations circulaires, c’est-à-dire
ê1 =
x̂ + iŷ
√
2
ê2 =
x̂ − iŷ
√
2
où l’axe des z est dans la direction du vecteur d’onde. Interprétez votre résultat : quel est le spin du photon?
Problme 6.2
Considérons un champ quantique scalaire φ, dont le développement en modes est le suivant :
s
X
2π φ(r) =
aq eiq·r + a†q e−iq·r
Vωq
q
Imaginons que nous avons un moyen de “mesurer” ce champ en un endroit donné, mais que nos appareils sont
entachés d’une certaine erreur, de sorte qu’ils ne mesurent pas le champ φ(r) directement, mais une certaine
moyenne de ce champ autour d’une position donnée, qu’on définit comme
Z
Φ(r) = d3 r0 φ(r0 )f (r − r0 )
6.6. Formulation lagrangienne
87
où f est une fonction qui ne dépend que de la distance, qu’on prend comme étant une gaussienne de largeur
R:
1
r2
A=
f (r) = A exp − 2
R
(πR2 )3/2
La constante A est choisie de manière à normaliser la fonction f à l’unité. Cette fonction caractérise
l’imprécision de l’“appareil de mesure” et R est en quelque sorte la résolution de l’appareil.
a) Montrez que la valeur moyenne dans le vide du “champ flou” Φ(0) est nulle.
b) Calculez la fluctuation de ce champ dans le vide, c’est-à-dire sa variance, définie dans ce cas-ci comme
∆Φ2 = h0|Φ(0)2 |0i. Montrez que
1
∆Φ =
π
2
Z
∞
dq
0
q 2 −q2 R2 /2
e
ωq
c) Montrez que cette variance tend vers l’infini quand R → 0. Calculez l’intégrale dans les deux cas limites
où (i) R 1/m et (ii) R 1/m, m étant la masse du champ φ.
Indice : n’hésitez pas à vous servir du théorème de Parseval et de la notion de convolution. Toutes les intégrales
en jeu se font analytiquement, mais l’usage de tables ou de Mathematica est bien sûr permis.
Ceci démontre que les champs quantiques sont des quantités aux très fortes fluctuations. . .
Problme 6.3
Un champ scalaire ordinaire φ (∈ R) représente un boson neutre. Pourquoi ne peut-il pas représenter un boson
chargé électriquement?
Montrer que pour représenter un boson chargé électriquement, on doit utiliser deux champs scalaires réels φ1
et φ2 de propriétés identiques (i.e. de même masse). Comment effectuer le couplage de ces champs avec le
champ électromagnétique? Quels sont les diagrammes de Feynman possibles?
Montrez que ces deux champs décrivent non seulement des bosons chargés, mais aussi leurs antiparticules.
CHAPITRE 7
Théorie relativiste de l’électron
7.1 Spin et transformations de Lorentz
L’équation de Klein-Gordon (ou, si on préfère, le champ correspondant) ne peut pas décrire des
particules de spin 21 comme les électrons ou autres particules de matière. Lors d’une rotation, par
exemple, les deux composantes d’un spineur se combinent entre elles, alors qu’un champ scalaire
reste inchangé. Le problème est ici de trouver comment un spineur se transforme quand on passe
d’un référentiel à l’autre, de manière à pouvoir écrire une équation d’onde pour un spineur qui
soit la même dans tous les référentiels. Ceci nous mènera à l’équation de Dirac. Alors seulement
pourrons-nous décrire des électrons relativistes.
En guise d’introduction, considérons un spineur ψ = (ψ1 , ψ2 ) et rappelons-nous que l’opérateur du
moment cinétique de spin S, dans ce langage, est
S=
1
σ = (σ1 , σ2 , σ3 )
2
où les trois matrices de Pauli sont données par
0 1
0
σ1 =
σ2 =
1 0
i
−i
0
(7.1)
σ3 =
1
0
0
−1
(7.2)
Lorsqu’on procède à une rotation des axes, la valeur moyenne
ψ † σψ
(7.3)
se comporte comme un vecteur, mais les composantes du spineur se transforment différemment.
Plus précisément, le spineur transformé ψ 0 est
ψ 0 = Rψ
où R = cos θ/2 + in · σ sin θ/2
(7.4)
où n est la direction de l’axe de rotation et θ l’angle de rotation. Cette matrice R a la propriété
que
R† σR = R(σ)
(7.5)
où R est la matrice de rotation des axes associée à la rotation (n, θ). Par exemple, une rotation
d’angle θ dans le plan xy correspond à la matrice


cos θ
sin θ 0
R(ẑ, θ) =  − sin θ cos θ 0 
(7.6)
0
0
1
7.1. Spin et transformations de Lorentz
89
Comment peut-on généraliser cette loi de transformation d’un spineur à une transformation de
Lorentz? Considérons pour ce faire la matrice hermitique suivante, construite à l’aide des composantes du quadrivecteur position (ou en fait de tout autre quadrivecteur) :
0
x − x3
−x1 + ix2
= xµ σ µ
(7.7)
X(x) =
−x1 − ix2
x0 + x3
où on a introduit la notation σ 0 = 1 et σ µ = (σ 0 , σ 1 , σ 2 , σ 3 ). La matrice X est la matrice hermitique
2 × 2 la plus générale qui soit. Son déterminant est
det X(x) = (x0 )2 − (x1 )2 − (x2 )2 − (x3 )2 = xµ xµ
(7.8)
et est invariant de Lorentz.
Considérons la transformation matricielle suivante :
N †X 0N = X
(7.9)
où N est une matrice complexe unimodulaire (c’est-à-dire de déterminant unité). Notons que par
définition, X 0 = x0µ σ µ et donc que la matrice N met en correspondance un quadrivecteur xµ avec
un quadrivecteur transformé x0µ . Comme le déterminant d’un produit de matrices est le produit
des déterminants et que det N = det N † = 1, on trouve det X 0 = det X et donc
(x00 )2 − (x01 )2 − (x02 )2 − (x03 )2 = (x0 )2 − (x1 )2 − (x2 )2 − (x3 )2
(7.10)
C’est donc qu’une matrice N préserve les invariants de Lorentz et correspond donc à une transformation de Lorentz bien précise, spécifiée par une matrice de transformation 4 × 4 Λ :
x0µ = Λµ ν xν
ou x0µ = Λµ ν xν
(7.11)
où la matrice Λµ ν est l’inverse de la transposée de Λµ ν (i.e. Λµ α Λν α = δνµ ). Notons qu’il faut 4×2 = 8
paramètres pour spécifier une matrice complexe 2 × 2 générale, et que la condition de déterminant
unité impose une contrainte complexe qui réduit le nombre de paramètres à 6. Il faut aussi 6
paramètres pour spécifier une transformation de Lorentz générale (3 composantes pour la vitesse
relative des deux référentiels et 3 pour spécifier une rotation relative des axes). La transformation
(7.9) peut aussi s’écrire
N † x0µ σ µ N = N † Λµ ν xν σ µ N = xν σ ν
(7.12)
Comme cette relation vaut pour toute valeur de x, on en déduit que σ µ se comporte comme un
quadrivecteur contravariant, soit
N † Λµ ν σ µ N = σ ν
ou N † σ µ N = Λµ ν σ ν
On aurait tout aussi bien pu considérer la matrice suivante :
0
x + x3 x1 − ix2
X̃(x) =
= xµ σ̃ µ
x1 + ix2 x0 − x3
(7.13)
(7.14)
où σ̃ µ = (σ 0 , −σ 1 , −σ 2 , −σ 3 ), et introduire une transformation
M † X̃ 0 M = X̃
(7.15)
M † σ µ M = Λµ ν σ ν
(7.16)
pour aboutir à la propriété
Les matrices N et M sont reliées; on montrera plus bas que M = (N −1 )† .
90
7. Théorie relativiste de l’électron
Considérons maintenant des exemples précis de transformations. La matrice
−η/2
e
0
N =P =
0
eη/2
correspond à une transformation de Lorentz de rapidité η dans la direction z. En effet,
−η
cosh η − sinh η
0
e
0
† 0
=
= σ 0 cosh η − σ 3 sinh η
P σ P =
0
cosh η + sinh η
0 eη
(7.17)
(7.18)
et
† 3
P σ P =
e−η
0
0
−eη
=
cosh η − sinh η
0
0
− cosh η − sinh η
= σ 3 cosh η − σ 0 sinh η
(7.19)
= σ1
(7.20)
alors que
† 1
P σ P =
e−η/2
0
0
eη/2
0
0
e−η/2
eη/2
et pareillement pour σ 2 . On vérifie aussi que changer le signe de σ 1,2,3 , donc passer de N à M ,
requiert changer le signe de η, et donc que la même transformation de Lorentz correspond plutôt
à M = P −1 .
Comme deuxième exemple, considérons la matrice
iθ/2
e
N =R=
0
0
(7.21)
e−iθ/2
On vérifie dans ce cas que R† = R−1 et donc que P † σ 0 P = σ 0 . D’autre part,
−iθ/2
iθ/2
e
0
e
0
† 3
Rσ R=
= σ3
0
eiθ/2
0
−e−iθ/2
(7.22)
Enfin,
† 1
Rσ R=
e−iθ/2
0
0
eiθ/2
e−iθ/2
0
−ie−iθ/2
0
0
eiθ/2
=
0
eiθ
e−iθ
0
= σ 1 cos θ + σ 2 sin θ
(7.23)
et
† 2
Rσ R=
e−iθ/2
0
0
eiθ/2
0
ieiθ/2
=
0
ieiθ
−ie−iθ
0
= σ 2 cos θ − σ 1 sin θ
(7.24)
On constate donc que cette matrice R correspond à une rotation d’angle θ par rapport à l’axe
z. Il s’agit en fait de la même matrice de rotation qu’à l’éq. (7.4), dans le cas particulier n = ẑ.
L’éq. (7.4) donne la forme de la matrice R correspondant à une rotation générale. On vérifie que
la même rotation est obtenue en posant M = R.
Par contre, une transformation de Lorentz associée à une vitesse v générale correspond plutôt à la
matrice
N = P (v̂, η) = cosh η/2 − v̂ · σ sinh η/2
(7.25)
alors qu’une transformation générale (changement de référentiel plus rotation) peut toujours s’écrire
comme N = P R. La matrice M correspondante est alors M = P −1 R = (N † )−1 . En somme, la
relation entre M et N est
M = (N † )−1
(7.26)
7.1. Spin et transformations de Lorentz
91
7.1.1 Spineurs droits et gauches
La comparaison avec la transformation des spineurs non relativistes (éq. (7.4)) nous porte à poser
simplement qu’un spineur se transforme comme ψ 0 = N ψ ou ψ 0 = M ψ lors d’une transformation
de Lorentz. Pour distinguer ces deux possibilités, on définira un spineur droit ψR et un spineur
gauche ψL tels que
ψR0 = N ψR et ψL0 = M ψL
(7.27)
Les qualificatifs droit et gauches seront justifiés plus bas. La distinction entre spineurs gauche et
droit n’a pas d’importance si on se limite à des rotations, sans changement de référentiel.
Maintenant que nous savons comment les spineurs se transforment lors d’une transformation
générale de Lorentz, nous pouvons construire un lagrangien invariant L impliquant ces spineurs,
afin de construire théorie relativiste des particules de spin 21 . Pour cela, nous devons identifier des
invariants construits à partir de ces spineurs. Comme démontré plus haut, N † σ µ N = Λµ ν σ ν et
M † σ̃ µ M = Λµ ν σ̃ ν . Donc les combinaisons
ψR† σ µ ψR
et
ψL† σ̃ µ ψL
(7.28)
se transforment comme des quadrivecteurs. Par exemple,
ψR0† σ µ ψR0 = ψR† N † σ µ N ψR = Λµ ν ψR† σ ν ψR
(7.29)
D’autre part, comme M = (N † )−1 , la combinaison ψR† ψL et son conjugué complexe ψL† ψR sont des
invariants de Lorentz :
ψR0† ψL0 = ψR† N † M ψL = ψR† ψL
(7.30)
Les expressions suivantes sont donc des termes possibles d’une densité lagrangienne construite à
l’aides de spineurs :
iψL† σ̃ µ ∂µ ψL
iψR† σ µ ∂µ ψR
(ψL† ψR + ψR† ψL )
i(ψL† ψR − ψR† ψL )
(7.31)
Notons que toutes ces quantités sont réelles, ce qui nécessite la prémultiplication par i dans les
deux premiers cas. En effet, l’action S correspondant au premier terme est
Z
S = i d4 x ψL† σ̃ µ ∂µ ψL
(7.32)
Son conjugué complexe est alors
Z
Z
n o
† µ
∗
4
S = −i d x ∂µ ψL σ̃ ψL = −i d4 x ∂µ ψL† σ̃ µ ψL − ψL† σ̃ µ ∂µ ψL
(7.33)
Le premier terme entre accolades est une dérivée totale et disparaı̂t de l’action, car il se transforme
en intégrale sur une hypersurface d’espace-temps à l’infini par utilisation du théorème de Gauss,
et la variation du lagrangien est toujours supposée nulle sur la frontière du domaine d’intégration
(ici, l’infini). On trouve donc
Z
n
o
† µ
∗
4
S = −i d x −ψL σ̃ ∂µ ψL = S
(7.34)
L’action est donc réelle, grâce au préfacteur i.
Considérons donc une théorie construite à l’aide d’un seul type de spineur, droit ou gauche. Le
lagrangien le plus simple, quadratique dans le champ ψ, serait
L = iψL† σ̃ µ ∂µ ψL
ou L = iψR† σ µ ∂µ ψR
(7.35)
92
7. Théorie relativiste de l’électron
Une variation du champ ψR ou ψL mène directement aux équations d’onde suivantes :
σ̃ µ ∂µ ψL = 0
σ µ ∂µ ψR = 0
(7.36)
Pour voir quel type d’objet est décrit par ces équations, posons une solution de type onde plane :
µ
ψL = uL e−ip
µ
ψR = uR e−ip
xµ
xµ
(7.37)
En substituant dans les équations d’ondes ci-haut, on trouve
σ̃ µ pµ uL = 0
σ µ pµ u R = 0
(7.38)
Supposons de plus que ces ondes se déplacent dans la direction +z, de sorte que pµ = (E, 0, 0, −p)
(covariant). Ces équations deviennent explicitement
E+p
0
E−p
0
uL = 0
uR = 0
(7.39)
0
E−p
0
E+p
En supposant que l’énergie est nécessairement positive, on est forcé d’admettre uniquement les
solutions suivantes :
0
1
uL =
(E = p) et uR =
(E = p)
(7.40)
1
0
On constate que les objets décrits par ces solutions ont une masse nulle, car E = |p|. D’autre part,
la projection de spin associée à ψL est négative, et celle associée à ψR est positive.
7.1.2 hélicité
On définit l’hélicité comme la composante du spin s le long de la quantité de mouvement :
h = s · p̂
(7.41)
L’hélicité d’une particule sans masse est un invariant. En effet, la combinaison s · p̂ est un produit
scalaire, et donc déjà invariante par rotations dans l’espace. Il suffit de montrer ici qu’elle est
aussi invariante par rapport aux transformations de Lorentz dans la direction du mouvement de
la particule. Posons justement que la particule se dirige le long de l’axe des z, de sorte que p̂ = ẑ.
Dans ce cas, h = sz . Mais lors d’une transformation de Lorentz dans la direction z, le moment
cinétique dans cette direction reste inchangé, car en général son expression est Lz = xpy −ypx et les
composantes de r et de p perpendiculaires à la direction de la transformation ne sont pas affectées
par la transformation. Cette propriété du moment cinétique s’étend aussi au moment cinétique
intrinsèque (spin), même si celui-ci n’est pas exprimé en fonction de la position et de la quantité
de mouvement. La seule manière de changer l’hélicité serait de changer la direction de p̂, ce qui
peut se faire si la transformation de Lorentz nous permet de “dépasser” la particule, de sorte que
h = s · p̂ change de signe. Mais une particule sans masse se déplace toujours à la vitesse de la
lumière et ne peut être dépassée. Donc l’hélicité h est un invariant de Lorentz.
Les solutions trouvées ci-haut montrent que le spineur ψL a une hélicité négative, soit un spin
antiparallèle à sa vitesse. On dit que ceci correspond à une polarisation circulaire gauche, d’où le
qualificatif “gauche” associé à ce type de spineur. Le contraire prévaut pour le spineur ψR .
7.2. Équation de Dirac
93
7.2 Équation de Dirac
Un champ de spineur ψR ou ψL ne peut décrire, en soi, que des particules de spin 12 sans masse
comme les neutrinos. Pour décrire une particule massive comme l’électron, nous devons combiner
des spineurs droit et gauche. Nous devons écrire une densité lagrangienne invariante de Lorentz
impliquant à la fois ψR et ψL , à l’aide des termes figurant dans (7.31). Si nous demandons en plus
que la théorie soit invariante par inversion de l’espace (transformation de parité), il faut aussi que
la densité lagrangienne reste la même lorsqu’on intervertit ψL et ψR . En effet, une inversion de
l’espace change la polarisation droite en polarisation gauche et vice-versa. Une autre façon de le
voir est que l’inversion de l’espace change le signe du vecteur vitesse (ou quantité de mouvement)
mais préserve l’orientation du vecteur moment cinétique, de sorte que l’hélicité h = s · p̂ change de
signe. La seule possibilité simple pour la densité lagrangienne est
LD = iψL† σ̃ µ ∂µ ψL + iψR† σ µ ∂µ ψR − m(ψL† ψR + ψR† ψL )
(7.42)
Nous verrons que le paramètre m correspond à la masse des particules.
Plutôt que de travailler avec des spineurs droit et gauche séparés, on les combine généralement en
un seul spineur à quatre composantes, dit spineur de Dirac :
ψL
ψ=
(7.43)
ψR
On peut alors écrire la densité lagrangienne ainsi :
µ
σ̃
0
0 1
†
†
L = iψ
∂µ ψ − mψ
ψ
0 σµ
1 0
On définit en outre les matrices 4 × 4 suivantes :
0 1
0
γ =
1 0
k
γ =
0
−σ k
σk
0
(7.44)
(7.45)
ce qui équivaut à
µ
γ =γ
0
σ̃ µ
0
0
σµ
(7.46)
On les appelle matrices de Dirac. Enfin, on définit le spineur conjugué ψ̄ comme
ψ̄ = ψ † γ 0
(7.47)
La densité lagrangienne peut alors s’écrire de la manière suivante :
LD = iψ̄γ µ ∂µ ψ − mψ̄ψ
(7.48)
L’avantage de définir le spineur conjugué ψ̄ est que la combinaison ψ̄ψ est un invariant de Lorentz,
alors que la combinaison ψ̄γ µ ψ est un quadrivecteur.
Une fois la forme de la densité lagrangienne établie, nous pouvons appliquer le principe de la
moindre action et trouver les équations de Lagrange correspondantes. Lors d’une variation δψ du
spineur de Dirac, le spineur conjugué varie comme δ ψ̄ = δψγ 0 . La variation de l’action de Dirac
qui s’ensuit est
Z
δS[ψ] = d4 x δ ψ̄ iγ µ ∂µ ψ − mψ + iψ̄γ µ ∂µ δψ − mψ̄δψ
Z
(7.49)
4
µ
µ
= d x δ ψ̄ iγ ∂µ ψ − mψ + −i∂µ ψ̄γ − mψ̄ δψ
94
7. Théorie relativiste de l’électron
où on a intégré par parties dans la dernière parenthèse. Comme le champ ψ est complexe, on peut
considérer que ses parties réelle et imaginaire varient de manière indépendante, ce qui se traduit
par des variations δψ et δ ψ̄ indépendantes. Le principe de la moindre action se traduit donc par
les équations séparées
iγ µ ∂µ ψ − mψ = 0 et − i∂µ ψ̄γ µ − mψ̄ = 0
(7.50)
On montre que ces équations sont en fait équivalentes. La première de ces équations est la célèbre
équation de Dirac.
7.2.1 Propriétés des matrices de Dirac
Avant d’étudier les solutions à l’équation de Dirac, signalons que les matrices de Dirac ne prennent
pas toujours la forme (7.45). Il est possible d’appliquer une transformation unitaire ψ → U ψ sur
les spineurs de Dirac et de modifier en même temps les matrices de Dirac par γ µ → U γ µ U † sans
modifier ni l’action, ni l’équation de Dirac.
La représentation (7.45) est qualifiée de chirale, alors que nous allons surtout utiliser la représentation
de Dirac :
I 0
0
σi
0
i
γ =
γ =
(7.51)
0 −I
−σi 0
On vérifie que cette représentation s’obtient de (7.45) par la transformation
1
I I
µ
µ †
γ → U γ U où U = √
2 −I I
(7.52)
ceci correpond à l’utilisation du spineur
1
ψ=√
2
ψL + ψR
−ψL + ψR
(7.53)
Quelle que soit la représentation, on vérifie que les matrices de Dirac ont les propriétés suivantes :
γ 0 γ µ γ 0 = (γ µ )†
γ µ γ ν + γ ν γ µ = 2g µν
(7.54)
7.2.2 Solution de l’équation de Dirac
Trouvons maintenant les solutions à l’équation de Dirac sous la forme d’ondes planes :
µ
ψ = ψp ei(p·r−Et) = ψp e−ipµ x
(7.55)
En substituant dans l’équation de Dirac, on trouve
!
0
iγ (−iE) + i
X
j
γ (ipj ) − m ψp = 0
(7.56)
j
Après prémultiplication par γ 0 , on trouve
!
X
0 j
0
E−
γ γ pj − mγ ψp = 0
j
ou
m
p·σ
p·σ
−m
ψp = Eψp
(7.57)
7.2. Équation de Dirac
95
(avec la représentation de Dirac (7.51)). Il s’agit d’une équation aux valeurs propres : les valeurs possibles de E sont les valeurs propres de la matrice qui multiplie ψp et les spineurs ψp sont les vecteurs
propres associés. Les valeurs propres se trouvent en solutionnant l’équation caractéristique :
m − E
p · σ 2
2
2
(7.58)
p · σ −m − E = 0 =⇒ E − m − p = 0
p
Si on définit Ep = p2 + m2 , alors les valeurs propres sont E = ±Ep . Il y a donc des solutions à
énergie positive et d’autres à énergie négative.
Déterminons maintenant la forme des vecteurs propres associés. Pour faciliter les choses, commençons par le cas de particules immobiles (p = 0). L’équation aux valeurs propres prend alors la
forme très simple
m
0
ψ0 = Eψ0
(7.59)
0 −m
et les vecteurs propres normalisés, notés ui (i = 1, 2, 3, 4) sont simplement
 
 
 
0
0
1
1
0
0
 
 
E = −m : u3 =  
E = m : u1 =   u2 =  
1
0
0
0
0
0
 
0
0
u4 =  
0
1
(7.60)
Utilisons ensuite un truc pour trouver les solutions associées à des valeurs non nulles de p.
L’équation qu’on veut résoudre est (iγ µ ∂µ − m)ψ = 0 et la solution recherchée a la forme
µ
ψ = ψp e−ipµ x en fonction du quadrivecteur impulsion covariant pµ = (Ep , −p). Appliquer la
dérivée ∂µ sur l’exponentielle revient à remplacer ∂µ par −ipµ et l’équation de Dirac devient
(pµ γ µ − m)ψp = 0. Or, tout spineur de la forme (pµ γ µ + m)ψ0 est une solution à cette équation,
car
(pµ γ µ − m)(pν γ ν + m) = pµ pν γ µ γ ν − m2 =
(7.61)
et
pµ pν γ µ γ ν =
1
p p (γ µ γ ν + γ ν γ µ ) = pµ pν g µν = E 2 − p2
2 µ ν
(7.62)
Donc
(pµ γ µ − m)(pν γ ν + m) = Ep2 − p2 − m2 = 0
(7.63)
Il suffit donc d’appliquer l’expression matricielle (pν γ ν + m) aux solutions trouvées ci-haut pour
p = 0 pour obtenir les solutions correspondant à une quantité de mouvement p 6= 0. Après
normalisation, on trouve



p
1


m + Ep




1


0 



 up,1 = p2E  σ · p
1
p
p
Ep
m + Ep 0






0

 up,2 = idem avec
1

(7.64)


−σ · p
1


p



1 

 Ep + m 0 


 up,3 = p2E  p
1 
p
Ep + m
−Ep
0






0

 up,4 = idem avec
1
96
7. Théorie relativiste de l’électron
Ces quatre vecteurs propres sont orthonormés :
u†j uk = δjk
(j, k = 1, 2, 3, 4)
(7.65)
Il est clair que les solutions trouvées correspondent à des particules de spin 12 , mais l’existence de 4
solutions (au lieu de deux) et la présence de solutions à énergie négative soulève des questions! Nous
y répondrons dans la section suivante, en procédant à la deuxième quantification de l’équation de
Dirac.
7.3 Deuxième quantification du champ de Dirac
En multipliant l’équation de Dirac par γ 0 , on trouve une forme qui nous rapproche de l’équation
de Schrödinger :
X
∂ψ
m
−iσ · ∇
0 j ∂
0
i
γ γ
= Hψ où H = −i
+ mγ =
(7.66)
−iσ · ∇
−m
∂t
∂xi
j
La forme du hamiltonien en deuxième quantification devrait donc être
Z
H = d3 r ψ † Hψ
(7.67)
En introduisant les transformées de Fourier :
ψ(r) =
1X
ψ eip·r
V p p
(7.68)
on trouve plutôt
H=
1X †
ψ
V p p
p·σ
−m
m
p·σ
ψp
(7.69)
Notons que les spineurs trouvés plus haut (7.64) sont précisément les vecteurs propres de la matrice
qui apparaı̂t dans cette expression. En fonction de ces spineurs, on introduit la décomposition
√
ψp = V cp,1 up,1 + cp,2 up,2 + cp,3 up,3 + cp,4 up,4
(7.70)
et on trouve le hamiltonien
H=
X
Ep c†p,1 cp,1 + c†p,2 cp,2 − c†p,3 cp,3 − c†p,4 cp,4
(7.71)
p
Nous avons procédé exactement de la même manière que pour le champ de Schrödinger, et les
opérateurs cp,j doivent également obéir à des relations d’anticommutation :
{cp,j , c†p0 ,j 0 } = δp,p0 δjj 0
{cp,j , cp0 ,j 0 } = 0
(7.72)
On pourrait également calculer l’opérateur de la quantité de mouvement, et trouver facilement
Z
X †
P = d3 r ψ † (−i∇)ψ =
p cp,j cp,j
(7.73)
p,j
De même, l’opérateur du nombre de particules serait
Z
X †
cp,j cp,j
N = d3 r ψ † ψ =
p,j
(7.74)
7.3. Deuxième quantification du champ de Dirac
97
7.3.1 Antiparticules
Nous n’avons toujours pas réglé la question des états d’énergie négative, créés en agissant avec les
opérateurs c†p,3 et c†p,4 . Il s’agit d’un problème en apparence très sérieux, car si on peut créer des
états d’énergie négative en appliquant c†p,3 et c†p,4 sur le vide |0i, c’est que le vide n’est pas l’état
fondamental. Dans ce cas, l’état fondamental serait obtenu en occupant tous les états d’énergie
négative, et il y en a deux pour chaque valeur de quantité de mouvement possible! Cet état fondamental contiendrait un nombre infini de particules et serait l’analogue de ce qu’on appelle la mer
de Fermi en physique de l’état solide. On l’appelle de fait la mer de Dirac. Annihiler une particule
d’énergie négative de la mer de Dirac revient à augmenter l’énergie du système de Ep et modifier la
quantité de mouvement du système de −p. En fait, point n’est besoin d’imaginer la mer de Dirac
pour résoudre le problème des états d’énergie négative. C’est un simple problème d’interprétation.
Il suffit de définir de nouveaux opérateurs :
dp,1 = c†−p,3
et
dp,2 = c†−p,4
(7.75)
Ces opérateurs obéissent aux même relations d’anticommutation que les autres :
{dp,j , d†p0 ,j 0 } = δp,p0 δjj 0
{dp,j , dp0 ,j 0 } = 0
(7.76)
(ceci ne serait pas vrai pour des bosons, car un changement de signe des commutateurs serait
survenu). On définit ensuite le vide |0i ainsi :
cp,1 |0i = cp,2 |0i = dp,1 |0i = dp,2 |0i = 0
(7.77)
Le hamiltonien prend alors la forme suivante :
X
†
†
†
†
Ep cp,1 cp,1 + cp,2 cp,2 − dp,1 dp,1 − dp,2 dp,2
H=
(7.78)
p
ce qui devient, en utilisant les relations d’anticommutation,
X
X
Ep
Ep c†p,1 cp,1 + c†p,2 cp,2 + d†p,1 dp,1 + d†p,2 dp,2 − 2
H=
(7.79)
p
p
Le dernier terme est une constante. Une constante infinie, malheureusement, mais une constante
tout de même, et on peut la laisser tomber, car l’énergie est de toute manière définie à une constante
près. Une autre façon de voir les choses, est que le hamiltonien intervient à travers l’équation de
Heisenberg Ȧ = i[H, A], et qu’une constante additive à H ne contribue pas au commutateur, et
donc n’a aucun impact. Cette constante est en fait l’énergie de la mer de Dirac définie plus haut.
Comme les définitions (7.75) font intervenir un changement dans le signe de la quantité de mouvement, on préserve quand même la forme correcte de l’opérateur quantité de mouvement :
X †
P=
p cp,1 cp,1 + c†p,2 cp,2 + d−p,1 d†−p,1 + d−p,2 d†−p,2
p
X †
=
p cp,1 cp,1 + c†p,2 cp,2 − d†−p,1 d−p,1 − d†−p,2 d−p,2
(7.80)
p
=
X †
p cp,1 cp,1 + c†p,2 cp,2 + d†p,1 dp,1 + d†p,2 dp,2
p
Par contre, l’opérateur du nombre de particules est vraiment modifié par la transformation (7.75) :
X †
(7.81)
N=
cp,1 cp,1 + c†p,2 cp,2 − d†p,1 dp,1 − d†p,2 dp,2
p
98
7. Théorie relativiste de l’électron
et rien ne peut changer les signes des deux derniers termes. Mais c’est ici que l’interprétation des
solutions prend toute sa richesse : les particules créées par les opérateurs d†p,j ne sont pas des
particules, mais des antiparticules! Elles ont les mêmes propriétés que les particules créées par les
opérateurs c†p,j , mais une charge opposée. L’opérateur N représente le nombre de particules, moins
le nombre d’antiparticules, soit la charge électrique (divisée par −e dans le cas des électrons).
Autrement dit, les antiparticules contribuent de manière négative au nombre de particules et à la
charge électrique.
La théorie de Dirac prédit donc l’existence d’antiparticules à l’électron, et en fait à toutes les
particules de spin 12 . L’anti-électron porte le nom de positron et a été identifié dès 1931 par Carl
Anderson.
Notons enfin que, en fonction des opérateurs de création et d’annihilation, le champ de Dirac a
l’expression suivante :
1 XX
ψ(r) = √
cp,j up,j eip·r + d†p,j vp,j e−ip·r
(7.82)
V p j=1,2
où on a définit des spineurs appropriés aux antiparticules :
vp,1 = u−p,3
vp,2 = u−p,4
(7.83)
7.4 L’électrodynamique quantique
7.4.1 Transformations de jauge et couplage minimal
Rappelons les propriétés des transformations de jauge du champ électromagnétique. Le potentiel
électromagnétique Aµ = (Φ, −A) n’est pas défini de manière unique, pour une configuration donnée
des champs E et B. On peut procéder à une transformation
Aµ → A0µ = Aµ − ∂µ ξ
où ξ est une fonction quelconque de l’espace-temps. Cette transformation n’affecte pas les champs
E et B, qui sont contenus dans le tenseur de Faraday, car
0
Fµν
= ∂µ A0ν − ∂ν A0µ = ∂µ Aν − ∂ν Aµ − ∂µ ∂ν ξ + ∂ν ∂µ ξ = Fµν
D’un autre côté, le potentiel électromagnétique apparaı̂t aussi dans le couplage de la matière au
champ électromagnétique, par exemple, dans l’équation de Schrödinger
i∂t ψ =
1
(−i∇ − eA)2 ψ + Φψ
2m
(7.84)
Le potentiel électromagnétique, dans cet exemple, intervient par la substitution suivante :
∂µ → Dµ = ∂µ + ieAµ
~ = ∇ − ieA, et l’équation de
où Dµ est appelée la dérivée covariante. En effet, D0 = ∂t + ieΦ et D
Schrödinger dans un champ électromagnétique peut alors s’écrire comme suit :
iD0 ψ = −
1 ~2
Dψ
2m
(7.85)
7.4. L’électrodynamique quantique
99
Il est clair que la transformation de jauge doit aussi affecter la fonction d’onde ψ de la manière
suivante :
ψ → ψ 0 = ψeieξ
Dans ce cas, la dérivée covariante Dµ ψ se transforme de la même manière que ψ :
D0µ ψ 0 = (∂µ + ieA0µ )ψ 0 = (∂µ + ieAµ − ie∂µ ξ)(eieξ ψ)
= eieξ ∂µ ψ + ie(∂µ ξ)eieξ ψ + ieAµ (eieξ ψ) − ie∂µ ξ(eieξ ψ)
= eieξ ∂µ ψ + ieAµ ψ
= eieξ Dµ ψ
De même, si on applique la dérivée covariante plusieurs fois, un seul facteur de phase émerge. Par
exemple,
Dµ Dν ψ → eieξ Dµ Dν ψ
comme cela se vérifie facilement, puisque Dν ψ se transforme exactement comme ψ, et ainsi de
suite.
L’équation de Schrödinger transformée est simplement
1 ieξ ~ 2
e Dψ
2m
c’est-à-dire la même qu’avant, puisque le facteur de phase s’élimine de l’équation.
ieieξ D0 ψ = −
(7.86)
L’introduction d’un champ électromagnétique permet donc d’élargir la symétrie de phase de la
fonction d’onde en mécanique quantique. Au lieu d’avoir une symétrie de la théorie lors de la multiplication de la fonction d’onde ψ par une phase globale (i.e. constante) eiθ , nous avons maintenant
une symétrie lors de la multiplication par une phase locale eieξ(r,t) quelconque. Une symétrie caractérisée par des changements ou transformations locales comme celle-ci porte le nom de symétrie
de jauge. La prescription qui consiste à remplacer les dérivées ordinaires ∂µ par des dérivées covariantes Dµ afin de garantir l’invariance de jauge porte le nom de couplage minimal.
Appliquons le couplage minimal à l’équation de Dirac (iγ µ ∂µ − m)ψ = 0. On trouve alors
(iγ µ Dµ − m)ψ = (iγ µ ∂µ − eAµ γ µ − m)ψ = 0
(7.87)
Le lagrangien associé à cette équation est alors
LD = ψ̄(iγ µ Dµ − m)ψ = ψ̄(iγ µ ∂µ − eAµ γ µ − m)ψ
(7.88)
Le couplage du champ de Dirac avec le champ électromagnétique prend la forme
L 1 = Aµ J µ
J µ = −eψ̄γ µ ψ
où J µ est le quadrivecteur courant associées au particules décrites par ψ (par exemple, les électrons
et les positrons).
La charge électrique est l’intégrale sur l’espace de la densité de charge, soit ρ = J 0 = eψ̄γ 0 ψ =
eψ † ψ :
Z
Z
3
Q = d r ρ(r) = e d3 r ψ † ψ
Ceci coı̈ncide (au facteur e près) avec l’expression de l’opérateur N du nombre de particules introduit plus haut. En substituant le développement en modes (7.82), on trouve
XX †
†
Q=
cp,j cp,j − dp,j dp,j
p j=1,2
100
7. Théorie relativiste de l’électron
ce qui démontre que les antiparticules ont la charge opposée des particules.
7.4.2 Hamiltonien d’interaction électron-photon
Le Hamiltonien d’interaction électron-photon est l’opposé du lagrangien d’interaction, soit
Z
H = e d3 r Aµ ψ̄γ µ ψ =
(7.89)
Dans la jauge de Coulomb, A0 = 0 et donc
Z
H = −e
d3 r A · ψ̄γψ =
(7.90)
En substituant les développements en mode (7.82) et (6.66), on trouve
s
Z
X X
2π e
d3 r
ajk êjk eik·r + a†jk ê∗jk e−ik·r ·
H=−
V
ωk V
j,k s,s0 ,p,p0
0
0
c†p,s ūp,s e−ip·r + dp,s v̄p,s eip·r γ cp0 ,s0 up0 ,s0 eip ·r + d†p0 ,s0 vp0 ,s0 e−ip ·r
(7.91)
Le développement s’effectue comme suit :
s
Z
X X 1
2π
3
HI = −e d r
V ωq V
0
0
p,p ,q j,j ,r
0
0
0
0
c†p,j cp0 ,j 0 arq (ūp,j γup0 ,j 0 ) · êr,q eir·(−p+p +q) + c†p,j d†p0 ,j 0 arq (ūp,j γvp0 ,j 0 ) · êr,q eir·(−p−p +q)
c†p,j cp0 ,j 0 a†rq (ūp,j γup0 ,j 0 ) · ê∗r,q eir·(−p+p −q) + c†p,j d†p0 ,j 0 a†rq (ūp,j γvp0 ,j 0 ) · ê∗r,q eir·(−p−p −q)
0
0
dp,j cp0 ,j 0 arq (v̄p,j γup0 ,j 0 ) · êr,q eir·(p+p +q) + dp,j d†p0 ,j 0 arq (v̄p,j γvp0 ,j 0 ) · êr,q eir·(p−p +q)
dp,j cp0 ,j 0 a†rq (v̄p,j γup0 ,j 0 )
·
0
ê∗r,q eir·(p+p −q)
+
dp,j d†p0 ,j 0 a†rq (v̄p,j γvp0 ,j 0 )
·
0
ê∗r,q eir·(p−p −q)
L’intégrale sur r permet d’éliminer l’un des vecteurs d’ondes :
s
XX
2π
HI = −e
ωq V
0
p,q
j,j ,r
c†p,j cp−q,j 0 arq (ūp,j γup−q,j 0 )
c†p,j cp+q,j 0 a†rq (ūp,j γup+q,j 0 )
· êr,q + c†p,j d†−p+q,j 0 arq (ūp,j γvp−q,j 0 ) · êr,q
· ê∗r,q + c†p,j d†−p−q,j 0 a†rq (ūp,j γvp+q,j 0 ) · ê∗r,q
dp,j c−p−q,j 0 arq (v̄p,j γu−p−q,j 0 ) · êr,q + dp,j d†p+q,j 0 arq (v̄p,j γvp−q,j 0 ) · êr,q
dp,j c−p+q,j 0 a†rq (v̄p,j γu−p+q,j 0 )
·
ê∗r,q
+
dp,j d†p−q,j 0 a†rq (v̄p,j γvp+q,j 0 )
·
ê∗r,q
Chacun de ces huit termes correspond à un processus particulier et à un type de vertex distinct
dans la théorie des perturbations ordinaires. En fonction de véritables diagrammes de Feynman,
ces huit termes ne représentent qu’un seule vertex, soit le vertex fondamental de la QED. Les huit
termes sont illustrés à la figure 7.1, dans le même ordre que ci-haut. Par convention et afin de
les distinguer, les lignes associées au électrons sont munies d’une flèche orientée de l’état initial
vers l’état final, alors que les lignes associées aux positrons sont munies de flèches orientées en
sens contraire. Dans les véritables diagrammes de Feynman, ces flèches sont conservées, mais on ne
7.4. L’électrodynamique quantique
101
Figure 7.1. Les huit différents vertex associés à l’interaction électron-photon dans la
théorie des perturbations ordinaire. Dans la théorie covariante des perturbations, c.-àd. dans les diagrammes de Feynman, tous ces vertex se fondent en un seul.
distingue pas les électrons des positrons virtuels; on se doit cependant de conserver la continuité des
flèches aux vertex. Selon une interprétation commune, les antiparticules sont comme des particules
qui se propagent à l’envers dans le temps (d’où le signe négatif de l’énergie dans l’exponentielle
associée à la dépendance temporelle).
7.4.3 Règles de Feynman
Le calcul des diagrammes de Feynman peut se faire en suivant les règles suivantes, dites règles de
Feynman:
1. Pour un processus donné, identifier les états inital et final et dessiner les lignes correspondantes.
Les lignes sont affublées de flèches pour distinguer les particules (flèches dirigées vers les haut)
des antiparticules (flèches dirigées vers le bas). Un photon est représenté par une ligne ondulée,
sans flèche (le photon est sa propre antiparticule).
2. Construire les diagrammes possibles à un ordre donné de la théorie des perturbations en reliant les lignes par des vertex et en insérant des lignes internes, correspondant à des particules
virtuelles, au besoin. Le nombre de vertex correspond à l’ordre dans le théorie des perturbations.
Dans l’amplitude au carré, à chaque vertex correspond un facteur e2 = α ≈ 1/137.
3. Chaque ligne porte une certaine quadri-impulsion: notons-la pi pour les lignes externes, et qi
pour les lignes internes. La direction de cette quadri-impulsion est arbitraire, c.-à-d. affaire de
convention. On peut faire une analogie avec les lois de Kirchhoff dans la théorie des circuits. La
quadri-impulsion est conservée à chaque vertex.
4. La contribution du diagramme à iM, où M est l’amplitude invariante du processus (normalisation relativiste) se calcule ensuite comme indiqué au tableau 7.1.
a) À chaque ligne externe est associé un facteur associé au type de particule entrante ou sortante.
b) À chaque ligne interne est associé un propagateur.
c) À chaque vertex est associé un facteur proportionnel à e, et à une fonction delta imposant
la conservation de la quadri-impulsion.
102
7. Théorie relativiste de l’électron
5. La conservation de la quadri-impulsion entre les états initial et final est une conséquence de
sa conservation à chaque vertex. Cependant, le facteur global (2π)4 δ(p1 + p2 + · − pn ) associé
à la conservation de l’énergie-impulsion doit être amputé, pour obtenir l’amplitude M (par
opposition à M . Voir à cet effet la discussion du chapitre 1).
6. On doit intégrer sur toute quadri-impulsion interne qi qui n’est pas fixée par la conservation de
la quadri-impulsion à chaque vertex. En pratique, à chaque boucle du diagramme correspond
une intégration. On doit aussi sommer sur tout indice de polarisation ou de spineur associé à
une ligne interne.
7. Les diagrammes qui diffèrent par la permutation de deux lignes externes associées à des fermions
indiscernables doivent être combinés avec un signe relatif. De plus, toute boucle interne de
fermions doit être accompagnée d’un facteur −1.
Tableau 7.1 Facteurs associés aux différents éléments d’un diagramme de Feynman.
fermion initial
uα (p)
fermion
ūα (p)
final
antifermion initial
vα (p)
antifermion final
v̄α (p)
photon initial
εµ
α
α
α
α
µ
µ
photon
final
fermion virtuel
photon virtuel
ε∗µ
(pµ γ µ + m)βα
p 2 − m2
gµν
−i 2
q
i
α
µ
β
ν
β
vertex
µ
4
µ
−ie(γ )βα (2π) δ(q1 − q2 + q3 )
α
Ces règles sont applicables dans la normalisation relativiste des états. Dans cette normalisation,
les facteurs (2Ep )−1/2 qui apparaissent devant les spineurs (7.64) disparaissent. Les spineurs ont
7.4. L’électrodynamique quantique
103
les propriétés suivantes :
ūp,j up,j 0 = 2mδjj 0
v̄p,j vp,j 0 = −2mδjj 0
ūp,j vp,j 0 = v̄p,j up,j 0 = 0
(7.92)
Les spineurs forment aussi une base complète dans l’espace des spineurs, ce qui se traduit par les
relations
X
X
(vp,j )α (v̄p,j )β = (pµ γ µ − m)αβ
(7.93)
(up,j )α (ūp,j )β = (pµ γ µ + m)αβ
j=1,2
j=1,2
Somme sur les polarisations et formules des traces
Très souvent, on doit faire la somme de la section efficace sur les polarisations possibles de l’état
final (si la polarisation des particules finales n’est pas observée dans une expérience) et la moyenne
sur les polarisations des particules initiales (si les particules initiales ne sont pas préparées dans
un état de polarisation donnée). Il s’agit d’une somme des carrés des amplitudes, et elle permet
généralement de simplifier considérablement le résultats. La formule suivante, dite formule de
Casimir, permettent d’effectuer cette somme :
X
[ū(p1 )Γu(p2 )][ū(p1 )Γ0 u(p2 )]∗ = Tr [Γ(p2 · γ + m2 )Γ0 (p1 · γ + m2 )]
(7.94)
j=1,2
0
où Γ et Γ sont des matrices 4 × 4, comme des matrices de Dirac ou des combinaisons ou produits
de matrices de Dirac. L’expression p · γ signifie bien sûr pµ γ µ .
Le calcul des traces s’effectue en utilisant les formules suivantes :
Tr (γ µ γ ν ) = 4g µν
Tr (γ µ γ ν γ ρ γ λ ) = 4(g µν g ρλ − g µρ g νλ + g µλ g ρν )
(7.95)
7.4.4 Exemples de processus
Indiquons quelques processus décrits par la théorie de l’interaction électron-photon, et les diagrammes de Feynman associés à l’ordre le plus bas de la théorie des perturbations.
1. Diffusion électron-muon:
3
4
(7.96)
1
2
Dans ce processus, l’important est que les deux fermions qui diffusent l’un sur l’autre ne soient pas
identiques. Le muon est représenté par une ligne pointillée pour le distinguer de l’électron, mais
ceci est tout-à-fait arbitraire. Une application des règles de Feynman mène à l’amplitude suivante :
M=−
e2
[ū γ µ up1 ,j1 ][ūp4 ,j4 γ µ up2 ,j2 ]
(p1 − p3 )2 p3 ,j3
(7.97)
La somme sur les polarisation (j1,2,3,4 ) du carré de l’amplitude, effectuée à l’aide de la formule de
Casimir et des formules de traces, donne
h|M|2 i =
8e4
(p1 · p2 )(p3 · p4 ) + (p1 · p4 )(p2 · p3 ) − M 2 (p1 · p3 ) − m2 (p2 · p4 ) − 2m2 M 2
4
(p1 − p3 )
(7.98)
104
7. Théorie relativiste de l’électron
où m est la masse de l’électron et M celle du muon.
À partir de cette formule, on peut démontrer la formule de Mott pour la section différentielle de
diffusion dans le repère du muon initial, en supposant que celui-ci est infiniment massif par rapport
à l’électron :
2
2
e2
dσ
=
m + p2 cos2 θ/2
(7.99)
2
2
dΩ
2p sin (θ/2)
où p est la quantité de mouvement de l’électron initial et θ est l’angle de diffusion.
1. Diffusion électron-électron ou Diffusion de Møller:
3
4
3
4
_
1
(7.100)
2
1
2
Dans ce cas, l’identité des deux particules en cause nous force à considérer deux diagrammes qui
diffèrent par une permutation des lignes sortantes.
1. Diffusion électron-positron ou Diffusion Bhabba:
3
4
3
4
+
1
(7.101)
1
2
2
1. Diffusion électron-photon ou Diffusion Compton:
3
4
3
4
+
1
2
(7.102)
1
2
Notons ici que deux diagrammes sont nécessaires, différant par une permutation des photons initial
et final.
7.4.5 Corrections radiatives
Pour un processus donné, les diagrammes à l’ordre le plus bas de la théorie des perturbations,
comme ceux illustrés ci-haut, ne comportent aucune boucle, c.-à-d. qu’ils ont la topologie d’un
arbre. Ces diagrammes sont tous relativement simples à calculer, en dépit d’un certain nombre de
traces de matrices de Dirac à effectuer.
Pour un processus donné, comme par exemple la diffusion électron-muon, les diagrammes contribuant à l’ordre suivant comportent tous une boucle, comme indiqué à la figure 7.2. On montre
7.4. L’électrodynamique quantique
105
Figure 7.2. Diagrammes contribuant à l’amplitude de diffusion électron-muon, à l’ordre
4 de la théorie des perturbations.
que la présence d’une boucle entraı̂ne l’existence d’une quadri-impulsion libre, non déterminée par
la conservation de la quadri-impulsion à chaque vertex. En fait, il est assez clair que la quadriimpulsion circulant dans une boucle insérée dans une ligne externe ou interne peut prendre une
valeur arbitraire sans affecter la conservation de la quadri-impulsion le long de cette ligne. Le
problème est que l’intégrale correspondante sur la quadri-impulsion est divergente. Ces divergences
dans la théorie des perturbations sont apparues très tôt dans le théorie – avant qu’elle soit formulée à l’aide de diagrammes – et en ont retardé le développement pendant presque vingt ans.
C’est le travail de Bethe, Feynman, Schwinger et Tomonaga à la fin des années 1940 qui a permit de
contourner cette difficulté. Une procédure, appelée renormalisation, a été élaborée afin d’absorber
des quantités formellement infinies – mais en pratique inobservables – dans une redéfinition de la
charge e, des masses des particules et de la normalisation des champs (d’où le nom de renormalisation). Cette procédure est essentielle afin de donner un sens aux ordres plus élevés de la théorie
des perturbations et permet dans quelques cas d’effectuer des calculs d’une remarquable précision.
Les corrections aux ordres supérieurs de la théorie des perturbations portent généralement le nom
de corrections radiatives.
L’exemple le plus remarquable est le calcul du moment magnétique anormal de l’électron, le célèbre
facteur g. Rappelons que le moment magnétique de l’électron est de grandeur gµB , où µB = e/2me
est le magnéton de Bohr et g le facteur de Landé, communément appelé “facteur g”. Si l’électron
se comportait comme une distribution de charge classique tournant sur elle-même comme une
microscopique boule de billard, son facteur g serait l’unité. On montre que l’équation de Dirac
mène à la valeur g = 2, ce qui constitue l’un des succès de cette équation. Par contre, la valeur
mesurée de g est différente de 2, même si elle en est très proche. La valeur expérimentale acceptée,
provenant d’expériences de résonances très précises, est la suivante :
g = 2(1 + a)
a = 0.001 596 521 884(43)
(7.103)
L’électrodynamique quantique permet de calculer a, c.-à-d. la déviation de g par rapport à 2. Cette
déviation provient exclusivement de corrections radiatives. Le calcul a été mené jusqu’à l’ordre 8
en théorie des perturbations – correspondant à quatre boucles par diagrammes – et un total de
près de 1000 diagrammes ont été calculés, la vaste majorité par des méthodes numériques, pour
parvenir au résultat suivant (Kinoshita 1989) :
a = C1 (α/π) + C2 (α/π)2 + C3 (α/π)3 + C4 (α/π)4 + δa
(7.104)
106
7. Théorie relativiste de l’électron
où les coefficients Ci sont le résultats d’intégrales cinématiques et le δa (∼ 4, 46 × 10−12 ) provient
d’autres effets (boucles de muons, de taus, effets hadroniques et électrofaibles). La valeur numérique
basée sur la valeur de α obtenue par l’effet Hall quantique est
a = 0.001 596 521 92(17)(73)(108)
(7.105)
Les trois sources d’erreur proviennent respectivement de C3 , C4 et α. L’accord entre la théorie
et l’expérience pour cette quantité est sans égal dans toute la physique théorique (10 chiffres
significatifs). En fait, on peut utiliser cet accord pour redéfinir la constante de structure fine :
α−1 = 137.035 991 4(11)
(7.106)
Problèmes
Problme 7.1
Essayons maintenant d’arriver à l’équation de Dirac d’une manière différente de celle que nous avons utilisée
en classe. Dans l’espace réciproque (impulsion et énergie), l’équation de Klein-Gordon prend la forme
(g µν pµ pν − m2 )ψ = 0
où pµ = (E, −p) est le quadrivecteur d’énergie impulsion.
Dans le but d’avoir une équation du premier ordre en dérivées – et donc linéaire en pµ – essayons de factoriser
cette équation comme suit :
(g µν pµ pν − m2 ) = (β µ pµ + m)(γ ν pν − m)
où β µ et γ ν sont des quantités à déterminer.
a) Démontrer que β µ et γ ν ne peuvent être des nombres ordinaires (réels ou complexes), c’est-à-dire que la
factorisation ne peut pas fonctionner dans ce cas.
b) Démontrez que la factorisation fonctionne si les β µ , γ ν sont des matrices telles que β µ = γ µ et
γ µ γ ν + γ ν γ µ = 2g µν
c) Démontrez qu’en quatre dimensions d’espace-temps, ces matrices sont au moins de dimension 4.
d) Démontrez qu’en dimension 3 d’espace-temps (donc deux dimensions d’espace), on pourrait choisir une
représentation des matrices de Dirac de dimension 2.
7.4. L’électrodynamique quantique
107
Problme 7.2
a) Étant donné un spineur de Dirac ψ, comment peut-on calculer la valeur des composantes (sx , sy , sz ) du
spin dans cet état?
b) Considérons en particulier un spineur associé à un électron de quantité de mouvement p = pẑ, mais dont
l’orientation de spin est quelconque, c’est-à-dire une superposition αu1 + βu2 , où |α|2 + |β|2 = 1. Montrer que
la projection du spin sur ẑ est 12 (|α|2 − |β|2 ), alors que les projections du spin le long de x̂ et ŷ sont
m
Re (α∗ β)
Ep
et
m
Im (α∗ β)
Ep
c) Que conclure de ceci pour un électron ultrarelativiste?
Problme 7.3
On définit l’opération de parité – ou inversion de l’espace – par la transformation r → −r. L’effet de cette
transformation sur le champ de Dirac est le suivant :
ψ(r, t) → ψ 0 (r, t) = ηγ 0 ψ(−r, t)
où η = ±1 est la parité intrinsèque du champ de Dirac.
a) Partez de l’action associée au champ de Dirac :
Z
S=
d4 x (iψ̄γ µ ∂µ ψ − mψ̄ψ)
et démontrez que cette action est invariante lorsqu’on procède à une transformation de parité.
b) Appliquez la transformation de parité à un spineur de Dirac représentant une particule au repos. Pourquoi,
d’après ce calcul, affirme-t-on que la parité d’une antiparticule est l’opposée de la parité de la particule?
c) Comment le champ de jauge électromagnétique Aµ se transforme-t-il lorsqu’on procède à une inversion de
l’espace? Raisonnez de deux façons indépendantes: (a) à l’aide de ce que vous savez du caractère axial ou
polaire des champs E et B. (b) à l’aide de la forme du couplage minimal entre le champ Aµ et un champ de
matière comme le champ de Dirac.
Problme 7.4
Nous allons étudier l’interaction des électrons et des positrons, décrits par le champ de Dirac, avec les bosons
décrits par le champ scalaire. Il s’agit ici d’une version simplifiée de l’électrodynamique quantique (QED) où
le photon a été remplacé par un boson sans polarisation. L’hamiltonien d’interaction Heφ entre le champ de
Dirac et le champ scalaire doit, pour respecter l’invariance de Lorentz, avoir la forme suivante :
Z
Heφ = g d3 r ψ̄ψφ
où ψ̄ = ψ † γ 0 .
a) Écrivez une expression de l’hamiltonien d’interaction Heφ en fonction des opérateurs de création et
d’annihilation des électrons (cp,j ), des positrons (dp,j ) et des bosons (aq ). Laissez les spineurs (u, ū, v,
v̄) intacts dans l’expression.
108
7. Théorie relativiste de l’électron
Considérons un processus de collision électron-positron au cours duquel l’électron annihile le positron pour
donner deux bosons. Soit p1 et p2 les quantités de mouvement de l’électron et du positron, respectivement.
Les quantités de mouvement des deux bosons de l’état final sont notées p3 et p4 .
b) Montrez que l’amplitude de diffusion Mf i s’annule au premier ordre de la théorie des perturbations, mais
pas au deuxième ordre et que quatre états intermédiaires y contribuent. Représentez graphiquement les termes
correspondants, comme à l’éq. (6.88) des notes.
c) Les quatre termes peuvent être groupés deux par deux : les deux derniers étant obtenus des deux premiers
par un échange des deux bosons dans l’état final, de manière similaire à l’exemple discuté dans les notes
(chap. 5). Montrez que les deux premiers termes peuvent être combinés de manière à obtenir
2πg 2
q·γ+m
v̄p ,j
up ,j
√
V ω 3 ω 4 2 2 q 2 − m2 1 1
où q = p1 − p3 . Ici, pi désigne le quadrivecteur énergie-impulsion de la particule no i. L’expression q · γ signifie
P
q 0 γ 0 − 3i=1 q i γ i .
Note : vous devrez utiliser les formule suivantes pour les sommes sur les spins :
α β
vq,j
v̄q,j =
1
(q · γ − m)αβ
2εq
(q 0 = εq )
uαq,j ūβq,j =
1
(q · γ + m)αβ
2εq
(q 0 = εq )
X
j=1,2
X
j=1,2
Les deux derniers termes, quant à eux, sont obtenus en remplaçant q par q̃ = p1 − p4 . L’amplitude totale est
donc donnée par l’expression
Mf i =
2πg 2
v̄p ,j Aup1 ,j1
√
V ω3 ω4 2 2
où A =
q · γ + m q̃ · γ + m
+ 2
q 2 − m2
q̃ − m2
Pour calculer la section efficace, nous devons mettre cette amplitude au carré. Si l’électron et le positron ne
sont pas préparés dans des états précis de spin, il faut sommer le résultat sur les différentes valeurs possible
du spin, c’est-à-dire sur j1 et j2 .
d) Montrez que
X
j1 ,j2
|Mf i |2 =
π2 g4
Tr ((p2 · γ − m)A(p1 · γ + m)A)
V2 ω3 ω4 ε1 ε2
e) Placez-vous dans le référentiel du centre de masse de l’électron et du positron. Soit E l’énergie de chacune
des particules incidentes et sortantes et posons p1 = pẑ, p3 = E(cos θẑ + sin θx̂). À l’aide de Mathematica,
complétez le calcul et démontrez que la section différentielle de diffusion est
dσ
g 4 x2 20 + x2 − 12 cos 2θ − x2 cos 4θ
=
dΩ
64 E 2
(1 + x2 sin2 θ)2
x≡
p
m
Indice : définissez les matrices de Dirac dans Mathematica, ainsi que des quadrivecteurs et un tenseur métrique.
f) Illustrez la dépendance angulaire de la section différentielle (i.e. un graphique en fonction de θ de θ = 0 à
θ = π pour p/m = 0.1, 1 et 10. Que remarquez-vous?
7.4. L’électrodynamique quantique
109
Problme 7.5
Dessinez tous les diagrammes contribuant à la diffusion électron-photon (effet Compton) au quatrième ordre
de la théorie des perturbations.
Problme 7.6
a) Étant donné un spineur de Dirac ψ, on définit le spineur conjugué ψc par
ψc = iγ 2 ψ ∗
Démontrez que le spineur conjugué obéit aussi à l’équation de Dirac, mais avec une charge opposée. Vous
devez pour cela inclure le couplage à un potentiel électromagnétique Aµ dans l’équation de Dirac. Le spineur
conjugué est ce qu’on obtient si on échange les rôles des particules et des antiparticules.
b) On définit un opérateur unitaire de conjugaison de charge, C, tel que
CψC † = ψc
où maintenant ψ est le champ de Dirac quantifié. Avec la définition donnée ci-haut de ψc et l’expression
explicite des spineurs de base up,j et vp,j , obtenez l’effet de cette transformation sur les opérateurs de création
et d’annihilation. Autrement dit, calculez
Ccp,j C †
et
Cdp,j C †
Problme 7.7
Quelle sont les dimensions (au sens des unités) du champ de Dirac, du champ électromagnétique Aµ et du
champ scalaire φ? Si un champ scalaire est couplé à un champ de Dirac par le lagrangien d’interaction suivant
LI = gφψ ψ̄
quelle est la dimension de la constante de couplage g? Partez du fait que l’action est sans unités dans le
système naturel.
Problme 7.8
Démontrez les formules de complétude (7.93).
Problme 7.9
Démontrez les formules de trace (7.95).
Problme 7.10
Démontrez la formule de Casimir (7.94).
Problme 7.11
Démontrez les formules (7.97), (7.98) et (7.99) concernant la diffusion électron-muon.
CHAPITRE 8
Introduction à la théorie des groupes
La théorie des groupes est l’un des outils les plus puissants de la physique mathématique. Ses
applications sont nombreuses dans plusieurs branches de la physique, de la théorie des particules
élémentaires à la physique des changements de phases, en passant par la physique du solide. Nous
nous intéresserons ici aux groupes de Lie, qui interviennent plus particulièrement en physique des
particules élémentaires dans deux contextes différents : (i) la classification des hadrons et (ii) les
théories de jauge, qui décrivent les interactions fondamentales. Le but de ce chapitre est d’offrir une
initiation relativement rapide à la théorie des groupes de Lie, en particulier à leurs représentations
matricielles. Comme cette théorie se construit par généralisation de SU(2), familier à tous ceux
qui ont étudié la théorie du moment cinétique en mécanique quantique, elle peut être exposée
relativement rapidement.
8.1 Définitions et concepts de base
8.1.1 Définition d’un groupe
Un ensemble G forme un groupe si une loi de composition (appelons-la multiplication) a été définie
sur cet ensemble, telle que
1. L’ensemble est fermé par cette loi : si a ∈ G et b ∈ G, alors ab ∈ G. Dans ce qui suit, cette
condition sera souvent appelée la règle de groupe.
2. La loi est associative : (ab)c = a(bc).
3. Il existe un élément neutre e, tel que ea = ae = a, pour tout élément a de G.
4. Tout élément a possède un inverse a−1 dans G tel que a−1 a = e.
Si la multiplication est commutative (ab = ba), le groupe est dit abélien. Dans le cas contraire,
plus intéressant de notre point de vue, le groupe est dit non-abélien.
Un sous-ensemble H de G est appelé sous-groupe de G s’il est lui-même un groupe, avec la même
loi de multiplication que G.
Groupes finis, discrets et infinis
Un groupe est dit fini s’il compte un nombre fini d’éléments. Il est infini dans le cas contraire. Il est
dit discret si ses éléments sont clairement séparés, plus précisément s’ils sont dénombrables. Il est
continu si ses éléments forment un espace ou la notion de continuité est définie. Plus précisément,
un groupe de Lie est un groupe dont les éléments groupe peuvent être repérés par un système de
coordonnées tiré de Rn (on dit alors que la dimension du groupe est n, le nombre de paramètres
nécessaire pour spécifier un élément du groupe).
8.1. Définitions et concepts de base
111
8.1.2 Groupes définis par des matrices
Il est plus simple à ce stade-ci de procéder directement à la définition des groupes de Lie qui nous
intéresseront par la suite. Ceux-ci peuvent être définis par des matrices. La loi de multiplication du
groupe est alors la loi de multiplication des matrices (réelles ou complexes). Les matrices formant
le groupe doivent toutes être régulières (c.-à-d. avoir un inverse). Le groupe général de toutes
les matrices régulières d’ordre n est appelé GL(n). Tous les groupes de Lie “classiques” sont des
sous-groupes de GL(n). Il est évident que GL(n) est un groupe : la multiplication des matrices
est associative et chaque matrice de GL(n) possède un inverse par définition. D’autre part, le
produit de deux matrices régulières est encore une matrice régulière. Les groupes matriciels les
plus importants sont :
1. Le groupe unitaire U(n), formé des matrices complexes unitaires d’ordre n. Bien entendu,
le produit de deux matrices unitaires est encore unitaire et la règle de groupe est respectée.
Le nombre de paramètres nécessaires pour spécifier une matrice complexe d’ordre n est 2n2 .
L’unitarité U † U = 1 impose n + 2 12 n(n − 1) conditions supplémentaires, ce qui réduit le nombre
de paramètres à n2 . La dimension du groupe U(n) est donc d = n2 .
2. Son sous-groupe SU(n), restreint par la condition det U = 1. Cette condition respecte la règle
de groupe. Une condition supplémentaire est imposée et le nombre de paramètres est réduit à
d = n2 − 1.
3. Le groupe orthogonal O(n), formé des matrices réelles orthogonales d’ordre n. Ici encore la règle
de groupe est respectée, car le produit de deux matrices orthogonales est aussi une matrice
orthogonale. Le nombre de paramètres est n2 , moins le nombre de contraintes indépendantes
imposées par l’orthogonalité, soit 21 n(n + 1). Il reste d = 12 n(n − 1) paramètres.
4. Son sous-groupe SO(n), restreint par la condition det O = 1. Notons que cette condition ne
change pas la dimension du groupe, car de toute manière det O = ±1 dans O(n). Topologiquement, elle restreint le groupe à une composante connexe. Autrement dit, tous les éléments de
SO(n) peuvent être obtenus en procédant de manière continue à partir de l’identité, ce qui n’est
pas le cas de O(n), puisque les matrices dites impropres (det O = −1) produisent une inversion
de l’espace à n dimension sur lequel elles agissent. Le groupe des rotations en trois dimensions
est précisément SO(3).
Symbole
R ou C
Définition
Dimension
Rang
U(n)
C
U †U = 1
n2
n
†
2
SU(n)
C
U U = 1 , det U = 1
n −1
n−1
O(n)
R
Ot O = 1
n(n − 1)/2
[n/2]
SO(n)
R
Ot O = 1 , det O = 1
n(n − 1)/2
[n/2]
Remarques :
1. SO(n) est bien sûr un sous-groupe de SU(n).
2. SU(n − 1) est un sous-groupe de SU(n), comme SO(n − 1) de SO(n) et ainsi de suite.
112
8. Introduction à la théorie des groupes
8.2 Rotations en mécanique quantique
L’étude des rotations constitue une introduction naturelle à la théorie des groupes de Lie. Une
rotation est une transformation des coordonnées de l’espace, caractérisée par un axe n et un angle
θ. Cette transformation des coordonnées peut être désignée par le symbole R(n, θ) et prend la
forme d’une action matricielle sur le vecteur-position. L’action de cette matrice sur deux vecteurscolonnes quelconques X1 et X2 ne change pas leurs produit scalaire :
0
X1,2
= RX1,2
=⇒
X10 t X20 = X1t Rt RX2 = X1t X2
(8.1)
ce qui entraı̂ne la condition
Rt R = 1
(8.2)
Autrement dit, les matrices de rotation sont orthogonales. Elles forment donc le groupe SO(3)
(la condition de déterminant unité est imposée pour interdire les rotations qui contiennent une
inversion de l’espace et qui correspondent à des matrices de déterminant −1). Par exemple,


cos θ − sin θ 0
R(ẑ, θ) =  sin θ
cos θ 0 
(8.3)
0
0
1
correspond à une rotation d’angle θ par rapport à l’axe des z. Notez que cette matrice diffère de
la matrice équivalente définie en (7.6) par le signe de θ. C’est que la transformation ci-haut est
une transformation active: le vecteur sur laquelle agit la matrice est transformé alors que les axes
restent fixes. La matrice de rotation (7.6) définit plutôt comment les composantes d’un vecteur A
fixe changent lors d’une rotation des axes, ce qu’on appelle une transformation passive. Les deux
points de vue diffèrent en ce que les matrices de rotations correspondantes sont les inverses l’une
de l’autre, mais l’invariance d’une théorie d’un point de vue actif est équivalente à son invariance
du point de vue passif.
En mécanique quantique, la rotation doit avoir un effet sur le vecteur d’état d’un système physique,
si on la considère comme une véritable opération qui affecte le système. Cet effet, d’après Wigner,
doit prendre la forme d’un opérateur unitaire R(n, θ) agissant sur l’espace de Hilbert : si le système
se trouve dans un état |ψi avant la rotation, il se trouvera dans un état |ψ 0 i = R(n, θ)|ψi après
la rotation. En particulier, si on considère les états propres |ri de la position, on doit trouver, par
définition,
R|ri = |R(n, θ)ri
(8.4)
Ceci a comme conséquence que la fonction d’onde de l’état transformé est
ψ 0 (r) = hr|ψ 0 i = hr|Rψi = hR−1 r|ψi = hR−1 (n, θ)r|ψi = ψ(R−1 (n, θ)r)
(8.5)
Notons que la rotation inverse s’applique sur les coordonnées de la fonction d’onde, et que
R−1 (n, θ) = R(n, −θ).
Nous allons maintenant démontrer que l’opérateur de rotation s’obtient par exponentiation de
l’opérateur du moment cinétique. Plus précisément,
R(n, θ) = exp (−iθn · J)
(8.6)
Considérons pour cela une rotation infinitésimale, d’un angle δθ. L’effet sur la position d’une telle
rotation est
r0 = r + δθn ∧ r
(8.7)
8.2. Rotations en mécanique quantique
113
Cette formule est une version différentielle de l’expression connue pour la vitesse d’un point en
rotation avec une vitesse angulaire ω = θ̇n, soit v = ω ∧r. L’effet d’une telle rotation infinitésimale
sur la fonction d’onde est
ψ 0 (r) = ψ(r − δθn ∧ r) = ψ(r) − δθεijk nj xk
∂
ψ(r)
∂xi
(8.8)
Mais l’opérateur du moment cinétique orbital, en représentation des coordonnées, est justement
∂
∂xi
(8.9)
ψ 0 (r) = ψ(r) − iδθnj Lj ψ(r) = (1 − iδθn · L) ψ(r)
(8.10)
L = R ∧ P = −iR ∧ ∇
ou Lj = −iεijk nj xk
On peut donc écrire que
Donc, dans le cas d’un système décrit par des coordonnées seulement (ce qui exclut le spin), on
trouve
R(n, δθ) = 1 − iδθn · L
(8.11)
au premier ordre en δθ. Pour exprimer une rotation d’angle θ fini, il suffit maintenant d’appliquer
N fois une rotation d’angle θ/N , dans la limite N → ∞, de manière à pouvoir utiliser la formule
ci-haut. On trouve alors
N
θ
= exp (−iθn · L)
(8.12)
R(n, θ) = lim 1 − i n · L
N →∞
N
par définition de l’exponentielle. Cette équation se généralise par définition au cas d’un système
avec spin, c’est-à-dire que l’opérateur de rotation sur un système de moment cinétique J général
est défini par la relation (8.6).
On dit que les composantes du moment cinétique sont les générateurs des rotations, justement
parce que les rotations sont obtenues par application successives de Jx,y,z , à travers l’exponentielle
(8.6).
Revoyons le même raisonnement différemment. Considérons un opérateur unitaire de rotation très
proche de l’opérateur identité (c’est-à-dire correspondant à un angle de rotation infinitésimal). On
peut écrire un tel opérateur comme
R = 1 − iδθH
(8.13)
La condition d’unitarité devient, dans ce cas,
R† R = 1
=⇒
(1 + iδθH † )(1 − iδθH) = 1
=⇒
H† = H
(8.14)
en supposant qu’on néglige les termes en δθ2 , qui sont du deuxième ordre de petitesse. L’opérateur
H doit donc être hermitique afin que R soit unitaire. Par exponentiation, on trouve encore une
fois que
R(θ) = e−iθH
(8.15)
L’opérateur H est justement la projection J · n.
114
8. Introduction à la théorie des groupes
8.3 Représentations du moment cinétique
La relation (8.6) donne la forme explicite de l’opérateur de rotation agissant dans l’espace de
Hilbert. Une action concrète de cet opérateur requiert donc de connaı̂tre précisément l’action de
l’opérateur J du moment cinétique. Or, ce que la théorie du moment cinétique nous apprend,
c’est que l’action de J est bien définie sur des ensembles finis d’états quantiques qui forment ce
qu’on appelles des représentations du moment cinétique. Plus précisément, une représentation du
moment cinétique est définie par un nombre j (entier ou demi-entier) et compte 2j + 1 états.
L’action des trois opérateurs Jx,y,z est fermée sur ces 2j + 1 états, ce qui signifie que si on applique
l’une des composantes de J sur l’un de ces états, on produit une combinaison linéaire des 2j + 1
états en question, sans sortir de ce sous-espace. Dit autrement, si on restreint l’espace de Hilbert
à ce sous-espace fini de dimension 2j + 1, alors l’action des composantes du moment cinétique sur
ce sous-espace est bien définie.
Comme premier exemple, considérons toutes les fonctions d’ondes quadratiques, c’est-à-dire de la
forme xi xj , où i et j prennent les valeurs 1 à 3 (ou x, y et z). Il y a six fonctions quadratiques
linéairement indépendantes :
x2
y2
z2
xy
xz
yz
(8.16)
Lorsqu’on procède à une rotation des axes, une fonction quadratique se transforme encore en
fonction quadratique. Ainsi, suite à une rotation d’angle θ par rapport à l’axe des z, la fonction x2
devient
x2 → (x cos θ − y sin θ)2 = x2 cos2 θ + y 2 sin2 θ − 2xy sin θ cos θ
(8.17)
ce qui illustre le fait que les fonctions quadratiques se transforment entre elles lors des rotations.
Cependant, on peut écrire une fonction quadratique qui est en soi invariante par rotation; il s’agit
bien sûr de
r2 = x2 + y 2 + z 2
(8.18)
C’est donc qu’il reste cinq autres fonctions qui doivent se transformées les unes dans les autres lors
d’une rotation. Ces cinq fonctions correspondent en fait aux harmoniques sphériques associées à
l=2:
s
s
15
15 1 2
Y2±2 =
sin2 θe±2iϕ
=
(x + y 2 ± 2xy)
32π
32π r2
s
s
15
15 1
(8.19)
Y2±1 = ∓
sin θ cos θe±iϕ = ∓
(zx ± izy)
8π
8π r2
s
s
15
15 1
0
2
Y2 =
(3 cos θ − 1) =
(2z 2 − x2 − y 2 )
2
16π
16π r
Or ces cinq fonctions forment un sous-espace sur lequel l’action des composantes du moment
cinétique orbital L est bien définie.
Comme deuxième exemple, considérons les deux états qui forment la représentation de spin 12 .
Dans ce cas, les états sont de nature plus abstraite, c’est-à-dire qu’ils ne correspondent pas à des
fonctions des coordonnées (le spin n’est pas défini en fonction des coordonnées). il est bien connu
que, dans ce cas, la forme explicite des matrices de rotation est
R(n, θ) = exp (−iθn · J) = cos θ/2 − in · σ sin θ/2
(8.20)
8.3. Représentations du moment cinétique
115
Rappelons la démonstration de cette relation. Dans le sous-espace des états de spin 12 , les composantes du moment cinétique ont la représentation matricielle J = 12 σ en fonction des matrices
de Pauli. Les matrices de Pauli ont la propriété suivante :
σa σb = δab + iεabc σc
(8.21)
(n · σ)2 = na nb σa σb = na na = n2 = 1
(8.22)
et ceci entraı̂ne que
de sorte que
m
(n · σ) =
1
(m pair)
n·σ
(m impair)
(8.23)
et donc que
m
m
∞
∞
X
X
1 −iθ
1 −iθ
exp (−iθn · J) =
+
n · σ = cos θ/2 − in · σ sin θ/2 (8.24)
m!
2
m!
2
m impair
m pair
8.3.1 SU(2)
Le groupe SU(2) des matrices unitaires 2 × 2 de déterminant unité est précisément décrit par
l’ensemble des matrices de rotations associées au spin 12 . En fait, toute matrice unitaire de
déterminant unité peut être représentée comme l’exponentielle d’une matrice hermitique sans trace :
U = e−iH . Notons à cette fin que, pour une matrice générale A, Tr ln A = ln det A, ce qui entraı̂ne
que si det A = 1, alors ln A est sans trace. Le fait que J · n soit un opérateur hermitique de trace
nulle entraı̂ne donc nécessairement que R(n, θ) est unitaire et de déterminant unité.
Il y a donc une relation étroite entre le groupe de rotation SO(3) et le groupe unitaire SU(2). Il
se trouve que la distinction entre les deux groupes est de nature topologique.1 . En fait, à chaque
élément de SO(3), donc à chaque rotation physique, correspondent deux éléments de SU(2). Plus
explicitement, à une rotation (n, θ) de SO(3) on peut associer les matrices R(n, θ) et R(n, θ + 2π),
qui diffèrent par leur signe, mais qui correspondent à la même opération physique. Comme les
spineurs transformés par θ et par θ + 2π ne diffèrent que par leur signe, c’est-à-dire une phase
globale, la distinction n’a pas de conséquences physiques.
8.3.2 Construction des représentations du moment cinétique
Nous présentons dans cette section une revue de la construction explicite des représentations du
moment cinétique.
À l’aide des trois opérateurs Ja , on peut construire un opérateur quadratique en J qui commute
avec tous les générateurs. Un tel opérateur porte le nom d’opérateur de Casimir en général, mais
dans le cas de SU(2) il correspond simplement au carré du moment cinétique :
J 2 = J12 + J22 + J32
(8.25)
On vérifie sans peine que [J 2 , Ja ] = 0. Donc, par le lemme de Schur, cet opérateur est proportionnel
à l’identité dans le module considéré. Nous désignerons la valeur propre de cet opérateur par j(j+1),
sans présumer tout-de-suite de la valeur (entière ou non) de j.
1
Dans le jargon, SU(2) est simplement connexe, alors que SO(3) est doublement connexe.
116
8. Introduction à la théorie des groupes
Ensuite, nous construisons des opérateurs d’échelle
J± = J1 ± iJ2
tels que
[J3 , J± ] = ±J±
[J+ , J− ] = 2J3
Ces relations de commutation signifient que l’opérateur J+ , agissant sur un état propre |mi de J3 ,
produit un autre état propre de J3 avec valeur propre m + 1. Ceci se voit facilement à partir de la
relation de commutation [J3 , J+ ] = J+ :
J3 (J+ |mi) = (J+ J3 + J+ )|ri = (m + 1)J+ |mi
(8.26)
Autrement dit, on a des relations du genre
J+ |mi = αm |m + 1i
J− |mi = βm |m − 1i
Pour déterminer ces constantes αm et βm , on utilise les relations de commutation pour écrire
J 2 = J32 + 21 (J+ J− + J− J+ ) = J32 + J3 + J− J+ = J32 − J3 + J+ J−
et on procède aux calculs suivants :
2
2
αm
= J+ |mi = hm|J− J+ |mi = hm|(J 2 − J32 − J3 )|mi = j(j + 1) − m(m + 1)
(8.27)
(8.28)
et
2
2
βm
= J− |mi = hm|J+ J− |mi = hm|(J 2 − J32 + J3 )|mi = j(j + 1) − m(m − 1)
(8.29)
et donc
J+ |mi =
p
j(j + 1) − m(m + 1)|m + 1i
J− |mi =
p
j(j + 1) − m(m − 1)|m − 1i
(8.30)
On constate que J+ |m = ji = 0 et que J− |m = −ji = 0. La dimension de la représentation est
donc finie, pourvu que m = j et m = −j soient toutes les deux des valeurs propres de J3 . Comme
ces valeurs propres sont espacées de 1, il faut donc que 2j soit un entier.
Dès lors, on peut construire explicitement les représentations possibles : à chaque valeur entière
ou demi-entière de j correspond une représentation irréductible de SU(2). Les éléments de matrice
des générateurs J3 et J± (et, par là, de J1 et J2 ) sont donnés par
hm0 |J3 |mi = mδm0 ,m
p
j(j + 1) − m(m + 1)
p
0
hm |J− |mi = δm0 ,m−1 j(j + 1) − m(m − 1)
hm0 |J+ |mi = δm0 ,m+1
Par exemple, dans

1

J3 = 0
0
le cas j = 1, on trouve


0 0
0
1 

1
0 0
J1 = √
2 0
0 −1
1
0
1

0
1
0

0
1 
J2 = √
i
2 0
(8.31)

−i 0
0 −i 
i
0
8.4. Représentations : concepts généraux
117
8.4 Représentations : concepts généraux
Le concept de représentation, que nous avons introduit de manière informelle dans la section
précédente dans le cas du groupe des rotations, est central à la théorie des groupes. Nous allons
maintenant le définir de manière plus générale.
Une représentation de dimension n d’un groupe G (plus précisément, une représentation vectorielle) est un ensemble de matrices d’ordre n qui sont en correspondance avec les éléments du
groupe (isomorphisme). Si on désigne par a et b des éléments de G et par R(a) et R(b) les matrices
correspondantes, on doit avoir
R(ab) = R(a)R(b)
R(a−1 ) = R(a)−1
(8.32)
Un même groupe a généralement plusieurs représentations de dimensions différentes. Les groupes de
Lie définis plus haut ont une infinité de représentations différentes. Parmi toutes ces représentations,
celle qui sert à définir le groupe est qualifiée de fondamentale. Par exemple, la représentation
fondamentale de SU(2) est formée des matrices définies en (8.20). La représentation fondamentale
de SO(3) serait plutôt donnée par les matrices de rotation 3 × 3 dont (8.3) est un cas particulier.
L’espace vectoriel de dimension n sur lequel les matrices d’une représentation agissent est appelé
le module de la représentation. Malheureusement, un abus de langage courant donne aussi à cet
espace le nom de représentation; le contexte aide généralement à distinguer les deux concepts.
C’est sur cet espace que résident les objets qui sont transformés par la représentation du groupe. Le
module de la représentation fondamentale de SO(3) est simplement l’espace cartésien de dimension
3. En mécanique quantique, les modules sont des sous-espaces de l’espace des états. Par exemple,
l’ensemble des états de moment cinétique orbital l dans un atome (oublions le spin pour le moment)
forme le module associé à la représentation de dimension 2l + 1 de SO(3). Il ne faut pas confondre
la dimension d’un groupe de Lie (le nombre de paramètres nécessaires pour repérer un élément du
groupe) et la dimension d’une représentation du même groupe.
Une représentation est dite réductible si le module V correspondant peut être divisé en une somme
directe (V = V1 ⊕ V2 ) telle que V1 et V2 ne sont pas mélangés par l’action du groupe. Cela signifie
qu’il est possible de choisir une base dans V telle que toutes les matrices de la représentation sont
diagonales par blocs, c.-à-d. qu’un élément de V1 (ou de V2 ) demeure dans V1 (resp. V2 ) quand
un élément du groupe agit sur lui. Dans le cas contraire, la représentation est dite irréductible.
Ce sont ces dernières qui sont intéressantes, puisque les représentations réductibles peuvent être
obtenues par somme directe de représentations irréductibles.
8.4.1 Lemme de Schur
Un des résultats importants de la théorie des groupes est le lemme de Schur, qui stipule que
si une matrice H commute avec tous les éléments d’une représentation irréductible, alors H est
proportionnel à l’identité. Si H commute avec tous les éléments d’une représentation réductible,
alors H est diagonal, et égal à un multiple de l’identité dans chaque sous-module irréductible, la
constante de proportionnalité étant a priori différente dans chaque sous-module.
L’application de ce lemme à la mécanique quantique est particulièrement utile : si, en raison d’une
symétrie, le hamiltonien H commute avec tous les éléments d’un groupe de transformation, alors
H est une constante dans chaque module irréductible du groupe, c’est-à-dire que tous les états
appartenant à un même module irréductible ont la même énergie. C’est ici le principal avantage
de la théorie des groupes en mécanique quantique : la classification des niveaux d’énergie. On
voit comment la présence de symétries dans un système quantique est reliée à une dégénérescence
des niveaux d’énergie : les n états indépendants d’une représentation (module) irréductible de
118
8. Introduction à la théorie des groupes
dimension n d’un groupe de symétrie du hamiltonien ont tous la même énergie, par le lemme de
Schur.
Si un groupe est abélien, chaque élément du groupe commute avec tous les autres et le lemme
de Schur s’applique à tous les éléments! On conclut que la seule représentation irréductible d’un
groupe abélien est de dimension 1.
Une représentation est dite unitaire si toutes ses matrices sont unitaires (ne pas confondre avec le
groupe unitaire U(n)). En mécanique quantique on s’intéresse uniquement aux représentations de
ce type. Deux représentations sont dite équivalentes si elles sont reliées par une transformation de
similitude, provenant par exemple d’un simple changement de base sur le module. En clair, si A est
un élément d’une représentation, alors la représentation formée des éléments SAS −1 est équivalente
à la première, pourvu que la matrice S soit la même pour tous les éléments de la représentation.
8.4.2 Représentation projective
Pour être plus précis, les représentations qui sont pertinentes à la mécanique quantiques ne sont
pas les représentation vectorielles proprement dites, mais les représentations dites projectives, qui
sont caractérisées par la relation
D(a)D(b) = e(a, b)D(ab)
où e(a, b) est une phase qui dépend des deux éléments a et b Ceci provient du fait que la propriété
de groupe doit être satisfaite non pas par des matrices agissant sur des vecteurs, mais sur des états
physiques, qui sont des vecteurs modulo une phase arbitraire. L’espace des états est en réalité un
espace projectif, c.-à-d. un espace vectoriel sur lequel deux vecteurs qui ne diffèrent que par une
constante multiplicative sont identifiés. La propriété de groupe s’énonce alors comme suit : les
états D(a)D(b)|ψi et D(ab)|ψi doivent être équivalents, ce qui mène à la relation (8.32). Wigner
a démontré qu’on pouvait toujours ramener une représentation projective à une représentation
vectorielle, parfois multivoque. C’est ce qui se produit dans le cas du groupe SO(3) et des spins
demi-entiers et qui explique l’équivalence de fait entre SO(3) et SU(2) en mécanique quantique.
8.5 SU(3)
Le groupe SU(3) est défini par l’ensemble des matrices unitaires 3 × 3 de déterminant unité. Il
intervient en physique des particules dans la classification des hadrons et, plus fondamentalement,
dans la théorie des interactions fortes (la chromodynamique quantique).
Nous allons esquisser comment les représentations de SU(3) sont construites, par analogie avec les
représentations de SU(2). Il faut premièrement identifier l’analogue pour SU(3) des opérateurs
du moment cinétique, c.-à-d. les générateurs du groupe. Comme toute matrice unitaire de
déterminant unité peut s’exprimer comme l’exponentielle d’une matrice hermitique de trace nulle,
les générateurs de SU(n) correspondent à toutes les matrices hermitiques de trace nulle possibles.
Dans le cas n = 2, il y a trois matrices linéairement indépendantes de ce type, soit les trois matrices de Pauli, et leurs relations de commutation sont celles des composantes du moment cinétique
(modulo un facteur multiplicatif de 2). Dans le cas n = 3, il y a n2 − 1 = 8 matrices hermitiques
sans trace. La convention est d’utiliser les matrices suivantes, dites matrices de Gell-Mann :
8.5. SU(3)
119

0
λ1 =  1
0

0
λ4 =  0
1

0
λ6 =  0
0
1
0
0
0
0
0
0
0
1

0
0
0

1
0
0

0
1
0

0 −i
λ2 =  i 0
0 0

0 0
λ5 =  0 0
i 0

0 0
λ7 =  0 0
0 i

0
0
0

−i
0 
0

0
−i 
0

1
λ3 =  0
0

0
0
0
0
−1
0

1
1
λ8 = √  0
3 0
0
1
0

0
0 
−2
Ces matrices sont une généralisation des matrices de Pauli. Elles sont normalisées afin que
Tr (λa λb ) = 2δab .
Par analogie avec le moment cinétique, on définit les opérateurs (ou générateurs) Ta qui obéissent
aux même relations de commutation que les matrices 12 λa , soit
[Ta , Tb ] = ifabc Tc
où

f123 = 1





 f147 = f246 = f257 = f345 = f516 = f637 =
√
3

f458 = f678 =



2


fijk = −fjik = −fikj
fiij = fijj = 0
1
2
(8.33)
Dans la représentation fondamentale de SU(3), les générateurs sont simplement donnés par Ta =
1
T3 de
2 λa , mais leur forme est différente dans les autres représentations. Notons que le générateur
√
SU(3) est souvent noté I3 , et on introduit aussi l’opérateur d’hypercharge Y = (2/ 3)T8 .
Deux des générateurs de SU(3) commutent entre eux : T3 et T8 . On peut donc désigner les états
propres d’une représentation par les valeurs propres associées à ces deux opérateurs :
T3 |m, yi = m|m, yi
T8 |m, yi = y|m, yi
Dans la représentation fondamentale, on peut lire les valeurs propres directement de la forme
explicite de T3 et T8 en fonction des matrices de Gell-Mann (8.32) :
(m, y) = ( 21 , 2√1 3 ) , (− 12 , 2√1 3 ) , (0, − √13 )
(8.34)
En portant ces valeurs sur un plan cartésien, on forme un triangle équilatéral inversé. Cette
représentation fondamentale est aussi désignée par la lettre 3 (un chiffre en caractères gras indiquant la dimension de la représentation).
Une fois construite une représentation des générateurs Ta , les matrices du groupe SU(3) s’obtiennent
simplement par exponentiation, exactement comme dans le cas des rotations et du moment
cinétique. Huit paramètres ωa (a = 1, . . . , 8) sont requis pour spécifier précisément la combinaison
requise ωa Ta des générateurs, et la matrice SU(3) correspondante est simplement l’exponentielle
R(ω) = e−iωa Ta
(8.35)
Mais généralement nous nous intéressons plus aux modules des représentations qu’aux représentations
proprement dites, de sorte que l’exponentiation ne sera pas calculée en pratique.
120
8. Introduction à la théorie des groupes
8.5.1 Représentations conjuguées
Supposons que nous ayons une certaine représentation des générateurs Ta , de dimension quelconque, et obéissant donc aux relations de commutation [Ta , Tb ] = ifabc Tc . La représentation conjuguée à celle-ci est définie en appliquant la conjugaison complexe et un changement de signe
(c)
aux générateurs : Ta = −Ta∗ . Ces opérateurs conjugués forment aussi une représentation, car ils
obéissent aux même relations de commutation; cela se vérifie en appliquant la conjugaison complexe :
([Ta , Tb ])∗ = −ifabc Tc∗ =⇒ [−Ta∗ , −Tb∗ ] = ifabc (−Tc∗ )
(8.36)
Dans le cas de SU(2), la représentation conjuguée est équivalente à la représentation d’origine, et
le concept n’est pas utile. Ce n’est plus le cas en général : la représentation conjuguée est vraiment
distincte, autrement dit, elle n’est pas reliée à la représentation d’origine par un simple changement
de base. En particulier, le changement de signe fait que les valeurs propres de (T3 , T8 ) associées à
la représentation conjuguée sont opposées à celle de la représentation d’origine. Par exemple, la
représentation conjuguée à la représentation fondamentale 3 de SU(3) est notée 3c , et les valeurs
propres associées sont
(m, y) = (− 12 , − 2√1 3 ) , ( 12 , − 2√1 3 ) , (0, √13 )
(8.37)
qui forment un triangle équilatéral droit dans le plan cartésien.
3c
6
15
3
8
Figure 8.1. Quelques représentations de SU(3), représentées sur le plan (m, y) des
valeurs propres de T3 et T8 . Un point encerclé désigne deux états dégénérés.
8.5.2 Représentation adjointe
Le commutateur de deux générateurs est une combinaison linéaire des générateurs. C’est le sens
de l’expression [Ta , Tb ] = ifabc Tc . Cette linéarité signifie qu’on pourrait représenter l’action d’un
générateur Ta sur un autre générateur Tb par son commutateur avec lui, et former une matrice
(Ta )cb = ifabc . Ces matrices forment une représentation du groupe qu’on appelle représentation
adjointe. Les valeurs propres associées à cette représentation s’obtiennent en considérant les
opérateurs d’échelle, définis comme suit :
I± = T1 + iT2
V± = T4 + iT5
U± = T6 + iT7
(8.38)
8.6. Produits tensoriels
121
et qui sont des généralisations des composantes J± du moment cinétique. On calcule les relations
de commutation suivantes avec T3 et T8 :
[T3 , I± ] = ±I±
[T3 , V± ] =
[T8 , I± ] = 0
√
3
V
2 ±
√
3
[T8 , U± ] = ±
U
2 ±
± 12 V±
[T8 , V± ] = ±
[T3 , U± ] = ∓ 21 U±
(8.39)
Ces relations confirment le caractère “échelle” de ces opérateurs, et démontrent aussi que ces
opérateurs sont des vecteurs propres de T3 et T8 dans la représentation adjointe. En effet, un
opérateur A qui est vecteur propre de T3 et T8 dans cette représentation est tel que
[T3 , A] = mA
[T8 , A] = yA
(8.40)
par définition de l’action des générateurs dans cette représentation. On peut donc lire les valeurs
propres (m, y) de cette représentation par les coefficients qui apparaissent dans (8.39) :
√
√
(m, y) = ±(1, 0) , ±( 12 , 3/2) , ±(− 12 , 3/2)
(8.41)
sans oublier (m, y) = (0, 0) deux fois, c’est-à-dire une fois pour chacun des opérateurs T3 et T8 , qui
commutent entre eux. Si on trace ces valeurs propres sur le plan cartésien, on trouve une figure
hexagonale. La représentation ajdointe de SU(3) est de dimension 8 (car il y a 8 générateurs) et
est notée 8.
8.6 Produits tensoriels
Lorsqu’on réunit deux systèmes physiques en un seul, l’espace des états en mécanique quantique
est le produit tensoriel des espaces associés aux deux systèmes qu’on réunit. De même, si on dispose
dans chacun de ces espaces d’une représentation d’un groupe de symétrie, les opérateurs du groupe
agissant sur l’espace-produit seront des produits tensoriels d’opérateurs :
(1)
R1 = e−iωa Ta
et
(2)
R2 = e−iωa Ta
(tot.)
mènent à R1 ⊗ R2 = e−iωa Ta
(8.42)
où on a défini le générateur total
Ta(tot.) = Ta(1) ⊗ 1 + 1 ⊗ Ta(2)
(8.43)
La théorie de l’addition des moments cinétiques est le prototype de la théorie plus générale du
produit tensoriel des représentations.
Dans le cas de SU(2), le produit tensoriel s’effectue simplement. Sans nous attarder à la question des
coefficients de Clebsch-Gordan, ne nous attardons qu’aux valeurs propres de la somme des moments
cinétiques. Supposons qu’on additionne deux moments cinétiques, dans les représentations j1 et j2 .
Cette somme produira plusieurs représentation irréductibles de SU(2), avec des valeurs de j allant
de j1 + j2 à |j1 − j2 |. On peut obtenir ce résultat en additionnant simplement les valeurs propres
de T3 pour les deux représentations, comme indiqué à la figure 8.2.
On procède de la même manière pour les produits tensoriel de SU(3). Un exemple est illustré à la
figure 8.3. On peut, en procédant à des produits tensoriels répétés, générer toutes les représentations
irréductibles de SU(3). Les diagrammes associés ont tous cette symétrie par rotation de 120◦ . Les
représentations les plus simples sont appelées triangulaires, et ont dimension 12 n(n + 1), c’est-à-dire
3, 6, 10, 15, 21, etc. Les diagrammes correspondant ont une forme de triangle et aucune des valeurs
122
8. Introduction à la théorie des groupes
m
j=5/2
j=3/2
j=1/2
Figure 8.2. Addition des moments cinétiques, c’est-à-dire des générateurs du groupe,
dans le cas de SU(2). On combine ici une représentation de spin j = 23 à une
représentation de spin j = 1. On ajoute à chaque valeur propre de la première
représentation les valeurs propres de la deuxième, ce qui produit un ensemble de
3 × 4 = 12 valeurs propres, la plupart dégénérées. On forme la représentation j = 52 à
partir de la plus élevée de ces valeurs propres. Si on enlève les valeurs propres correspondantes, il ne reste qu’une copie de la valeur propre m = 23 , à partir de laquelle on
sait qu’une représentation j = 23 existe dans la somme; si on enlève les valeurs propres
correspondantes, il ne reste que les deux valeurs propres associée à la représentation
j = 12 . Donc on sait, symboliquement, que
( 32 ) ⊗ (1) = ( 52 ) ⊕ ( 32 ) ⊕ ( 12 )
y
m
Figure 8.3. Combinaison de deux copies de la représentation fondamentale de SU(3).
On constate que 3 ⊗ 3 = 6 + 3c .
propres n’est dégénérée. En général, les représentations ont la forme de triangles tronqués (comme
la représentation non triangulaire de dimension 15 ilustrée à la fig. 8.1) ou la représentation de
dimension 42 illustrée à la figure 8.4). Si p + 1 est le nombre de points sur le côté supérieur du
diagramme et q +1 le nombre de points sur le côté inférieur, alors on peut désigner la représentation
par le couple (p, q). La figure 8.4, par exemple, illustre la représentation (2, 3). La représentation
fondamentale est (1, 0), l’adjointe est (1, 1) et les représentation triangulaires sont de la forme
(n, 0) où n = 1, 2, 3, . . .. La représentation conjuguée à (p, q) est (q, p). La dégénérescence des
valeurs propres est déterminée par les règles suivantes :
1. Les valeurs propres situées sur la périphérie du diagramme sont non dégénérées.
2. La dégénérescence augmente de 1 à mesure qu’on pénètre dans le diagramme à partir de la
périphérie, mais arrête d’augmenter dès qu’on rencontre une forme triangulaire à l’intérieur.
Voir la figure 8.4 comme exemple.
8.6. Produits tensoriels
123
Figure 8.4. Représentation de dimension 42. Les valeurs propres représentées par les
cercles simples sont non dégénérées. Celles représentées par les cercles doubles sont
dégénérées deux fois, et celles représentées par les cercles triples sont dégénérées trois
fois. Cette représentation est aussi notée (2, 3).
On indique dans ce qui suit quelques produits tensoriels simples :
3 ⊗ 3 = 3c ⊕ 6
3 ⊗ 3c = 8 ⊕ 1
3 ⊗ 6 = 8 ⊕ 10
3c ⊗ 6 = 3 ⊕ 15
(8.44)
3 ⊗ 8 = 3 ⊕ 6c ⊕ 15
3 ⊗ 10 = 15 ⊕ 150
où par définition la représentation 150 est triangulaire et correspond à (4, 0). Ces produits
s’écriraient plutôt comme suit dans la notation (p, q) :
(1, 0) ⊗ (1, 0) = (0, 1) ⊕ (2, 0)
(1, 0) ⊗ (0, 1) = (1, 1) ⊕ (0, 0)
(1, 0) ⊗ (2, 0) = (1, 1) ⊕ (3, 0)
(0, 1) ⊗ (2, 0) = (1, 0) ⊕ (2, 1)
(1, 0) ⊗ (1, 1) = (1, 0) ⊕ (0, 2) ⊕ (2, 1)
(1, 0) ⊗ (3, 0) = (2, 1) ⊕ (4, 0)
(8.45)
124
8. Introduction à la théorie des groupes
8.7 Symétrie de saveur des quarks
Considérons les trois quarks les plus légers : u, d et s. On peut considérer ces trois quarks comme
trois composantes d’un même objet (u, d, s). Les interactions fortes traiteront ces trois quarks de
la même manière, et si on néglige les différences de masses parmi ces trois quarks, alors la physique
des interactions fortes devrait être identique pour les trois.
Plus précisément, le lagrangien de ces trois quarks, en l’absence d’interaction, serait de la forme
suivante :
X
L=
ψ̄ α (iγ µ ∂µ − mα )ψα
(8.46)
α
où le spineur de Dirac ψα représente les quarks (u, d, s) pour α = 1, 2, 3. Si les trois masses sont
égales, alors ce lagrangien est invariant lorsqu’on procède à une rotation unitaire
ψα → Uαβ ψβ
ou, plus court, ψ → U ψ
(8.47)
Il s’agit d’une rotation dans l’espace des saveurs de quarks et le groupe de symétrie est SU(3).
Les trois quarks (u, d, s) forment à eux trois la représentation fondamentale de SU(3), soit 3 =
¯ s̄), obtenus par conjugaison de charge, forment la représentation
(1, 0). Les trois antiquarks (ū, d,
c
conjuguée 3 = (0, 1).
Les mésons sont obtenus en assemblant un quark et un antiquark. Les représentations correspondantes viennent du produit tensoriel de 3 et de 3c , c’est-à-dire un octet 8 = (1, 1) et un singulet
1 = (0, 0). L’assignation des mésons à ces états est illustrée à la figure 8.5.
K0
π–
K+
K*0
π+
π0
_
K0
K–
J=0
ρ–
K*+
ρ+
ρ0
K*–
_
K*0
J=1
Figure 8.5. La classification des mésons dans des multiplets du SU(3) de saveur. À
gauche, les états de spin 0, à droite ceux de spin 1. Dans les deux cas, les octets sont
illustrés. Il y a aussi un singulet η 0 de spin 0 et un singulet φ de spin 1.
Les baryons sont obtenus en assemblant trois quarks. Les représentations correspondantes viennent
du triple produit tensoriel de 3 avec lui-même, c’est-à-dire
3 ⊗ 3 ⊗ 3 = 3 ⊗ (3c ⊕ 6) = 1 ⊕ 8 ⊕ 8 ⊕ 10
Le décuplet et l’octet sont illustrés à la figure 8.6.
8.8. Symétrie de couleur
125
n
Σ–
∆–
p
Σ0
Σ+
∆0
∆+
Σ *– Σ *0
∆ ++
Σ *+
Λ
Ξ–
Ξ0
Ξ *–
Ξ *0
Ω0
J=1/2
J=3/2
Figure 8.6. La classification des baryons dans des multiplets du SU(3) de saveur. À
gauche, les états de spin 21 dans un octet; à droite ceux de spin 32 dans un décuplet.
8.8 Symétrie de couleur
Les quarks possèdent aussi une “couleur”, c’est-à-dire que chaque saveur de quark existe dans des
combinaisons linéaires de trois composantes ψi (i = 1, 2, 3). Les transformations de couleur sont
donc formellement semblables aux transformations de saveur et appartiennent aussi à un groupe
SU(3) – qu’on désigne souvent par SU(3)c pour le distinguer du groupe SU(3)s des saveurs. La
différence importante est que la symétrie de couleur est exacte et a en plus rang de symétrie locale
(voir le chapitre sur les théories de jauge), alors que la symétrie de saveur est approximative, de
sorte que les différents états de saveurs appartenant à une même représentation n’ont pas en réalité
la même masse.
L’une des propriétés fondamentales de l’interaction forte, basée sur la couleur, est que seuls les
singulets de couleurs sont des états physiques. Les représentations de dimensions plus grandes que
l’unité sont, en quelque sorte, infiniment massives et n’apparaissent pas dans le spectre des états
physiques. Ainsi, les quarks libres, qui appartiennent à la représentation fondamentale de SU(3),
ne sont pas des états physiques.
On peut tirer des produits tensoriels étudiés plus haut qu’il est possible de construire un singulet
de couleur en combinant (i) un quark et un antiquark et (ii) trois quarks. En effet, les produits
tensoriels 3⊗3c et 3⊗3⊗3 contiennent chacun un singulet, et donc un état physique possible. Ceci
n’est pas vrai pour une combinaison de deux quarks (3 ⊗ 3) ou de quatre quarks (3 ⊗ 3 ⊗ 3 ⊗ 3). Il
se trouve que l’état singulet à trois quarks est l’état complètement antisymétrique lors de l’échange
de deux quarks. On peut l’écrire comme suit :
1
√ (|RGBi + |GBRi + |BRGi − |GRBi − |RBGi − |BGRi)
6
(8.48)
où (R, G, B) désignent les trois états de couleur qui forment une base conventionnelle dans l’espace
des couleurs. Dans le cas d’une combinaison quark-antiquark, la combinaison invariante est plutôt
1
√ |RR̄i + |GḠi + |B B̄i
3
(8.49)
où (R̄, Ḡ, B̄) désignent les trois états de couleur pour les antiquarks.
L’autre particule fondamentale des interactions fortes est le gluon, ou plutôt les gluons, car il y
en a huit. Ils appartiennent à la représentation 8 = (1, 1) (l’octet) de SU(3). En soi, les gluons ne
sont pas des états physiques, mais des combinaisons de deux gluons ou de trois gluons – appelées
126
8. Introduction à la théorie des groupes
glueballs (ou boules de glue) – ne sont pas interdites par la règle de neutralité de couleur. En effet,
on a le produits tensoriel suivant :
8 ⊗ 8 = 1 ⊕ 8 ⊕ 8 ⊕ 10 ⊕ 10c ⊕ 27
(8.50)
et, à partir de ce produit tensoriel, on montre facilement que 8 ⊗ 8 ⊗ 8 contient aussi un singulet.
La théorie du groupe SU(3)c sera abondamment utilisée dans le chapitre portant sur les théories
de jauge.
Problèmes
Problme 8.1
Considérez le problème d’un oscillateur harmonique en trois dimensions, avec la même constante de ressort
dans les trois directions. Les niveaux d’énergie de ce système sont Enmr = ω(n + m + r) + E0 où ω est
la fréquence caractéristique de l’oscillateur, E0 est l’énergie du fondamental, et les entiers (n, m, r) sont les
nombres quantiques entiers associés à chacune des directions de l’espace.
a) Quels sont les quatre premiers niveaux d’énergie de ce systèmes, avec leur dégénérescence? Ces dégénérescences peuvent-elles être expliquées uniquement par l’invariance par rotation (c’est-à-dire par des multiplet
de moment cinétique orbital l entier), ou existe-t-il une dégénérescence accidentelle?
b) Montrez que ce système possède une symétrie SU(3). Cela est facile à voir lorsque l’hamiltonien est exprimé
en fonction des opérateurs d’échelle.
c) Dans cette optique, expliquez la dégénérescence des niveaux en fonction de représentations irréductibles
de SU(3).
Problme 8.2
Dressez un catalogue des hadrons construits à l’aide des
quarks u, d et s en les classant selon leur spin, en supposant que le moment cinétique orbital est nul. Ignorez
les degrés de liberté de couleur ainsi que le principe de
Pauli.
Autrement dit, remplissez les tableaux ci-contre, en spécifiant
le symbole de chaque hadron, ainsi que sa masse. Vous pouvez bien sûr vous aider du livret de physique des particules
(Table of particle properties). Notez que les mésons “diagonaux en saveur”, c’est-à-dire ceux situés le long de la diagonale du tableau, peuvent présenter des ambiguités sur le
plan de leur composition. Y a-t-il des cases vides dans le
tableau des baryons? Pourquoi?
J=1/2 J=3/2
u
d
s
uuu
u
uud
d
udd
s
ddd
J=0
uus
u
d
s
uds
u
dds
d
uss
s
dss
J=1
sss
8.8. Symétrie de couleur
127
Problme 8.3
On peut montrer que le seul état de couleur qui soit neutre lorsqu’on combine trois quarks est l’état
complètement antisymétrique
1
|ψi = √ (|RGBi + |GBRi + |BRGi − |GRBi − |RBGi − |BGRi)
6
Supposons qu’au lieu de trois couleurs, il n’y en ait que deux, et que les baryons soient composés de deux
quarks, au lieu de trois, ceci afin de simplifier les choses. Dans ce cas, quelle serait la combinaison complètement
antisymétrique? Démontrez que ce serait aussi la seule combinaison neutre possible. Pour guider votre imagination, notons ces deux couleurs ↑ et ↓, de manière à profiter de l’analogie avec le spin que suggère la
symétrie de couleur simplifiée. Cette symétrie est l’invariance par rapport à un mélange des couleurs via la
multiplication par une matrice unitaire d’ordre 2.
Problme 8.4
a) Démontrez la formule suivante pour une matrice carrée d’ordre 3 :
εijk Uil Ujm Ukn = εlmn det U
où une sommation sur les indices répétés est implicite.
b) En vous servant de la formule démontrée en (a), démontrez maintenant que l’état de couleur complètement
antisymétrique
1
|ψi = √ (|RGBi + |GBRi + |BRGi − |GRBi − |RBGi − |BGRi)
6
est invariant par rapport à toute transformation de couleur, c’est-à-dire que U |ψi ∝ |ψi pour toute matrice
unitaire U d’ordre 3.
c) Démontrez aussi que la combinaison suivante
1
|ψi = √ |RR̄i + |GḠi + |B B̄i
3
est invariante. Remarquez cependant que les antiparticules se transforment avec la matrice conjuguée complexe
U ∗.
Problme 8.5
a) Montrez que le produit tensoriel correspondant à la représentation réductible d’un ensemble de trois quarks
est
3 ⊗ 3 ⊗ 3 = 1 ⊕ 8 ⊕ 8 ⊕ 10
b) Montrez par la même technique qu’un état neutre de couleur à 4 quarks est impossible.
CHAPITRE 9
Théories de jauge
9.1 Symétrie de jauge non abélienne
En 1954, Yang et Mills ont généralisé l’idée d’un symétrie de phase locale à une symétrie plus vaste
impliquant des rotations unitaires de plusieurs champs. La théorie obtenue est appelée théorie
de jauge non abélienne, car elle implique des transformations qui ne commutent pas entre elles
(des transformations unitaires, par exemple) et que ces transformations forment un groupe noncommutatif, ou groupe “non-abélien”. Ces théorie forment maintenant la base du modèle standard
des interactions fondamentales.
Nous adopterons comme modèle la théorie dynamique de la couleur, ou chromodynamique, qui
est la théorie fondamentale des interactions fortes entre quarks. Considérons donc un spineur ψ
décrivant un quark dans ses trois couleurs, c’est-à-dire que le spineur ψin comporte un indice de
Dirac (i = 1, 2, 3, 4) et un indice de couleur (n = 1, 2, 3). L’indice de Dirac sera toujours implicite,
alors que l’indice de couleur sera implicite la plupart du temps. Les transformation de jauge agissant
sur ce spineur sont en fait des rotations unitaires dans l’espace des couleurs, autrement dit
ψn → ψn0 = Unm ψm
ou ψ → ψ 0 = U ψ
(9.1)
où U est une matrice unitaire.
Le lagrangien de Dirac
L = ψ̄(iγ µ ∂µ − m)ψ
(9.2)
est certainement invariant lors d’une transformation de couleur globale. Autrement dit, si U est
une matrice unitaire agissant dans l’espace des couleurs et indépendante de la position et du temps,
alors le lagrangien est invariant lorsqu’on procède à la transformation ψ → ψ 0 = U ψ, car alors
ψ̄ 0 = ψ̄U † et les deux facteurs U † et U se combinent pour former la matrice unité. Notons bien sûr
que la matrice U agissant dans l’espace des couleurs seulement, commute avec toutes les matrices
de Dirac, qui agissent dans l’espace des spineurs seulement.
Cependant, le lagrangien n’est plus invariant si la matrice U dépend de la position ou du temps,
en raison de la dérivée agissant sur ψ. Nous devons définir encore une fois une dérivée covariante
Dµ = ∂µ + igAµ , où g est une constante de couplage (l’analogue dans les interactions fortes de la
charge électrique). Il faut définir la transformation de jauge du champ Aµ de manière à ce que la
dérivée covariante se transforme simplement, comme le champ ψ lui-même :
Dµ ψ → D0µ ψ 0 = U (Dµ ψ)
Dans le détail, ceci entraı̂ne que
(∂µ + igA0µ )U ψ = (∂µ U )ψ + U ∂µ ψ + igA0µ U ψ
(9.3)
9.2. Le tenseur de Faraday
129
doit être égal à
U (∂µ ψ + igAµ )ψ
et donc que
∂µ U + igA0µ U = igU Aµ
=⇒
i
A0µ = U Aµ U † + ∂µ U U †
g
(9.4)
L’action de Dirac invariante de jauge est alors simplement obtenue par couplage minimal, c’est-àdire en remplaçant les dérivées ordinaires par des dérivées covariantes :
L = ψ̄(iγ µ Dµ − m)ψ = ψ̄(iγ µ ∂µ − gAµ γ µ − m)ψ
(9.5)
Le champ Aµ est appelé champ de jauge et est une combinaison des générateurs du groupe SU(3).
En effet, toute matrice U peut être représentée comme une exponentielle U = eiωa Ta . Dans ce cas,
i
i
∂µ U U † = (i∂µ ωa )Ta
g
g
(9.6)
et ce terme de la relation (9.4) est une combinaison linéaire des générateurs. Il en va de même
du premier terme de la relation (9.4). En effet, en posant H = −iωa Ta et d’après la relation de
Hausdorf, ce premier terme est
e−H Aµ eH = A + [A, H] +
1
1
[[A, H], H] + [[[A, H], H], H] + · · ·
2!
3!
(9.7)
Comme H est une combinaison des générateurs Ta et que le commutateurs deux combinaisons
linéaires des Ta est encore une combinaison linéaire des Ta , toute l’expression ci-haut est encore
une combinaison linéaire des générateurs. Ceci démontre la cohérence de la loi de transformation
(9.4) avec la fait que le champ de jauge Aµ est une combinaison linéaire des générateurs du groupe.
On écrit donc la décomposition suivante :
Aµ = Aaµ Ta
(9.8)
où les champs Aaµ , qui sont au nombre des générateurs du groupe de jauge, sont maintenant des
champs réels non matriciels.
9.2 Le tenseur de Faraday
Une fois la symétrie de jauge accomplie pour le champ de Dirac et le champ de jauge Aµ introduit,
il faut construire une théorie dynamique pour le champ Aµ lui-même, modelée sur la théorie
électromagnétique. Il faut en fait construire une densité lagrangienne pour Aµ , en suivant autant que
possible le modèle électromagnétique et en s’assurant que cette densité lagrangienne soit également
invariante de jauge.
La première étape consiste à construire le tenseur de Faraday
Fµν = ∂µ Aν − ∂ν Aµ
Malheureusement, cette expression est loin d’être invariante de jauge dans le cas non-abélien. La
solution est de remplacer ici aussi les dérivées ordinaires par des dérivées covariantes :
Fµν = Dµ Aν − Dν Aµ
= ∂µ Aν − ∂ν Aµ + ig[Aµ , Aν ]
(9.9)
130
9. Théories de jauge
Voyons comment cette expression se comporte lors d’une transformation de jauge :
0
Fµν → Fµν
= D0µ A0ν − D0ν A0µ
(9.10)
Calculons d’abord
i
†
U Aν U + ∂ν U U
= ∂µ + igU Aµ U − ∂µ U U
g
i
= ∂µ U Aν U † + U ∂µ Aν U † + U Aν ∂µ U † + ∂µ ∂ν U U †
g
i
i
+ ∂ν U ∂µ U † + igU Aµ Aν U † + U Aµ ∂ν U † − ∂µ U Aν U † + ∂µ U ∂ν U †
g
g
D0µ A0ν
†
†
†
(9.11)
où nous avons utilisé à deux reprises le fait que U † ∂µ U = ∂µ (U † U ) − ∂µ U † U = −∂µ U † U . Notons
que le premier et huitième termes se compensent mutuellement. D’autre part, comme nous devons
soustraire de cette expression une expression équivalente où les indices µ et ν sont échangés, nous
pouvons éliminer de cette expression tous les termes qui sont symétriques lors de l’échange µ ↔ ν.
Or, le troisième terme se combine avec le septième pour former une expression symétrique en
(µ, ν). La même chose est vraie des cinquième et neuvième termes. Enfin, le quatrième terme est
manifestement symétrique de lui-même. Il reste les deuxième et sixième termes :
U ∂µ Aν U † + igU Aµ Aν U †
En échangeant µ ↔ ν et en soustrayant, on trouve
0
Fµν
= U (∂µ Aν − ∂ν Aµ )U † + igU [Aµ , Aν ]U † = U Fµν U †
(9.12)
Donc le tenseur de Faraday Fµν n’est pas invariant de jauge, mais se transforme de manière simple.
9.3 Le lagrangien de la QCD
Le lagrangien du champ électromagnétique est
Lem = −
1
F F µν
16π µν
(9.13)
Cette forme doit être adaptée au cas non-abélien, car en soi elle n’est pas invariante de jauge (en
fait, ce n’est pas un scalaire, mais une matrice dans ce cas). La solution consiste à prendre la trace :
LQCD = −
1
Tr (Fµν F µν )
8π
(9.14)
Ce lagrangien est bel et bien invariant de jauge car
L0QCD = −
1
1
1
0
Tr (Fµν
F 0µν ) = −
Tr (U Fµν U U † F µν U ) = −
Tr (Fµν F µν )
8π
8π
8π
(9.15)
en raison de la propriété cyclique de la trace d’un produit de matrices : Tr (ABC) = Tr (BCA) =
Tr (CAB).
En fonction des générateurs Ta , le tenseur de Faraday s’écrit
Fµν = (∂µ Aaν − ∂ν Aaµ )Ta + igAbµ Acν [Tb , Tc ]
(9.16)
Comme [Tb , Tc ] = ifbca Ta , on peut écrire
a
Fµν = Fµν
Ta
a
où Fµν
= ∂µ Aaν − ∂ν Aaµ − gfbca Abµ Acν
(9.17)
9.3. Le lagrangien de la QCD
131
Le lagrangien devient alors
LQCD = −
1 a bµν
F F Tr (Ta Tb )
8π µν
(9.18)
La convention habituelle sur la normalisation des générateurs est de les choisir tels que
Tr (Ta Tb ) = 12 δab
(9.19)
C’est le cas notamment des générateurs de SU(2) et de SU(3) introduits dans le chapitre portant
sur la théorie des groupes. On trouve alors
LQCD = −
1 a aµν
F F
16π µν
(9.20)
a
Dans la limite où la constante de couplage g tend vers zéro, Fµν
devient simplement équivalent au
tenseur de Faraday électromagnétique, et alors on se trouve en présence d’une théorie équivalente
à N copies de l’électromagnétisme, N étant le nombre de générateurs (8 pour la QCD). Ainsi,
N bosons, similaires au photon, apparaissent dans la théorie. En QCD, ces bosons sont appelés
gluons, et ils transmettent l’interaction forte de la même manière que les photons transmettent
l’interaction électromagnétique. Par exemple, les quarks pourraient diffuser l’un sur l’autre par
l’échange d’un gluon virtuel, etc.
Si g est non nul, cependant, les choses sont plus complexes. Le lagrangien comporte des termes
cubiques et des termes quartiques en A, comme le montre l’expression explicite suivante :
LQCD = −
1
∂µ Aaν − ∂ν Aaµ − gfbca Abµ Acν ∂ µ Aaν − ∂ ν Aaµ − gfdea Adµ Aeν
16π
(9.21)
Les termes cubique en A sont d’ordre g, et les termes quartiques d’ordre g 2 . Ce lagrangien, ou le
hamiltonien correspondant, est impossible à résoudre. Autrement dit, les états propres de cette
théorie ne sont pas connus, et en tout cas ne correspondent pas à des bosons libres, comme dans
le cas du champ électromagnétique. Bref, même en l’absence de quarks, la QCD est une théorie
complexe. Si g était petit, alors on pourrait utiliser la théorie des perturbations (les diagrammes de
Feynman) pour décrire les effets de termes cubiques et quartiques. Des vertex comme ceux illustrés
ci-dessous seraient des ingrédients des diagrammes de Feynman de la QCD.
(9.22)
Notez qu’on représente la propagation d’un gluon par une ligne ayant l’apparence d’un ressort,
pour symboliser l’intensité de l’interaction forte!
Le lagrangien complet de la QCD comporte l’expression ci-haut (9.21), plus les termes décrivant
les quarks et leur interaction avec les gluons, soit l’expression (9.5).
132
9. Théories de jauge
9.4 Propriétés de la QCD
Terminons ce chapitre avec quelques remarques sur la QCD et les théories de jauge en général.
Une propriété de la QCD, commune à toutes les théories de jauge, est la renormalisabilité. Une
théorie quantique des champs, pour être utile et bien définie, doit être renormalisable. Expliquons
brièvement. Si on applique la théorie des perturbations aux ordres plus élevés, on trouve des
expressions infinies, divergentes. Ceci se produit pratiquement à chaque fois qu’un diagramme de
Feynman comporte une ou plusieurs boucles fermées. Pour corriger ce problème, on doit supposer
que l’espace n’est pas continu à une échelle très petite ou, ce qui est équivalent, supposer que
les vecteur d’ondes ne peuvent pas prendre des valeurs arbitrairement grandes. Si une théorie des
champs est renormalisable, on peut procéder à certains ajustements d’un nombre fini de paramètres
(comme la masse, la constante de couplage, ou la normalisation du champ) afin d’éliminer ces
infinités (ou plutôt, de les balayer sous le tapis). Par contre, si la théorie n’est pas renormalisable,
un nombre infini de paramètres ajustables est nécessaire pour les éliminer, et la théorie perd
tout son sens en tant que théorie fondamentale. Il se trouve que toutes les théories de jauge sont
renormalisables. En fait, les théories de jauge sont les seules théories, avec celle d’un champ scalaire,
qui ont cette propriété.
L’un des effets de cette procédure de renormalisation est que la constante de couplage g n’est
pas vraiment une constante. Elle dépend faiblement d’une échelle d’énergie q, échelle d’énergie
caractéristique des phénomènes étudiés. Il se trouve que la constante αs = g 2 se comporte comme
suit en fonction de l’échelle d’énergie q :
αs =
12π
(33 − 2Nq ) ln(q 2 /Λ)
(9.23)
où Λ est l’échelle d’énergie de la QCD, égale à 200 ± 100 MeV (la précision n’est pas énorme) et Nq
est le nombre de saveurs de quarks, soit six. Ce résultat est obtenu par la théorie des perturbations
(diagrammes de Feynman à une boucle) et n’est valable que si αs est petit, mais indique que la
constante de couplage tend vers zéro aux très grandes énergies. Cette propriété porte le nom de
liberté asymptotique. Les diagrammes de Feynman qui mènent à cette formule sont illustré à la
figure 9.1. L’une des conséquences de la liberté asymptotique est que lors de processus impliquant un
très grand transfert de quantité de mouvement, comme dans les expériences de diffusion inélastique
profonde, la constante de couplage effective est petite et les quarks se comportent comme des
particules quasi-libres.
Figure 9.1. Diagrammes contribuant à la polarisation de couleur du vide en QCD.
Celui du haut comporte l’émission de paires virtuelles quark-antiquarks et ceux du bas
à l’émission de gluons virtuels. Les deux contributions (qq̄ et gluons) ont des signes
opposés.
Une façon de présenter la liberté asymptotique est de parler d’effet anti-écran. L’effet d’écran est
bien connu en physique du solide : dans un milieu polarisable, la charge effective d’une source est
9.4. Propriétés de la QCD
133
de plus en plus grande lorsqu’on l’observe de plus en plus proche, car la polarisation du milieu
entourant la charge tend à la masquer partiellement. Le vide aussi est polarisable, car des paires
virtuelles électron-positron peuvent être créées, et donc la charge élémentaire, ou la constante de
structure fine α = e2 , augmente avec la résolution spatiale, c’est-à-dire augmente avec l’échelle
d’énergie associée au processus. C’est l’inverse de la liberté asymptotique. En QCD, la polarisation
de couleur du vide par émission de paires virtuelles quark-antiquark agit dans le même sens qu’en
électrodynamique, et donc contre la liberté asymptotique. Par contre, une polarisation de couleur
dans le sens opposé (donc un anti-écrantage) est causée par les gluons (les deux diagrammes du
bas de la figure 9.1), et la contribution des gluons domine. Au total, l’effet anti-écran domine et il
y a liberté asymptotique.
La contrepartie de la liberté asymptotique est l’augmentation présumée de g 2 quand l’échelle
d’énergie diminue. On peut présumer que, en deça d’une certaine échelle d’énergie Λ, la théorie
des perturbations perd toute son utilité et qu’il est vain de penser en termes de diagrammes
de Feynman. D’autres approches théoriques, dites “non perturbatives”, sont requises. De telles
méthodes, en particulier numériques, sont un sujet de recherche très actif en physique théorique
des particules. Une conséquence présumée de cette augmentation de la constante de couplage est
le confinement : le fait que seuls les états neutres de couleurs puissent exister.
Problèmes
Problme 9.1
Montrez que, dans une théorie de jauge non-abélienne, le tenseur de Faraday Fµν = Dµ Aν − Dν Aµ se
transforme comme Fµν → U Fµν U −1 .
Problme 9.2
Dans une théorie de jauge comme la chromodynamique (QCD), on peut en principe définir des champs
chromo-électrique et chromo-magnétiques, Ea et Ba , qui figurent dans le tenseur de Faraday :


0
Exa
Eya
Eza
 −Exa
0
−Bza Bya 
a

(a = 1, 2, . . . , 8)
(9.24)
Fµν
: 
a
a
 −E
B
0
−B a 
y
−Eza
z
−Bya
x
Bxa
0
a) Écrivez l’expression explicite de ces champs en fonction des potentiels Aa et Φa (la version “couleur” des
potentiels vecteur et scalaire).
b) L’équivalent des équations de Maxwell pour les champs de couleurs s’obtient en remplaçant les dérivées
ordinaires par des dérivées covariantes. Écrivez l’équivalent de la loi de Gauss. En quoi diffère-t-elle de la loi
de Gauss pour le champ électromagnétique? Qu’est-ce qui, selon vous, en rend la résolution difficile?
CHAPITRE 10
Modèle standard des interactions
électro-faibles
10.1 Interactions faibles
Les interactions faibles ont les propriétés suivantes :
1. Elle affectent toutes les particules matérielles connues.
2. Leur portée est très courte, et leur intensité est très faible.
3. Elles peuvent changer la saveur des quarks. Par exemple, les particules comportant un quark s
se désintègrent par interaction faible.
4. Elle ne respectent pas l’invariance par inversion de l’espace (parité).
Cette dernière propriété (la brisure de la parité) est apparue premièrement dans la désintégration
(faible) des kaons. Les kaons peuvent se désintégrer parfois en des produits ayant une parité paire,
parfois en des produits ayant une parité impaire, ce qui contredit la loi de conservation de la parité.
Lee et Yang ont proposé que l’interaction faible brisait peut-être la parité. Une expérience menée
par Mme Wu en 1956 confirma cette hypothèse.
S
p2
I2
p1
I1
S
p2
I2
p1
I1
Figure 10.1. Schéma de l’expérience de Wu sur la violation de la parité. À gauche, le
schéma direct. À droite, celui obtenu par inversion de l’espace.
10.1. Interactions faibles
135
Dans cette expérience, on étudie la désintégration d’un noyau de
magnétique :
60
Co → 60 Ni + e− + ν̄
60
Co en présence d’un champ
(10.1)
Le champ magnétique permet d’imposer au noyau de cobalt une orientation fixe de son spin1 .
On détecte ensuite les électrons émis dans des directions opposées, comme indiqué sur le schéma
de la fig. 10.1 : deux détecteurs comptent les électrons et recoivent des intensités I1 et I2 (un seul
électron est émis par désintégration, bien-sûr, mais on compte ici les électrons émis par un très
grand nombre de désintégrations). Si on effectue une réflexion de l’espace (comme indiqué), alors les
deux détecteurs sont échangés, alors que le spin reste inchangé. Si la parité était conservée, alors les
deux détecteurs devraient recevoir la même intensité d’électrons (I1 = I2 ), car les deux situations
seraient indiscernables. En pratique, on procède non pas à un échange des deux détecteurs, mais à
une inversion du spin en changeant le sens du champ magnétique appliqué. En effet, si on procède
à une rotation de 180◦ par rapport à un axe perpendiculaire à la fois à p1 et à S, on retrouve la
situation originale, sauf que l’orientation du spin a été inversée. On trouve que l’intensité I1 n’est
pas la même avant et après le changement de sens du champ magnétique. Donc la parité n’est pas
conservée dans les interactions faibles.
10.1.1 Première théories des interactions faibles
La première théorie des interactions faibles a été proposée par Fermi en 1933. Elle est basée sur le
lagrangien d’interaction suivant :
G
(10.2)
LI = √F (p̄γ µ n)(ēγµ ν)
2
où nous avons défini γµ = gµν γ ν . Dans cette expression, les symboles p, n, e et ν désignent des
spineurs de Dirac décrivant respectivement un proton, un neutron, un électron et un neutrino.
Cette théorie fut la première où le concept de création et d’annihilation de particules matérielles
fit son apparition.
Ce lagrangien d’interaction mène au vertex suivant (à gauche) :
p
e
u
e
(10.3)
n
ν
d
ν
ou, de manière équivalent, à celui de droite, si on remplace le proton par un quark u et le neutron
par un quark d (les deux autres quarks du nucléon ne jouant aucun rôle dans le processus). La
désintégration β s’explique dans cette théorie par un diagramme de Feynman simple avec un
neutron comme état initial et un proton, un électron et un antineutrino dans l’état final. La
constante de couplage GF , appelée constante de couplage de Fermi, a les unités d’une masse inverse
au carré, et vaut
GF = 1.166 × 10−5 GeV−2
(10.4)
1
Pourvu que la température soit suffisamment basse pour que l’orientation du spin ne soit pas désordonnée
par les fluctuations thermiques. Ceci nécessite des températures de l’ordre de 10 mK et un processus de
désaimantation adiabatique.
136
10. Modèle standard des interactions électro-faibles
La théorie de Fermi, cependant, ne brise pas la parité et donc ne peut pas bien représenter tous les
processus causés par l’interaction faible, en particulier les processus dans lesquels la polarisation
des particules n’est pas moyennée.
10.1.2 Spineurs droit et gauche
Feynman et Gell-Mann ont modifié la théorie de Fermi pour y ajouter un ingrédient qui brise
explicitement la parité. Pour cela, ils ont utilisé la décomposition d’un spineur de Dirac en composantes droite et gauche (ou composantes chirales), que nous introduisons ici. Revenons pour cela
aux spineurs à deux composantes ψR et ψL qui composent le champ de Dirac, telles qu’introduites
à la section 7.1.1. Rappelons que, dans la représentation chirale, le spineur de Dirac à quatre
composantes est formé des spineurs droit et gauche à deux composantes de la manière suivante :
ψL
ψ=
(rep. chirale)
(10.5)
ψR
Dans le but d’extraire ces composantes dans le cadre de spineurs à 4 composantes, on introduit la
matrice suivante :
γ 5 = iγ 0 γ 1 γ 2 γ 3
(10.6)
La forme explicite de cette matrice est la suivante, dans les deux représentations utilisées des
matrices de Dirac :
−1 0
0 1
5
γ =
(rep. chirale)
(rep. de Dirac)
(10.7)
0 1
1 0
On définit ensuite les composantes droite et gauche du spineur de Dirac comme
ψR = 21 (1 + γ 5 )ψ
ψL = 12 (1 − γ 5 )ψ
(10.8)
En effet, dans la représentation chirale,
1
2 (1
5
+ γ )ψ =
et
1
2 (1
5
− γ )ψ =
0
1
1 0
0 0
0
0
ψ=
ψ=
0
ψR
ψL
0
(10.9)
(10.10)
Notons qu’ici nous utilisons la même notation (ψR et ψL ) pour les spineurs droit et gauche à
deux composantes, et pour les spineurs à quatre composantes correspondants. Notons aussi que
la définition (10.8) est valable dans toutes les représentation des matrices de Dirac; c’est la forme
matricielle précise de γ 5 qui change d’une représentation à l’autre.
En fonction de ces spineurs chiraux, on vérifie facilement que l’action de Dirac a la forme suivante :
LD = iψ̄ L γ µ ∂µ ψL + iψ̄ R γ µ ∂µ ψR − m(ψ̄ L ψR + ψ̄ R ψL )
(10.11)
On constate que le terme de masse couple les spineurs gauches et droits, alors que le reste du
lagrangien se sépare bien en deux termes, l’un gauche et l’autre droit.
Dans le cas sans masse, les spineurs droit et gauche décrivent des particules d’hélicité bien définie,
comme nous l’avons entrevu à la section 7.1.2. Dans ce cas, les spineurs droit et gauche peuvent être
considérés séparément, c’est-à-dire qu’on peut définir une théorie ne comportant que la composante
gauche ou que la composante droite, car les deux ne sont pas couplées par le terme de masse et donc
sont indépendantes. Dans le cas massif, les composantes chirales ne décrivent plus des particules
10.1. Interactions faibles
137
d’hélicité bien définie, mais demeurent utiles dans la description d’interactions qui brisent la parité,
comme nous le verrons dans les prochaines sections.
Une inversion de l’espace a comme effet d’échanger les composantes droite et gauche d’un spineur
de Dirac. Explicitement, dans la représentation chirale, la transformation de parité est
ψL (r, t)
ψR (−r, t)
0
ψ(r, t) =
→ ψ (r, t) =
= γ 0 ψ(−r, t)
(10.12)
ψR (r, t)
ψL (−r, t)
Cette forme de la transformation de parité reste la même dans toutes les représentations des
matrices de Dirac.
Étant donnés deux spineurs de Dirac ψ1 et ψ2 , la matrice γ 5 nous permet de définir un pseudoscalaire et un pseudo-vecteur :
ψ̄ 1 γ 5 ψ2 et ψ̄ 1 γ µ γ 5 ψ2
(10.13)
Ces deux quantités se transforment respectivement comme un scalaire et un vecteur lors des transformations de Lorentz qui n’impliquent pas d’inversion de l’espace. On vérifie, à l’aide de la forme
donnée ci-haut de la transformation de parité sur un spineur de Dirac, que la première quantité
(ψ̄ 1 γ 5 ψ2 ) change de signe lors d’une réflexion de l’espace : ce qu’on appelle un pseudo-scalaire. De
même, la partie spatiale de la deuxième quantité (ψ̄ 1 γ µ γ 5 ψ2 ) est un vecteur axial, c’est-à-dire un
vecteur qui ne change pas de signe lors d’une inversion de l’espace, aussi appelé pseudo-vecteur.
Rappelons que les vecteurs positions, quantité de mouvement, champ électrique sont des vecteurs
polaires, qui changent de signe lors d’une inversion de l’espace, alors que les vecteurs moment
cinétique et champ magnétique sont des pseudo-vecteurs.
10.1.3 Théorie V–A
Feynman et Gell-Mann on formé les quadri-courants à caractère polaire et axial suivants :
p̄γ µ n
p̄γ µ γ 5 n
et
ēγ µ ν
ēγ µ γ 5 ν
(10.14)
et ont proposé le lagrangien suivant pour les interactions faibles :
G
L = √F (p̄γ µ n − p̄γ µ γ 5 n)(ēγµ ν − ēγµ γ 5 ν) + c.h.
4 2
(10.15)
appelé communément V–A, car il provient de la soustraction d’un vecteur axial (A) d’un vecteur
polaire (V). Ce lagrangien peut aussi être vu comme un couplage de type Fermi, mais seulement
avec la composante gauche du neutron et du neutrino :
G
L = √F (p̄γ µ nL )(ēγµ νL ) + c.h.
2
(10.16)
Cette théorie de Feynman et Gell-Mann corrige les imperfections de la théorie de Fermi, c’est-à-dire
qu’elle contient une brisure explicite de la parité, et est conforme à tous les phénomènes impliquant
l’interaction faible connus à l’époque.
Insuffisance de la théorie V–A
La théorie V–A, comme la théorie de Fermi originale, ne peut pas être considérée comme une
théorie fondamentale des interactions faibles. La raison en est qu’elle n’est pas renormalisable.
Autrement dit, tous les calculs perturbatifs qui sont fait au-delà de l’ordre le plus bas n’ont pas de
sens. L’une des conséquences de ce fait, assez simple à démontrer, est la violation de l’unitarité.
Expliquons. Considérons la section efficace pour la diffusion par interaction faible entre un électron
et un neutrino. Ce processus doit être très peu probable. Dans le référentiel du centre d’impulsion
138
10. Modèle standard des interactions électro-faibles
des deux particules, la section efficace doit, au premier ordre de la théorie des perturbation, être
proportionnelle à G2F (car GF apparaı̂t linéairement dans le diagramme de Feynman associé et donc
dans l’amplitude de diffusion). Mais l’amplitude de diffusion est sans unités, alors que GF a les
unités d’une masse inverse au carré. Il faut donc que l’amplitude de diffusion soit proportionnelle
à une quantité ayant les unités de la masse au carré, soit la masse invariante de la réaction (la
seule possibilité). Donc l’amplitude croı̂t comme le carré de la masse invariante, et cette dernière
quantité est proportionnelle à l’énergie de l’électron incident. Ceci signifie que la section efficace
va croı̂tre sans bornes avec l’énergie, ce qui est absurde. À un moment donné, la probabilité de
collision d’un électron avec un neutrino sera plus grande que un! C’est ce qu’on appelle une violation
de l’unitarité, en somme une non-conservation de la probabilité. Le problème est que les ordres
supérieurs de la théorie des perturbations devraient être inclus, et qu’ils ne peuvent l’être parce
que la théorie n’est pas renormalisable.
10.2 Théorie de jauge SU(2)× U(1)
La solution proposée au problèmes de la théorie V–A est de la considérer comme une théorie effective, une approximation d’une théorie plus fondamentale qui serait, elle, renormalisable. Dès 1961,
Glashow proposa une théorie incomplète qui unifiait l’interaction électromagnétique et l’interaction
faible en une seule interaction électro-faible. En 1967, Weinberg et Salam proposèrent qu’il devait
s’agir d’une théorie de jauge non abélienne, mais que l’état fondamental (le vide) ne serait pas
invariant de jauge, ce qu’on appelle une brisure spontanée de la symétrie. En 1971, t’Hooft et Veltman démontrèrent que cette théorie compliquée est renormalisable. Glashow, Weinberg et Salam
reçurent le prix Nobel en 1979 pour l’élaboration de cette théorie; t’Hooft et Veltman le reçurent
une vingtaine d’années plus tard pour avoir démontré que la dite théorie était cohérente. Nous
allons maintenant décrire cette théorie.
La théorie électro-faible est une théorie de jauge basée sur le produit de groupes SU(2)×U(1). C’est
donc qu’elle comporte trois champs de jauge pour SU(2) (le nombre de générateurs), qu’on notera
Aaµ (a = 1, 2, 3) et un champ de jauge pour U(1), qu’on notera Bµ . Ce champ de jauge U(1) se
comporte en principe de la même manière que le champ électromagnétique, sauf qu’il ne se couple
pas à la charge électrique, mais à une autre quantité Y appelée hypercharge faible2 . Par analogie
avec le spin, l’espace abstrait sur lequel agit le groupe SU(2) est appelé espace d’isospin faible.
Les fermions fondamentaux qui se couplent à ces champs de jauge doivent occuper des représentations bien précises de SU(2) et avoir une valeur précise de l’hypercharge Y . Dans la théorie
électrofaible, tous les fermions sont sans masse au départ (la masse est générée plus tard, par
le mécanisme de Higgs décrit plus bas). Donc les composantes droites et gauches des fermions sont
indépendantes à ce stade, et peuvent appartenir à des représentations différentes du groupe SU(2),
ce qui permet d’introduire une violation maximale de la parité.
Commençons par traiter le cas d’une seule famille de particules élémentaires, soit les quarks u et d,
l’électron et le neutrino électronique. Les champs associés à ces particules sont agencés come suit :
νL
uL
eR , uR , dR
(10.17)
`L =
qL =
eL
dL
où on remarque deux doublets d’isospin faible, formé des composantes gauches des leptons et
des quarks, respectivement. Les composantes droites forment des singulets d’isospin faible, ce qui
2
Ne pas confondre avec l’hypercharge introduite dans la classification des hadrons, qui est une combinaison
de l’étrangeté et de la charge électrique.
10.2. Théorie de jauge SU(2)× U(1)
139
signifie qu’ils n’interagissent pas avec le champ de jauge SU(2). Ces différent doublets et singulets
ont les valeurs suivantes de l’hypercharge :
champ
Y
`L = (ν, e)L −1
Q = 21 Y + T3
(0, −1)
qL = (u, d)L
1
3
( 32 , − 13 )
eR
−2
−1
uR
4
3
2
3
dR
− 23
− 31
On a aussi indiqué pour chaque champ la valeur de la charge électrique, qui est une combinaison
de l’hypercharge et du troisième générateur de SU(2).
Le lagrangien de la théorie est simple : l’action de Dirac s’applique à tous les champs, la dérivée
covariante remplaçant la dérivée ordinaire :
Dµ = ∂µ + igAaµ T a + ig 0 21 Y Bµ
(10.18)
où les T a sont les générateurs de SU(2) dans la représentation considérée, et où le facteur 21 devant
Bµ est conventionnel : il affirme simplement que le champ Bµ se couple à l’hypercharge divisée
par deux, et non à l’hypercharge directement. Les constantes de couplage g et g 0 sont distinctes,
car elles n’ont pas besoin d’être identiques pour garantir l’invariance de jauge de la théorie. Par
exemple, sur le doublet de leptons gauches, on a
(10.19)
Dµ `L = ∂µ + ig 12 Aaµ σ a − i 12 g 0 Bµ `L
où les générateurs de SU(2) sont les matrices de Pauli (divisées par 2), alors que pour l’électron
droit, on a simplement
Dµ eR = ∂µ − ig 0 Bµ eR
(10.20)
où les générateurs de SU(2) sont nuls (correspondant à la représentation triviale de SU(2), où tous
les éléments du groupe sont associés au nombre 1).
Aux lagrangiens des fermions, on doit ajouter ceux des champs de jauge :
LAB = −
1 a aµν
1
Fµν F
−
G Gµν
16π
16π µν
(10.21)
a
où Fµν
est le tenseur de Faraday du champ de jauge SU(2) Aaµ , alors que Gµν est celui du champ
de jauge abélien Bµ :
a
Fµν
= ∂µ Aaν − ∂ν Aaµ − gεabc Abµ Acν
Gµν = ∂µ Bν − ∂ν Bµ
(10.22)
Notons que les constantes de structure de SU(2) sont simplement fabc = εabc d’après les relation de
commutation des matrices de Pauli divisées par deux, qui sont celles des composantes du moment
cinétique.
Si cette théorie en restait là, alors nous aurions affaire à un ensemble de particules sans masses
(oublions la QCD et le confinement pour le moment) interagissant via deux champs de jauge
distincts associés à 4 bosons de spin 1 similaires au photon. La différence serait que les trois bosons
associés aux champs SU(2) interagissent entre eux et forment ensemble une théorie non linéaire.
140
10. Modèle standard des interactions électro-faibles
La réalité est plus complexe, car les interactions faibles ont une portée très courte et les trois bosons
en questions n’ont été découverts qu’en 1983 et ont des masses de l’ordre de 80–90 GeV. C’est la
brisure spontanée de l’invariance de jauge qui explique cet état de fait.
10.3 Brisure spontanée de la symétrie : mécanisme de Higgs
Le mécanisme de Higgs modifie le contenu physique de la théorie électrofaible décrite ci-haut en
conférant une masse à trois des quatre bosons de jauge et en donnant une masse non nulle aux
fermions. Il se base sur la présence dans la théorie d’un champ scalaire Φ, en plus des fermions
décrits plus haut et des champs de jauge. Ce champ scalaire représente un boson de spin zéro, qui
forme cependant un doublet complexe d’isospin faible et qui possède une hypercharge Y = 1. On
peut exprimer ce doublet comme
+
φ
(10.23)
Φ=
φ0
où l’assignation des charges électriques des membres du doublet correspond bien à Q = 12 Y + T3 .
Rappelons qu’un champ scalaire ordinaire, obéissant à l’équation de Klein-Gordon, est décrit par
le lagrangien suivant :
L = 21 ∂µ φ∂ µ φ − 12 m2 φ2
(10.24)
Un tel champ, cependant, ne peut pas être incorporé à une théorie de jauge (abélienne ou non)
car il n’admet aucune transformation de symétrie : il ne possède qu’une seule composante, réelle
de surcroı̂t. Pour qu’un champ scalaire puisse se coupler au champ électromagnétique, il doit
représenter une particule chargée et donc doit nécessairement être complexe (par opposition à
réel). En effet, il doit pouvoir admettre une transformation de jauge, qui prend alors la forme
φ → φ0 = eieξ φ
(10.25)
Un champ scalaire complexe peut être vu comme formé de deux champ scalaires
√ réels (un pour√sa
partie réelle, l’autre pour sa partie imaginaire), de sorte que φ = (φ1 + iφ2 )/ 2 (le facteur de 2
est conventionnel). Le lagrangien du champ scalaire complexe est alors
X
µ
∗ µ
2
2
1
1 2 2
L=
(10.26)
2 ∂µ φi ∂ φi − 2 m φi = ∂µ φ ∂ φ − m |φ|
i=1,2
Ce champ complexe peut se coupler au champ électromagnétique par couplage minimal, soit en
remplaçant ∂µ φ par Dµ φ.
On pourrait, raffinement supplémentaire, ajouter un terme en |φ|4 à ce lagrangien :
L = (Dµ φ)∗ Dµ φ − m2 |φ|2 − λ|φ|4
(10.27)
Dans ce cas, la théorie n’est plus soluble exactement. Le terme en |φ|4 correspond à une interaction
du champ avec lui-même, un peu comme dans la théorie de Fermi des interactions faibles, sauf que
les particules impliquées sont des bosons. Notons que la constante de couplage λ n’a pas d’unités,
ce qui entraı̂ne que la théorie est renormalisable et qu’elle constitue donc une théorie physique
acceptable en principe.
Pour qu’un champ scalaire puisse aussi interagir avec les champs de jauge Aaµ de SU(2), il ne doit
pas former un singulet de SU(2), mais appartenir à une représentation non triviale de SU(2). La
possibilité la plus simple est le doublet décrit plus haut.
10.3. Brisure spontanée de la symétrie : mécanisme de Higgs
141
Le lagrangien de ce doublet, dit doublet de Higgs, est
LH = (Dµ Φ)† (Dµ Φ) − V (Φ)
V (Φ) = −µ2 Φ† Φ + λ(Φ† Φ)2
(10.28)
Le premier terme du lagrangien est simplement le lagrangien d’un champ scalaire ordinaire, où
les dérivées ordinaires ont été remplacées par des dérivées covariantes pour assurer l’invariance de
jauge. Comme Φ est un doublet d’hypercharge 1, on a
Dµ Φ = ∂µ Φ + 12 igAaµ σ a Φ + 12 ig 0 Bµ Φ
(10.29)
V(|Φ|)
√
ν/ 2–
|Φ|
Figure 10.2. Le potentiel de Higgs V (|Φ|).
Le deuxième terme du lagrangien est un potentiel V (Φ) qui ne dépend que de la grandeur Φ† Φ =
|φ+ |2 + |φ0 |2 . Le potentiel V (|Φ|) associé a ceci de particulier que, en raison du signe négatif du
terme quadratique,
son minimum n’est pas situé à |Φ| = 0, mais à une valeur non nulle de |Φ|
√
qu’on note v/ 2 (voir fig. 10.2). Ceci signifie
√ que la valeur du champ Φ n’est pas nulle dans
l’état fondamental, mais telle que |Φ| = v/ 2. Mais il faut voir le potentiel V dans un espace
à 4 dimensions (Φ possède l’équivalent de 4 composantes réelles) dont seule une coupe dans une
direction particulière est illustrée à la fig. 10.2. En effet, le potentiel, comme le reste du lagrangien,
est invariant par transformation de jauge
Φ → Φ0 = U eiθ Φ
(10.30)
où U est une matrice appartenant à SU(2) et θ est un facteur de phase associé à la symétrie de jauge
U(1) de l’hypercharge. Dans l’état fondamental, le système choisit une direction dans cet espace
quadri-dimensionnel. Il y a donc brisure de la symétrie de jauge dans l’état fondamental, même si
le lagrangien est invariant. Ce phénomène porte le nom de brisure spontanée de la symétrie, et
intervient couramment dans les théories d’unification des particules et, surtout, en physique de la
matière condensée. La conséquence de cette brisure spontanée, c’est-à-dire de la valeur constante
non-nulle de Φ, est que les champs de jauge qui interagissent avec ce champ constant deviennent
massifs. Ils sont en quelque sorte “alourdis” par leur interaction avec un champ qui possède une
valeur constante, comme nous allons maintenant le voir en détail.
En première approximation, supposons que le champ de Higgs est exactement égal à sa valeur dans
l’état fondamental, c’est-à-dire
0√
Φ=
(10.31)
v/ 2
et négligeons les fluctuations du champ Φ autour de cette valeur constante. Nous avons manifestement choisi une direction dans l’espace interne du doublet, en supposant que la valeur de φ+ dans
le vide est nulle – ce qui signifie a posteriori que le vide n’est pas chargé électriquement et donc
que l’invariance de jauge électromagnétique est préservée – et que la valeur de φ0 est réelle.
142
10. Modèle standard des interactions électro-faibles
Voyons maintenant ce que produit le lagrangien du doublet de Higgs quand on substitue cette
valeur de Φ. Toutes les dérivées sont nulles, bien sûr, mais il reste les couplages aux champs de
jauge, qui deviennent
1
iv
v 1
gAµ − igA2µ
0
a a
1 0
= √
(10.32)
Dµ Φ → √ ( 2 igAµ σ + 2 ig Bµ )
0
3
1
2
2 2 g Bµ − gAµ
Le lagrangien du doublet devient alors
† 1µ
v 2 gA1µ − igA2µ
gA − igA2µ
LH →
g 0 B µ − gA3µ
8 g 0 Bµ − gA3µ
v 2 2 1 1µ
=
g (Aµ A + A2µ A2µ ) + (g 0 Bµ − gA3µ )(g 0 B µ − gA3µ )
8
(10.33)
On voit que des termes quadratiques dans les champs de jauge sont générés, ce qui correspond
à conférer à ces champs une masse. En effet, un terme quadratique (de signe négatif) dans le
lagrangien du champ scalaire est associé à une masse de ce champ. Ceci vaut aussi pour chacune
des composantes d’un champ vectoriel, comme pour un champ scalaire. Mais ce ne sont pas tous
les champs de jauge qui acquièrent une masse dans ce mécanisme. Il est pratique alors de définir
les combinaisons suivantes :
1
Wµ± = √ A1µ ± iA2µ
2
−g 0 Bµ + gA3µ
Zµ0 = p
g 2 + g 02
gBµ + g 0 A3µ
Aµ = p
g 2 + g 02
(Wµ− = (Wµ+ )∗ )
(10.34)
En fonction de ces combinaisons, les termes de masses du lagrangien deviennent
LH →
vg 2
2
(W +µ )∗ Wµ+ +
1 v2 2
(g + g 02 )Z 0µ Zµ0
2 4
(10.35)
alors que la combinaison Aµ , qui est en fait le champ électromagnétique, demeure sans masse. On
exprime souvent les combinaisons de champs A et Z en fonction de l’angle de Weinberg θW , défini
par
g0
g
g0
sin θW = p
cos θW = p
tan θW =
(10.36)
g
g 2 + g 02
g 2 + g 02
On écrit alors
Zµ0 = cos θW A3µ − sin θW Bµ
(10.37)
Aµ = sin θW A3µ + cos θW Bµ
D’après l’éq. (10.35), le rapport de masse du W ± au Z 0 est
s
mW
g2
= cos θW
=
mZ
g 2 + g 02
(10.38)
et les valeurs observées sont :
mW = 80.42 GeV
mZ = 91.19 GeV
sin2 θW ≈ 0.23
(10.39)
10.3. Brisure spontanée de la symétrie : mécanisme de Higgs
143
Note : Le champ complexe Wµ+ porte une charge électrique et son conjugué complexe est Wµ− .
Ceci signifie que le boson W + interagit avec le photon (il peut en émettre et en absorber) et que
le boson W − est son antiparticule. Le couplage du champ Wµ+ au photon est en fait un couplage
au champ A3µ et résulte de la nature non-abélienne de la symétrie de jauge SU(2).
10.3.1 Courants chargés, neutres et électromagnétique
En fonction des nouveaux champs de jauge W ± , Z 0 et A, le lagrangien d’interaction entre les
fermions et les bosons de jauge a une apparence différente. Pour mieux l’exprimer, nous utilisons
la notion de courant et écrivons les termes d’interaction comme
où
LI = gJ aµ Aaµ + g 0 J Y µ Bµ
(10.40)
J aµ = 12 `¯L γ µ σ a `L + 12 q̄L γ µ σ a qL
X
Yα f¯α γ µ fα
J Y µ = 21
(10.41)
α
où la somme dans la deuxième équation est prise sur toutes les espèces de fermions fα présentes,
droites et gauches, et Yα est l’hypercharge de chaque espèce.
On voit facilement que les courant J 1 et J 2 peuvent être réorganisés en J ± = J 1 ± iJ 2 , ce qui mène
à un premier terme d’interaction
g
LCC = √ J +µ Wµ+ + J −µ Wµ−
(10.42)
2
Les courants J ± sont appelés courants chargés parce qu’ils sont couplés à des particules chargées
et parce qu’en tant qu’opérateurs, ils ne sont pas invariants lors d’une transformation de jauge
électromagnétique (d’où l’indice CC).
Par ailleurs, on peut vérifier sans problème que les combinaisons linéaires suivantes de J 3 et J Y se
couplent respectivement à A et Z 0 :
J em = 21 J Y + J 3
J 0 = J 3 − sin2 θW J em
c’est-à-dire que
LCN = eJ emµ Aµ +
(10.43)
g
J 0µ Zµ0
cos θW
(10.44)
où on a introduit la constante de couplage électromagnétique e = g sin θW , alors que le quotient
g/ cos θW représente la constante de couplage faible. L’indice CN signifie courants neutres.
d
ν
d
W
u
ν
u
W
e
u
ν
Z0
e
u
ν
Figure 10.3. Diagrammes typiques résultants des interactions des bosons W ± et Z 0
avec les courants chargés et neutres, respectivement.
144
10. Modèle standard des interactions électro-faibles
Des diagrammes de Feynman typiques résultant des lagrangiens LCC et LCN et représentant des
interactions faibles sont représentés à la figure 10.3. Notons que les courants neutres impliquent
des fermions de la même espèce, car ils sont construits à partir de générateurs diagonaux. Par
contre, les courants chargés impliquent un changement d’espèce de fermions, à l’intérieur d’un
même doublet d’isospin faible.
10.3.2 Relation avec la théorie V–A
Pourquoi les interactions faibles sont-elles faibles? Parce que les bosons de jauge associés sont
massifs. Ainsi, dans un processus d’interaction comme ceux illustrés à la figure 10.3, la particule
virtuelle émise (le boson) représente une énorme fluctuation d’énergie (en raison de sa grande masse)
et doit donc exister pour un temps extrêmement court. Une façon plus exacte de traiter le problème
est de se souvenir de notre traitement de la théorie des perturbations du champ de Schrödinger
avec un champ scalaire relativiste. Nous avons alors calculé les diagrammes explicitement et les
avons combinés de manière à faire ressortir un dénominateur de la forme 1/(ω 2 − q 2 ), où ω est
l’énergie de la particule virtuelle (obtenue par conservation de l’énergie au vertex du diagramme)
et q sa quantité de mouvement (obtenue de la même manière). Si la particule virtuelle avait été
massive, un résultat légèrement différent aurait été obtenu et un facteur
ω2
1
− q 2 − m2
(10.45)
serait apparu, m étant la masse de la particule virtuelle. Dans le cas des bosons W ± et Z 0 , et de
processus impliquant des transferts d’énergie et d’impulsion faibles devant m, ce facteur se réduit
à 1/m2 . L’amplitude de diffusion obtenue du diagramme de Feynman est donc de l’ordre g 2 /m2W
pour les courants chargés, et en fait identique pour les courants neutres.
On pourrait en fait remplacer l’interaction de jauge par une interaction effective courant-courant
qui aurait la forme suivante :
Leff.
CC = −
g 2 + +µ
J J
2m2W µ
Leff.
CN = −
g 2 0 0µ
J J
2m2Z µ
(10.46)
On vérifie que cette interaction (du moins la partie courants chargés) coı̈ncide avec l’interaction
V–A. La relation entre les constantes de couplage est
g2
GF
√ =
8m2W
2
(10.47)
La dimension (unités) de la constante GF et sa petite valeur trouvent ici une explication naturelle.
En fait, les interaction faibles ne sont faibles qu’aux petites énergies. Dans les processus à très
haute énergie, impliquant des transferts d’énergie et de quantité de mouvement de l’ordre de la
masse mW ou plus grands, les interactions faibles sont d’une force comparable à l’interaction
électromagnétique. En fait, à ces grandes énergies, les masses des bosons intermédiaires perdent
de leur importance. La constante de couplage g 2 = e2 / sin2 θW ≈ 1/30 est en fait plus grande
que la constante de structure fine électromagnétique, de sorte que ces interactions sont en fait
plus intenses que l’interaction électromagnétique, mais restent tout de même dans le régime où la
théorie des perturbations est applicable.
10.5. Réplication des familles et mélange des quarks
145
10.4 Génération des masses
Jusqu’ic, dans notre traitement de la théorie électrofaible, les fermions sont toujours sans masse.
Il est possible de leur conférer une masse par le mécanisme de Higgs, comme pour les bosons de
jauge. Il suffit pour cela de postuler que le doublet de Higgs Φ est couplé aux fermions par un
terme d’interaction simple, dit de Yukawa :
Lf H = f (e) `¯L eR Φ + f (u) q̄L uR Φ̃ + f (d) q̄L dR Φ + c.h.
(10.48)
où les constantes de couplage f (e,u,d) sont des paramètres supplémentaires de la théorie électrofaible, et où Φ̃ = iσ 2 Φ∗ est le champ de Higgs conjugué.
Ces interactions de Yukawa ne sont pas arbitraires : elles sont invariantes de Lorentz et invariantes
de jauge (le doublet de Higgs est toujours apparié à √
un doublet d’isospin faible). Lorsque le doublet de Higgs a une valeur moyenne non nulle (0, v/ 2) dans le vide, ces couplages, en première
approximation, deviennent des termes de masse pour les fermions :
v
v
v
Lf H → f (e) √ ēL eR + f (u) √ ūL uR + f (d) √ d¯L dR + c.h.
(10.49)
2
2
2
et les masses des fermions sont simplement
v
v
mu = f (u) √
me = f (e) √
2
2
v
md = f (d) √
2
(10.50)
Ainsi, tous les fermions – sauf les neutrinos, qui n’ont pas, dans ce modèle, de composante droite
– acquièrent une masse par brisure spontanée de la symétrie de jauge.
10.5 Réplication des familles et mélange des quarks
Une subtilité de la théorie électro-faible apparaı̂t lorsqu’on l’applique non seulement à une famille de
particules élémentaire, mais aux trois familles. Rappelons l’agencement des particules élémentaires
connues dans ces trois familles, en énumérant tous les doublets d’isospin faible :
νe
νµ
ντ
e
µ
τ
(10.51)
u
d
c
s
t
b
Chaque famille (i.e. colonne) de ce tableau est couplée aux champs de jauge exactement de la
même manière. Cependant, les couplages de Yukawa peuvent être plus généraux, et mélanger des
fermions de familles différentes : Combinons les trois familles dans une notation succintes pour les
différents membres des doublets (a = 1, 2, 3) :
ea = (e, µ, τ )
pa = (u, c, t)
na = (d, s, b)
(10.52)
Les couplages de Yukawa généraux peuvent alors s’écrire comme
(e)
(p)
(n)
Lf H = fab `¯a,L eb,R Φ + fab q̄a,L ub,R Φ̃ + fab q̄a,L db,R Φ + c.h.
Les termes de masse correspondants sont
o
v n (e)
(p)
(n)
Lf H → √ fab ēa,L eb,R + fab ūa,L ub,R + fab d¯a,L db,R + c.h.
2
(10.53)
(10.54)
146
10. Modèle standard des interactions électro-faibles
Nous avons donc affaire à des matrices de masse
(e,p,n)
Mab
v (e,p,n)
= √ fab
2
(10.55)
qu’il faut diagonaliser. Cette diagonalisation peut se faire à l’aide d’une transformation biunitaire
M = SMd T †
(10.56)
où ls matrice Md est diagonale et les matrices S et T sont unitaires.3
La diagonalisation est nécessaire afin de pouvoir interpréter les interactions en fonction de particules
bien définies. Il s’agit ici de l’équivalent des modes normaux dans un système d’oscillateurs. On doit
d’abord identifier les modes normaux avant de traiter les effets non linéaires dans un tel système,
c’est-à-dire l’équivalent ici des interactions.
Adoptons maintenant un changement de notation : tous les champs considérés précédemment seront
affublés d’un prime (0 ) et seront qualifiés d’états propres de jauge, en ce sens que les courants chargés
et neutres sont diagonaux en fonction de ces champs. Les termes de masses, cependant, ne le sont
pas, et ont la structure ψL0 M ψR0 , où ψ 0 désigne e0 , p0 ou n0 . Après diagonalisation, on trouve
ψL0 M ψR0 = ψL0 SMd T † ψR0 = ψL Md ψR
(10.57)
où on a défini les champs diagonaux (états propres de la masse) ψL = S † ψL0 et ψR = T † ψR0 .
Ceci implique que les courants chargés et neutres ne sont pas diagonaux dans les nouveaux champs
e, p et n et donc que les interactions faibles peuvent effectuer des transitions entre les différentes
familles. Voyons comment cela fonctionne : la contribution des quarks au courant chargé J +µ
devient, en fonctions des états propres de la masse,
J +µ = q̄L0 γ µ σ + qL0 = p̄0L γ µ n0L = p̄L S (p)† γ µ T (n) nL = p̄L γ µ U nL
(10.58)
où la matrice U = S (p)† T (n) est unitaire, et caractérise un mélange des quarks (d, c, b) se couplant
au quark u dans le courant chargé.
Ceci signifie, par exemple, que dans les diagrammes de la fig. 10.3, le quark d devrait être remplacé
par la combinaison Udd d + Uds s + Udb b, et donc que des processus sont possibles par lesquels un
quark s se désintègre en quark u et en leptons. On pourrait reprendre le même raisonnement avec
les courants neutres. La matrice U porte le nom de matrice de Cabibbo-Kobayashi-Masakawa
(matrice CKM), et ses éléments forment aussi des paramètres du modèle standard (en fait, seuls 4
paramètres sont vraiment indépendants dans la spécification de cette matrice).
Qu’en est-il des leptons? Les neutrinos n’ayant pas de masse (en raison de l’absence des neutrinos
droits νR de la théorie), la contribution des leptons au courant chargés s’écrit plutôt
J +µ = `¯0L γ µ σ + `0L = ν̄L0 γ µ e0L = ν̄L0 γ µ T (e) eL
(10.59)
Mais les neutrinos n’ayant pas de masse, les trois espèces sont dégénérées. Donc on peut sans peine
définir ν = T (e)† ν 0 sans affecter les masses (nulles) des neutrinos : ν 0 et ν représentent tous les deux
des états propres de la masse. Le courant chargé leptonique reste donc diagonal en fonction des
familles de leptons :
J +µ = ν̄L γ µ eL
(10.60)
3
On peut montrer relativement facilement – ce que nous ne prenons pas le temps de faire ici – que toute
matrice M peut être diagonalisée de cette façon. Si M est diagonalisable au sens habituel du terme, c’est que
S = T ; c’est le cas si M est hermitique.
10.6. La symétrie CP et sa brisure
147
10.5.1 Angle de Cabibbo
Le cas de deux familles est plus simple, et a été étudié plus tôt. Dans ce cas, la matrice CKM est
2 × 2 et ne comporte comme paramètre indépendant qu’un angle θc appelé angle de Cabibbo :
cos θc
sin θc
(10.61)
U=
− sin θc cos θc
ce qui donne le courant neutre hadronique suivant :
cos θc
+µ
µ
µ
J = p̄L γ U nL = ( ūL c̄L ) γ
− sin θc
sin θc
cos θc
dL
sL
(10.62)
= cos θc ūL γ µ dL + sin θc ūL γ µ sL − sin θc c̄L γ µ dL + cos θc c̄L γ µ sL
De cette manière, on conclut que l’amplitude du processus de désintégration s → ueν est tan θc
fois l’amplitude correspondante pour la désintégration du quark d. La valeur observée de l’angle
de Cabibbo est θc = 0.222. Mais gardons à l’esprit que la matrice CKM est en réalité 3 × 3 et que
d’autres angles et phases interviennent. Mais le mélange entre la première et la deuxième famille
est le plus important.
10.6 La symétrie CP et sa brisure
Les interactions faibles brisent la parité, car seuls les fermions gauches interviennent dans la
symétrie de jauge SU(2). Cette violation est maximale, en ce sens qu’elle n’est pas caractérisée
par un petit paramètre, mais est aussi grande qu’elle pourrait l’être. Cette brisure de la parité P
s’accompagne d’une brisure correspondante de la conjugaison de charge C.
En effet, lorsqu’on applique l’opérateur de conjugaison de charge sur un spineur droit, on obtient
un spineur gauche :
CψR = iγ 2 ψR∗ = 21 iγ 2 ((1 + γ 5 )ψ)∗ = 21 (1 − γ 5 )iγ 2 ψ ∗ = (ψc )L
(10.63)
parce que γ 5 anticommute avec γ 2 . En clair, l’opération de conjugaison de charge remplace la
composante droite d’une particule par la composante gauche de son antiparticule. Or, dans la
théorie électrofaible, on trouve des neutrinos gauches et des antineutrinos gauches, mais pas de
neutrinos et d’antineutrinos droits. Donc cette théorie n’est pas invariante par conjugaison de
charge.
Notons cependant qu’elle est invariante sous l’action combinée de la parité et de la conjugaison de
charge. L’opération de parité échange les composantes droite et gauche, de sorte que l’opération
CP change un neutrino droit en un antineutrino droit, et la théorie est bel et bien invariante par
cette opération. On dit alors qu’elle conserve CP.
L’une des conséquences de cette conservation de CP est le mélange des kaons neutres, expliqué par
Gell-Man et Pais en 1955. Les kaons neutres K 0 et K̄ 0 sont les antiparticules l’une de l’autre. Leur
contenu en quarks est
K 0 = s̄d
K̄ 0 = sd¯
(10.64)
Ces particules sont, en quelque sorte, des états propres des interactions fortes, qui les crée sous
cette forme lors de réactions hadroniques. Par contre, ces particules ne sont pas des états propres
de C, car, symboliquement, C|K 0 i = |K̄ 0 i et C|K̄ 0 i = |K 0 i. Ce sont cependant des états propres
de P , avec une parité intrinsèque η = −1. Comme la désintégration des ces particules est gouvernée
148
10. Modèle standard des interactions électro-faibles
par les interactions faibles, il est normal de chercher à les décrire par des états propres de CP, qui
est conservé par les interactions faibles. On construit donc les combinaisons linéaires suivantes :
1
|K2 i = √ |K 0 i + |K̄ 0 i
2
1
|K1 i = √ |K 0 i − |K̄ 0 i
2
(10.65)
qui sont des états propres de CP avec valeurs propres +1 et −1 respectivement. Par exemple,
1
1
1
CP |K1 i = √ CP |K 0 i − CP |K̄ 0 i = √ η C|K 0 i − C|K̄ 0 i = √ η |K̄ 0 i − |K 0 i = |K1 i
2
2
2
(10.66)
Les deux états K1 et K2 ne se désintègrent pas de la même façon. K1 peut se désintégrer en deux
pions : K1 → π + π − ou K1 → π 0 π 0 . En effet, plaçons-nous dans le référentiel du kaon; l’état initial
et l’état final on un spin nul et le moment cinétique orbital des deux pions est donc nul. La parité
de la fonction d’onde des deux pions est donc +1. Lorsqu’on applique une inversion de l’espace,
les deux pions, qui s’en vont dans des directions opposées, sont échangés, et ils sont échangés de
nouveau losrqu’on applique la conjugaison de charge, car ils sont l’antiparticule l’un de l’autre (le
π 0 est, quant à lui, sa propre antiparticule, ce qui revient au même). Donc l’état final est invariant
par CP, c’est-à-dire qu’il est un état propre de CP avec valeur propre +1. La désintégration est
donc permise, en vertu de la conservation de CP dans les interactions faibles. Par contre, K2 ayant
CP = −1, ne peut pas se désintégrer en deux pions, mais il peut se désintégrer en trois pions :
K2 → πππ. Comme l’énergie cinétique disponible dans l’état final est moindre dans ce cas, l’espace
des phases est plus restreint et le taux de désintégration est plus faible, menant à des vies moyennes
différentes :
τ1 = 0.9 × 10−10 s
τ2 = 0.5 × 10−7 s
(10.67)
Le K2 vie en moyenne 550 fois plus longtemps que le K1 .
1
0.8
0.6
K0
0.4
0.2
_
K0
2
4
6
8
10
12
t/τ1
Figure 10.4. Évolution dans le temps de la probabilité de trouver un kaon K 0 et un
antikaon K̄ 0 dans un faisceau ne contenant initialement que des k 0 .
Nous pouvons caractériser la propagation de ces particules en spécifiant leur masse et leur vie
moyenne inverse Γ = τ −1 . En fonction, du temps, l’état |K1 i évolue de la manière suivante :
|K1 (t)i = a1 (t)|K1 i où a1 (t) = a1 (0)e−im1 t−Γ1 t/2
(10.68)
10.6. La symétrie CP et sa brisure
149
et pareillement pour K2 . Les conditions initiales font que seuls les K0 sont produits à t = 0. En effet,
¯ simplement
la production associée de quarks s et s̄ fait que l’état s̄d est formé, mais pas l’état sd,
¯
parce qu’il n’y a pas de quark d dans la cible frappée par le faisceau de l’accélérateur. Le s̄ se
combine à d (ou à u) pour former un kaon, et le s au reste des quarks pour former un baryon.
Comme
1
1
K̄ 0 = √ (|K1 i − |K2 i)
(10.69)
K 0 = √ (|K1 i + |K2 i)
2
2
√
Les conditions initiales sont a1 (0) = a2 (0) = 1/ 2, et la probabilité de trouver un K 0 ou un K̄ 0
au temps t dans le faisceau de kaons ainsi créé est
I(K 0 ) = 21 |a1 (t) + a2 (t)|2 = 14 e−Γ1 t + e−Γ2 t + 2e−(Γ1 +Γ2 )t/2 cos(∆mt)
(10.70)
I(K̄ 0 ) = 21 |a1 (t) − a2 (t)|2 = 14 e−Γ1 t + e−Γ2 t − 2e−(Γ1 +Γ2 )t/2 cos(∆mt)
où ∆m = |m1 − m2 |. Ce comportement est illustré à la fig. 10.4. On a mesuré que ∆mτ1 =
0.477 ± 0.002. Ceci équivaut à une différence de masse ∆m = 3.49 × 10−12 MeV.
Nous avons vu que les K 0 sont produits par impact d’un faisceau de protons sur un cible, alors
que les K̄ 0 ne peuvent être produits de cette façon, car ils contiennent un quark d¯ qui n’existe pas
dans la cible. Ce quark est généré par les interactions faibles au cours de la propagation du kaon.
Lorsque le faisceau de kaons frappe une cible, la situation est inversée : l’antikaon K̄ 0 peut réagir
facilement avec la matière de la cible, car le quark anti-d qu’il contient peut facilement s’annihiler
avec les quarks d de la cible, alors que le quark s du kaon ne peut pas s’annihiler avec un antis, absent de la cible. Donc les anti-kaons réagiront facilement avec la cible pour produire d’autre
chose alors que les kaons seront beaucoup moins affectés par la cible et pourront la traverser intacte
(ce sont toutes les deux des particules neutres et donc seules les interactions fortes les affectent
d’une manière importante dans la cible). Ce phénomène est appelé regénération, même si en réalité
les kaons ne sont pas regénérés : ce sont les anti-kaons qui sont éliminés du faisceau qui traverse
la cible. En mesurant le flux de kaons sortant de la deuxième cible, en fonction de la distance
entre la première cible (qui produit les kaons en premier lieu) et la deuxième, on arrive à mesurer
l’amplitude |a1 (t) + a2 (t)|2 et à confirmer les prédictions de la fig. 10.4.
La physique des kaons est une application particulièrement frappante de la mécanique quantique
d’un système à deux niveaux, et illustre très bien la notion de particule en mécanique quantique,
avec les superpositions possibles qu’elle implique.
10.6.1 Brisure de CP
Les kaons neutres existent donc en deux espèces, qu’on a appelé K1 et K2 , mais qu’on devrait de
manière plus prudente appeler KS0 et KL0 (S et L pour short et long) désignant respectivement les
états à vie moyenne courte et longue. Si la symétrie CP est exacte, alors KS coı̈ncide avec K1 et
KL avec K2 .
En 1964, les équipes de Cronin et Fitch ont montré que le kaon KL , qui en principe ne devrait
pas se désintégrer en deux pions en raison de la conservation de CP, parvient quand même à se
désintégrer dans ce canal, avec un rapport d’embranchement toutefois assez petit :
KL0 → π + π −
KL0 → modes chargés
= 0.002
(10.71)
Donc KL0 , un état propre des interactions faibles, n’est pas un état propre parfait de CP; il y a
une petite déviation. Cette révélation créa une onde de choc dans le monde de la physique des
particules, comparable à celle qu’avait créé la découverte de la brisure de la parité en 1957.
150
10. Modèle standard des interactions électro-faibles
Un théorème très robuste de la physique théorique des particules stipule que la combinaison des
opérations C, P, et T doit vraiment laisser l’univers invariant. En clair, selon ce théorème CPT,
notre univers est entièrement équivalent à un autre univers obtenu en inversant l’espace, en inversant le cours du temps et en remplaçant la matière par l’antimatière. Il découle de ce théorème, par
exemple, que la masse des particules doit être rigoureusement identique à celle des antiparticules.
Pratiquement personne ne met en doute la conservation de CPT.
La violation de CP entraı̂ne donc que la symétrie T est violée également, c’est-à-dire que les lois
microscopiques de la physique ne sont pas invariantes par inversion du temps. Cette asymétrie ne
se manifeste que dans les interactions faibles, et de manière assez petite, mais elle existe tout de
même.
En fait, les kaons neutres sont à ce jour le seul système physique où cette brisure de CP (ou de T) a
été observée. On présume qu’elle devrait l’être de manière plus importante dans les mésons formés
de quarks b, et pour cette raison on pousse pour la construction d’accélérateurs spéciaux dédiés à
la productions de mésons B (on appelle de telle machine des “usines de B” ou B-factories).
L’importance de la brisure de CP vient de la cosmologie. Notre univers comporte, heureusement,
un excédent de matière sur l’antimatière. Le nombre de nucléons dans l’univers est environ un
milliard de fois plus petit que le nombre de photons. Si on suppose que ces photons sont venus de
l’annihilation des quarks avec les antiquarks (et des électrons avec les positrons), on doit supposer
qu’à l’époque où le rayonnement était en équilibre avec la matière (c’est-à-dire qu’il y avait autant
de créations de paires particule-antiparticule que d’annihilations), l’excédent de quarks sur les
antiquarks devrait être de l’ordre d’un milliardième :
nq − nq̄
∼ 10−9
nq + nq̄
(10.72)
Cette petite différence a permis à la matière de survivre; autrement, l’univers ne contiendrait que
des photons. En 1967, le physicien russe A. Sakharov – plus connu en tant que père de la bombe
H soviétique et plus tard comme le plus célèbre des dissidents russes – a énoncé trois conditions
qui, ensemble, peuvent expliquer l’excédent de matière sur l’antimatière dans notre univers :
1. Une brisure de l’inversion du temps dans les lois fondamentales.
2. Une phase dans l’évolution de l’Univers, peu après le big bang, où l’équilibre thermodynamique
était rompu.
3. Un mécanisme, dans les interactions fondamentales, qui viole la conservation du nombre de
baryons, i.e., qui peut changer le nombre net de quarks.
La première condition est remplie par les interactions faibles, même si on ne connaı̂t pas explicitement la cause profonde de cette brisure.4 La deuxième est acquise aussi, car il suffit que l’expansion
de l’univers après le big bang soit, à un moment donné, plus rapide que le temps moyen d’une
réaction importante. La troisième nécéssite d’aller au-delà du modèle standard, vers un modèle
d’unification des forces fondamentales.
4
On sait cependant comment la paramétriser : un élément complexe de la matrice CKM suffit. Mais cela
n’explique pas comment une telle phase dans la matrice CKM est apparue.
10.7. L’unification des forces
151
10.7 L’unification des forces
Depuis les années 1970, plusieurs théories ont été proposées dans le but d’unifier les interactions
électro-faible et forte dans une même théorie de jauge. Aucune de ces théories n’a été retenue
définitivement, car leur prédictions sont très difficiles à vérifier. De telles théories portent le nom
de théories de grande unification, ou GUTs (grand unified theories). L’idée de base est de supposer
qu’un groupe de jauge supérieur G gouverne toutes les forces également. Les groupes de jauge de
la QCD et de la théorie électrofaible sont des sous-groupes de G :
SU (3) × SU (2) × U (1) ⊂ G
(10.73)
La théorie de jauge basée sur G subit un mécanisme de brisure spontanée de la symétrie, semblable
au mécanisme de Higgs, mais à une échelle d’énergie beaucoup plus élevée, appelée “échelle de
grande unification”. La constante de couplage unique gu de cette théorie, qui dépend de l’échelle
d’énergie comme dans toute théorie des champs, se sépare en trois constantes gs , g et g 0 pour les
parties forte et électro-faible de la théorie résultant de la brisure spontanée, et ces trois constantes
de couplage évoluent différemment en fonction de l’échelle d’énergie, comme illustré à la figure 10.5.
L’échelle d’énergie à laquelle se produit cette unification, c’est-à-dire l’échelle d’énergie au-delà de
laquelle les interactions deviennent toutes équivalentes, est de l’ordre de 1014 GeV, une énergie
cent milliards de fois plus grande que celle que peut produire le plus puissant des accélérateurs
présentement en fonction. C’est donc dire que la physique des interactions unifiées est loin de nos
capacités expérimentales.
gs
g
g′
gu
log q
Figure 10.5. Évolution schématique, en fonction de l’échelle d’énergie, des constantes
de couplages de la QCD (gs ) et de la théorie électro-faible (g et g 0 ). Les trois constantes
convergent à peu près à une échelle d’énergie appelée échelle de grande unification, et
qui vaut environ 1014 GeV, après quoi une seule constante de couplage gu émerge.
Nous allons décrire brièvement la plus connue d’entre elles, basée sur le groupe de jauge SU(5).
Dans cette théorie, les quarks des trois couleurs et les leptons sont intégrés, famille par famille, dans
des représentations du groupe SU(5). La plus simple de ces représentations est la représentation
fondamentale, de dimension 5, et on y agence les quarks d et les leptons comme suit :
5 : (d1 , d2 , d3 , ec , −ν c )R
5c : (dc1 , dc2 , dc3 , e, −ν)L
(10.74)
où l’indice 1,2,3 des quarks désigne la couleur, et le symbole c désigne l’antiparticule (i.e. ec = e+ ).
SU(5) possède aussi une représentation de dimension 10, sous la forme d’une matrice anti-
152
10. Modèle standard des interactions électro-faibles
symétrique. Les fermions restant y sont agencés comme suit :


0 uc3 −uc2 uc1 d1
0
uc1 u2 d2 



0
u3 d3 
10 : 


0 ec
0 L
(10.75)
Notons que (uci )L contient en fait uiR , et donc le contenu de ces trois représentations est exaustif.
Les champs de jauge de la théorie SU(5) sont au nombre de 52 − 1 = 24. De ce nombre, 8 sont les
précurseurs des gluons et 4 les précurseurs des bosons W ± , Z 0 et du photon. Il reste 12 bosons de
jauge qui acquièrent, présumément, une masse de l’ordre de 1014 GeV lors de la brisure spontanée
de SU(5). Ces douze bosons de jauge sont notés Xα± et Yα± et forment des doublets d’isospin faible
(X, Y ) et des triplets de couleur (X1 , X2 , X3 ) et (Y1 , Y2 , Y3 ). Les bosons X portent en outre un
charge électrique ± 43 et les bosons Y une charge ± 13 .
uc
e+
uc
X
νc
uc
e+
Y
u
d
d
Y
d
d
u
Figure 10.6. Diagrammes de Feynman impliquant les bosons X et Y de la théorie de
grande unification SU(5). Notez qu’une antiparticule entrante, comme uc , équivaut à
une particule sortante, de sorte que les processus illustrés ici ne conservent pas la nombre
baryonique (ou le nombre de quarks).
L’une des caractéristiques intéressantes des théorie d’unification est qu’elles expliquent la quantification de la charge électrique. La théorie SU(5) explique naturellement que la charge des quarks
doit être en multiples de 31 et celle des leptons en multipes de 1. Une autre caractéristique est que
cette théorie fournit un mécanisme pour la non conservation du nombre baryonique. Autrement
dit, il existe des processus qui permettent la transformation d’un quark en lepton, par émission ou
absorption d’un boson de jauge X. Les diagrammes de Feynman typiques impliquant les bosons
X et Y sont illustré à la fig. 10.6.
En particulier, un processus possible est la désintégration du proton, qui pourrait s’effectuer par
l’intermédiaire d’un boson X, comme illustré ci-dessous :
e+
u
p
u
d
X
d
(10.76)
π0
d
La vie moyenne estimée du proton par ce processus est située entre 1028 et 1032 années. L’estimation
expérimentale de la vie moyenne du proton dans le processus p → e+ π 0 est supérieure à un valeur
10.7. L’unification des forces
153
allant de 1031 et 1033 années. La prédiction de la théorie SU(5) est donc marginalement rejetée par
l’expérience. Mais les incertitudes sont énormes tant que la masse des hypothétiques bosons X et
Y n’est pas estimée avec plus de précision.
Problèmes
Problme 10.1
a) Démontrez, à partir de la transformation de parité (10.12), que l’expression ψ̄ 1 γ 5 ψ2 est un pseudo-scalaire.
ψ1 et ψ2 sont deux spineurs de Dirac quelconques.
b) De même, démontrez que la partie spatiale du quadri-vecteur ψ̄ 1 γ 5 γ µ ψ2 est un vecteur axial, ou pseudovecteur.
Problme 10.2
a) Démontrez que ψ̄ L , défini comme étant ψL† γ 0 , est en fait égal à
1
2 ψ̄(1
+ γ 5 ). De même, montrez que
ψ̄ R = 21 ψ̄(1 − γ 5 ).
b) Démontrez que la conjugaison de charge échange les composantes droite et gauche. Autrement dit, (ψ c )R =
(ψL )c et vice-versa.
Problme 10.3
Dans la théorie de Fermi des interactions faibles, l’hamiltonien d’interaction est donné par l’expression suivante :
Z
GF
HI = − √
d3 r (p̄γ µ n)(ēγ µ ν)
(10.77)
2
où p, n, ν, et e sont les spineurs décrivant respectivement le proton, le neutron, le neutrino et l’électron.
Considérez que l’état initial |ii du système est un neutron au repos, et que l’état final |f i contient un proton,
un électron et un antineutrino. Supposons que le proton, l’électron et le neutrino sont respectivement dans
des états de spineur up (pp ), ue (pe ) et vν (pν ), et que le neutron d’origine a un spin ‘up’.
Utilisez la règle d’or pour calculer l’amplitude associé à ce processus de désintégration.
Problme 10.4
Exprimez comment les doublets d’isospin faible `L et qL se couplent au bosons de jauge W ± . Partez du
lagrangien d’interaction de ces doublets avec les champs A1µ et A2µ et de la définition Wµ± = A1µ ± iA2µ .
Problme 10.5
Démontrez explicitement, dans le lagrangien, qu’un terme de masse pour les leptons ou les quarks viole la
symétrie de jauge SU(2).
Problme 10.6
D’après la forme de l’interaction entre le champ de Higgs et les leptons et quarks, comment se désintègrerait
la particule de Higgs?
154
10. Modèle standard des interactions électro-faibles
Problme 10.7
À l’aide d’un diagramme de flot de particules (quarks ou autres), illustrez comment peut se désintégrer les
particules suivantes : Essayez de donner plusieurs possibilités là où c’est possible et consultez le livret des
particules pour vérifier que les désintégrations peuvent se produire comme vous le suggérez, et notez le rapport
d’embranchement ainsi que la vie moyenne.
a) Le neutron b) Le muon c) Le lepton tau (τ ) d) Le méson lourd Υ (bb̄) e) Le pion π + f) Le pion
neutre π 0
Table des Matières
1. Processus élémentaires
. . . . . . . .
1.1. Probabilité de transition . . . . . . . . . . . . .
1. Règle d’or de Fermi . . . . . . . . . . . .
1.2. Normalisation des états et espace des phases . . . .
1.3. Désintégration et espace des phases . . . . . . . .
1. Forme générale du taux de désintégration
. .
2. Exemple : désintégration à deux corps . . . .
3. Loi exponentielle de désintégration
. . . . .
1.4. Collisions et section efficace . . . . . . . . . . .
1. Diffusion par un potentiel . . . . . . . . .
2. Interprétation de la section efficace . . . . .
3. Longueur d’atténuation . . . . . . . . . .
4. Formule de Rutherford . . . . . . . . . . .
5. Forme relativiste générale de la section efficace
1.5. Résonances et masse invariante . . . . . . . . . .
Problèmes . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
3
4
5
7
7
8
9
10
10
12
12
12
14
15
17
. . . . . . . . . . .
2.1. Composition des noyaux . . . . . . . . . . . . . . . . . . . . .
1. Terminologie . . . . . . . . . . . . . . . . . . . . . . .
2.2. Taille des noyaux . . . . . . . . . . . . . . . . . . . . . . . .
2.3. Masse des noyaux
. . . . . . . . . . . . . . . . . . . . . . .
1. Les noyaux stables
. . . . . . . . . . . . . . . . . . . .
2. Énergie de liaison . . . . . . . . . . . . . . . . . . . . .
3. Modèle de la goutte liquide et formule semi-empirique des masses
2.4. Le modèle en couches des noyaux . . . . . . . . . . . . . . . . .
1. La force nucléaire . . . . . . . . . . . . . . . . . . . . .
2. Fondements du modèle en couches dans les atomes
. . . . . .
3. Les nombres magiques . . . . . . . . . . . . . . . . . . .
4. Forme du potentiel nucléaire . . . . . . . . . . . . . . . .
2.5. Annexe : L’addition des moments cinétiques et l’interaction spin-orbite
Problèmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
21
21
23
23
25
25
26
27
29
29
30
31
32
34
35
2. Modèles élémentaires du noyau
iii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3. Instabilités nucléaires
. . . . . . . . . .
3.1. Processus alpha, bêta et gamma . . . . . . . . . .
1. Émission gamma . . . . . . . . . . . . . .
2. Émission bêta
. . . . . . . . . . . . . . .
3. Émission alpha . . . . . . . . . . . . . . .
3.2. Séquences radioactives
. . . . . . . . . . . . . .
1. Stabilité des nuclides par émission bêta
. . . .
2. Séquences d’émission alpha et bêta . . . . . .
3. Équilibre séculaire . . . . . . . . . . . . . .
3.3. Théorie de l’émission alpha
. . . . . . . . . . . .
1. Mécanisme de l’émission alpha . . . . . . . .
2. Calcul élémentaire du taux de désintégration . .
3. Traitement plus rigoureux de la barrière sphérique
4. Relation entre l’énergie et le taux d’émission . .
Problèmes . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. .
. .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
38
38
38
39
41
42
42
42
43
45
45
46
46
47
48
4. Réactions nucléaires
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
50
50
51
53
53
55
55
56
56
57
57
58
58
.
5.1. Le modèle standard . . . . . . . . . . . . . . . .
5.2. Classification des particules élémentaires
. . . . . .
5.3. Plan du reste du cours
. . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
61
61
62
64
6. Quantification du champ et interactions
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
65
65
65
66
67
68
68
69
71
71
73
76
77
77
79
. . . . . .
4.1. Modèle du noyau composé . . . . . . . .
4.2. Fission induite . . . . . . . . . . . . .
1. Réaction en chaı̂ne . . . . . . . .
2. Les réacteurs nucléaires . . . . . .
4.3. Nucléogenèse . . . . . . . . . . . . . .
1. Nucléogenèse primordiale
. . . . .
2. Le cycle du proton
. . . . . . . .
3. Combustion de l’hélium . . . . . .
4. Combustion du carbone et de l’oxygène
5. Combustion du silicium et au-delà . .
6. La fusion nucléaire sur Terre . . . .
Problèmes . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. .
. .
. .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5. Particules élémentaires : généralités
6.1. Ondes électromagnétiques . . . . . . . . . . . . .
1. Équations de Maxwell et transformées de Fourier
2. champs transverses et longitudinaux . . . . . .
3. Variables normales
. . . . . . . . . . . . .
6.2. Quantification du champ électromagnétique . . . . .
1. Hamiltonien du champ . . . . . . . . . . . .
2. Photons . . . . . . . . . . . . . . . . . .
6.3. Fermions
. . . . . . . . . . . . . . . . . . . .
1. Électrons non relativistes : champ de Schrödinger
2. Interaction électrons-photons . . . . . . . . .
3. Théorie du champ scalaire . . . . . . . . . .
6.4. Théorie des perturbations et diagrammes de Feynman .
1. Diffusion des électrons par un champ scalaire . .
2. Calcul de l’amplitude de diffusion complète . . .
iv
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6.5. Équation de Klein-Gordon . . . . . . . . .
1. Le champ scalaire massif . . . . . . .
2. Théorie de Yukawa de l’interaction forte
6.6. Formulation lagrangienne . . . . . . . . .
1. Rappels de mécanique de Lagrange . .
2. Densité lagrangienne
. . . . . . . .
3. Action du champ scalaire
. . . . . .
Problèmes . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
80
81
82
83
84
84
85
86
. .
7.1. Spin et transformations de Lorentz . . . . . . .
1. Spineurs droits et gauches . . . . . . . .
2. hélicité
. . . . . . . . . . . . . . . .
7.2. Équation de Dirac . . . . . . . . . . . . . .
1. Propriétés des matrices de Dirac
. . . . .
2. Solution de l’équation de Dirac . . . . . .
7.3. Deuxième quantification du champ de Dirac . . .
1. Antiparticules
. . . . . . . . . . . . .
7.4. L’électrodynamique quantique . . . . . . . . .
1. Transformations de jauge et couplage minimal
2. Hamiltonien d’interaction électron-photon .
3. Règles de Feynman . . . . . . . . . . .
4. Exemples de processus . . . . . . . . . .
5. Corrections radiatives . . . . . . . . . .
Problèmes . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
88
88
91
92
93
94
94
96
97
98
98
100
101
103
104
106
. . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
du moment cinétique
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
110
110
110
111
112
114
115
115
117
117
118
118
120
120
121
124
125
126
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
128
128
129
130
132
133
7. Théorie relativiste de l’électron
.
.
.
.
.
8. Introduction à la théorie des groupes
8.1. Définitions et concepts de base . . .
1. Définition d’un groupe . . . .
2. Groupes définis par des matrices
8.2. Rotations en mécanique quantique .
8.3. Représentations du moment cinétique
1. SU(2) . . . . . . . . . . .
2. Construction des représentations
8.4. Représentations : concepts généraux
1. Lemme de Schur . . . . . .
2. Représentation projective
. .
8.5. SU(3) . . . . . . . . . . . . . .
1. Représentations conjuguées . .
2. Représentation adjointe . . .
8.6. Produits tensoriels . . . . . . . .
8.7. Symétrie de saveur des quarks . . .
8.8. Symétrie de couleur . . . . . . . .
Problèmes . . . . . . . . . . . . . .
9. Théories de jauge
. .
9.1. Symétrie de jauge non abélienne
9.2. Le tenseur de Faraday . . . .
9.3. Le lagrangien de la QCD
. .
9.4. Propriétés de la QCD . . . .
Problèmes . . . . . . . . . . .
. .
.
. .
. .
. .
. .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
v
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10. Modèle standard des interactions électro-faibles
10.1. Interactions faibles . . . . . . . . . . . . . . . .
1. Première théories des interactions faibles . . . .
2. Spineurs droit et gauche . . . . . . . . . . .
3. Théorie V–A . . . . . . . . . . . . . . . .
10.2. Théorie de jauge SU(2)× U(1)
. . . . . . . . . .
10.3. Brisure spontanée de la symétrie : mécanisme de Higgs
1. Courants chargés, neutres et électromagnétique .
2. Relation avec la théorie V–A . . . . . . . . .
10.4. Génération des masses . . . . . . . . . . . . . .
10.5. Réplication des familles et mélange des quarks
. . .
1. Angle de Cabibbo . . . . . . . . . . . . . .
10.6. La symétrie CP et sa brisure . . . . . . . . . . .
1. Brisure de CP
. . . . . . . . . . . . . . .
10.7. L’unification des forces . . . . . . . . . . . . . .
Problèmes . . . . . . . . . . . . . . . . . . . . . .
vi
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
134
134
135
136
137
138
140
143
144
145
145
147
147
149
151
153