Théorie de la Mesure et Intégration

Transcription

Théorie de la Mesure et Intégration
Ecole Nationale de la Statistique et de
l’Administration Economique
Théorie de la Mesure et Intégration
Xavier MARY
2
Table des matières
I
Théorie de la mesure
11
1 Algèbres et tribus de parties d’un ensemble
1.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Tribu engendrée, tribu image réciproque . . . . . . . .
1.3 Exemples . . . . . . . . . . . . . . . . . . . . . . . . .
1.4 Produit d’espaces mesurables . . . . . . . . . . . . . .
1.5 La tribu borélienne . . . . . . . . . . . . . . . . . . . .
1.6 Compléments : π-système, λ-système, classe monotone
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
13
14
15
16
16
18
2 Mesure, espace mesuré
21
2.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2 Propriétés élémentaires, caractérisation d’une mesure finie . . 22
3 Prolongement d’une mesure et applications
3.1 Théorème de prolongement (Carathéodory) . . . .
3.2 Mesure extérieure . . . . . . . . . . . . . . . . . . .
3.3 Application : la mesure de Borel . . . . . . . . . .
3.4 Ensembles négligeables, tribu et mesure complétée
3.5 Produit fini d’une famille d’espaces mesurés . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
25
25
25
29
29
30
4 Applications mesurables
4.1 Définition d’une application mesurable . . . . .
4.2 Propriétés générales . . . . . . . . . . . . . . .
4.3 Propriétés des fonctions mesurables réelles . . .
4.4 Fonction à valeur dans R̄ = [−∞, +∞] . . . . .
4.5 Transport d’une mesure, mesure image . . . . .
4.6 Approximation d’une fonction mesurable réelle
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
31
31
32
32
33
34
34
3
.
.
.
.
.
.
.
.
.
.
.
.
5 Théorie de la mesure et probabilités
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Exemples élémentaires . . . . . . . . . . . . . . . . . . . . . .
5.2.1 Ensemble fini : Ω = {ω1 , ...ωn } . . . . . . . . . . . . .
5.2.2 Cas d’un ensemble infini dénombrable Ω = {ωi , i ∈ N}
5.3 Probabilités conditionnelles, événements indépendants . . . .
5.4 Variables aléatoires . . . . . . . . . . . . . . . . . . . . . . . .
5.4.1 Variables aléatoires réelles. . . . . . . . . . . . . . . .
5.4.2 Variables aléatoires, vecteurs aléatoires, indépendance
37
37
38
38
39
39
41
41
42
II
45
Intégration
6 Intégration des fonctions mesurables positives
47
6.1 Intégrale (supérieure) des fonctions étagées . . . . . . . . . . 47
6.2 Intégrale d’une fonction mesurable positive . . . . . . . . . . 49
6.3 Propriété vraie presque partout . . . . . . . . . . . . . . . . . 50
6.4 Propriétés générales . . . . . . . . . . . . . . . . . . . . . . . 51
6.5 Théorème de transfert (changement de variable) . . . . . . . 53
6.6 Mesures définies par des densités . . . . . . . . . . . . . . . . 54
6.7 Mesures absolument continues, étrangères . . . . . . . . . . . 55
6.8 Absolue continuité et densité . . . . . . . . . . . . . . . . . . 55
6.9 Théorème de changement de variable, λ mesure de Lebesgue . 56
6.10 Caractérisation de la mesure produit, théorème de FubiniTonelli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7 Intégration des fonctions mesurables quelconques
7.1 Intégrale d’une fonction mesurable . . . . . . . . . . . . . . .
7.1.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . .
7.1.2 L’ensemble L1 . . . . . . . . . . . . . . . . . . . . . .
7.2 Propriétés générales . . . . . . . . . . . . . . . . . . . . . . .
7.2.1 Premières propriétés, lemme de Fatou . . . . . . . . .
7.2.2 Théorème de la convergence dominée et applications .
7.2.3 Exemples . . . . . . . . . . . . . . . . . . . . . . . . .
7.3 Théorème de Fubini pour les fonctions mesurables quelconques
7.3.1 Le théorème de Fubini . . . . . . . . . . . . . . . . . .
7.3.2 Exemples . . . . . . . . . . . . . . . . . . . . . . . . .
7.4 La convolution . . . . . . . . . . . . . . . . . . . . . . . . . .
7.4.1 Convolution de deux mesures . . . . . . . . . . . . . .
4
61
61
61
62
62
62
63
66
66
66
67
68
68
7.4.2
7.4.3
Convolution d’une fonction et d’une mesure, de deux
fonctions . . . . . . . . . . . . . . . . . . . . . . . . .
Exemples . . . . . . . . . . . . . . . . . . . . . . . . .
8 Théorie de l’intégration et probabilités
8.1 Espérance et moments . . . . . . . . . . .
8.1.1 Espérance . . . . . . . . . . . . . .
8.1.2 Moments . . . . . . . . . . . . . .
8.1.3 Covariance et corrélation . . . . .
8.1.4 Propriétés des moments . . . . . .
8.1.5 Inégalités . . . . . . . . . . . . . .
8.2 Variable aléatoire réelle (vecteur aléatoire)
8.3 Retour sur l’indépendance . . . . . . . . .
III
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
et densité
. . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Compléments
69
70
71
71
71
72
72
73
73
74
74
77
9 Les espaces Lp et Lp , p ∈ N∗ ∪ +{∞}
9.1 Définitions des espaces Lp . . . . . . . . . . . . . . . . . . .
9.1.1 Les espaces Lp , p ∈ N∗ . . . . . . . . . . . . . . . . .
9.1.2 Les espaces L∞ , L∞ . . . . . . . . . . . . . . . . . .
9.2 Propriétés des espaces Lp , 1 ≤ p ≤ +∞ . . . . . . . . . . .
9.2.1 ||.||p est une norme . . . . . . . . . . . . . . . . . . .
9.2.2 Complétude des espaces Lp . . . . . . . . . . . . . .
9.2.3 Autres propriétés . . . . . . . . . . . . . . . . . . . .
9.3 Dual des espaces Lp . . . . . . . . . . . . . . . . . . . . . .
9.4 Quelques résultats d’analyse fonctionnelle dans L1 (R, BR , λ)
.
.
.
.
.
.
.
.
.
79
79
79
80
80
80
82
83
83
84
10 La transformée de Fourier
87
10.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
10.2 Propriétés générales . . . . . . . . . . . . . . . . . . . . . . . 88
10.3 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
10.4 Propriétés générales X = Rd : théorèmes d’injectivité et d’inversion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
10.4.1 Théorème d’injectivité . . . . . . . . . . . . . . . . . . 89
10.4.2 Théorème d’inversion . . . . . . . . . . . . . . . . . . 91
10.5 Propriétés analytiques (sur R). . . . . . . . . . . . . . . . . . 91
10.6 Transformée de Fourier dans L1 : propriétés analytiques . . . 92
10.7 Transformée de Fourier dans L2 . . . . . . . . . . . . . . . . . 93
5
Index
93
6
Introduction
H. Lebesgue est généralement considéré comme le père de la théorie moderne
de l’intégration. Sa définition de fonction intégrable reste la plus satisfaisante
à ce jour. On doit cependant également citer trois mathématiciens qui ont
aidé Lebesgue à formuler son intégrale. Les deux premiers sont G. Peano et
C. Jordan : G. Peano a défini le premier les notions de mesure intérieure et
extérieure, tandis que C. Jordan est le premier à intégrer sur des ensembles
distincts d’intervalles, appelés ensembles Jordan-mesurables. Le troisième
est le mathématicien E. Borel, qui définit les notions de tribus (boréliennes)
et de mesures de Borel. C’est la première apparition de mesures σ-finie sur
un espace mesurable (et non une algèbre).
Pourquoi H. Lebesgue a-t-il eu besoin de toutes ces notions ? D’ou viennent
les notions de tribus, de mesure extérieure ? Une réponse est la résolution
du problème de Lebesgue, que nous aborderons rapidement.
Nous discuterons ensuite brièvement des différences fondamentales entre
intégrale de Riemann et intégrale de Lebesgue, avant d’aborder le domaine
des probabilités.
Le cours sera ensuite divisé en 2 grandes parties : la théorie de la mesure, théorie abstraite qui sera ensuite appliquée à une nouvelle théorie de
l’intégration : l’intégrale de Lebesgue.
7
Le problème de Lebesgue
L’objectif de Lebesgue est le suivant : tenter de généraliser la notion de
longueur (aire, volume,...) à une famille de parties plus grandes que les intervalles (pavés). Plus précisément, il cherche une fonction
λ : P(Rn ) −→ [0, +∞]
vérifiant les 3 propriétés suivantes :
– invariance par translation
→
→
∀−
v ∈ Rn , λ(A + −
v ) = λ(A)
– σ-additivité
λ(
[
Ai ) =
i∈I
X
λ(Ai ), I dénombrable, Ai disjoints
i∈I
– normalisation
λ([0, 1]n ) = 1
1905 (Vitali) : le problème de Lebesgue n’a pas de solution : il faut affaiblir les hypothèses.
Deux solutions sont apportées. Elles conduisent à deux notions différentes
de mesure :
– on demande seulement la σ-sous-additivité
[
X
λ( Ai ) ≤
λ(Ai ), I dénombrable
i∈I
i∈I
Une solution unique appelée mesure extérieure.
– On travaille sur un sous-ensemble B de P(Rn ) :
Une solution unique sur la tribu des boréliens appelée mesure de Borel
ou mesure de Lebesgue (cette dernière étant en fait la mesure sur la
tribu complétée).
Intégrale de Riemann, intégrale de Lebesgue
Concernant l’intégration, l’idée de Lebesgue est la suivante : plutôt que de
définir les fonctions horizontalement par f (t), il définit les fonctions verticalement par f −1 (x). L’intégrale est alors une somme sur les valeurs et non
sur le support.
8
X
f (i)
Riemann discret
i∈[1,n]
contre
X
x.Card(f −1 (x))
Lebesgue discret
x∈R
Les principales différences entre les deux intégrales sont alors les suivantes :
Riemann
Lebesgue
mesure des intervalles A ∈ A
mesure des boréliens B ∈ B
⇓ A 7→ 1A
⇓ B 7→ 1B
R
R
fonctions en escalier
↓ limite uniforme
R
fonctions étagées
↓ limite simple dominée
R
fonctions réglées (≥ 0)
fonctions mesurables (≥ 0)
Mesures et probabilités
La théorie des probabilités est une branche des mathématiques qui permet
de modéliser les phénomènes aléatoires. Celle-ci repose sur une formalisation
développée par le mathématicien russe Kolmogorov dans les années 1930.
Son axiomatique repose sur les notions de tribu et de mesure développées par
Borel dans les années 1900. La théorie de l’intégrale de Lebesgue développée
à la même époque a permis d’asseoir en toute généralité la notion de moment
d’une variable aléatoire. Nous aborderons les relations entre la théorie de la
mesure et de l’intégration et la théorie des probabilités à la fin de chaque
chapitre de ce cours.
9
10
Première partie
Théorie de la mesure
11
Chapitre 1
Algèbres et tribus de parties
d’un ensemble
Dans toute la suite, X sera un ensemble quelconque non vide. On note alors
P(X) l’ensemble des parties de l’ensemble X.
1.1
Définitions
Définition 1.1.1 (algèbre de Boole, ou de parties de X)
A ⊂ P(X) est une algèbre (de Boole) si pour tout A, B ∈ A :
1. {∅, X} ∈ A
2. Ac = X\A ∈ A
3. A ∩ B ∈ A
4. A ∪ B ∈ A
C’est une semi-algèbre (notée S) si les conditions 1) et 3) sont vérifiées et
que le complémentaire d’un élément de S est réunion finie d’éléments de S.
On remarquera que certaines de ces conditions sont redondantes. Ainsi, par
passage au complémentaire, si A contient l’ensemble vide elle contient X et
réciproquement. De même, 2) et 3) implique 4) et 2) et 4) implique 3).
Remarque 1.1.2 L’algèbre A engendrée par une semi-algèbre est constituée
des réunions finies de parties de S.
Définition 1.1.3 (σ-algèbre ou tribu)
A ⊂ P(X) est une tribu (sur X) si c’est une algèbre stable par réunion
dénombrable croissante.
13
Remarque 1.1.4 Une tribu est alors stable par réunion dénombrable et
intersection dénombrable.
Définition 1.1.5 (Espace mesurable)
Un ensemble X muni d’une tribu A ⊂ P(X) est appelé espace mesurable et
noté (X, A).
1.2
Tribu engendrée, tribu image réciproque
Proposition 1.2.1
1) Toute intersection quelconque de tribus est une tribu.
2) Une réunion finie de tribus n’est pas forcément une tribu.
Preuve \
1) Soit (Ai )i∈I une famille de tribus. Montrons que
Ai est une tribu :
i∈I
(1) : ∀i ∈ I, X ∈ Ai , donc X ∈
\
Ai
i∈I
(2) : soit A ∈
finalement
Ac
\
Ai .Alors ∀i ∈ I, A ∈ Ai donc ∀i ∈ I, Ac ∈ Ai , et
\i∈I
∈
Ai .
i∈I
(3) : soit (An )n∈N une famille d’éléments de
An ∈ Ai , soit ∀i ∈ I,
[
n∈N
An ∈ Ai et
[
An ∈
n∈N
\
Ai . Alors ∀n ∈ N, ∀i ∈ I,
i∈I
\
Ai .
i∈I
2) Soit X = {a, b, c}. Alors Aa = {φ, {a} , {b, c} , X} et Ab = {φ, {b} , {a, c} , X}
sont des tribus. Mais Aa ∪ Ab = {φ, {a} , {b, c} , {b} , {a, c}} n’est pas une
tribu, car {a, b} = {a} ∪ {b} ∈
/ Aa ∪ Ab . On en déduit la proposition suivante qui définit la notion de tribu engendrée :
Proposition 1.2.2 (tribu engendrée)
Soit M ⊂ P(X). L’intersection de toutes les tribus contenant M est une
tribu appelée tribu engendrée par M et notée σ(M). C’est la plus petite tribu
contenant M.
Cette proposition tient lieu de définition.
Il est également possible de transporter une tribu par image réciproque
d’une fonction quelconque. Cette propriété vient de la compatibilité entre
les opérations ensemblistes et la fonction d’ensemble “image réciproque” :
14
1. f −1 (Ac ) = f −1 (A)c
2. f −1 (A ∪ B) = f −1 (A) ∪ f −1 (B)
3. f −1 (A ∩ B) = f −1 (A) ∩ f −1 (B)
De telles relations sont bien évidemment fausses concernant l’image directe.
Théorème 1.2.3 (tribu image réciproque)
Soit Y un ensemble, (X, A) un espace mesurable et f : Y −→ X une application. Alors
1. f −1 (A) = {f −1 (A), A ∈ A} est une tribu sur Y appelée tribu image réciproque
par f (ou tribu engendrée par f )
2. (lemme de transport) ∀M ∈ P(X), f −1 (σ(M)) = σ(f −1 (M)) .
Ce théorème tient lieu de définition.
Preuve - 1) Montrons que B = f −1 (A) est une tribu.
i- f −1 (X) = Y ∈ B.
ii- ∀A, B ∈ A, f −1 (A ∩ B) = f −1 (A) ∩ f −1 (B) donc B est stable par
intersection fini.
c
iii- ∀A ∈ A, f −1 (Ac ) = f −1 (A) donc B est stable par passage au
complémentaire.
[
[
iv- f −1 (
An ) =
f −1 (An ) donc B est stable par union dénombrable.
n∈N
n∈N
−1
f (A)
Finalement, B =
est une tribu.
2) Soit M ∈ P(X). Nous allons montrer les deux inclusions :
– f −1 (σ(M)) est une tribu (cf point 1)) qui contient f −1 (M) donc σ(f −1 (M) ⊂
f −1 (σ(M)).
– Posons R = {A ∈ σ(M), f −1 (A) ∈ σ(f −1 (M))}. Il est facile de voir
que R est une tribu et que R contient M. On en déduit que σ(M) ⊂ R
ce qui implique f −1 (σ(M) ⊂ σ(f −1 (M)).
Finalement (σ(f −1 (M)) ⊂ f −1 (σ(M)) ⊂ σ(f −1 (M) et on a l’égalité recherchée. 1.3
Exemples
1. L’ensemble des pavés (produits d’intervalles (a1 , b1 ), ..., (ap , bp )) de Rp
est une semi-algèbre.
15
2. σ(∅) = {∅, X} est une algèbre appelée algèbre triviale (ou grossière :
c’est la plus petite des tribus sur X).
3. P(X) appelée tribu discrète (c’est la plus grosse des tribus).
4. {A ∈ P(X), A ou Ac fini} est une algèbre mais pas une tribu.
5. Soit X = {a, b, c} un ensemble formé de trois points distincts. Alors
la classe de parties de X définie par τa = {φ, {a} , {b, c} , X} est une
tribu.
6. σ( ouverts de Rn ) = B tribu des boréliens.
Remarque 1.3.1 (importante) Une erreur fréquente est de croire que si
A ∈ A et que B ⊂ A, alors B ∈ A. C’est faux comme le prouve l’exemple
de la tribu τa où {b, c} ∈ τa mais {b} ∈
/ τa , même si {b} ⊂ {b, c}.
1.4
Produit d’espaces mesurables
Définition 1.4.1 (produit de deux espaces mesurables)
Soient (Xi , Ai ), i = 1, 2 deux espaces mesurables :
on appelle tribu produit sur X1 × X2 la tribu A1 ⊗ A2 engendrée par les
parties {A1 × A2 , Ai ∈ Ai , i = 1, 2}.
L’espace mesurable (X1 × X2 , A1 ⊗ A2 ) est appelé espace mesurable produit.
Définition 1.4.2 (produit d’une famille d’espaces mesurables)
Soient (Xi , Ai ), i ∈ I une famille d’espaces mesurables :
on appelle tribu produit sur Π Xi la tribu ⊗ Ai engendrée par les parties
i∈I
i∈I
{ Π Ai , Ai ∈ Ai ∀i ∈ I et Ai = Xi sauf pour un nombre fini }.
i∈I
L’espace mesurable ( Π Xi , ⊗ Ai ) est appelé espace mesurable produit.
i∈I
1.5
i∈I
La tribu borélienne
Définition 1.5.1 (tribu borélienne)
Soit X un espace topologique. La tribu engendrée par les ouverts de X s’appelle la tribu borélienne.
Proposition 1.5.2 Sur X = Rp la tribu borélienne est engendrée par :
– les ouverts
– les fermés
– les pavés
16
la démonstration de cette proposition est laissée en exercice. On peut notamment se servir des résultats qui suivent.
Les questions de dénombrabilité interviennent naturellement dans la théorie
des espaces mesurables boréliens, comme le montrent les propositions suivantes :
Proposition 1.5.3 Soit X un espace topologique et (Xn ) une famille dénombrable
de boréliens de réunion X. Alors
A ∈ B(X) ⇐⇒ ∀n, A ∩ Xn ∈ B(Xn )
Preuve - L’implication est directe car l’ensemble A = {A ∈ P(X), A∩Xn ∈
B(Xn )} est une tribu contenant les ouverts de X donc la tribu engendrée
par les ouverts i.e. la tribu borélienne.
Pour la réciproque, notons Bn = {A ∩ Xn , A ∈ B(X)}. C’est une tribu sur
Xn contenant les ouverts de Xn (intersection d’ouverts de X avec Xn par
définition), donc B(Xn ) ⊂ Bn .
[
Soit A ∈ A. Alors A ∩ Xn ∈ Bn ⊂ B(X) et comme A =
A ∩ Xn , A est
n∈N
borélien comme union dénombrable de boréliens. Remarque 1.5.4 Cette caractérisation des boréliens est très importante
puisqu’elle permet d’étendre des résultats vrais sur les (Xn , B(Xn )) a l’espace
mesurable (X, B(X)) tout entier. Le cas X = [0, +∞[, Xn = [n, n + 1[ est
un exemple important.
Dans le cas d’espaces topolgiques à base dénombrable d’ouverts (i.e. tels
qu’il existe une famille dénombrable d’ouverts engendrant tous les ouverts
de X), on peut caractériser les boréliens uniquement à partir de cette base :
Lemme 1.5.5 Si X admet une base dénombrable d’ouverts, sa tribu borélienne
est engendrée par cette base.
Preuve - Soit A la tribu engendrée par cette base. Elle contient alors les
réunions dénombrables des ouverts de la base et donc par définition, tous
les ouverts. Finalement, elle contient la tribu borélienne.
Réciproquement, la tribu borélienne contient la base d’ouverts donc A, et
les deux tribus coı̈ncident. 17
Remarque 1.5.6 Si O1 et O2 sont deux bases dénombrables d’ouverts de
X1 et X2 , alors O1 × O2 est une base dénombrable d’ouverts de X1 × X2
Théorème 1.5.7 Soient Xi , i = 1, 2 deux espaces topologiques à base dénombrable
d’ouverts.
Alors la tribu produit des tribus boréliennes B1 ⊗ B2 est la tribu borélienne
de X1 × X2 muni de la topologie produit.
Preuve - Soient τ1 et τ2 les topologies (ou ouverts) de X1 et X2 . Posons
A1 = {A ∈ P(X1 ), A × τ2 ∈ B(X1 × X2 )}. C’est une tribu contenant τ1
donc B(X1 ) × τ2 ⊂ B(X1 × X2 )}.
Posons alors A2 = {A ∈ P(X2 ), B(X1 ) × A ∈ B(X1 × X2 )}. C’est une tribu
contenant τ2 (d’après le résultat précédent) donc B(X1 ) × B(X2 ) ⊂ B(X1 ×
X2 )} puis par passage a la tribu engendrée, B(X1 ) ⊗ B(X2 ) ⊂ B(X1 × X2 )}.
- Montrons maintenant l’inclusion inverse :
Si O1 et O2 sont deux bases dénombrables d’ouverts de X1 et X2 , alors
O1 × O2 est une base dénombrable d’ouverts de X1 × X2 et σ(O1 × O2 ) ⊂
σ(O1 ) ⊗ σ(O2 ). Finalement on conclut grâce au lemme précédent. On a prouvé au passage que la tribu produit est toujours (même sans l’hypothèse de dénombrabilité) incluse dans la tribu borélienne de X1 × X2 .
1.6
Compléments : π-système, λ-système, classe
monotone
Il est souvent intéressant de travailler sur des familles plus simples que des
tribus, et les notions suivantes seront donc utiles dans la suite :
Définition 1.6.1 (π-système)
Un π-système est une famille de parties de X stable par intersection finie et
contenant X.
Exemple 1.6.2 π = {] − ∞, x], x ∈ R} est un pi-système très utile (cf.
fonctions de répartitions).
Définition 1.6.3 (λ-système)
Un λ-système est une famille de parties de X stable par différence et limite
croissante( (réunion dénombrable croissante).
Définition 1.6.4 (classe monotone)
Une classe monotone est une famille de parties de X stable par union (resp.
intersection) dénombrable croissante (resp. décroissante).
18
Proposition 1.6.5
1. π-système et λ-système ⇐⇒ tribu.
2. algèbre et classe monotone ⇐⇒ tribu.
3. (lemme de Dynkin, ou théorème λπ) Tout λ-système contenant
un π-système contient la tribu engendrée par ce dernier.
4. (théorème de la classe monotone) Toute classe monotone contenant une algèbre contient la tribu engendrée par cette dernière.
Preuve - La démonstration des deux premières équivalences est laissée en
exercice.
[lemme de Dynkin] - Soit λ(π) le λ-système engendré par π (c’est l’intersection de tous les λ-systèmes contenant π). Alors λ(π) ⊂ σ(π) car une
tribu est un λ-système.
Montrons que λ(π) est une tribu, i.e. est stable par intersection fini (d’après
1)).
On définit l’ensemble A1 = {A ∈ λ(π), A ∩ B ∈ λ(π) ∀B ∈ π}. C’est un
λ-système contenant π donc λ(π) ⊂ A1 .
Soit maintenant A2 = {A ∈ λ(π), A ∩ B ∈ λ(π) ∀B ∈ λ(π)}. C’est un
λ-système contenant π d’après le résultat précédent donc λ(π) ⊂ A2 .
Finalement λ(π) = σ(π).
[théorème de la classe monotone] - Soit M(A) la classe monotone engendrée par A (c’est l’intersection de toutes les classes monotones contenant
A). Alors M(A) ⊂ σ(A) car une tribu est une classe monotone.
Montrons que M(A) est une tribu, i.e. est une algèbre (d’après 2)).
On définit l’ensemble A = {A ∈ M(A), Ac ∈ M(A)}. C’est une classe monotone contenant A donc M(A) ⊂ A et M(A) est stable par passage au
complémentaire.
Soit A1 = {A ∈ M(A), A ∪ B ∈ M(A) ∀B ∈ A}. C’est une classe monotone
contenant A donc M(A) ⊂ A1 .
Soit A2 = {A ∈ M(A), A ∪ B ∈ M(A) ∀B ∈ M(A)}. C’est une classe monotone contenant A d’après le résultat précédent donc M(A) ⊂ A2 et M(A)
est stable par union finie.
Finalement M(A) = σ(A). 19
20
Chapitre 2
Mesure, espace mesuré
2.1
Définitions
Contrairement a l’intuition (et au vocabulaire), la définition d’une mesure
est au départ relative à un espace X muni d’une algèbre A et non à un
espace mesurable. Cependant, et ce sera l’objet du prochain chapitre, il sera
toujours possible d’étendre univoquement une mesure (σ-finie) à la σ-algèbre
engendrée par A, et donc de parler de mesure sur un espace mesurable.
Définition 2.1.1 (Mesure sur une algèbre, espace mesuré)
On appelle mesure sur l’algèbre A toute fonction
µ : A −→ R̄+ = [0, +∞]
non constante avec +∞ et σ-additive :
pour toute
S famille dénombrable An d’éléments de A deux à deux disjoints
telle que An ∈ A,
n
[
X
µ( An ) =
µ(An )
n
n
L’espace (X, A, µ) est appelé espace mesuré.
Remarque 2.1.2 Un espace mesuré n’est donc pas pour l’instant obligatoirement mesurable. Nous verrons cependant qu’il pourra toujours être considéré
comme tel grâce au théorème de prolongement.
Définition 2.1.3 La mesure est finie (ou bornée) si µ(X) < ∞
Elle est σ-finie si X est réunion dénombrable d’ensembles de mesure finie.
On appelle mesure de probabilité (ou simplement probabilité) toute mesure
vérifiant µ(X) = 1.
21
Il est toujours possible de construire une mesure (sur une algèbre) à partir
d’une fonction d’ensemble σ-additive sur une semi-algèbre :
Lemme 2.1.4 Soit S une semi-algèbre et µ : S −→ [0, +∞] une fonction σadditive. Alors µ se prolonge de manière unique en une mesure sur l’algèbre
engendrée par S.
Preuve - Par additivité, le seul prolongement possible est
µ
b(
n
[
Ai ) =
i=1
n
X
µ(Ai )
i=1
On vérifie aisément que c’est bien une mesure sur l’algèbre engendrée par S
(composée des réunions finies d’éléments de S). 2.2
Propriétés élémentaires, caractérisation d’une
mesure finie
Toute mesure µ vérifie les propriétés suivantes :
Proposition 2.2.1
1. µ(∅) = 0.
2. (σ-sous-additivité) µ(
[
An ) ≤
n∈N
X
µ(An ).
n∈N
3. (monotonie) Si A ⊂ B, A, B ∈ A alors µ(A) ≤ µ(B).
4. (continuité) Si An ↑ A ∈ A, µ(An ) ↑ µ(A).
Remarque 2.2.2 Nous verrons que cette dernière propriété caractérise les
mesures.
Preuve 1. Une mesure n’est pas constante égale à +∞ donc il existe A, µ(A) <
+∞. De µ(A) = µ(A ∪ ∅) = µ(A) + µ(∅) on déduit µ(∅) = 0.
2. On écrit :
+∞
[
n=1
An =
+∞
[
n=1
22
An \
n−1
[
k=1
!
Ak
avec la convention :
0
[
Ak = φ. Alors :
k=1
µ
+∞
[
!
=
An
n=1
+∞
X
µ An \
n=1
n−1
[
!
Ak
≤
+∞
X
µ (An ) .
n=1
k=1
3. De B = A ∪ B\A, on déduit : µ(B) = µ(A) + µ(B\A) ≥ µ(A).
4. On construit la suite (Bn )n≥1 selon :
B1 = A1
Bn = An \An−1 pour n ≥ 2
Alors pour tout n ≥ 1,
An =
n
[
Bk
k=1
et donc
+∞
[
An =
n=1
+∞
[
Bk
k=1
Comme les Bn sont deux à deux disjoints par construction, on a :
!
! +∞
+∞
+∞
[
[
X
µ
An
= µ
Bk =
µ(Bk )
n=1
=
k=1
n
X
lim
n→∞
k=1
µ(Bk ) = lim µ
n→∞
k=1
n
[
k=1
!
Bk
= lim µ (An ) n→∞
Théorème 2.2.3 Une fonction
µ : A −→ R̄+ = [0, +∞]
non égale à +∞ et additive est une mesure si et seulement si elle vérifie la
propriété de continuité croissante :
An ↑ A ∈ A ⇒ µ(An ) ↑ µ(A)
Preuve - Nous avons déjà vu que toute mesure vérifie cette propriété. La
n
[
réciproque est évidente car si Bn est une suite d’ensemble disjoints,
Bi ↑
i=1
[
Bn et la continuité croissante entraı̂ne la σ-additivité. n∈N
Il existe de plus une caractérisation très utile des mesures finies :
23
Théorème 2.2.4 Soit µ : A −→ [0, +∞] telle que :
1. (finitude) µ(X) < +∞.
2. (additivité) ∀A, B ∈ A, A ∩ B = ∅, µ(A ∪ B) = µ(A) + µ(B).
3. (Condition de Carathéodory) An ↓ ∅ ⇒ µ(An ) ↓ 0.
Alors µ est une mesure (finie par hypothèse) et réciproquement, toute mesure
finie vérifie ces trois propriétés.
Preuve - Pour la première partie du théorème, il nous faut montrer la σadditivité de µ.
Soit Bi une famille dénombrable d’ensembles de A deux à deux disjoints
+∞
n
[
[
[
telle que B =
Bi ∈ A. Posons An =
Bi = B\
Bi . La suite An
i=n+1
i∈N
décroı̂t vers 0 donc
µ(B\
n
[
i=1
Bi ) −→ 0
n→+∞
i=1
par hypothèse (3). Mais d’après (2)
µ(B) = µ([B\
n
[
i=1
Bi ] ∪ [
n
[
Bi ]) = µ(B\
i=1
n
[
Bi ) +
i=1
n
X
µ(Bi )
i=1
et la condition de carathéodory implique la σ-additivité
µ(B) =
+∞
X
µ(Bi )
i=1
Réciproquement, soit µ une mesure finie et An ↓ ∅. La continuité croissante
implique µ(X\An ) ↑ µ(X). Mais
µ(X) = µ([X\An ] ∪ [An ]) = µ(X\An ) + µ(An )
et comme toutes les quantités sont finies, on a µ(An ) = µ(X)−µ(X\An ) ↓ 0.
24
Chapitre 3
Prolongement d’une mesure
et applications
3.1
Théorème de prolongement (Carathéodory)
Théorème 3.1.1 (de prolongement (admis))
Toute mesure σ-finie sur une algèbre A se prolonge de manière unique en
une mesure (σ-finie) sur σ(A).
La démonstration de ce théorème est hors programme. Cependant la notion de mesure extérieure est intéressante et est donc donnée ici. Le lemme
d’égalité des mesures est quant à lui fondamental.
3.2
Mesure extérieure
Afin de prouver le théorème, on définit la mesure extérieure d’une mesure
µ:
Définition 3.2.1 (mesure extérieure de µ)
Soit µ une mesure sur une algèbre A ∈ X. Alors
µ∗ : P(X) −→ [0, +∞]
A 7−→ µ∗ (A) =
inf
P
µ(An )
{A⊂∪An , An ∈A} n
n
est appelée mesure extérieure de µ sur X.
Une partie A ⊂ X sera dite µ∗ -mesurable si
∀E ∈ P(X), µ∗ (E) = µ∗ (E ∩ A) + µ∗ (E ∩ Ac )
25
Remarquons que µ∗ prolonge µ sur A :
Lemme 3.2.2 ∀A ∈ A, µ∗ (A) = µ(A)
Preuve - Soit An un recouvrement quelconque de A (A ⊂ ∪An , An ∈ A).
n
[
X
X
Alors µ(A) = µ(
(A ∩ An ) ≤
µ(A ∩ An ) ≤
µ(An ) par σ-additivité
n∈N
n∈N
n∈N
et monotonie. donc µ(A) ≤ µ∗ (A).
De plus , la famille
X A1 = A, A2 = A3 = ... = ∅ est un recouvrement de A
∗
donc µ (A) ≤
µ(An ) = µ(A) et l’égalité est prouvée. n∈N
Proposition 3.2.3 µ∗ est monotone et σ-sous-additive.
Preuve monotonie Soit A ⊂ B. Alors tout recouvrement de B recouvre A et µ∗ (A) ≤
µ∗ (B)
croissance Soit {An , n ∈ N} une famille dénombrable et soit > 0 fixé. Alors
∀n ∈ N, ∃(Bkn ) ∈ A,
X
µ(Bkn ) ≤ µ∗ (An ) + 2−n
k∈N
Comme A ⊂
[
Bkn on a
(k,n)∈N2
µ∗ (A) ≤
X
µ(Bkn ) ≤
(k,n)∈N2
X
µ∗ (An ) + n∈N
et étant arbitraire, on obtient la σ-sous-additivité. Cette propriété des mesures extérieures associées aux mesures classiques
peut d’ailleurs servir de définition :
Définition 3.2.4 (mesure extérieure)
Une application Φ∗ : P(X) −→ [0, +∞] est appelée mesure extérieure si :
1. Φ∗ (∅) = 0.
2. (σ-sous-additivité) Φ∗ (
[
An ) ≤
n∈N
X
Φ∗ (An ).
n∈N
3. (monotonie) ∀A, B ∈ A, A ⊂ B ⇒ Φ∗ (A) ≤ Φ∗ (B).
26
Le théorème de prolongement est alors une conséquence directe des lemmes
suivants :
Lemme 3.2.5 (lemme d’égalité des mesures)
Deux mesures sur (X, A) espace mesurable égales sur un π-système π ⊂ A
et σ-finies sur π sont égales sur σ(π).
Preuve - Soit R = {A ∈ A, µ1 (A) = µ2 (A)}. Alors R contient π par hypothèse. Il suffit alors de montrer que R est un λ-système pour prouver le
lemme en vertu du lemme de Dynkin.
- Si µ1 est finie alors µ2 est finie car X ∈ π et l’égalité µ(A\B) = µ(A)−µ(B)
vraie pour les mesures finies prouve que R est stable par différence. Si An
est une suite croissante d’éléments de R de limite A,
µ1 (A) = lim ↑ µ1 (An ) = lim ↑ µ2 (An ) = µ2 (A)
- On suppose
[ maintenant que µ1 est σ-finie sur π, i.e. ∃{πn }, µ1 (πn ) <
+∞ ∀n et
(πn ) = X.
n∈N
Alors on peut appliquer le résultat precedent (lemme d’égalité des mesures
finies) aux espaces mesurables (πn , A ∩ πn ) ce qui prouve que les mesures µ1
et µ2 sont égales sur σπn (π ∩ πn ).
On montre (exercice) l’égalité suivante :
σπn (π ∩ πn ) = σX (π) ∩ πn
Posons
∀n ∈ N,
\
Πn = πn
n−1
[
(
!
c
πi )
i=1
Alors Πn ⊂ σX (π) ∩ πn = σπn (π ∩ πn ) et
[
Πn = X, la somme étant
n∈N
disjointe. Finalement,
!
∀A ∈ σ(π),
µ1 (A) = µ1
[
(A ∩ Πn )
=
n∈N
X
µ1 (A ∩ Πn )
n∈N
!
=
X
µ2 (A ∩ Πn ) = µ2
n∈N
= µ(A)
27
[
n∈N
(A ∩ Πn )
Le lemme d’égalité des mesures est intéressant en lui même puisqu’il permet
de caractériser les mesures σ-finies uniquement par leur donnée sur un πsystème. Dans le cas du π-système π = {] − ∞, x], x ∈ R}, le théorème
assure que deux mesures ayant la même fonction de répartition (F (x) =
µ(] − ∞, x])) sont égales.
Lemme 3.2.6 L’ensemble M des parties µ∗ -mesurables est une tribu et µ∗
est σ-additive (et donc une mesure) sur M.
Preuve - Montrons tout d’abord que M est une algèbre et que µ∗ est
finiment additive sur M.
La stabilité par passage au complémentaire est évidente. Soient A, B ∈ M.
Alors pour tout E ∈ P(X) :
µ∗ (E) = µ∗ (E ∩ A) + µ∗ (E ∩ Ac )
= µ∗ (E ∩ A ∩ B) + µ∗ (E ∩ Ac ∩ B)
+ µ∗ (E ∩ A ∩ B c ) + µ∗ (E ∩ Ac ∩ B c )
≥ µ∗ (E ∩ A ∩ B) + µ∗ (E ∩ (A ∩ B)c )
par sous-additivité
de µ∗ . Mais cette même sous-additivité donne µ∗ (E) =
S
µ∗ (E ∩ (A ∩ B) E ∩ (A ∩ B)c ) ≤ µ∗ (E ∩ A ∩ B) + µ∗ (E ∩ (A ∩ B)c et
finalement on a l’égalité.
Pour l’additivité finie on prouve pour A et B disjoints l’égalité renforcée :
µ∗ (E ∩ (A ∪ B)) = µ∗ (E ∩ (A ∪ B) ∩ A) + µ∗ (E ∩ (A ∪ B) ∩ Ac )
= µ∗ (E ∩ A) + µ∗ (E ∩ B)
Soit maintenant une suite de parties disjointes {An , n ∈ N}. Alors on a
∗
∗
µ (E) = µ (E ∩ (
n
[
∗
Ai )) + µ (E ∩ (
i=1
=
n
X
≥
Ai )c )
i=1
µ∗ (E ∩ Ai ) + µ∗ (E ∩ (
i=1
n
X
n
[
n
[
Ai )c )
i=1
µ∗ (E ∩ Ai ) + µ∗ (E ∩ (
i=1
[
i∈N
28
Ai )c )
par monotonie. Le résultat étant vrai pour tout n, il vient µ∗ (E) ≥
Ai ) + µ∗ (E ∩ (
µ∗ (E ∩ (
[
[
X
i∈N
[
Ai )c ) et par sous σ-additivité, µ∗ (E) ≥ µ∗ (E ∩ (
i∈N
Ai )c ).
µ∗ (E∩
Ai )) +
i∈N
De nouveau la même sous σ-additivité donne également
i∈N
l’inégalité inverse, et donc l’égalité. Finalement,
[
Ai est µ∗ -mesurable.
i∈N
La σ-additivité est alors une conséquence directe de l’additivité finie et de
la sous σ-additivité. Lemme 3.2.7 A ⊂ M.
La démonstration de ce lemme est laissée en exercice.
3.3
Application : la mesure de Borel
Avant de construire la mesure de Borel, nous rappelons qu’une fonction
d’ensemble additive µ0 définie sur une semi-algèbre S admet un unique prolongement en une fonction additive µ sur l’algèbre engendrée par S. Elle est
définie par :
n
n
[
X
µ( Si ) =
µ0 (Si )
i=1
i=1
pour toute famille finie disjointe.
Corollaire 3.3.1 Par le théorème précédent, la mesure de Borel est l’unique
prolongement à la tribu des boréliens de la fonction longueur sur les intervalles de R (resp. à la fonction volume sur les pavés de Rp ) étendue à
l’algèbre engendrée par les intervalles (resp. à l’algèbre engendrée par les
pavés).
Théorème 3.3.2 (admis) Toute mesure borélienne invariante par translation est proportionnelle à la mesure de Borel.
3.4
Ensembles négligeables, tribu et mesure complétée
Définition 3.4.1 (ensemble négligeable, tribu complète)
Soit (X, A, µ) un espace mesuré. On appelle ensemble négligeable (ou de mesure nulle) toute partie B ∈ P(X) telle qu’il existe A ∈ A, B ⊂ A et µ(A) =
29
0.
On dit que la tribu A est complète (pour la mesure µ) si les ensembles
négligeables sont mesurables.
Remarquons qu’en général l’adjonction des ensembles négligeables élargit la
tribu.
Théorème 3.4.2 Il existe un unique prolongement de µ σ-finie à la tribu
complétée A∗ engendrée par A et l’ensemble des ensembles négligeables tel
que (A∗ , µ) soit complet. (X, A∗ , µ) est appelé espace complété.
C’est une conséquence directe du théorème de prolongement.
Exemple 3.4.3 La mesure (resp. tribu) complétée de la mesure de Borel
(resp. tribu borélienne) s’appelle mesure (resp. tribu) de Lebesgue.
3.5
Produit fini d’une famille d’espaces mesurés
Une autre application du théorème de prolongement est l’existence et l’unicité de la mesure produit sur le produit (fini) d’espaces mesurés :
Définition 3.5.1 (produit fini d’une famille d’espaces mesurés)
Soient (Xi , Ai , µi ), i ∈ I une famille finie d’espaces mesurés σ-finis :
on appelle mesure produit sur ( Π Xi , ⊗ Ai ) l’unique mesure ⊗ µi vérifiant
i∈I
i∈I
⊗ µi ( Π Ai ) = Π µi (Ai ),
i∈I
i∈I
i∈I
i∈I
Ai ∈ Ai ∀i ∈ I
L’espace mesuré ( Π Xi , ⊗ Ai , ⊗ µi ) est appelé espace mesuré produit.
i∈I
i∈I
i∈I
Remarque 3.5.2 Il existe une caractérisation différente de la mesure produit fondée sur les marginales qui sera donnée en abordant le théorème de
Fubini.
30
Chapitre 4
Applications mesurables
Ce chapitre, qui traite des applications mesurables, tient à la fois de la
théorie de la mesure et de la théorie de l’intégration. Si les notions définies
et le théorème de la mesure image sont partie prenante de la théorie de
la mesure, le théorème fondamental d’approximation est en effet le point
de départ de toute la théorie de l’intégration de Lebesgue, celle-ci étant
l’intégration des fonctions mesurables.
4.1
Définition d’une application mesurable
Définition 4.1.1 (application mesurable)
Soient (X, A) et (Y, B) deux espaces mesurables. Alors une fonction f :
X −→ Y est (A, B)-mesurable (ou simplement mesurable) si
∀B ∈ B, f −1 (B) ∈ A
Exemple 4.1.2 (fondamental) Posons Y = {0, 1} et B = P(X). Alors
∀A ⊂ X, 1A est mesurable ⇐⇒ A est mesurable.
Proposition 4.1.3 Si X et Y sont deux espaces topologiques,
f continue ⇒ f mesurable pour les tribus boréliennes
Preuve - Soient τX et τY les ouverts de X et Y . f continue ⇒ f −1 (τY ) ⊂ τX .
Par le lemme 1.2.3 (de transport), il vient
f −1 (σ(τY )) = σ(f −1 (τY )) ⊂ σ(τX )
31
Remarque 4.1.4 Dans le cas précédent où X et Y sont munis de leurs tribus boréliennes, les applications mesurables sont simplement appelées applications boréliennes.
4.2
Propriétés générales
Proposition 4.2.1
1. Si B = σ(C), f mesurable ⇐⇒ {∀C ∈ C, f −1 (C) ∈ A}.
2. f : (X, A) −→ (R, BR ) mesurable ⇐⇒ {∀x ∈ R, f −1 (] − ∞, x]) ∈ A}.
3. Soit g : (Y, B) −→ (Z, C) mesurable. Alors g ◦ f mesurable.
4. f : (X, A) −→ (R, BR ) et g : (X, A) −→ (R, BR ) mesurables ⇐⇒
(f, g) : (X, A) −→ (R2 , BR2 ) est mesurable.
Preuve 1. Conséquence directe du lemme 1.2.3 (de transport).
2. Application de 1) avec C = {] − ∞, x], x ∈ R} (+ proposition 1.5.2).
3. (g ◦ f )−1 (C) = f −1 (g −1 (C)) ⊂ f −1 (B) ⊂ A.
4. [⇒] R étant à base dénombrable d’ouvert, on sait (1.5.5) que B(R2 )
est engendré par cette base. D’après 1), il suffit donc de prouver
que l’image réciproque d’un produit d’ouverts (les produits d’ouverts
forment une base) est dans A :
(f, g)−1 (O1 × O2 ) = f −1 (O1 ) ∩ g −1 (O2 )
et comme A est stable par intersection finie, (f, g)−1 (O1 × O2 ) ∈ A.
[⇐] Les projections étant continues, f = pX ◦ (f, g) et g = pY ◦ (f, g)
sont mesurables d’après la proposition 4.1.3 et 2). 4.3
Propriétés des fonctions mesurables réelles
On appelle fonction mesurable réelle toute fonction f : (X, A) −→ (R, BR )
mesurable (elle sera appelée variable aléatoire réelle en théorie des probabilités).
Les propriétés de ces fonctions sont très importantes, et le calcul intégral
développé par la suite sera presque entièrement dédié à ces fonctions mesurables réelles.
32
Proposition 4.3.1
– Soient f : (X, A) −→ (R, BR ) et g : (X, A) −→ (R, BR ) mesurables et
soit α ∈ R. Alors
f + g, α.f, sup(f, g), inf(f, g), |f | sont mesurables.
– Soit {fn , n ∈ N} une suite de fonctions mesurables. Alors
sup fn , inf fn , lim sup fn , lim inf fn sont mesurables (dès que finies).
n∈N
n∈N
n∈N
n∈N
– Si fn −→ f , f est mesurable.
Preuve 1. La somme, le produit par un réel, le sup, l’inf, la valeur absolue sont
continues donc mesurables (proposition 4.2.1). On utilise ensuite les
points 3) et 4) de la proposition 4.2.1.
2. montrons que le sup est mesurable en utilisant le point 2) de la proposition 4.2.1 :
\
sup fn−1 (] − ∞, x]) = {sup fn ≤ x} =
{fn ≤ x} ∈ A
n∈N
n∈N
n∈N
3. si fn −→ f , alors f = lim sup fn = lim inf fn est mesurable d’après
n∈N
n∈N
2). On en déduit directement le corollaire suivant :
Corollaire 4.3.2 L’ensemble M des applications mesurables réelles est un
R espace vectoriel.
4.4
Fonction à valeur dans R̄ = [−∞, +∞]
L’utilisation des suprema et infima est rendue malaisée par l’interdiction des
valeurs +∞ ou −∞. De plus, une mesure pouvant prendre la valeur +∞,
l’utilisation de mesures pour définir des fonctions peut être gênante.
Afin de suppléer à ce problème, nous admettrons dans la suite du cours que
l’ensemble R̄ = [−∞, +∞] peut être muni d’une topologie correspondant à
l’intuition (c’est à dire où les convergences sont les convergences classiques,
y compris pour les suites convergeant vers +∞ ou −∞).
A partir de maintenant, nous travaillerons toujours (sauf précision) sur la
droite réelle étendue R̄. Les théorèmes précédents restent alors valables.
33
4.5
Transport d’une mesure, mesure image
Proposition 4.5.1 (Mesure image)
Soit (X, A, µ) un espace mesuré, f : (X, A) −→ (Y, B) une application mesurable. Alors la fonction d’ensemble
ν : B −→ [0, +∞]
B 7−→ µ(f −1 (B))
est une mesure sur B appelée mesure image de µ par f et notée f∗ µ.
Preuve - f étant mesurable, pour tout borélien B de B, f −1 (B) ∈ A. on
a trivialement ν(∅) = 0 donc ν n’est pas constante égale à +∞. Reste à
vérifier la σ-additivité :
Soit (An )n≥1 une suite de boréliens deux à deux disjoints. Alors
!
!!
!
+∞
+∞
+∞
[
[
[
An
= µ f −1
An
=µ
f −1 (An )
ν
n=1
n=1
=
+∞
X
µ f −1 (An ) =
n=1
4.6
n=1
+∞
X
ν (An ) n=1
Approximation d’une fonction mesurable réelle
Nous approchons ici toute fonction mesurable réelle par une suite de fonctions étagées. Le théorème d’approximation est à la base du calcul intégral
de Lebesgue, qui consiste à prouver des propriétés sur les fonctions étagées
puis à passer à la limite.
Définition 4.6.1 On appelle fonction étagée sur l’espace mesurable (X, A)
une fonction de la forme
f=
n
X
xi 1Ai ,
xi ∈ R, Ai ∈ A
i=1
Théorème 4.6.2 (fondamental d’approximation)
– Toute fonction mesurable positive (f : X −→ R̄+ ) est limite d’une
suite croissante de fonctions étagées positives.
34
– Toute fonction mesurable réelle est limite d’une suite de fonctions
étagées.
Afin de prouver ce théorème, nous démontrons le lemme suivant :
Lemme 4.6.3 soit f : (X, A) −→ (R, B) une fonction mesurable réelle
bornée par M . Alors il existe une fonction étagée g telle que 0 ≤ g ≤ f et
supx∈X |f (x) − g(x)| ≤ M
2 .
Preuve - On vérifie que la fonction étagée
g=
M
1
M
2 {f > 2 }
possède les propriétés requises. On peut maintenant prouver le théorème :
Preuve -(du théorème 4.6.2)
1. On suppose dans un premier temps que f est bornée. Alors par récurrence
et en utilisant le lemme précédent 4.6.3, il existe une suite de fonctions étagées gn telle que ∀n ∈ N, 0 ≤ gn ≤ f − (g1 + ... + gn−1 ) et
supx∈X |f (x) − (g1 (x) + ... + gn )| ≤ 2Mn .
La suite hn = g1 + ... + gn possède les propriétés voulues.
Si f n’est pas bornée, on pose fn = inf(f, n). fn ↑ f et les fn sont mesurables, positives et bornées. D’après le résultat précédent, il existe gn
étagée positive, supx∈X |fn (x)−gn (x)| ≤ n1 . La suite hn = sup(g1 , ..., gn )
possède alors les propriétés voulues.
2. On a f = f + − f − avec f + et f − mesurables positives. Elles sont alors
limites des suites de fonctions étagées gn+ et gn− et gn+ − gn− converge
vers f . Ce théorème permet de démontrer de nombreux résultats importants
en théorie de l’intégration. Il permet également de démontrer facilement le
résultat suivant, qui est crucial pour la théorie de l’esprérance conditionnelle
et le calcul stochastique.
Lemme 4.6.4 (de Doob) Soit h : E → (F, F)et f : E → (R, B) des applications. On munit E de la tribu σ(h) engendrée par h. Si f est σ(h)−mesurable,
alors il existe g (F,B) −mesurable telle que
f =g◦h
35
Preuve – La propriété est vraie pour les indicatrices
Soit A ∈ B. Si f = 1A , alors
f −1 ({1}) = A ∈ σ(h)
Or σ(h) = h−1 (B); B ∈ F . Donc il existe B dans F tel que A =
h−1 (B).
Donc f s’écrit sous la forme f = 1h−1 (B) = 1B ◦ h = g ◦ h avec g = 1B
– La propriété est vraie pour les fonctions
X étagées positives
αi 1Ai , donc
Si f est étagée positive, alors f =
i
f −1 ({αi }) = Ai ∈ σ(h)
Donc il existe Bi dans F tel que Ai = h−1 (Bi ). Donc
X
f=
αi 1Bi ◦ h
i
– La propriété est vraie pour les fonctions mesurables positives
Soit f mesurable positive. Par le lemme fondamental d’approximation,
il existe une suite (sn )n de fonctions étagées positives qui converge
simplement en croissant vers f . Or, pour tout n, on peut écrire sn =
gn ◦ X avec gn mesurable. Donc, gn ◦ h ↑ g ◦ h = f avec g = limgn .
La propriété est vraie pour les fonctions mesurables à valeurs réelles.
Cela résulte de la décomposition f = f + − f − . On applique le résultat
précédent à f + et f − . Il y a une petite difficulté car g + et g − peuvent
valoir ∞, mais en multipliant par exemple g + par 1g+ <+∞ , on élimine
le problème sans changer g ◦ h.
36
Chapitre 5
Théorie de la mesure et
probabilités
5.1
Introduction
Il y a deux notions fondamentales en probabilités :
Expérience aléatoire : expérience dont le résultat est soumis au hasard.
Exemples :
1. jet aléatoire de deux dés,
2. battage d’un jeu de n cartes,
3. jeu de Pile ou Face de durée infinie,
4. observation de la durée de vie d’un appareil,
5. mouvement d’une particule pendant un intervalle de temps [t1 ; t2 ].
Description mathématique : à l’aide d’un ensemble Ω dont les éléments
ω représentent les issues possibles. Dans les exemples ci-dessus on peut
prendre :
1. {1, ..., 6} × {1, ..., 6},
2. Sn , n-ieme groupe symétrique,
3. {0, 1}N , ensemble des suites à valeurs dans {0, 1},
4. N ou R+ ,
5. C([t1 ; t2 ], R3 ).
Événement aléatoire : événement lié à une expérience aléatoire. Par exemple,
dans les situations précédentes :
1. amener un total supérieur ou égal à 10,
37
2. il n’y a pas deux as consécutifs,
3. obtenir une série de cent pile consécutifs,
4. observer une durée de vie supérieure à deux ans,
5. la particule reste confinée dans la boule unité.
Description mathématique : par la partie A de Ω égale à l’ensemble
des ω qui réalisent l’événement. Ainsi dans l’exemple 1. on aura
A = {(5; 5); (5; 6); (6; 5); (6; 6)}
Alors que le langage de la théorie de la mesure est ensembliste, celui des
probabilités est (par définition) probabiliste. Il suffit alors de changer de
terminologie pour transformer un énoncé de probabilité en théorie de la mesure, et réciproquement.
Il est naturel de souhaiter que la classe des événements soit stable par les
opérations “contraire”, “et”, “ou” appliquées à des suites éventuellement
infinies d’événements : il est alors naturel d’imposer à cette classe, au niveau
ensembliste, de former une tribu A de parties de Ω. Finalement, pour décrire
complètement une expérience aléatoire, il reste à introduire la notion de probabilité i.e. de munir l’espace mesurable (Ω, A) d’une mesure de probabilité
P (P(Ω) = 1).
Ainsi, toute expérience aléatoire se décrit mathématiquement par la donnée
d’un espace probabilisé (Ω, A, P).
5.2
5.2.1
Exemples élémentaires
Ensemble fini : Ω = {ω1 , ...ωn }
On peut toujours supposer, quitte à remplacer par l’ensemble des atomes
de A (on rappelle que cet ensemble engendre A ), que A = P (Ω) la tribu
discrète. Il est clair alors que grâce à la propriété d’additivité (appelée ici
“axiome des probabilités totales”)Pdéfinir P équivaut à définir une famille
finie (pi ) de réels positifs tels que ni=1 pi = 1, en posant : P(ωi ) = pi .
On a en effet alors
X
X
∀A ∈ A, P(A) =
P(ωi ) =
pi
ωi ∈A
i; ωi ∈A
En particulier, lorsqu’il est question de tirage au hasard on sous entend que
les probabilités des évenements sont équiprobables dans le sens ou P est la
38
“probabilité uniforme” définie par : P(ωi ) = pi =
la formule précédente s’écrit
∀A ∈ A, P(A) =
1
n
=
1
Card(Ω)
de sorte que
Card(A)
Card(Ω)
. A ce niveau, il est clair que le calcul des probabilités se ramène à un calcul
de dénombrement.
5.2.2
Cas d’un ensemble infini dénombrable Ω = {ωi , i ∈ N}
La remarque faite à propos du cas fini reste valable : on peut prendre A =
P (Ω). Toute probabilité P sur (Ω, A) peut être définie par la donnée de
la
Pnfamille dénombrable {pi , i ∈ N} de réels positifs (vérifiant bien sûr :
i=1 pi = 1).
On remarquera qu’il n’y a pas dans ce cas de probabilité uniforme possible.
5.3
Probabilités conditionnelles, événements indépendants
Exemple : on tire une carte au hasard dans un jeu de trente deux cartes.
On associe à cette expérience aléatoire l’espace (Ω, A, P) où Ω est un ensemble à 32 éléments, A = P (Ω) et P la probabilité uniforme. On considère
les événements A : “tirer un roi noir”, B : “tirer un trèfle”. On obtient
1
immédiatement P(A) = 16
et P(B) = 14 . Supposons que l’on dispose de
l’information : “la carte tirée est un roi noir” ; il est raisonnable alors de
prendre comme nouvel espace probabilisable (A, P (A)) muni de la probabilité uniforme PA . L’événement “tirer un trèfle” se décrit maintenant par
B 0 = B ∩ A et
PA (B 0 ) =
Card(B 0 )
Card(B ∩ A)
1
P(B ∩ A)
=
= =
Card(A)
Card(A)
2
P(A)
Cette dernière égalité suggère aussi de garder l’espace (Ω, P (Ω)) et de le
munir d’une nouvelle probabilité “concentrée sur A”, définie à partir de P.
Définition 5.3.1 Soit (Ω, A, P) un espace probabilisé et A un événement de
probabilité non nulle. On appelle probabilité conditionnelle d’un événement
B “sachant A” ou “par rapport à A” le nombre P(B|A) défini par :
P(B|A) =
P(B ∩ A)
P(A)
39
Proposition 5.3.2 Soit (Ω, A, P) un espace probabilisé et A un événement
de probabilité non nulle. L’application P(.|A) : A → [0; 1] définie par
∀B ∈ A, P(B|A) =
P(B ∩ A)
P(A)
est une probabilité sur (Ω, A).
Définition 5.3.3
Soit (Ω, A, P) un espace probabilisé. Deux événements A et B sont indépendants
si
P(A ∩ B) = P(A)P(B)
Les événements {Ai , i ∈ I} sont (globalement, ou stochastiquement) indépendants
si
∀i1 , ..., ik , P(Ai1 ∩ ... ∩ Aik ) = P(Ai1 )...P(Aik )
Remarque 5.3.4 Si A et B sont indépendants et si P(A) 6= 0, on a
P(B ∩ A) = P(B)
De façon intuitive cela signifie que la réalisation de A n’a pas d’influence
sur la probabilité de réalisation de B.
Définition 5.3.5 n tribus (A1 , ..., An ) sont indépendantes si pour tout système
(A1 , ..., An ) d’événements tel que ∀1 ≤ i ≤ n, Ai ∈ Ai on a
\
P(
Ai ) = Πni=1 P(Ai )
1≤i≤n
Une famille (potentiellement infinie) de tribus est indépendant si toute sousfamille finie est indépendante.
On a bien la cohérence entre événements et tribus indépendantes :
Définition 5.3.6 la famille d’événements (Ai , i ∈ I) est indépendante si
et seulement si la famille de tribu (σ(Ai ), i ∈ I) qu’ils engendrent l’est.
Proposition 5.3.7 (lemme de Borel-Cantelli) Soit (Ω, A, P) un espace
probabilisé et (An ), n ∈ N une suite infinie d’événements.
X
1. Si
P(An ) < +∞ alors P(limAn ) = P(lim sup An ) = 0, c’est à dire
n∈N
que presque sûrement un nombre fini de An au plus sont réalisés.
40
2. Si la suite (An ) est indépendante et si
X
P(An ) = +∞ alors P(limAn ) =
n∈N
P(lim sup An ) = 1, c’est à dire que presque sûrement une infinité de
An sont réalisés.
En particulier pour une suite indépendante d’événements :
Corollaire 5.3.8 (loi du 0 − 1)
Soit (An ) une suite d’événements indépendants. Alors
P(lim sup An ) = 0 ou 1
(suivant que
X
P(An ) converge ou diverge).
n∈N
5.4
5.4.1
Variables aléatoires
Variables aléatoires réelles.
Définition 5.4.1 (variable aléatoire réelle)
Soit (Ω, A, P) un espace probabilisé. Une variable aléatoire (v.a.) réelle est
une fonction mesurable X : (Ω, A) −→ (R, B(R)).
On dit que X est discrète si X(Ω) est fini ou dénombrable, entière si X(Ω) ∈
Z.
Définition 5.4.2 (loi d’une v.a. (ou distribution))
On appelle loi (de probabilité) de la v.a. X la mesure image de P par X,
notée PX , qui est donc une probabilité sur R.
∀B ∈ B(R)), PX (B) = P(X −1 (B)) = P(X ∈ B)
Définition 5.4.3 On appelle fonction de répartition de P (resp. de X),
notée F (resp. FX ) la fonction réelle
F (x) = P(] − ∞, x]) (resp. FX (x) = PX (] − ∞, x]) = P(X ≤ x))
D’après le lemme d’égalité des mesures, elle caractérise entièrement la probabilité P (resp. la loi de X).
Proposition 5.4.4 La fonction de répartition F d’une variable aléatoire
réelle X est croissante, cadlag (continue à droite limite à gauche),
limt→−∞ F (t) = 0, limt→+∞ F (t) = 1.
41
Réciporquement, si F : R → R est une fonction croissante, continue à
droite, de limites respectives 0 et 1 en −∞ et +∞ alors il existe une unique
probabilité P sur (R, B(R)) de fonction de répartition F . P est la mesure de
Lebesgue-Stieljes associée à F .
Définition 5.4.5 On dit que P est diffuse si F est continue ( ⇐⇒ P (x) =
0 ∀x ∈ R).
Elle est discrète si ∃S dénombrable, P(S) = 1.
Théorème 5.4.6 Toute probabilité est combinaison convexe d’une probabilité diffuse et d’une probabilité discrète.
5.4.2
Variables aléatoires, vecteurs aléatoires, indépendance
Définition 5.4.7 (variable aléatoire)
Soit (Ω, A, P) un espace probabilisé, (E, B) un espace mesurable.
Une variable aléatoire (v.a.) sur (E, B) est une fonction mesurable X :
(Ω, A) −→ (E, B). Sa loi est la probabilité PX sur (E, B).
Définition 5.4.8 (variable aléatoire à valeur dans Rn )
Une v.a. à valeur dans Rn est une fonction mesurable X : (Ω, A) −→
(R, B(Rn )).
Sa loi est la probabilité PX sur (R, B(Rn )).
Proposition 5.4.9 ∀a ∈ (Rn ), ha, Xi est alors une v.a. réelle et X est de
la forme X = (X1 , ..., Xn ) où les Xi sont des v.a. réelles.
Définition 5.4.10 On appelle également X vecteur aléatoire. Les v.a. réelles
Xi = hei , Xi = pi ◦ X s’appelle marges de X, leurs lois lois marginales de
X.
Attention : les marges déterminent X, mais les lois marginales ne déterminent
pas PX en général.
Tout comme pour les v.a. réelles, on peut définir la fonction de répartition
d’un vecteur aléatoire :
Définition 5.4.11 On appelle fonction de répartition du vecteur aléatoire
X, notée FX la fonction FX : Rn −→ [0, 1]n
FX (x1 , ..., xn ) = P(X1 ≤ x1 , ..., Xn ≤ xn )
Elle définit entièrement X.
42
Définition 5.4.12 (v.a. indépendantes)
Soit {Xi , i ∈ I} une famille de v.a. définie sur (Ω, A, P) un espace probabilisé. les Xi , i ∈ I sont indépendantes si les tribus image réciproque sont
indépendantes.
Théorème 5.4.13
Soit {Xi , i ∈ I} une famille de v.a. définie sur (Ω, A, P). Alors les propositions suivantes sont équivalentes :
1. les Xi sont indépendantes
2. ∀i1 , ..., ik ,
∀Aij ∈ Aij ,
P(Xi1 ∈ Ai1 , ..., Xik ∈ Aik ) = P(Xi1 ∈ Ai1 )...P(Xik ∈ Aik )
3. ∀i1 , ..., ik ,
∀Aij ∈ Aij
P(Xi1 ,...,Xi
k)
= PXi1 ⊗ ... ⊗ PXik
Dans le cas de vecteurs aléatoires on a :
Proposition 5.4.14 Les Xi sont indépendantes si et seulement si
F(X1 ,...,Xn ) (x1 , ..., xn ) = FX1 (x1 )...FXn (xn )
43
44
Deuxième partie
Intégration
45
Chapitre 6
Intégration des fonctions
mesurables positives
Dans ce chapitre, on se fixe une fois pour toute un espace mesuré (X, A, µ).
6.1
Intégrale (supérieure) des fonctions étagées
On note E + l’ensemble des fonctions étagées positives (à valeurs dans R+ ).
Définition 6.1.1 Soit
f=
n
X
αi 1Ai ,
αi ∈ R+ ,
Ai ∈ A
i=1
une fonction étagée positive. Alors on définit l’intégrale (supérieure) de f
par rapport à µ comme
Z
Z
n
X
I(f ) =
f dµ = f dµ =
αi µ(Ai )
X
i=1
Cette définition ne dépend pas de la décomposition choisie par additivité de
la mesure.
R
R
Remarque 6.1.2 On notera encore X f dµ = x∈X f (x)dµ(x).
Cette intégrale peut avoir pour valeur +∞.
On déduit de cette définition les premières propriétés de l’intégrale de fonctions étagées :
47
Proposition 6.1.3
–
R
1A dµ = µ(A),
–
R
(f + g)dµ =
–
R
αf dµ = α.
– f ≤g⇒
R
R
R
A∈A
f dµ +
R
f, g ∈ E + (additivité)
gdµ,
α ∈ R+ (homogénéité)
f dµ,
f dµ ≤
R
gdµ,
f, g ∈ E + (croissance)
La propriété cruciale de l’intégrale des fonctions étagées est donnée par le
lemme suivant :
Lemme 6.1.4 (de Beppo-Levi)
Soit fn une suite croissante d’éléments de E + et f ∈ E + . Alors
Z
Z
lim fn ≥ f ⇒ lim
fn dµ ≥ f dµ
n→+∞
n→+∞
Preuve - Puisque limn→+∞ fn ≥ f on a
∀c ∈]0, 1[,
An = {fn ≥ cf } ↑ X
De plus par définition de An on a fn ≥ cf 1An et en écrivant f sous sa forme
étagée
Z
f 1An dµ =
N
X
αi µ(Ai ∩ An ) ↑
i=1
Finalement
N
X
Z
αi µ(Ai ) =
i=1
Z
Z
fn dµ ≥ c
lim
n→+∞
f dµ ∀c ∈ [0, 1]
(on peut faire tendre c vers 1 dans l’inégalité). Corollaire 6.1.5
Z
fn ↑ f ⇒
Z
fn dµ ↑
f dµ,
fn , f ∈ E +
X
Preuve - La croissance de l’intégrale donne
Z
Z
lim
fn dµ ≤ f dµ
n→+∞
48
f dµ
et le lemme de Beppo-Levi donne l’inégalité opposée
Z
Z
lim
fn dµ ≥ f dµ
n→+∞
d’où l’égalité. 6.2
Intégrale d’une fonction mesurable positive
On note M + l’ensemble des fonctions mesurables positives (à valeurs dans
R̄+ ).
Définition 6.2.1 (intégrale (supérieure))
Soit f ∈ M + . On définit l’intégrale (supérieure) de f par rapport à µ comme
Z
Z
I(f ) = f dµ = sup{ hdµ, h ∈ E + , h ≤ f }
Remarque 6.2.2 Comparez cette définition aux notions de mesure extérieure,
intérieure. Qu’en déduisez-vous ?
Proposition 6.2.3 Soit hn ∈ E + , hn ↑ f (cf. théorème 4.6.2 d’approximation). Alors
Z
Z
I(f ) = f dµ = lim hn dµ
Preuve - Puisque ∀n, hn ∈ E + , hn ≤ f on a ∀n,
passage à la limite
Z
Z
lim
hn dµ ≤ f dµ
R
hn dµ ≤
R
f dµ et par
n→+∞
Soit h ∈
E+,
h ≤ f . Le lemme de Beppo-Levi donne
Z
Z
lim
hn dµ ≥ hdµ
n→+∞
d’où
Z
lim
n→+∞
Z
hn dµ ≥
f dµ
et finalement on a l’égalité. Les deux exemples suivants sont fondamentaux : le premier donne les séries
comme intégrales par rapport aux mesures discrètes et le second voit l’intégrale
par rapport à la mesure de Borel comme une extension de l’intégrale de Riemann.
49
Exemple 6.2.4 (Intégration par rapport à une mesure discrète)
Une mesure discrète est de la forme
X
µ(A) =
pi 1ai (A), pi > 0, ai ∈ X
i∈N
Alors
∀f ∈ M + ,
Z
I(f ) =
f dµ =
X
pi f (ai )
i∈N
Exemple 6.2.5 (Riemman et Borel)
Si f ∈ M + est Riemman-intégrable, elle est Borel intégrable et les deux
intégrales coincident.
6.3
Propriété vraie presque partout
Un propriété P est vraie (µ) presque partout (P vraie p.p.) si elle est fausse
sur un ensemble de mesure nulle.
Exemple 6.3.1 χQ = 0 p.p. pour la mesure de Borel.
Lemme 6.3.2
f, ∈ M + , I(f ) = 0 ⇐⇒ f = 0 p.p.
f, g ∈ M + , f = g p.p.⇒ I(f ) = I(g).
Preuve - La première équivalence est évidente sur les fonctions étagées
positives.
Soit maintenant hn ∈ E + , hn ↑ f . Alors f = 0 p.p. ⇒ ∀n, hn = 0 p.p. ⇒
∀n, I(hn ) = 0 et par le lemme de Beppo-Levi (et monotonie) 0 ≤ I(f ) ≤ 0.
Réciproquement par monotonie I(f ) = 0 ⇒ ∀n, I(hn ) = 0 ⇒ ∀n, hn = 0
p.p. mais alors
+∞
[
{f > 0} =
{hn > 0}
n=1
est de mesure nulle comme réunion dénombrable d’ensembles de mesure
nulle.
Enfin la deuxième implication est une conséquence de la première équivalence
car f = g p.p. ⇒ (f − g)1(f −g)≥0 = (g − f )1(g−f )≥0 = 0 p.p. et
g + (f − g)1(f −g)≥0 = f + (g − f )1(g−f )≥0
50
d’où
I(g) = I(g) + I (f − g)1(f −g)≥0 d’après l’équivalence précédente
= I g + (f − g)1(f −g)≥0 = I f + (g − f )1(g−f )≥0 par linéarité
= I(f ) + I (g − f )1(g−f )≥0 = I(f )
Ce lemme permet d’étendre la définition de l’intégrale aux fonctions définies
p.p.
Remarque 6.3.3 L’ordre des quantificateurs est très important si on quantifie sur des ensembles non dénombrables (et pas important sinon). En effet :
- Soit µ la mesure de Borel sur R. On définit fα (t) = 1, t 6= α et fα (α) = 0.
Alors
∀α ∈ R, {fα = 1 presque partout}
mais
µ({∀α ∈ R, fα = 1}) = µ(∅) = 0
- Par contre, une union dénombrable d’ensembles de mesure nulle étant de
mesure nulle, on a
∀n, {Pn vraie p.p.} ⇐⇒ {∀n, Pn } vraie p.p.
6.4
Propriétés générales
Cette section présente deux résultats cruciaux : le théorème de convergence
monotone et le lemme de Fatou. On donne également l’inégalité de Markov.
Théorème 6.4.1
– L’intégrale sur M + prolonge l’intégrale sur E + .
– f 7−→
R
f.dµ est additive, homogène et croissante.
R
R
– fn ↑ f ⇒ fn dµ ↑ f dµ,
monotone (Beppo-Levi)).
fn , f ∈ M + (théorème de la convergence
R
Le lemme de Fatou sera fondamental pour passer à la limite sous le signe .
51
Lemme 6.4.2 (lemme de Fatou (1ère version))
Pour toute suite fn ∈ M + on a
Z
Z
(lim inf fn )dµ ≤ lim inf( fn dµ)
n
n
Preuve - Soit
hn = inf fp
p≥n
Alors hn est une suite croissante de limite limn inf fn (par définition). Le
théorème de convergence monotone donne
Z
Z
limn→+∞ hn dµ = lim inf fn dµ
n
D’autre part on a
hn ≤ fp
∀p ≥ n
et par monotonie
Z
Z
hn dµ ≤
d’où
fp dµ
Z
∀p ≥ n
Z
hn dµ ≤ inf
p≥n
∀n
fp dµ
et en passant à la limite,
Z
lim
n→+∞
Z
hn dµ ≤ lim inf
n
fn dµ
soit compte tenu de la première égalité
Z
Z
lim inf fn dµ ≤ lim inf fn dµ
n
n
Enfin, une petite inégalité très simple et très utile (notamment en probabilité) :
Proposition 6.4.3 (Inégalité de Markov) Soit f ∈ M+ (A) et a ∈ R+ .
Alors
Z
1
µ {x ∈ X : f (x) ≥ a} ≤
f dµ .
a X
Preuve -Remarquer que f ≥ a1{f ≥a} puis intégrer.
Remarquons qu’en posant h = g ◦ f avec g strictement positive croissante
(donc mesurable), on obtient ce qui peut paraı̂tre bien plus :
Z
1
µ {x ∈ X : f (x) ≥ a} ≤
g ◦ f dµ .
g(a) X
52
6.5
Théorème de transfert (changement de variable)
Soit (Y, B) un espace mesuré et
φ : X −→ Y
une application (A, B)-mesurable. Soit ν = φ∗ µ = µ(φ−1 ) la mesure image.
Théorème 6.5.1 f : Y −→ R̄+ , f ∈ M + vérifie
Z
Z
(f ◦ φ)dµ
f dν =
X
Y
Preuve - Pour les fonctions indicatrices
Z
Z
Z
−1
1B dν = ν(B) = µ(φ (B)) =
1φ−1 (B) dµ =
(1B ◦ φ)dµ
Y
X
X
On en déduit que le théorème est vrai sur les fonctions étagées par linéarité
puis sur les fonctions mesurables par convergence monotone. Cependant, il est pour l’instant difficile de caractériser la mesure image.
Exemple 6.5.2 (Loi de Cauchy)
Soit λ la mesure de Borel sur ] − π2 , π2 [ et µ = πλ . Soit
φ :] − π2 , π2 [ −→
R
θ
7−→ tan θ
alors la mesure image ν s’appelle mesure (ou loi) de Cauchy.
Elle vérifie pour h Riemman-intégrable
R
R hdν =
R
=
1
π
π
2
− π2
R
h(tan θ)dµ(θ)
π
2
− π2
h(tan θ)dθ =
R
dt
R h(t) π(1+t2 )
Au vu de cet exemple, on aimerait pouvoir dire que, dans un certain sens
ν=
1
λ
π(1 + t2 )
La prochaine section donne un sens à cette écriture.
53
6.6
Mesures définies par des densités
Proposition 6.6.1 (définition)
Soit f ∈ M + . L’application
ν : A −→ R R̄+
A
7−→
1A f dµ
est une mesure sur (X, A) appelée mesure de densité f par rapport à µ. On
la note souvent ν = f.µ
Preuve - On a bien évidemment ν(∅) = 0 et ν n’est pas constante égale à
+∞.
Elle est additive car si A1 ∈ A, A2 ∈ A sont deux ensembles disjoints,
Z
Z
ν(A1 ∪ A2 ) = 1A1 ∪A2 f dµ = (1A1 + 1A2 )f dµ
Z
Z
= 1A1 f dµ + 1A2 f dµ = ν(A1 ) + ν(A2 )
Et finalement elle est continue par convergence monotone
Z
Z
An ↑ A ⇒ 1An f ↑ 1A f ⇒ 1An f dµ ↑ 1A f dµ
On démontre alors facilement le théorème suivant (exercice) :
R
R
Théorème 6.6.2 ∀g ∈ M + ,
gd(f.µ) = gf dµ.
Exemple 6.6.3 La loi de Cauchy définie précédemment est la mesure de
1
densité π(1+x
2 ) par rapport à la mesure de Borel sur R.
Exemple 6.6.4 Posons f = +∞. Alors la mesure ν = f.µ est simple : elle
vaut 0 sur les ensembles de µ mesure nulle et +∞ sinon.
Exemple 6.6.5 (Exemple fondamental des fonctions de répartition)
Soit ν une mesure de probabilité, F sa fonction de répartition. On suppose
que F est continuement différentiable et on note f sa dérivée (continue).
Alors
ν = f.λ
54
où λ est la mesure de Borel sur R.
En effet,
Z
x
ν(] − ∞, x]) = F (x) =
Z
f (t)dt =
1]−∞,x] f dλ
−∞
Les deux mesures (ν et f.λ) correspondant sur un π-systèmes, elles sont
égales par le lemme d’égalité des mesures.
6.7
Mesures absolument continues, étrangères
On considère toujours (X, A, µ) espace mesurable, et soit ν une seconde
mesure sur (X, A).
Définition 6.7.1 On dit que ν est absolument continue par rapport à µ (et
on note ν ≺ µ) si
∀A ∈ A,
µ(A) = 0 ⇒ ν(A) = 0
On dit que ν et µ sont étrangères (et on note ν ⊥ µ) si
∃N ∈ A,
µ(N ) = ν(N c ) = 0
Exemple 6.7.2
ν = f.µ ⇒ ν ≺ µ
Sur (R, B(R)),toute mesure discrète est étrangère a la mesure de Borel.
6.8
Absolue continuité et densité
Nous admettons alors les deux théorèmes suivants (théorème de RadonNikodym et théorème de décomposition de Lebesgue) :
Théorème 6.8.1 (Radon-Nikodym (admis))
Si µ et ν sont σ-finies, ν ≺ µ, alors
∃f mesurable positive, ν = f.µ
de plus, f est unique à une µ-équivalence près. On note f =
l’égalité
Z
Z
dν
+
∀g ∈ M ,
gdν = g dµ
dµ
55
dν
dµ
et on a
Il existe en fait une version plus générale de ce théorème :
Théorème 6.8.2 (de décomposition de Lebesgue (admis))
Si µ et ν sont σ-finies, alors il existe f mesurable positive, unique à une
µ-équivalence près et une unique mesure γ étrangère à µ telle que
ν = f.µ + γ
6.9
Théorème de changement de variable, λ mesure de Lebesgue
On peut désormais expliciter la forme de la mesure image dans le cas particulier de la mesure de Borel pour certaines fonctions φ.
Soit X et Y deux ouverts de Rn , λ la mesure de Borel sur Rn et
φ : X −→ Y
un C 1 -difféomorphisme (d’où Y = φ(X)).
Théorème 6.9.1 (changement de variable (admis))
ν = φ∗ λ = λ(φ−1 ) est absolument continue par rapport à λ de densité
dν
= |Jac(φ)|−1 = |Jac(φ−1 )|
dλ
Le théorème de transfert s’écrit
Z
Z
(f ◦ φ)dλ =
X
Z
f dν =
Y =φ(X)
f |Jac(φ−1 )|dλ
Y
où Jac(φ−1 ) est la fonction Jacobienne (ou Jacobien) de φ−1 .
On en déduit le changement de variable linéaire :
Proposition 6.9.2 (Changement de variable liénaire)
Soit A ∈ Gld (R) et b ∈ Rd . Alors pour toute f de L1 Rd , B Rd
Z
1
f (Ax + b)dx =
|det(A)|
Rd
56
Z
f (y)dy
Rd
Preuve - On pose φ : Rd → Rd ,x 7−→ Ax + b. On peut encore écrire


d
X
φ (x1 , ..., xd ) = 
aij xj + bj 
j=1
Alors Jφ (u) = det
∂φi
∂uj
1≤j≤d
= det (aij )1≤i,j≤d = det(A). D’où le résultat.
1≤i,j≤d
Exemple 6.9.3 Soit f intégrable sur Rd . Alors :
Z
Z
f (−x)dx =
f (y)dy
Rd
Rd
Remarque 6.9.4 Afin de démontrer le théorème de changement de variable, on procède de manière inverse. On montre d’abord le théorème de
changement de variable linéaire, puis on prouve le théorème général de changement de variable.
6.10
Caractérisation de la mesure produit, théorème
de Fubini-Tonelli
La définition de l’intégrale permet de caractériser la mesure produit. Soit
(Xi , Ai , µi ), i = 1, 2 deux espaces mesurés, (X1 × X2 , A1 ⊗ A2 , µ1 ⊗ µ2 )
l’espace mesuré produit.
Définition 6.10.1 (section)
Soit A ∈ A1 ⊗ A2 et soit
f : (X1 × X2 , A1 ⊗ A2 ) −→ (Y, B) une application mesurable.
Ax1 := {x2 ∈ X2 , (x1 , x2 ) ∈ A}
s’appelle section de A en x1 ,
fx1 (.) := f (x1 , .)
section de f en x1 .
(on définit de même les sections de A et f en x2 .)
Lemme 6.10.2 Soit A ∈ A1 ⊗ A2 :
1. ∀x1 ∈ X1 , Ax1 ∈ A2
57
2. ∀x1 ∈ X1 , fx1 est (A2 , B) mesurable.
3.
hA : X −→ [0, +∞]
x1 7−→ µ2 (Ax1 )
est (A1 , B(R̄+ )) mesurable.
Preuve - Soit x1 ∈ X1 fixé.
1. Soit C = {A ∈ A1 ⊗ A2 , Ax1 ∈ A2 }. C est stable par passage au
complémentaire et par intersection dénombrable car
(Ac )x1 = (Ax1 )c
et
(
\
An )x1 =
n∈N
\
(An )x1
n∈N
C’est donc une tribu.
Elle contient les pavés (A1 × A2 , A1 ∈ A1 , A2 ∈ A2 ) car
(A1 × A2 )x1 = A2 si A1 3 x1
(A1 × A2 )x1 = ∅ si Ac1 3 x1
et finalement, C = A1 ⊗ A2 .
2. on applique le résultat précédent à la section f −1 (B) x1 = fx−1
(B)
1
pour tout ensemble mesurable B ∈ B.
3. Soit L = {A ∈ A1 ⊗ A2 , hA mesurable}. on vérifie aisément que L
est un λ-système qui contient le π-système des pavés. On en déduit
d’après le lemme de Dynkin (proposition 1.6.5) que L = A1 ⊗ A2 . Théorème 6.10.3 (Fubini-Tonelli)
∀A ∈ A1 ⊗ A2
Z
Z
µ1 ⊗ µ2 (A) =
µ2 (Ax1 )dµ1 (x1 ) =
X1
µ1 (Ax2 )dµ2 (x2 )
X2
Soit f : (X1 × X2 , A1 ⊗ A2 ) −→ (R̄+ , B(R̄+ )) mesurable
f dµ1 ⊗ µ2 =
fx1 (x2 )dµ2 (x2 ) dµ1 (x1 )
X1 ×X2
X1
X2
Z Z
fx2 (x1 )dµ1 (x1 ) dµ2 (x2 )
=
Z
Z
X2
Z
X1
58
Preuve - Montrons que
Z
ν : A −→
µ2 (Ax1 )dµ1 (x1 )
X1
est une mesure sur (X1 × X2 , A1 ⊗ A2 ).
Soient A, B ∈ A1 ⊗ A2 deux ensembles disjoints. Alors
Z
[
[
µ2 ((A B)x1 )dµ1 (x1 )
ν(A B) =
ZX1
[
µ2 (Ax1
Bx1 )dµ1 (x1 )
=
ZX1
=
[µ2 (Ax1 ) + µ2 (Bx1 )]dµ1 (x1 )
X1
et par additivité de l’intégrale, ν est additive.
Soit (An )n∈N ∈ A1 ⊗ A2 ) une suite[croissante de
[ limite A. Alors (An )x1 est
également une suite croissante et (
An )x1 =
(An )x1 d’où par continuité
n∈N
n∈N
des mesures
µ2 ((An )x1 ) ↑ µ2 ((A)x1 )
et par continuité monotone de l’intégrale,
ν(An ) ↑ ν(A)
Elle n’est pas constante égale à +∞ car ν(∅) = 0 et, d’après le théorème
2.2.3, c’est une mesure.
Finalement, on vérifie que ν = µ1 ⊗µ2 sur les pavés et par le lemme d’égalité
des mesures (ou le théorème de prolongement), les mesures sont égales.
Pour la deuxième partie du théorème, le résultat est vrai pour les fonctions
indicatrices (c’est l’égalité des mesures précédentes) et donc par additivité
et homogénéité sur les fonctions étagées.
Soit maintenant f ∈ M + et hn ∈ E + , hn ↑ f . D’après le lemme précédent
(lemme 6.10.2)
R les fonctions (hn )xR1 et fx1 sont mesurables et on peut légitimement
poser Hn = (hn )x1 dµ2 et H = fx1 dµ2 . De plus la fonction Hn est mesurable comme somme pondérée de fonctions mesurables par le 3ème point du
lemme 6.10.2. Mais
hn ↑ f ⇒ H n ↑ H
et H est mesurable comme limite de fonctions mesurables.
59
Finalement on a l’égalité
Z
Z
hn dµ1 ⊗ µ2 =
Hn dµ1
X1 ×X2
X1
et par continuité monotone, on en déduit
Z
Z
f dµ1 ⊗ µ2 =
X1 ×X2
X1
60
H dµ1
Chapitre 7
Intégration des fonctions
mesurables quelconques
Comme dans le chapitre précédent, on se fixe une fois pour toute un espace
mesuré (X, A, µ).
7.1
Intégrale d’une fonction mesurable
L’extension de l’intégrale positive à M tout entier n’est pas possible en
général. Il faut considérer un sous-ensemble de M .
7.1.1
Définitions
Définition 7.1.1 Soit f ∈ M , f = f + − f − . f est (µ)-intégrable si
I(f + ) < +∞,
I(f − ) < +∞
et alors l’intégrale de f par rapport à µ est le nombre réel (fini) défini par
Z
I(f ) = f dµ = I(f + ) − I(f − )
Définition 7.1.2 On désigne par L1 (X, A, µ) (ou simplement L1 (µ), L1 )
l’ensemble des fonctions µ-intégrables.
Remarque 7.1.3 On dit que f ∈ M admet une intégrale si l’une au
moins des deux intégrales
I(f + ), I(f − ) est finie. on note encore cette valeur
R
(possiblement ∞) f dµ.
Toute fonction mesurable positive admet donc une intégrale, mais elle n’est
intégrable que si son intégrale est finie.
61
7.1.2
L’ensemble L1
Théorème 7.1.4 L1 est un espace vectoriel et I : f 7−→ I(f ) =
une forme linéaire positive sur L1 .
R
f dµ est
La démonstration de ce théorème est laissée en exercice.
Théorème 7.1.5 Soit f ∈ M . Alors f ∈ L1 ⇐⇒ |f | ∈ L1 et
Z
Z
| f dµ| ≤ |f |dµ
Preuve - Soit f ∈ M , f = f + − f − . Alors l’égalité |f | = f + + f − et la
linéarité de l’intégrale donne le résultat. C’est cette caractérisation des fonctions intégrables qui sera la plus utile en
général.
7.2
7.2.1
Propriétés générales
Premières propriétés, lemme de Fatou
Les résultats suivants sont basés sur des propriétés vraies µ p.p.
Lemme 7.2.1 Soit f ∈ M,
g ∈ L1 ∩ M + . Alors
|f | ≤ g p.p. ⇒ f ∈ L1 ( et I(|f |) ≤ I(g))
Preuve - Soit φ+ = f + 1|f |≤g (resp. φ− = f − 1|f |≤g ). Alors I(φ+ ) ≤ I(g)
(resp. I(φ− ) ≤ I(g)) par monotonie de l’intégrale supérieure. On utilise alors
le lemme 6.3.2 qui nous donne I(f + ) = I(φ+ ) ≤ I(g) et I(f − ) = I(φ− ) ≤
I(g). On en déduit que la fonction mesurable positive |f | est d’intégrale finie
inférieure à I(g). Corollaire 7.2.2 Soit f ∈ M,
g ∈ L1 (resp. admet une intégrale) :
f = g p.p. ⇒ f ∈ L1 ( resp. admet une intégrale) et I(f ) = I(g)
Preuve - |f − g| ≤ 0 p.p. ⇒ f − g ∈ L1 et I(|f − g|) ≤ I(0) = 0 d’après le
lemme précédent. On en déduit que f ∈ L1 car L1 est un espace vectoriel
et par linéarité de l’intégrale, I(f ) = I(f − g) + I(g) = 0 + I(g) = I(g). 62
Lemme 7.2.3 (lemme de Fatou)
Soit g ∈ L1 . Pour toute suite fn ∈ M on a
Z
Z
fn ≥ g µ p.p. ∀n ⇒ (lim inf fn )dµ ≤ lim inf( fn dµ)
n
Z
fn ≤ g µ p.p.
∀n ⇒
n
Z
(lim sup fn )dµ ≥ lim sup( fn dµ)
n
n
Preuve - On remarque qu’en changeant fn en −fn la deuxième partie du
lemme se déduit directement de la première partie. On va donc prouver
uniquement la première inégalité :
Z
Z
fn ≥ g µ p.p. ∀n ⇒ (lim inf fn )dµ ≤ lim inf( fn dµ)
n
n
Ce théorème se prouve en deux étapes.
étape 1 : On suppose que la majoration à lieu partout. Alors ∀n ∈
N, fn − g ∈ M + et l’inégalité se déduit du lemme de Fatou pour
les fonctions positives
avec pour
toute suite réelle un et tout réel u :
lim inf(un − u) = lim inf un − u.
n
n
[
étape 2 : Soit N =
{fn < g} ; C’est un ensemble de mesure nulle
n∈N
comme union dénombrable d’ensembles de mesure nulle. on pose alors
pour tout n ∈ N :
0
fn = fn 1N c + g1N
0
On a fn ≥ g donc d’après l’étape 1,
Z
Z
0
0
(lim inf fn )dµ ≤ lim inf( fn dµ)
n
n
0
Mais en dehors de l’ensemble négligeable N , fn = fn et lim inf fn =
n
0
lim inf fn et on conclut grâce au corollaire 7.2.2 précédent. n
7.2.2
Théorème de la convergence dominée et applications
Le théorème suivant, dit de convergence dominée, est un théorème crucial de
la théorie de l’intégration. Il est ici donné sous sa version forte, qui considère
des convergences presque partout.
63
Théorème 7.2.4 (de convergence dominée de Lebesgue)
Soit fn une suite de fonctions mesurables et g ∈ L1 , |fn | ≤ g µ p.p.
Alors
Z
Z
1
fn → f µ p.p. ⇒ f ∈ L et
fn dµ → f dµ
∀n.
quitte à considérer la tribu complétée.
Remarque 7.2.5 Pour éviter de considérer la tribu complétée, il suffit de
rajouter l’hypothèse suivante : f est mesurable.
Preuve - Tout comme pour le lemme de Fatou, la démonstration se fait en
deux étapes.
étape 1 : On suppose que la convergence à lieu partout. Quitte à raisonner séparément sur les fn+ et fn− , on peut supposer les fn positives.
Alors f = lim inf fn = lim sup fn est mesurable et par le lemme de
n
n
Fatou,
Z
Z
Z
Z
Z
lim sup( fn dµ) ≤ (lim sup fn )dµ = f dµ = (lim inf fn )dµ ≤ lim inf( fn dµ)
n
n
n
n
On conclut aisément qu’il y a égalité et que l’intégrale est finie du fait
de l’hypothèse de domination.
étape 2 : On pose hsup = lim sup fn et hinf = lim inf fn . Soit
n
N=
[
n
{fn < g}
[
{hinf < hsup }
n∈N
C’est un ensemble de mesure nulle comme union dénombrable d’ensembles de mesure nulle. on pose alors pour tout n ∈ N :
0
fn = fn 1N c
0
0
On a fn ≤ g1N c et fn → hsup 1N c = hinf 1N c = f 0 donc d’après l’étape
0
1, f est intégrable et
Z
Z
0
0
f dµ = lim( fn dµ)
n
0
0
Mais en dehors de l’ensemble négligeable N , f = f et fn = fn et on
conclut grâce au corollaire 7.2.2 précédent si f est mesurable.
On admet que si fn → f µ p.p., alors f est mesurable sur la tribu
complétée. 64
Remarque 7.2.6 Le théorème de convergence dominé est très souvent utilisé pour échangé limite et somme (dans les espaces normés, les limites sont
séquentielles).
R
Les théorèmes suivants de continuité et dérivation sous le signe sont des
conséquences du théorème de convergence dominée.
Soit T un intervalle de R, f : T × X −→ R telle que ∀t ∈ T, f (t, .) soit
A, B(R) mesurable. Soient finalement g1 , g2 ∈ L1 et t0 ∈ T .
Théorème 7.2.7 (Continuité)
Si ∀t ∈ T, |f (t, x)| ≤ g1 (x) µ p.p. et si t −→ f (t, x) est continue en t0 µ
p.p., alors
Z
h : t −→ h(t) = f (t, x)dµ(x) est continue en t0
Preuve - On remarque déjà que h(t) existe pour tout t d’après le théorème
de convergence dominée.
Dire que h est continue en t0 se traduit en terme de suite par :
∀sn → t0 , h(sn ) → h(t0 )
Le théorème de convergence dominée appliqué à la suite fn (.) = f (sn , .)
donne le résultat. Théorème 7.2.8 (Dérivation)
On suppose f(t,.) intégrable pour tout t.
∂
Si t −→ f (t, x) est dérivable µ p.p. et que sur cet ensemble | ∂t
f (t, x)| ≤
g2 (x), alors
Z
h : t −→ h(t) = f (t, x)dµ(x) est dérivable sur T
et
d
h(t) =
dt
Z
∂
f (t, x)dµ(x)
∂t
Preuve - Il suffit maintenant
de montrer que pour toute suite sn → t, sn 6= t
R ∂
h(sn )−h(t)
la suite sn −t → ∂t f (t, x)dµ(x). Pour cela, on applique le théorème de
convergence dominée à la suite
fn (x) =
f (sn , x) − f (t, x)
sn − t
en remarquant que par le théorème des accroissements finis, |fn | ≤ g2 . On peut itérer ce processus pour dériver n fois en faisant attention de dominer toutes les dérivées.
65
7.2.3
Exemples
1. Dérivée d’une série
Soit un une suite de fonctions dérivables sur I intervalle de R. On
suppose que :
– la série de terme général un (t) est absolument convergente pour tout
t∈I
– |u0n | ≤ vn avec vn terme général d’une série (absolument) convergente.
Alors la fonction
X
S(t) =
un (t)
n
est dérivable de dérivée
S 0 (t) =
X
u0n (t)
n
2. Transformée de Laplace
Soit f une fonction borélienne bornée sur R+ . Alors la fonction
+∞
Z
h(t) =
e−tx f (x)dx
0
(appelée transformée de Laplace de f ) est n-dérivable sur I =]a, +∞[
pour tout a > 0 de dérivée n-ième
∂n
h(t) =
∂tn
7.3
7.3.1
+∞
Z
(−x)n e−tx f (x)dx
0
Théorème de Fubini pour les fonctions mesurables quelconques
Le théorème de Fubini
Théorème 7.3.1 (Fubini)
Soit f : (X1 × X2 , A1 ⊗ A2 ) −→ (R̄, B(R̄)) mesurable. Alors les 3 assertions
suivantes sont équivalentes :
1. f est intégrable par rapport à µ = µ1 ⊗ µ2 ;
R
2. x1 7−→ |f (x1 , x2 )|dµ2 (x2 ) est intégrable ;
R
3. x2 7−→ |f (x1 , x2 )|dµ1 (x1 ) est intégrable ;
66
et on a :
f dµ1 ⊗ µ2 =
fx1 (x2 )dµ2 (x2 ) dµ1 (x1 )
X1 ×X2
X1
X2
Z Z
=
fx2 (x1 )dµ1 (x1 ) dµ2 (x2 )
Z
Z
X2
Z
X1
Preuve - Pour l’équivalence, on applique le théorème de Fubini-Tonelli à la
fonction positive |f | et pour l’égalité, aux fonctions positives f + et f − . Remarquons que sous l’une des hypothèses précédentes, la fonction
Z
f1 : x1 7−→ f (x1 , x2 )dµ2 (x2 )
est seulement définie p.p. Elle est intégrable avec l’abus de notation
Z
Z
f1 dµ =
f1 dµ
{f1 définie}
X1
La condition 2 du théorème de Fubini s’écrit simplement
Z
Z
dµ1 |f (x1 , x2 )|dµ2 (x2 ) < +∞
7.3.2
Exemples
1. Séries
P
Soit un,m une suite sur N2 telle que N2 |un,m | < +∞. Alors
!
!
X
X X
X X
un,m =
un,m =
un,m
n,m∈N2
n∈N
m∈N
m∈N
n∈N
C’est l’application du théorème de Fubini avec les mesures de comptage.
2. Intégrale d’une série
Soit fn Rune suite de fonctions mesurables. Alors si la série de terme
général fn dµ1 est absolument convergente, on peut intervertir somme
et intégrale :
Z X !
X Z
fn dµ =
fn dµ
n∈N
n∈N
67
3. Contre-exemple
On considère µ1 = µ2 = λ non finie Rsur (R, B(R)).
+∞
Soit g : [0, +∞[−→ R+ , 0 < a = 0 gdλ < +∞ et g(0) = 0. On
définit
f (x, y) = g(x − y)1x≥y − g(y − x)1x≤y
Alors
Z +∞
Z
+∞
dλ(y)
−∞
Z
+∞
f (x, y)dλ(x) =
−∞
Z
+∞
dλ(x)
−∞
f (x, y)dλ(y) = 0
−∞
mais f (x, y) n’est pas intégrable :
Z
+∞
Z
+∞
+∞
|f (x, y)|dλ(x) =
dλ(y)
−∞
Z
−∞
2a dλ(y) = +∞
−∞
car la mesure n’est pas finie.
7.4
La convolution
La théorie de la convolution est une application de la théorie des mesures
produits, du théorème de transfert et du théorème de Fubini.
La convolution est une “multiplication” de mesures. Elle correspond à l’addition de variables aléatoires indépendantes en probabilité.
Pour cette théorie, X est une espace vectoriel topologique et B sa
tribu borélienne. On suppose de plus l’existence d’une mesure λ
σ-finie invariante par translation.
7.4.1
Convolution de deux mesures
Définition 7.4.1 (produit de convolution)
Soit µ et λ deux mesures σ-finies sur l’espace mesurable (X, B). Alors on
appelle produit de convolution µ?ν la mesure image de µ⊗ν par l’application
Σ : X × X −→ X
(x, y) 7−→ x + y
Par le lemme de transfert et Fubini, il vient :
68
Proposition 7.4.2
Z
1A (x + y)d(µ ⊗ ν)(x, y)
Z
= dµ(x) 1A (x + y)dν(y)
Z
Z
= dν(y) 1A (x + y)dµ(x)
µ ? ν(A) =
Z
Le produit de convolution est donc commutatif. Il est également associatif.
La démonstration de cette proposition est laissée en exercice.
Proposition 7.4.3 Si f est µ ? ν-intégrable,
Z
Z
Z
Z
Z
f d(µ ? ν) = dµ(x) f (x + y)dν(y) = dν(y) f (x + y)dµ(x)
Preuve - Il suffit de passer à la limite sur les fonctions étagées grâce à la
proposition précédente. 7.4.2
Convolution d’une fonction et d’une mesure, de deux
fonctions
On définit alors de deux manières différentes la convolution d’une fonction
avec une mesure, ou encore de deux fonctions :
Définition 7.4.4 (f ? ν)
Soit f une fonction mesurable positive telle que µ = f.λ soit σ-finie. On
appelle produit de convolution de f par ν la densité
f ?ν =
d(µ ? ν)
dλ
Si f = f + − f − alors
f ? ν = f+ ? ν − f− ? ν
La convolution de deux fonctions est alors évidente :
Définition 7.4.5 (f ? g)
Soient f, g deux fonctions mesurables positives telles que µ = f.λ, ν = g.λ
soient σ-finie. On appelle produit de convolution de f par g la densité
f ?g =
d(µ ? ν)
dλ
69
Si f = f + − f − , g = g + − g − alors
f ? g = f + ? g+ + f − ? g− − f − ? g+ − f + ? g−
Dans le cas de mesures finies, on peut caractériser ce produit sous forme
d’une intégrale :
Proposition 7.4.6 Si ν est finie, f et g λ-intégrables alors
Z
d(f.λ ? ν)
(x) = (f ? ν)(x) = f (x − y)dν(y)
dλ
Z
d(f.λ ? g.λ)
(x) = (f ? g)(x) = f (x − y)g(y)dλ(y)
dλ
Preuve - Soit g
Z
Z
gd(µ ? ν) =
Z
=
Z
=
Z
=
µ ∗ λ-intégrable : d’après la proposition ,
Z
dν(y) g(x + y)dµ(x)
Z
dν(y) g(x + y)f (x)dλ(x)
Z
dν(y) g(x)f (x − y)dλ(x) par invariance par translation
Z
dλ(x) g(x)f (x − y)dν(y) par Fubini
Et finalement en prenant pour g l’indicatrice de n’importe quel ensemble
mesurable (g est alors intégrable
car les mesures considérées sont finies), on
R
obtient l’égalité f.λ ? ν = f (. − y)dν(y).λ.
Le second résultat se déduit directement du premier. 7.4.3
Exemples
1. Si ν = µ est la mesure de Borel sur (R, B(R)), alors µ ? ν vaut 0 sur
les ensembles négligeables et +∞ sinon
2. Si µ et ν sont des mesures de probabilités, µ ? ν aussi.
70
Chapitre 8
Théorie de l’intégration et
probabilités
8.1
8.1.1
Espérance et moments
Espérance
Soit X une variable aléatoire réelle sur (Ω, A, P).
Définition 8.1.1 (espérance mathématique) Si X est intégrable, on appelle espérance de X (notée E(X) ou EX) l’intégrale de X par rapport à
P
Z
EX =
X(ω)P(dω)
Ω
Théorème 8.1.2 D’après le théorème de transfert
Z
Z
EX =
X(ω)P(dω) =
xPX (dx)
Ω
R
L’espérance d’une v.a. ne dépend que de sa loi.
Plus généralement, on à le résultat suivant :
Théorème 8.1.3 Soit X : (Ω, A, P) → (R, B(R)) une v.a. réelle, et
φ : R → R.
Alors φ(X) est intégrable par rapport à P si et seulement si f est intégrable
par rapport à PX et
Z
Z
E (φ(X)) =
φ ◦ X(ω)P(dω) =
φ(x)PX (dx)
Ω
R
71
Exemples
1. Si X ∼ B(1, p), EX = 1.p + 0.(1 − p) = p
2. Si PX est discrète, le calcul de EX est celui d’une série
X
EX =
sPX (s)
s∈S
3. Un v.a. suivant une loi de Cauchy de densité f (x) =
pas d’espérance.
8.1.2
1
π(1+x2 )
n’admet
Moments
On définit (lorsqu’ils existent) les moments d’ordre p :
Définition 8.1.4 (Moments)
1. EX p est le moment d’ordre p
2. E[(X − EX)p ] est le moment centré d’ordre p
3. E[(X − a)p ] est le moment centré en a d’ordre p
Le moment centré d’ordre 2 s’appelle la variance et est noté V X, sa racine
carrée positive σX s’appelle l’écart-type.
8.1.3
Covariance et corrélation
Si X et Y sont deux v.a.r. de carré intégrable, on appelle
- covariance entre X et Y le nombre
cov(X, Y ) = E [(X − EX)(Y − EY )]
- coefficient de corrélation entre X et Y le nombre
ρ(X, Y ) = cov(
cov(X, Y )
X Y
,
)=
σX σY
σX σY
La corrélation est comprise entre −1 et 1 (se démontre par l’inégalité de
Schwartz).
Exemples :
1. Si X ∼ B(1, p)
V X = (1 − p)2 .p + (0 − p)2 .(1 − p) = p(1 − p)
72
2. Si X suit une loi de Poisson de paramètre λ, elle admet une variance
et V X = λ.
3. Un v.a. suivant une loi de Cauchy de densité f (x) =
pas de moment d’ordre p.
8.1.4
1
π(1+x2 )
n’admet
Propriétés des moments
Proposition 8.1.5
1. EX p existe ⇒ EX n existe ∀ n ≤ p
2. EX p existe ⇐⇒ E[(X − a)p ] existe ∀ a ∈ R
3. V X = 0 ⇐⇒ ∃a ∈ R, X = a P p.s.
4. V X = EX 2 − (EX)2
8.1.5
Inégalités
- inégalité de Schwartz
Si EX 2 et EY 2 existent, alors E|XY | existe et
(E|XY |)2 ≤ EX 2 EY 2
- inégalité de Tchebychev
Soit X une v.a. positive, g : R+ −→ R+ strictement croissante (telle
que E[g(X)] existe). alors
P(X ≥ a) ≤
E[g(X)]
,
g(a)
∀a > 0
- inégalité de Markov
Soit X positive.
P(X ≥ a) ≤
EX
,
a
∀a > 0
- inégalité de Bienaymé-Tchebychev
Soit X intégrable.
P(|X − EX| ≥ a) ≤
73
VX
,
a2
∀a > 0
8.2
Variable aléatoire réelle (vecteur aléatoire) et
densité
Définition 8.2.1 (variable aléatoire à densité)
Soit X une variable aléatoire réelle (resp. dans Rn ), λ la mesure de Lebesgue
sur R (resp. sur Rn ). On dira que X est une variable à densité si sa loi est
absolument continue par rapport à λ. Par le théorème de Radon-Nikodym,
la densité est l’unique fonction de L1+ telle que
PX (B) = P(X −1 (B)) = P(X ∈ B) =
Z
f dλ
B
On peut alors faire le lien entre fonction de répartition et densité :
Théorème 8.2.2
PX est absolument continue (par rapport à la mesure de Borel sur R) si et
seulement si il existe f positive λ-intégrable
Z
f (t)λ(dt), x ∈ R
FX (x) =
]−∞,x]
alors f =
dP
dλ
dans L1 et F est λ presque partout dérivable de dérivée f .
Pour les variables à densité, on a les formules suivantes pour l’espérance :
Si X est intégrable et de densité f
Z
Z
Z
EX =
X(ω)P(dω) =
xdPX (x) = xf (x)dλ
Ω
R
Plus généralement si φ(X) est intégrable par rapport à P ( ⇐⇒
intégrable par rapport à PX )
Z
E (φ(X)) =
φ(x)f (x)dλ
φ est
R
8.3
Retour sur l’indépendance
Théorème 8.3.1
Soit {Xi , i ∈ I} une famille de v.a. définie sur (Ω, A, P). Alors les propositions suivantes sont équivalentes :
1. les Xi sont indépendantes
74
2. ∀i1 , ..., ik ,
∀Aij ∈ Aij ,
P(Xi1 ∈ Ai1 , ..., Xik ∈ Aik ) = P(Xi1 ∈ Ai1 )...P(Xik ∈ Aik )
3. ∀i1 , ..., ik ,
∀Aij ∈ Aij
4. ∀i1 , ..., ik ,
∀gi1 , ..., gik mesurables bornées
P(Xi1 ,...,Xi
k)
= PXi1 ⊗ ... ⊗ PXik
E (gi1 (Xi1 )...gik (Xik )) = E (gi1 (Xi1 )) ...E (gik (Xik ))
Dans le cas de vecteurs aléatoires on a :
Théorème 8.3.2
- les Xi sont indépendantes si et seulement si
F(X1 ,...,Xn ) (x1 , ..., xn ) = FX1 (x1 )...FXn (xn )
- si les Xi sont indépendantes et admettent des densités, (X1 , ..., Xn ) admet
une densité donnée par
f(X1 ,...,Xn ) (x1 , ..., xn ) = fX1 (x1 )...fXn (xn )
- réciproquement, si (X1 , ..., Xn ) admet une densité donnée par
f(X1 ,...,Xn ) (x1 , ..., xn ) = gX1 (x1 )...gXn (xn )
et si les gi sont des densités, alors les Xi sont indépendantes de densité
respective gi .
Théorème 8.3.3
Soit X, Y deux v.a. indépendantes. Alors
1. E(XY ) = E(X)E(Y ) ( ⇐⇒ Cov(X, Y ) = 0)
2. V (X + Y ) = V (X) + V (Y )
3. PX+Y = PX ∗ PY
4. Si X, Y sont de plus de densité respectives f et g, alors X + Y a pour
densité f ∗ g
75
76
Troisième partie
Compléments
77
Chapitre 9
Les espaces Lp et Lp,
p ∈ N∗ ∪ +{∞}
9.1
Définitions des espaces Lp
Nous allons différencier 2 cas : p < +∞ et p = +∞. Les démonstrations
sont en général différentes selon ces deux cas, et les énoncés également.
9.1.1
Les espaces Lp , p ∈ N∗
On définit pour tout 1 ≤ p < +∞ les fonctions suivantes :
||.||p : M
f
−→ R̄+
R
1
1
7−→ I(|f |p ) p = ( |f |p dµ) p = ||f ||p
Définition 9.1.1 On appelle espace Lp l’ensemble des fonctions mesurables
telles que ||f ||p < +∞ :
Lp = {f ∈ M, ||f ||p < +∞}
Proposition 9.1.2 Pour tout 1 ≤ p < +∞, Lp est un espace vectoriel et
||f ||p = 0 ⇐⇒ f = 0 p.p.
||f − g||p = 0 ( ⇐⇒ f = g p.p.) est donc une relation d’équivalence.
Preuve - Rappelons que ∀x, y ≥ 0, (x + y)p ≤ 2p (xp + y p ). En effet on a
∀x ≥ 0, (1 + x)p ≤ 2p (1 + xp ) : c’est évident si x ≤ 1 et si x ≥ 1, il suffit de
regarder x1 .
79
En appliquant cette inégalité à |f | et |g|, on obtient |f + g|p ≤ 2p (|f |p + |g|p )
et par domination, |f + g| ∈ Lp . Lp est donc un espace vectoriel.
Pour la deuxième proposition, on applique le lemme 7.2.1 aux fonctions f p
et g p . Nous verrons plus loin que cette fonction ||.||p est une semi-norme. Pour être
une norme, il faudrait qu’elle sépare les éléments. Une façon de résoudre ce
problème est de passer à l’espace quotient :
Définition 9.1.3 Lp = Lp /||.||p est l’espace des classes d’équivalences des
fonctions de Lp égales presque partout. C’est un espace vectoriel.
9.1.2
Les espaces L∞ , L∞
Les espaces L∞ et L∞ représentent les fonctions mesurables “bornées presque
partout” (on dit quelquefois essentiellement bornées).
Précisément on pose
||.||∞ : M
f
−→ R̄+
7−→ inf(a ∈ R̄+ , |f | ≤ a p.p.) = ||f ||∞
Définition 9.1.4
L∞ = {f ∈ M, ||f ||∞ < +∞}
et
L∞ = L∞ /||.||∞
On a bien évidement la propriété suivante :
Proposition 9.1.5 L∞ et L∞ sont des espaces vectoriels.
9.2
9.2.1
Propriétés des espaces Lp , 1 ≤ p ≤ +∞
||.||p est une norme
Afin de prouver que ||.||p est une norme sur Lp il nous manque l’inégalité
triangulaire. Elle est conséquence des résultats suivants :
Lemme 9.2.1 (inégalité de Jensen)
Soit ν une mesure de probabilité. Si φ est convexe sur I intervalle
de R,
R
alors pour toute fonction f intégrable telle que f (x) ∈ I on a f dν ∈ I et
Z
Z
φ( f dν) ≤ φ(f )dν
80
R
Preuve - Posons I = [a, b], a, b ∈ R̄. Soit m = f dν. On a a ≤ f ≤ b
d’oùRpar monotonie de l’intégrale et comme ν est une mesure de probabilité,
a ≤ f dν ≤ b.
Comme φ est convexe il existe une droite affine passant par φ(m) en m
y = α(x − m) + φ(m) situé sous la courbe de φ pour tout x ∈ I :
∀x ∈ I, α(x − m) + φ(m) ≤ φ(x)
En intégrant cette inégalité il vient
Z
Z
(α(f − m) + φ(m))dν = φ(m) ≤ φ(f )dν
Lemme 9.2.2 (inégalité de Hölder)
soit 1 ≤ p, q, r ≤ +∞ tels que p1 + 1q = 1r . Alors
f ∈ Lp , g ∈ Lq ⇒ f g ∈ Lr
et
||f g||r ≤ ||f ||p ||g||q
Preuve - Le résultat est évident si p ou q vaut +∞ ou si f ou g est nulle. On
suppose donc p et q finis et puisqu’on ne considère que des valeurs absolues,
f et g positives
non nulles.
R
Soit F = f p dµ et ν = F1 f p .µ la mesure de probabilité de densité F1 f p par
rapport à µ.
Z
Z
(f g)r dµ = f r−p g r F dν
Z
r
= F (f −p g q ) q dν d’après les hypothèses sur p, q, r
Z
r
≤ F ( (f −p g q )dν) q par Jensen
Z
r
1− r
≤ F q ( g q )dµ) q
Z
Z
r
r
p
p
≤ ( f )dµ) ( g q )dµ) q
On en déduit l’inégalité triangulaire :
81
Lemme 9.2.3 (inégalité de Minkowski)
Si f, g ∈ Lp ,
||f + g||p ≤ ||f ||p + ||g||p
Preuve - On applique l’inégalité de Hölder avec r = 1 à |f |, |g| ∈ Lp et
|f + g|p−1 ∈ Lq . Le théorème suivant est alors évident :
Théorème 9.2.4
(Lp , ||.||p ), 1 ≤ p ≤ +∞ est un espace vectoriel normé.
9.2.2
Complétude des espaces Lp
On a en fait un résultat beaucoup plus fort, l’espace normé est complet :
Théorème 9.2.5 (Lp , ||.||p ), 1 ≤ p ≤ +∞ est un espace vectoriel normé
complet (i.e. un Banach).
La complétude une conséquence des deux lemmes suivants :
Lemme 9.2.6 Dans Lp , toute série absolument convergente est convergente, i.e.
+∞
+∞
X
X
fn ∈ Lp ,
||fn ||p < +∞ ⇒
fn ∈ Lp
i=0
et on a
||
+∞
X
i=0
fn ||p ≤
i=0
+∞
X
||fn ||p
i=0
P
Preuve - Posons hN = N
i=0 |fn | et h = lim sup hN =↑ hN . Par le théorème
de convergence monotone on a
Z
Z
p
h dµ =↑ hpN dµ
R p
P+∞
p
L’inégalité triangulaire
permet
de
majorer
h
dµ
par
[
i=0 ||fn ||p ] quelque
N
R p
soit N et finalement h dµ ≤ ∞.
On en déduit que hN est presque partout fini et appartient à Lp . Nous admettons le théorème suivant qui est un résultat classique d’analyse
fonctionnelle :
Lemme 9.2.7 (admis) E espace normé est complet si et seulement si toute
série absolument convergente est convergente.
82
9.2.3
Autres propriétés
On peut également citer les propositions suivantes :
Proposition 9.2.8 Soit 1 ≤ p < +∞. Si fn → f µ p.p. et |fn | ≤ g ∈
Lp ∀n, alors fn → f dans Lp .
Preuve - On applique le théorème de convergence dominée à la suite |fn −
f |p qui convergence p.p. vers 0 et est dominée par (2g)p . Proposition 9.2.9 (admis) Soit 1 ≤ p < +∞. Si fn → f dans Lp , alors
on peut extraire de la suite fn une sous-suite convergeant µ p.p. vers f .
Lorsque p = +∞, on a le résultat bien plus fort suivant : si fn → f dans
L∞ , alors en dehors d’un ensemble négligeable fn converge uniformément
vers f (la démonstration de ce résultat est laissée en exercice).
9.3
Dual des espaces Lp
Théorème 9.3.1 L2 muni du produit scalaire hf, giL2 =
espace de Hilbert.
R
f gdµ est un
Preuve - On vérifie aisément que la forme est bilinéaire, symétrique et
positive. L2 est donc un espace prehilbertien complet d’après le théorème
9.2.5, donc un Hilbert. Théorème 9.3.2 (admis)
Soit 1 ≤ p ≤ +∞, q tel que
1
p
+
1
q
= 1. Alors
D : Lq −→ (Lp )0
R
g 7−→ Dg : f 7→ gf dµ
est une application linéaire continue.
C’est un isomorphisme si 1 ≤ p < +∞.
La première partie du théorème se déduit directement de l’inégalité de
Hölder. Nous admettons l’isomorphisme.
83
9.4
Quelques résultats d’analyse fonctionnelle dans
L1 (R, BR , λ)
Le premier résultat porte sur la convolution dans L1 .
Théorème 9.4.1 (L1 , +, ., ∗) est une algèbre de Banach commutative, autrement dit le produit de convolution est commutatif, associatif, distributif
par rapport à l’addition et
||f ∗ g||1 ≤ ||f ||1 ||g||1
On a également l’égalité
∀f, g ∈ L1 ,
Z
Z
Z
f ∗ gdλ = ( f dλ).( gdλ)
Preuve - On utilise principalement le théorème de Fubini et de changement
de variable (affine). Les théorèmes suivants portent sur la densité de certains espaces fonctionnels
dans L1 . On utilise notamment la notion de noyau régularisant qui fait
l’objet de la définition suivante :
Définition 9.4.2 On appelle noyau régularisant toute fonction ρ ∈ C ∞ à
support compact vérifiant
Z
ρ ≥ 0, supp(ρ) ⊂ BF (0, 1),
ρ=1
On appelle suite (resp. famille) régularisante toute suite ρn = nρ(nx) (resp.
ρ = 1 ρ( x ))
Il n’est pas évident que de tels noyaux régularisants existent. Un exemple
φ
−1
est donné par le noyau ρ = ||φ||
avec φ(x) = exp( 1−|x|
2 )1BF .
1
Lemme 9.4.3 L’ensemble Cc des fonctions continues à support compact est
dense dans L1 .
Preuve - Comme l’ensemble des fonctions étagées intégrables est dense
dans L1 , il suffit de montrer que toute indicatrice d’un borélien de mesure
fini peut être approchée (en norme 1) par une fonction continue à support
compact.
Soit A un tel borélien et > 0 fixé. On sait (cf TD) qu’il existe un fermé
84
F et S
un ouvert O tel que F ⊂ A ⊂ O et λ(O\F ) ≤ . En remarquant que
F = n BF (0, n) ∩ F et en utilisant la continuité croissante des mesures on
peut supposer F compact. Or dans R (et plus généralement dans Rd ) si F
est compact et G(= Oc ) est un fermé disjoint il existe une fonction continue
nulle sur G et valant 1 sur F . Cette fonction φ est bien continue à support
compact et vérifie ||1A − φ ||1 ≤ λ(O\F ) ≤ . On en déduit le résultat suivant très important en lui même et utile pour la
démonstration des propositions qui vont suivre.
Lemme 9.4.4 (continuité
R en moyenne)
Soit f ∈ L1 , alors limh→0 |f (x + h) − f (x)|dx = 0
Preuve - On démontre facilement le résultat pour f continue à support
compact (exercice). Pour f dans L1 on utilise ensuite la densité de cet espace
dans L1 en décomposant
Z
Z
Z
Z
|f (x+h)−f (x)|dx ≤ |f (x+h)−fn (x+h)|dx+ |fn (x+h)−fn (x)|dx+ |fn (x)−f (x)|dx
Lemme 9.4.5 Soit ρ un noyau régularisant et f ∈ L1 . Alors f ∗ ρn ∈ C ∞
et converge vers f dans L1 .
∞
Preuve - L’appartenance
R à C découle du théorème de dérivation sous le
signe somme. Comme ρn = 1, on a
Z
(f ∗ ρn )(x) − f (x) = (f (x − y) − f (x))ρn (y)dy
d’où
Z
Z
||f ∗ ρn ) − f ||1 ≤
|f (x − y) − f (x)|dx dy
ρn (y)
Soit fixé.R D’après le lemme de continuité sous la moyenne, il existe δ,
|y| < δ ⇒ |f (x − y) − f (x)|dx ≤ Mais ρn est nulle à partir d’un certain
rang en dehors de la boule de rayon δ et on obtient la convergence. Corollaire 9.4.6 L’ensemble C ∞
est dense dans L1 .
T
L1 des fonctions indéfiniment dérivables
Finalement, on a la proposition suivante (qui est la plus forte) :
85
Proposition 9.4.7 L’ensemble Cc∞ des fonctions indéfiniment dérivables à
support compact est dense dans L1 .
Preuve - A l’aide d’une suite régularisante, on montre que Cc ⊂ Cc∞ et on
conclut par le lemme 9.4.3. 86
Chapitre 10
La transformée de Fourier
Pour cette théorie, X est une espace vectoriel topologique et B sa tribu
borélienne. On suppose de plus l’existence de λ mesure σ-finie invariante
par translation. En dehors des définitions générales, on aura X = Rd et λ
est la mesure de Lebesgue.
On rappelle que pour intégrer une fonction à valeur complexes, ont peut
intégrer séparément la partie réelle et la partie imaginaire (en identifiant C
et R2 ).
10.1
Définitions
Définition 10.1.1 (Transformée de Fourier d’une mesure finie)
On appelle transformée de Fourier d’une mesure finie µ sur (X, B) la fonction :
Z
0
F(µ)(x0 ) = µ
b(x0 ) =
e−2iπhx ,xi(X 0 ,X) dµ(x)
X
0
Remarquons que cette définition à bien un sens car la fonction e−2iπhx ,xi(X 0 ,X)
étant bornée (en module) par 1 pour tout x0 , elle est µ intégrable (la mesure
µ est finie).
En théorie des probabilité, on utilise plus généralement la fonction caractéristique :
Définition 10.1.2 (Fonction caractéristique)
On appelle fonction caractéristique d’une mesure finie µ sur (X, B) la fonction :
Z
0
x0
0
φµ (x ) = F(µ)(− ) =
eihx ,xi(X 0 ,X) dµ(x)
2π
X
87
Définition 10.1.3 (Transformée de Fourier d’une fonction intégrable)
On appelle transformée de Fourier d’une fonction f ∈ L1 la fonction :
Z
0
e−2iπhx ,xi(X 0 ,X) f (x)dλ(x)
F(f )(x0 ) = fb(x0 ) =
X
Remarque 10.1.4 Sif =
c
+−µ
−.
a fb = µc
10.2
f+
− f −,
en notant µ+ = f + .λ et µ− = f − .λ on
Propriétés générales
Proposition 10.2.1
1. La transformée de Fourier est linéaire.
2. La transformée de Fourier échange convolution et multiplication :
µ[
? ν(x0 ) = µ
b(x0 )b
ν (x0 )
(idem pour la convolution d’une fonction et d’une mesure ou de deux
fonctions).
Preuve - La linéarité de la transformée de Fourier est une conséquence
directe de la linéarité de l’intégrale :
Z
0
e−2iπhx ,xi (dµ(x) + αdν(x)) = µ
b + αb
ν , α ∈ R+
µ\
+ αν =
X
Pour le second résultat, on utilise la proposition 7.4.2 :
Z
Z
0
0
µ[
? ν(x0 ) =
e−2iπhx ,xi d(µ ? ν)(x) =
e−2iπhx ,x+yi dµ(x)dν(y)
X2
ZX
Z
0
0
=
e−2iπhx ,xi dµ(x)
e−2iπhx ,yi dν(y)
X
X
10.3
Exemples
– Dirac : La transformée de Fourier de la mesure de Dirac a vérifie
0
ba (x0 ) = e−2iπhx ,ai(X 0 ,X) . En particulier b0 (x0 ) = 1.
on remarque que cette dernière égalité est compatible avec l’échange
entre convolution et produit pour la transformée de Fourier, et l’égalité
µ = 0 ? µ pour toute mesure finie µ.
88
– Série de Fourier : Une série de Fourier est une série de terme général
0
un = an e2iπnx indicée par P
n ∈ Z. C’est donc la transformée de Fourier
de la mesure discrète µ = n∈Z an −n .
– Mesure gaussienne : Soit µ la mesure gaussienne sur Rd de densité
gd,σ (x) =
−|x|2
1
√
e 2σ2
(σ 2π)d
Sa transformée de Fourier vérifie
0
−2π
gd
d,σ (x ) = e
10.4
2 σ 2 |x0 |2
Propriétés générales X = Rd : théorèmes d’injectivité et d’inversion
On suppose maintenant que X = Rd et que λ est la mesure de Lebesgue.
10.4.1
Théorème d’injectivité
Théorème 10.4.1 (injectivité)
1. La transformée de Fourier µ
b caractérise la mesure finie µ (deux mesures finies ayant la même transformée de Fourier sont égales).
2. La transformée de Fourier fb caractérise la fonction intégrable f λ-p.p.
Une démonstration de ce théorème est fondée sur le lemme suivant :
Lemme 10.4.2
Soit µ une mesure finie sur (Rd , BRd ) :
R
0
2 2 0 2
1. (gd,σ ? µ)(x) = Rd µ
b(x0 )e2iπhx ,xi−2π σ |x | dλ(x0 )
2. Pour toute fonction continue bornée h,
Z
Z
(gd,σ ? µ)(x)h(x)dλ(x) −→ hdµ
σ↓0
X
3.
R
Z
Z
hdµ = lim
σ↓0
0
[h(x)dλ(x)
X 0 =Rd
2iπhx0 ,xi−2π 2 σ 2 |x0 |2
µ
b(x )e
Preuve - - Remarquons d’abord que
gd,σ (x) =
1
√
g\
1 (−x)
(σ 2π)d d, 2πσ
89
dλ(x ) ].
0
on a alors :
Z
gd,σ (x − y)dµ(y)
Z
1
= √
g\
1 (y − x)dµ(y)
d, 2πσ
(σ 2π)d
Z
Z
1
−2iπhy−x,zi
= √
dλ(z)
dµ(y)
gd, 1 (z)e
2πσ
(σ 2π)d
Z
Z
2iπhx,zi−2π 2 σ 2 |z|2
−2iπhy,zi
= e
dλ(z)
e
dµ(y) par Fubini
(gd,σ ? µ)(x) =
- Pour la deuxième partie du lemme, on vérifie par des calculs simples que
Z
Z
Z
(gd,σ ? µ)(x)h(x)dλ(x) = dµ(y)
h(y + σu)gd,1 (u)dλ(u)
X
R
Posons alors Hσ (y) = h(y + σu)gd,1 (u)dλ(u) et soit C un majorant de
|h| (bornée par hypothèse). Comme gd,1 est d’intégrale 1 il vient |Hσ (y)| ≤
C, ∀y ∈ Rd . Le théorème de convergence dominée appliqué à h(y+σn u)gd,1 (u)
(pour une suite σn tendant vers 0) donne par continuité de h :
Z
Hσ (y) −→ h(y)gd,1 (u)dλ(u) = h(y)
σ↓0
En appliquant une seconde fois le théorème de convergence dominée à la
suite Hσn (y), on obtient le résultat voulu.
- Enfin la troisième partie du lemme est une combinaison des deux premières
parties. Preuve (du théorème d’injectivité) - Il suffit de prouver le théorème
sur les mesures, le théorème pour les fonctions se déduisant par linéarité
avec µ = f.λ, f ≥ 0.
D’après
b on connaı̂t également gd,σ ? µ, donc
R le lemme 10.4.2, si on connaı̂t µ
aussi hdµ pour toute fonction h continue et bornée.
Mais pour tout pavé A = Πdi=1 ] − ∞, ai ], il est facile d’approcher simplement 1A par une suite de fonctions continues bornées par 1. Le théorème de
convergence dominée nous donne alors µ(A) = µ(A0 ) pour tout pavé A. Ces
pavés formant un π-système, on conclut par le lemme d’égalité des mesures.
90
10.4.2
Théorème d’inversion
On en déduit le théorème suivant :
Théorème 10.4.3 (d’inversion)
Si la transformée de Fourier de µ, mesure finie, est intégrable, alors µ admet
une densité continue et bornée par rapport à λ donnée par :
Z
dµ
0
µ
b(x0 )e2iπhx ,xi dλ(x0 )
(x) =
dλ
Rd
Si f est intégrable de transformée de Fourier intégrable, alors
Z
0
b
f (x) =
fb(x0 )e2iπhx ,xi dλ(x0 ) = fb(−x) λ p.p.
Rd
R
0
Preuve - Posons g(x) = Rd µ
b(x0 )e2iπhx ,xi dλ(x0 ). Puisque µ
b est intégrable,
par le théorème de convergence dominée on peut échanger limite et intégrale
dans l’égalité
Z
Z
0 2iπhx0 ,xi−2π 2 σ 2 |x0 |2
0
hdµ = lim h(x)dλ(x)
µ
b(x )e
dλ(x )
σ↓0
R
X 0 =Rd
R
et finalement, hdµ = hgdλ pour toute fonction continue bornée. Le
même raisonnement que pour la démonstration du théorème d’injectivité
nous donne alors l’égalité des deux mesures sur le π-système des pavés et
donc sur la tribu borélienne toute entière. 10.5
Propriétés analytiques (sur R).
(Il existe des théorèmes analogues en dimension n qui sortent du cadre de
ce cours).
Proposition 10.5.1 (continuité, dérivabilité)
Soit µ une mesure fini sur R.
1. F(µ) est continue.
2. si x est intégrable, alors F(µ) est Lipschitzienne.
3. Si xn est intégrable, n ≥ 1 alors F(µ) est n-fois dérivable et
Z
0
(k) 0
k
F(f ) (x ) = (−2iπ)
xk e−2iπx x dµ(x)
La démonstration est laissée en exercice. Utiliser les théorèmes 7.2.7 et 7.2.8.
91
10.6
Transformée de Fourier dans L1 : propriétés
analytiques
Les résultats précédents s’appliquent directement pour les fonctions intégrables.
Mais on a également quelques résultats en plus que nous donnons dans cette
section.
On déduit notamment de la proposition et du théorème d’inversion la propriété suivante : la transformée de Fourier échange dérivation et multiplication.
Proposition 10.6.1 Si xn f et xn fb sont intégrables alors f et fb sont n-fois
dérivable et on a :
n f (x) = (2iπ)n fb(n) (x)
1. xd
(n) (x) = (2iπ)n xn fb(x)
2. fd
Proposition 10.6.2 (Comportement en +∞)
1. Si f est intégrable, fˆ est continue et tend vers 0 en +∞.
2. Soit n ≥ 1, f ∈ Cn et f, f 0 , ·, f (n) intégrables (par rapport à la mesure
de Lebesgue). Alors
1
0
F(f )(x ) 0 = o
x →+∞
x0n−1
Preuve - On a déjà vu la continuité. Montrons la convergence. Soit tn → ∞.
On a
Z
Z
1
−2iπtn x
ˆ
f (tn ) = f (x)e
dx = − f (x)e−2iπtn (x− 2tn ) dx
car eiπ = −1. En faisant le changement de variable u = (x −
ajoutant les deux expressions pour fˆ on obtient
Z 1
2fˆ(tn ) =
f (x) − f (x +
) e−2iπtn x dx
2tn
1
2tn )
et en
d’où 2|fˆ(tn )| ≤ ||f (.) − f (. + 2t1n )||1 qui tend vers 0 d’après le théorème 9.4.4
de continuité en moyenne.
La démonstration de la seconde partie de la proposition est laissée en exercice. Intégrer par parties. De manière synthétique, on peut donc écrire en posant C0 =} l’ensemble
des fonctions continues de valeur nulle en ∞} :
92
Théorème 10.6.3 L’application
F : (L1 , ||.||1 ) −→ (C0 , ||.||∞ )
f
7−→
fb
est linéaire continue.
Preuve - On applique la proposition précédente pour montrer que l’on
tombe bien dans C0 . La linéarité est déjà prouvée et la continuité se réduit
alors à ||ˆ(f )||+∞ ≤ ||f ||1 (évident par majoration) 10.7
Transformée de Fourier dans L2
Théorème 10.7.1 (admis)
La transformée de Fourier est un isomorphisme de L2 dans L2 . De plus, son
inverse est donné par
F−1 (f )(x) = F(f )(−x)
Ce théorème se déduit des lemmes suivants :
Lemme 10.7.2
Soit f ∈ L1 continue bornée. Alors f et fb sont de carré intégrable et kf kL2 =
kfbkL2 .
Preuve - On utilise le lemme 10.4.2 et le théorème de Fubini. Lemme 10.7.3 (admis)
L’ensemble des fonctions intégrables, continues et à support compact est
dense dans L2 .
Ce théorème est en fait vrai pour tous les espaces Lp , p < ∞ et la démonstration
est identique au cas p = 1.
Ce lemme, conjugué au lemme précédent (qui nous donne la continuité du
morphisme F) nous permet d’étendre la définition de la transformée de Fourier à l’espace L2 tout entier par prolongement d’une application linéaire
continue à valeur dans un espace complet. On vérifie ensuite que F est bien
un isomorphisme par des résultats d’analyse fonctionnelle.
93
Index
de Doob, 35
de Fatou, 52, 63
de transport, 15
λ-système, 18
π-système, 18
algèbre, 13
application
borélienne, 32
mesurable, 31
classe monotone, 18
espace
Lp , 80
Lp , 79
complété, 30
mesuré, 21
produit, 30
mesurable, 14
produit, 16
fonction
étagée, 34
caractéristique, 87
inégalité
de Hölder, 81
de Jensen, 80
de Markov, 52
de Minkowski, 82
intégrale, 49
supérieure, 49
lemme
d’égalité des mesures, 27
de Beppo-Levi, 48
mesure, 21
étrangère, 55
extérieure, 25
absolument continue, 55
de densité, 54
image, 34
produit, 30
produit de convolution, 68
semi-algèbre, 13
théorème
changement de variable, 56
de convergence dominée de Lebesgue, 64
de décomposition de Lebesgue,
56
de Fubini, 66
de Fubini-Tonelli, 58
de prolongement, 25
de Radon-Nikodym, 55
fondamental d’approximation, 34
transformée de Fourier, 87
tribu, 13
borélienne, 16
complète, 30
engendrée, 14
image réciproque, 15
94