Rendements et matrices de covariances Simulations et Estimations

Transcription

Rendements et matrices de covariances Simulations et Estimations
Rendements et matrices de covariances
Simulations et Estimations en Excel
Mean Blur
Daniel Herlemont
15 juin 2011
Table des matières
1
Objectifs et motivations
Programmer en Excel :
ˆ La génération de nombres pseudo aléatoires normalement distribués mono varié et
multi varié.
ˆ Mettre en évidence la difficulté à utiliser les rendements historiques pour les rendements
futurs ... ”les performances passées ne préjugent pas des performances futures” ...
ˆ La décomposition de Cholesky
ˆ les estimateurs des rendements et matrices de covariances.
2
A faire
2.1
Loi Unifrome
ˆ Utliser la fonction ALEA pour générer une série de nombre aléatoires suivant une loi
uniforme sur [0,1].
1
2 A FAIRE
ˆ Calculer la moyenne et la variance sur un grand nombre de tirages (disons 1000).
Vérifier que la moyenne et la variance (dont on rappellera les valeurs théoriques) sont
bien celles d’une variable aléatoire uniforme entre 0 et 1.
2.2
Génération de rendements gaussiens
On considère une action type de rendement annuel de rendement annuel de 12% et volatilité
de 15%.
Générer aléatoirement une série de rendements mensuels
typiques suivant une loi normale
√
de moyenne µ = .12/12 = 0.01 et σ = 0.0433 = .15/ 12.
Sous Excel, on utilisera la fonction inverse de la fonction de répartition de la loi normale.
Vérifier que l’on obtient bien les premiers moments d’une loi normale sur un très grand
nombre de tirages (disons 10000), en calculant la moyenne, l’écart type, l’asymétrie (skewness), ainsi que la kurtosis en excès :
mean = E(X)
variance = E(X 2 ) − E(X)2
√
variance
standardDeviation =
E[(X − E(X))3 ]
skewness =
standardDeviation3
E[(X − E(X))4 ]
excessKurtosis =
−3
standardDeviation4
2.3
(1)
De la difficulté à estimer les rendements
On effectuera ensuite des tirages pour des échantillons de faible taille, disons 12 mois, correspondant à 1 an d’historique.
Effectuer les mêmes calculs d’estimation de la moyenne et de la volatilité.
Rerpoduire un tableau analogue au tableau suivant :
Daniel Herlemont
2
2 A FAIRE
Que peut on dire de la précision des estimations (voir exercice du cours) :
ˆ du rendement moyen ?
ˆ de la volatilité ?
2.4
Are more data helpful ?
On considère les rendements journaliers de l’action précédente. Les rendements journaliers
√
suivent un loi normale de paramètres µjour = 0.12/250 = 0.00048 et σjour = 0.15/ 250
Effectuer les mêmes estimations que dans ?? avec 250 rendements journalier (au lieu de
12 rendements annuels).
On annualisera
les résultats en multipliant les rendements moyens par 250 et les ecart
√
types par 250
Conclusions ?
Voir aussi les exercices (facultatifs) en fin du TP.
2.5
Mean blur avec des données réelles
A faire :
Daniel Herlemont
3
2 A FAIRE
ˆ Télécharger les historiques des prix CAC40 en données mensuelles et journalières sur les
8 dernières années à partir du site yahoo http://finance.yahoo.com/q/hp?s=^FCHI
ˆ Effectuer les mêmes estimations que dans ?? à partir des rendements mensuels et
journaliers
2.6
Décomposition de Cholesky
Effectuer une décompostion de Cholesky pour une matrice à deux dimensions :
σ
ρσ
σ1
0
σ12
ρσ1 σ2
1
2
p
p
=
ρσ1 σ2
σ22
0 σ2 1 − ρ2
ρσ2 σ2 1 − ρ2
(2)
Par exemple, pour σ1 = 0.3, σ2 = 0.2 et ρ = 0.15 on obtient :
0.3
0
L=
0.03 0.1977372
2.7
Simulation d’une loi multinormale
La loi multinormale correspond à l’extension de la loi normale au cas de n variables x −
1, x − 2, ...x − n. Elle est caractérisée par un vecteur de moyennes µ et une matrice de
variance-covariance V . On la note N (µ, V ).
L’élément µi du vecteur µ représente la valeur moyenne de la variable xi . L’élément
diagonal Vii de la matrice V représente la variance σi2 de la variable xi (σi étant l’écarttype). L’élément non diagonal Vij de la matrice V représente la covariance des variables xi
et xj . Le coefficient de corrélation ρij s’en déduit par :
Vij
Vij
=
ρij = p
σii σjj
Vii Vjj
Ce coefficient est toujours compris entre −1 et 1. Il est positif si xi et xj ont tendance à
varier dans le même sens, négatif dans le cas contraire.
Pour simuler une loi multinormale N (µ, V ) de dimension n, on applique l’algorithme
suivant. Soit u un vecteur constitué de n nombres aléatoires indépendants distribués selon
la loi normale réduite. Soit L la matrice triangulaire inférieure résultant de la décomposition
de Cholesky de la matrice V Le vecteur x = µ + Lu suit la loi multinormale N (µ, V ).
On peut le vérifier pour une loi bi-normale, par exemple. Soit L la matrice de la décomposition de Cholesky ?? :
σ1
p0
ρσ2 σ2 1 − ρ2
Daniel Herlemont
4
3 ANNEXE
et u le vecteur (u1 , u2 ), avec les Ui de loi normale réduite centrée N (0, 1) et indépendants.
p
µ + Lu = (µ1 + σ1 u1 , µ2 + ρσ2 u1 + σ2 1 − ρ2 u2 )T
Les composantes des vecteurs sont bien des loi normales, car combinaisons linéaires de lois
normales. Il suffit donc de vérifier que la première composante est une loi normale N (µ1 , σ12 ),
la deuxième composante est bien une loi N (µ2 , σ22 ). Enfin, la covariance des deux composantes
est bien ρσ1 σ2 . Tout d’abord, il est immédiat E(µ + Lu) = µ. Ensuite,
var(µ1 + σ1 u1 ) = σ12 var(u1 ) = σ12
p
1 − ρ2 u2 ) = ρ2 σ22 + σ22 (1 − ρ2 ))
= σ22
p
cov(µ1 + σ1 u1 , µ2 + ρσ2 u1 + σ2 1 − ρ2 u2 ) = σ1 σ2 ρ
var(µ2 + ρσ2 u1 + σ2
(3)
(4)
En notant que cov(ui , ui ) = var(ui ) = 1 et cov(u1 , u2) = 0, u1 et u2 sont indépendants.
CQFD
A faire
ˆ Effectuer une génération aléatoire (disons 1000 tirages) d’une normale bi variée avec
σ1 = 0.3, σ2 = 0.2 et ρ = 0.15
ˆ Estimer les moyennes et matrice de covariance (notamment la corrélation) à partir des
nombres générés.
3
Annexe
3.1
Simulation d’une variable aléatoire quelconque a partir d’un
loi uniforme
Pour une variable aléatoire X de fonction de répartition F , il suffit de remarquer que la
variable F −1 (U ), avec U uniforme et X ont une même loi. En effet :
P (F −1 (U ) ≤ x) = P (U ≤ F (x)) = F (x) = P (X ≤ x)
Pour générer un nombre aléatoire de loi F , une méthode générale consiste donc à :
ˆ à tirer un nombre pseudo aléatoire selon une loi uniforme sur [0, 1] : soit u ce nombre.
ˆ renvoyer F −1 (u). Dans le cas où F −1 n’est pas connu explicitement, on pourra inverser
la fonction F par simple bi-section.
Daniel Herlemont
5
3 ANNEXE
3.2
Variable aléatoire gaussienne - méthode de Box-Muller
Soient X, Y deux variables aléatoires gaussiennes centrées, réduites et indépendantes. Soient
R et θ, les coordonnées polaires. On montre que 1
ˆ R2 suit une loi exponentielle de paramètre 1/2
ˆ θ suit une loi uniforme sur [0, 2π]
L’algorithme s’en déduit facilement :
ˆ Tirer U1 et U2 selon une loi uniforme sur [0, 1[
ˆ R2 = −2log(U1 ) suit une loi exponentielle de paramètre 1/2
ˆ θ = 2πU2 suit une loi uniforme sur [0, 2π]
On en déduit :
ˆ X = R cos(θ)
ˆ Y = R sin(θ)
3.3
3.3.1
Exercices - facultatifs
Propriétés des estimateurs
(ref Luenberger [?], exercice 4, p. 225)
Soient ri pour i = 1, ...n, un échantillon d’une distribution de rendement de moyenne r
et variance σ 2 . On définit les estimateurs :
n
1X
r̂ =
ri
n i=1
1
Pour la démonstration de l’algorithme de Box-Muller, on utilise un changement de variables. Rappel,
si X1 et X2 sont deux variables aléatoires, de densité f (x1 , x2 ), et Y1 (X1 , X2 ), Y2 (X1 , X2 ) une transformation de X1 , X2 (suffisamment régulière), alors, la densité g de Y1 , Y2 s’obtient à l’aide du Jacobien de la
transformation
∂x1 ∂x1
∂y1 ∂y2 f (x , x )
g(y1 , y2 ) = ∂x
1
2
∂x2
2
∂y1 ∂y2
Daniel Herlemont
6
4 REFERENCES
et
n
1 X
s =
(ri − r̂)2
n − 1 i=1
2
Montrer que E(s2 ) = σ 2
puis :
var(s2 ) =
ou, de manière équivalente,
2σ 4
n−1
√ 2
2σ
ecarttype(s ) = √
n−1
2
Conclusion.
p
L’écart type de l’estimation de la variance est 2/(n − 1) fois la vraie variance. Par
conséquent, l’erreur d’estimation de σ 2 n’est pas trop grande pour n raisonnablement élevé.
Par exemple,
pl’écart type (relatif) d’une estimation de la volatilité sur un an d’historique
journaliers est 2/(260 − 1) = 0.088, ce qui est très faible.
3.3.2
Are mode data helpful
(voir Luenberger [?], exercice 5, p. 225)
Soient r̄, le rendement annuel d’une action et σ 2 la variance des rendements. Pour estimer
ces quantités, on divise l’année en n périodes égales. Soient r¯n , le rendement moyen et σn2 la
variance sur chaque sous période.
On admettra que r¯n = r̄/n et σn2 = σ 2 /n. Si rˆ¯n et σˆn 2 les estimations, alors on peut
estimer le rendement annuel et sa variance par r̄ˆ = nrˆ¯n et σ̂ 2 = nσ(rˆ¯n2 ). On notera σ(r̄ˆ) et
σ(σ̂ 2 ) les écarts types de ces estimateurs.
ˆ Montrer que l’écart type de l’estimation du rendement σ(r̄ˆ) est indépendant de n
ˆ Quelle est la dépendance de l’écart type de l’estimation de la variance en fonction de
n. On supposera que les rendements sont normalement distribués.
ˆ Répondre à la question posée par le titre de l’exercice. Est il utile d’effectuer des
estimations à des fréquences d’échantillonnage plus élevées.
4
References
Daniel Herlemont
7