Rendements et matrices de covariances Simulations et Estimations

Transcription

Rendements et matrices de covariances
Simulations et Estimations en Excel
Mean Blur
Daniel Herlemont
15 juin 2011
Table des matières
1
Objectifs et motivations
Programmer en Excel :
La génération de nombres pseudo aléatoires normalement distribués mono varié et
multi varié.
Mettre en évidence la difficulté à utiliser les rendements historiques pour les rendements
futurs ... ”les performances passées ne préjugent pas des performances futures” ...
La décomposition de Cholesky
les estimateurs des rendements et matrices de covariances.
2
A faire
2.1
Loi Unifrome
Utliser la fonction ALEA pour générer une série de nombre aléatoires suivant une loi
uniforme sur [0,1].
1
2 A FAIRE
Calculer la moyenne et la variance sur un grand nombre de tirages (disons 1000).
Vérifier que la moyenne et la variance (dont on rappellera les valeurs théoriques) sont
bien celles d’une variable aléatoire uniforme entre 0 et 1.
2.2
Génération de rendements gaussiens
On considère une action type de rendement annuel de rendement annuel de 12% et volatilité
de 15%.
Générer aléatoirement une série de rendements mensuels
typiques suivant une loi normale
√
de moyenne µ = .12/12 = 0.01 et σ = 0.0433 = .15/ 12.
Sous Excel, on utilisera la fonction inverse de la fonction de répartition de la loi normale.
Vérifier que l’on obtient bien les premiers moments d’une loi normale sur un très grand
nombre de tirages (disons 10000), en calculant la moyenne, l’écart type, l’asymétrie (skewness), ainsi que la kurtosis en excès :
mean = E(X)
variance = E(X 2 ) − E(X)2
√
variance
standardDeviation =
E[(X − E(X))3 ]
skewness =
standardDeviation3
E[(X − E(X))4 ]
excessKurtosis =
−3
standardDeviation4
2.3
(1)
De la difficulté à estimer les rendements
On effectuera ensuite des tirages pour des échantillons de faible taille, disons 12 mois, correspondant à 1 an d’historique.
Effectuer les mêmes calculs d’estimation de la moyenne et de la volatilité.
Rerpoduire un tableau analogue au tableau suivant :
Daniel Herlemont
2
2 A FAIRE
Que peut on dire de la précision des estimations (voir exercice du cours) :
du rendement moyen ?
de la volatilité ?
2.4
Are more data helpful ?
On considère les rendements journaliers de l’action précédente. Les rendements journaliers
√
suivent un loi normale de paramètres µjour = 0.12/250 = 0.00048 et σjour = 0.15/ 250
Effectuer les mêmes estimations que dans ?? avec 250 rendements journalier (au lieu de
12 rendements annuels).
On annualisera
les résultats en multipliant les rendements moyens par 250 et les ecart
√
types par 250
Conclusions ?
Voir aussi les exercices (facultatifs) en fin du TP.
2.5
Mean blur avec des données réelles
A faire :
Daniel Herlemont
3
2 A FAIRE
Télécharger les historiques des prix CAC40 en données mensuelles et journalières sur les
8 dernières années à partir du site yahoo http://finance.yahoo.com/q/hp?s=^FCHI
Effectuer les mêmes estimations que dans ?? à partir des rendements mensuels et
journaliers
2.6
Décomposition de Cholesky
Effectuer une décompostion de Cholesky pour une matrice à deux dimensions :
σ
ρσ
σ1
0
σ12
ρσ1 σ2
1
2
p
p
=
ρσ1 σ2
σ22
0 σ2 1 − ρ2
ρσ2 σ2 1 − ρ2
(2)
Par exemple, pour σ1 = 0.3, σ2 = 0.2 et ρ = 0.15 on obtient :
0.3
0
L=
0.03 0.1977372
2.7
Simulation d’une loi multinormale
La loi multinormale correspond à l’extension de la loi normale au cas de n variables x −
1, x − 2, ...x − n. Elle est caractérisée par un vecteur de moyennes µ et une matrice de
variance-covariance V . On la note N (µ, V ).
L’élément µi du vecteur µ représente la valeur moyenne de la variable xi . L’élément
diagonal Vii de la matrice V représente la variance σi2 de la variable xi (σi étant l’écarttype). L’élément non diagonal Vij de la matrice V représente la covariance des variables xi
et xj . Le coefficient de corrélation ρij s’en déduit par :
Vij
Vij
=
ρij = p
σii σjj
Vii Vjj
Ce coefficient est toujours compris entre −1 et 1. Il est positif si xi et xj ont tendance à
varier dans le même sens, négatif dans le cas contraire.
Pour simuler une loi multinormale N (µ, V ) de dimension n, on applique l’algorithme
suivant. Soit u un vecteur constitué de n nombres aléatoires indépendants distribués selon
la loi normale réduite. Soit L la matrice triangulaire inférieure résultant de la décomposition
de Cholesky de la matrice V Le vecteur x = µ + Lu suit la loi multinormale N (µ, V ).
On peut le vérifier pour une loi bi-normale, par exemple. Soit L la matrice de la décomposition de Cholesky ?? :
σ1
p0
ρσ2 σ2 1 − ρ2
Daniel Herlemont
4
3 ANNEXE
et u le vecteur (u1 , u2 ), avec les Ui de loi normale réduite centrée N (0, 1) et indépendants.
p
µ + Lu = (µ1 + σ1 u1 , µ2 + ρσ2 u1 + σ2 1 − ρ2 u2 )T
Les composantes des vecteurs sont bien des loi normales, car combinaisons linéaires de lois
normales. Il suffit donc de vérifier que la première composante est une loi normale N (µ1 , σ12 ),
la deuxième composante est bien une loi N (µ2 , σ22 ). Enfin, la covariance des deux composantes
est bien ρσ1 σ2 . Tout d’abord, il est immédiat E(µ + Lu) = µ. Ensuite,
var(µ1 + σ1 u1 ) = σ12 var(u1 ) = σ12
p
1 − ρ2 u2 ) = ρ2 σ22 + σ22 (1 − ρ2 ))
= σ22
p
cov(µ1 + σ1 u1 , µ2 + ρσ2 u1 + σ2 1 − ρ2 u2 ) = σ1 σ2 ρ
var(µ2 + ρσ2 u1 + σ2
(3)
(4)
En notant que cov(ui , ui ) = var(ui ) = 1 et cov(u1 , u2) = 0, u1 et u2 sont indépendants.
CQFD
A faire
Effectuer une génération aléatoire (disons 1000 tirages) d’une normale bi variée avec
σ1 = 0.3, σ2 = 0.2 et ρ = 0.15
Estimer les moyennes et matrice de covariance (notamment la corrélation) à partir des
nombres générés.
3
Annexe
3.1
Simulation d’une variable aléatoire quelconque a partir d’un
loi uniforme
Pour une variable aléatoire X de fonction de répartition F , il suffit de remarquer que la
variable F −1 (U ), avec U uniforme et X ont une même loi. En effet :
P (F −1 (U ) ≤ x) = P (U ≤ F (x)) = F (x) = P (X ≤ x)
Pour générer un nombre aléatoire de loi F , une méthode générale consiste donc à :
à tirer un nombre pseudo aléatoire selon une loi uniforme sur [0, 1] : soit u ce nombre.
renvoyer F −1 (u). Dans le cas où F −1 n’est pas connu explicitement, on pourra inverser
la fonction F par simple bi-section.
Daniel Herlemont
5
3 ANNEXE
3.2
Variable aléatoire gaussienne - méthode de Box-Muller
Soient X, Y deux variables aléatoires gaussiennes centrées, réduites et indépendantes. Soient
R et θ, les coordonnées polaires. On montre que 1
R2 suit une loi exponentielle de paramètre 1/2
θ suit une loi uniforme sur [0, 2π]
L’algorithme s’en déduit facilement :
Tirer U1 et U2 selon une loi uniforme sur [0, 1[
R2 = −2log(U1 ) suit une loi exponentielle de paramètre 1/2
θ = 2πU2 suit une loi uniforme sur [0, 2π]
On en déduit :
X = R cos(θ)
Y = R sin(θ)
3.3
3.3.1
Exercices - facultatifs
Propriétés des estimateurs
(ref Luenberger [?], exercice 4, p. 225)
Soient ri pour i = 1, ...n, un échantillon d’une distribution de rendement de moyenne r
et variance σ 2 . On définit les estimateurs :
n
1X
r̂ =
ri
n i=1
1
Pour la démonstration de l’algorithme de Box-Muller, on utilise un changement de variables. Rappel,
si X1 et X2 sont deux variables aléatoires, de densité f (x1 , x2 ), et Y1 (X1 , X2 ), Y2 (X1 , X2 ) une transformation de X1 , X2 (suffisamment régulière), alors, la densité g de Y1 , Y2 s’obtient à l’aide du Jacobien de la
transformation
∂x1 ∂x1
∂y1 ∂y2 f (x , x )
g(y1 , y2 ) = ∂x
1
2
∂x2
2
∂y1 ∂y2
Daniel Herlemont
6
4 REFERENCES
et
n
1 X
s =
(ri − r̂)2
n − 1 i=1
2
Montrer que E(s2 ) = σ 2
puis :
var(s2 ) =
ou, de manière équivalente,
2σ 4
n−1
√ 2
2σ
ecarttype(s ) = √
n−1
2
Conclusion.
p
L’écart type de l’estimation de la variance est 2/(n − 1) fois la vraie variance. Par
conséquent, l’erreur d’estimation de σ 2 n’est pas trop grande pour n raisonnablement élevé.
Par exemple,
pl’écart type (relatif) d’une estimation de la volatilité sur un an d’historique
journaliers est 2/(260 − 1) = 0.088, ce qui est très faible.
3.3.2
Are mode data helpful
(voir Luenberger [?], exercice 5, p. 225)
Soient r̄, le rendement annuel d’une action et σ 2 la variance des rendements. Pour estimer
ces quantités, on divise l’année en n périodes égales. Soient r¯n , le rendement moyen et σn2 la
variance sur chaque sous période.
On admettra que r¯n = r̄/n et σn2 = σ 2 /n. Si rˆ¯n et σˆn 2 les estimations, alors on peut
estimer le rendement annuel et sa variance par r̄ˆ = nrˆ¯n et σ̂ 2 = nσ(rˆ¯n2 ). On notera σ(r̄ˆ) et
σ(σ̂ 2 ) les écarts types de ces estimateurs.
Montrer que l’écart type de l’estimation du rendement σ(r̄ˆ) est indépendant de n
Quelle est la dépendance de l’écart type de l’estimation de la variance en fonction de
n. On supposera que les rendements sont normalement distribués.
Répondre à la question posée par le titre de l’exercice. Est il utile d’effectuer des
estimations à des fréquences d’échantillonnage plus élevées.
4
References
Daniel Herlemont
7

Rendements et matrices de covariances Simulations et Estimations

Transcription

Documents pareils

Télécharger l`article au format PDF - ALE 08

Réponses des exercices

03 Siska Gaeremyn

Introduction `a R

Devoir surveillé sur les probabilités en première S

Nini peau de chien

Cours de Gym, Yoga, Fitness et Step

Age of Empire est la réplique de la version originale du jeu pour PC

newcastle brown ale - Direct Distribution

Analyse de Variance à 1 Facteur

a l`issue de ce jeu le gain algebrique (gain ou perte