Rendements et matrices de covariances Simulations et Estimations
Transcription
Rendements et matrices de covariances Simulations et Estimations
Rendements et matrices de covariances Simulations et Estimations en Excel Mean Blur Daniel Herlemont 15 juin 2011 Table des matières 1 Objectifs et motivations Programmer en Excel : La génération de nombres pseudo aléatoires normalement distribués mono varié et multi varié. Mettre en évidence la difficulté à utiliser les rendements historiques pour les rendements futurs ... ”les performances passées ne préjugent pas des performances futures” ... La décomposition de Cholesky les estimateurs des rendements et matrices de covariances. 2 A faire 2.1 Loi Unifrome Utliser la fonction ALEA pour générer une série de nombre aléatoires suivant une loi uniforme sur [0,1]. 1 2 A FAIRE Calculer la moyenne et la variance sur un grand nombre de tirages (disons 1000). Vérifier que la moyenne et la variance (dont on rappellera les valeurs théoriques) sont bien celles d’une variable aléatoire uniforme entre 0 et 1. 2.2 Génération de rendements gaussiens On considère une action type de rendement annuel de rendement annuel de 12% et volatilité de 15%. Générer aléatoirement une série de rendements mensuels typiques suivant une loi normale √ de moyenne µ = .12/12 = 0.01 et σ = 0.0433 = .15/ 12. Sous Excel, on utilisera la fonction inverse de la fonction de répartition de la loi normale. Vérifier que l’on obtient bien les premiers moments d’une loi normale sur un très grand nombre de tirages (disons 10000), en calculant la moyenne, l’écart type, l’asymétrie (skewness), ainsi que la kurtosis en excès : mean = E(X) variance = E(X 2 ) − E(X)2 √ variance standardDeviation = E[(X − E(X))3 ] skewness = standardDeviation3 E[(X − E(X))4 ] excessKurtosis = −3 standardDeviation4 2.3 (1) De la difficulté à estimer les rendements On effectuera ensuite des tirages pour des échantillons de faible taille, disons 12 mois, correspondant à 1 an d’historique. Effectuer les mêmes calculs d’estimation de la moyenne et de la volatilité. Rerpoduire un tableau analogue au tableau suivant : Daniel Herlemont 2 2 A FAIRE Que peut on dire de la précision des estimations (voir exercice du cours) : du rendement moyen ? de la volatilité ? 2.4 Are more data helpful ? On considère les rendements journaliers de l’action précédente. Les rendements journaliers √ suivent un loi normale de paramètres µjour = 0.12/250 = 0.00048 et σjour = 0.15/ 250 Effectuer les mêmes estimations que dans ?? avec 250 rendements journalier (au lieu de 12 rendements annuels). On annualisera les résultats en multipliant les rendements moyens par 250 et les ecart √ types par 250 Conclusions ? Voir aussi les exercices (facultatifs) en fin du TP. 2.5 Mean blur avec des données réelles A faire : Daniel Herlemont 3 2 A FAIRE Télécharger les historiques des prix CAC40 en données mensuelles et journalières sur les 8 dernières années à partir du site yahoo http://finance.yahoo.com/q/hp?s=^FCHI Effectuer les mêmes estimations que dans ?? à partir des rendements mensuels et journaliers 2.6 Décomposition de Cholesky Effectuer une décompostion de Cholesky pour une matrice à deux dimensions : σ ρσ σ1 0 σ12 ρσ1 σ2 1 2 p p = ρσ1 σ2 σ22 0 σ2 1 − ρ2 ρσ2 σ2 1 − ρ2 (2) Par exemple, pour σ1 = 0.3, σ2 = 0.2 et ρ = 0.15 on obtient : 0.3 0 L= 0.03 0.1977372 2.7 Simulation d’une loi multinormale La loi multinormale correspond à l’extension de la loi normale au cas de n variables x − 1, x − 2, ...x − n. Elle est caractérisée par un vecteur de moyennes µ et une matrice de variance-covariance V . On la note N (µ, V ). L’élément µi du vecteur µ représente la valeur moyenne de la variable xi . L’élément diagonal Vii de la matrice V représente la variance σi2 de la variable xi (σi étant l’écarttype). L’élément non diagonal Vij de la matrice V représente la covariance des variables xi et xj . Le coefficient de corrélation ρij s’en déduit par : Vij Vij = ρij = p σii σjj Vii Vjj Ce coefficient est toujours compris entre −1 et 1. Il est positif si xi et xj ont tendance à varier dans le même sens, négatif dans le cas contraire. Pour simuler une loi multinormale N (µ, V ) de dimension n, on applique l’algorithme suivant. Soit u un vecteur constitué de n nombres aléatoires indépendants distribués selon la loi normale réduite. Soit L la matrice triangulaire inférieure résultant de la décomposition de Cholesky de la matrice V Le vecteur x = µ + Lu suit la loi multinormale N (µ, V ). On peut le vérifier pour une loi bi-normale, par exemple. Soit L la matrice de la décomposition de Cholesky ?? : σ1 p0 ρσ2 σ2 1 − ρ2 Daniel Herlemont 4 3 ANNEXE et u le vecteur (u1 , u2 ), avec les Ui de loi normale réduite centrée N (0, 1) et indépendants. p µ + Lu = (µ1 + σ1 u1 , µ2 + ρσ2 u1 + σ2 1 − ρ2 u2 )T Les composantes des vecteurs sont bien des loi normales, car combinaisons linéaires de lois normales. Il suffit donc de vérifier que la première composante est une loi normale N (µ1 , σ12 ), la deuxième composante est bien une loi N (µ2 , σ22 ). Enfin, la covariance des deux composantes est bien ρσ1 σ2 . Tout d’abord, il est immédiat E(µ + Lu) = µ. Ensuite, var(µ1 + σ1 u1 ) = σ12 var(u1 ) = σ12 p 1 − ρ2 u2 ) = ρ2 σ22 + σ22 (1 − ρ2 )) = σ22 p cov(µ1 + σ1 u1 , µ2 + ρσ2 u1 + σ2 1 − ρ2 u2 ) = σ1 σ2 ρ var(µ2 + ρσ2 u1 + σ2 (3) (4) En notant que cov(ui , ui ) = var(ui ) = 1 et cov(u1 , u2) = 0, u1 et u2 sont indépendants. CQFD A faire Effectuer une génération aléatoire (disons 1000 tirages) d’une normale bi variée avec σ1 = 0.3, σ2 = 0.2 et ρ = 0.15 Estimer les moyennes et matrice de covariance (notamment la corrélation) à partir des nombres générés. 3 Annexe 3.1 Simulation d’une variable aléatoire quelconque a partir d’un loi uniforme Pour une variable aléatoire X de fonction de répartition F , il suffit de remarquer que la variable F −1 (U ), avec U uniforme et X ont une même loi. En effet : P (F −1 (U ) ≤ x) = P (U ≤ F (x)) = F (x) = P (X ≤ x) Pour générer un nombre aléatoire de loi F , une méthode générale consiste donc à : à tirer un nombre pseudo aléatoire selon une loi uniforme sur [0, 1] : soit u ce nombre. renvoyer F −1 (u). Dans le cas où F −1 n’est pas connu explicitement, on pourra inverser la fonction F par simple bi-section. Daniel Herlemont 5 3 ANNEXE 3.2 Variable aléatoire gaussienne - méthode de Box-Muller Soient X, Y deux variables aléatoires gaussiennes centrées, réduites et indépendantes. Soient R et θ, les coordonnées polaires. On montre que 1 R2 suit une loi exponentielle de paramètre 1/2 θ suit une loi uniforme sur [0, 2π] L’algorithme s’en déduit facilement : Tirer U1 et U2 selon une loi uniforme sur [0, 1[ R2 = −2log(U1 ) suit une loi exponentielle de paramètre 1/2 θ = 2πU2 suit une loi uniforme sur [0, 2π] On en déduit : X = R cos(θ) Y = R sin(θ) 3.3 3.3.1 Exercices - facultatifs Propriétés des estimateurs (ref Luenberger [?], exercice 4, p. 225) Soient ri pour i = 1, ...n, un échantillon d’une distribution de rendement de moyenne r et variance σ 2 . On définit les estimateurs : n 1X r̂ = ri n i=1 1 Pour la démonstration de l’algorithme de Box-Muller, on utilise un changement de variables. Rappel, si X1 et X2 sont deux variables aléatoires, de densité f (x1 , x2 ), et Y1 (X1 , X2 ), Y2 (X1 , X2 ) une transformation de X1 , X2 (suffisamment régulière), alors, la densité g de Y1 , Y2 s’obtient à l’aide du Jacobien de la transformation ∂x1 ∂x1 ∂y1 ∂y2 f (x , x ) g(y1 , y2 ) = ∂x 1 2 ∂x2 2 ∂y1 ∂y2 Daniel Herlemont 6 4 REFERENCES et n 1 X s = (ri − r̂)2 n − 1 i=1 2 Montrer que E(s2 ) = σ 2 puis : var(s2 ) = ou, de manière équivalente, 2σ 4 n−1 √ 2 2σ ecarttype(s ) = √ n−1 2 Conclusion. p L’écart type de l’estimation de la variance est 2/(n − 1) fois la vraie variance. Par conséquent, l’erreur d’estimation de σ 2 n’est pas trop grande pour n raisonnablement élevé. Par exemple, pl’écart type (relatif) d’une estimation de la volatilité sur un an d’historique journaliers est 2/(260 − 1) = 0.088, ce qui est très faible. 3.3.2 Are mode data helpful (voir Luenberger [?], exercice 5, p. 225) Soient r̄, le rendement annuel d’une action et σ 2 la variance des rendements. Pour estimer ces quantités, on divise l’année en n périodes égales. Soient r¯n , le rendement moyen et σn2 la variance sur chaque sous période. On admettra que r¯n = r̄/n et σn2 = σ 2 /n. Si rˆ¯n et σˆn 2 les estimations, alors on peut estimer le rendement annuel et sa variance par r̄ˆ = nrˆ¯n et σ̂ 2 = nσ(rˆ¯n2 ). On notera σ(r̄ˆ) et σ(σ̂ 2 ) les écarts types de ces estimateurs. Montrer que l’écart type de l’estimation du rendement σ(r̄ˆ) est indépendant de n Quelle est la dépendance de l’écart type de l’estimation de la variance en fonction de n. On supposera que les rendements sont normalement distribués. Répondre à la question posée par le titre de l’exercice. Est il utile d’effectuer des estimations à des fréquences d’échantillonnage plus élevées. 4 References Daniel Herlemont 7