Séries chronologiques
Transcription
Séries chronologiques
GEA : Statistiques – Séries chronologiques Séries chronologiques 1. Définition et composantes Ce sont des séries d'observations échelonnées dans le temps. On étudie les séries chronologiques pour : • analyser un phénomène temporel en mettant en évidence essentiellement la tendance générale et les fluctuations saisonnières • élaborer un modèle permettant de faire de la prévision à court terme On distingue 3 composantes dans une série chronologique : • Une composante longue, observée sur une longue période : TREND ou TENDANCE : T • Un mouvement saisonnier se reproduisant chaque année : S • Des variations accidentelles aléatoires (conditions climatiques exceptionnelles, grève, …) : A T: S: A: Remarque : On introduit parfois une 4ème composante traduisant les périodes d’expansion et de récession à moyen ou long terme. C’est un mouvement cyclique se traduisant par des oscillations de part et d’autre de la courbe du trend : alternance. Les schémas de décomposition les plus courants sont : • Le schéma additif Y = T + S + A (on additionne les diverses composantes) • Le schéma multiplicatif Y = T × S × A (chaque composante se traduit par un facteur) 2. schéma additif ou multiplicatif Afin de faire la distinction entre schéma multiplicatif et additif, on peut se baser sur une méthode graphique. On représente graphiquement les droites passant respectivement par les minimas et les maximas. On obtient deux cas de figures : Schéma additif : courbes parallèles. Les oscillations sont constantes autour du trend et ne dépendent pas de la saison. Schéma additif : Y=Trend+Saison 60 Données 50 40 30 20 10 0 0 2 4 6 8 10 12 14 Temps Page 1 sur 5 GEA : Statistiques – Séries chronologiques Schéma multiplicatif : courbes qui s’écartent (ou se rejoignent). Les variations saisonnières augmentent (ou diminuent) avec la saison. Données Schéma multiplicatif : Y=Trend.Saison 70 60 50 40 30 20 10 0 0 2 4 6 8 10 12 14 Temps Il existe de nombreuses méthodes permettant de déterminer le Trend et les coefficients saisonniers. Nous nous limiterons à deux méthodes. 3. Cas multiplicatif Nous essaierons de "chiffrer" le trend par l'intermédiaire d'une fonction affine et d'estimer les mouvements saisonniers via les coefficients saisonniers multiplicatifs. Nous allons étudier une approche basée sur les moyennes mobiles. 1ère étape : moyennes mobiles Afin d’éliminer ou d’amortir les mouvements cycliques, saisonniers et accidentels, on utilise la technique des moyennes mobiles. On procède ainsi en quelque sorte au lissage de la courbe. Théorème : Les moyennes mobiles d’une série soumise à des variations saisonnières ne sont pas soumises à ces variations si leur longueur est un multiple de la période. Principe des moyennes mobiles : Le principe de cette méthode est de calculer des moyennes arithmétiques successives de longueur p fixe à partir des données originales. Chacune de ces moyennes obtenues correspondra au « milieu » de la période pour laquelle la moyenne arithmétique vient d’être calculée. Moyenne d’ordre p impair : Exemple ordre 3 : Valeur Moyenne d’ordre 3 5 6 5+ 6+ 9 ≈ 6, 67 3 9 6 + 9 + 15 = 10 3 15 Moyenne d’ordre pair : on réalise la moyenne sur p+1 valeurs avec des coefficients 1/2 aux deux extrémités. Exemple ordre 4 : Valeur 3 5 10 13 11 15 Moyenne d’ordre 3 3 + 5 + 10 + 13 + 11 5 + 10 + 13 + 11 + 15 2 2 = 8, 75 2 2 = 11 4 4 AUTRE METHODE : On peut déterminer le trend en se basant sur la méthode des moindres carrés. 2° étape : calcul des coefficients saisonniers. Le coefficient saisonnier est dans notre cas multiplicatif. Y = Trend x Coefficient saisonnier Les moyennes mobiles (proches du trend) vont nous permettre de calculer les composantes saisonnières (proches des coefficients saisonniers). Composante saisonnière = Y / moy. mobile Page 2 sur 5 GEA : Statistiques – Séries chronologiques Calcul des moyennes mobiles ordre 4 (car la périodicité est 4) puis calcul des composantes saisonnières : Année Trimestre CA = Y Moyenne mobile Composante Saisonnière Année 1 1 5 2 15,6 Année 2 3 9,6 15 Année 3 4 1 2 3 4 1 2 26,6 11 32,5 19,6 43,4 17 44,4 17,8 21,2 24,5 27,4 29,6 31,7 34,3 3 24 4 60,2 0,64 1,49 0,52 1,33 0,72 1,47 0,54 1,29 Moyenne mobile M oye nne s m obile s 70 Données 60 50 40 30 20 10 0 0 5 Trim e s tre s 10 15 Pour déterminer les coefficients saisonniers, il suffit de réaliser la moyenne des composantes saisonnières sur chaque saison puis de normaliser ces coefficients pour obtenir une moyenne de 1. Moyenne des composantes saisonnières : Trimestre 1 Coeff. Saisonnier = 0,52 + 0,54 = 0,53 Moyenne des composantes 2 saisonnières 2 3 4 1,31 0,68 1,48 Normalisation : Si la moyenne des coefficients saisonniers ne vaut pas 1, on normalise. Pour cela, on divise chaque coefficient saisonnier par la moyenne des coefficients saisonniers. On obtient alors les coefficients saisonniers normalisés. Coeff . Coeff. Normalisé = Moyenne des coeff. Calcul des valeurs désaisonnalisées à partir des coefficients saisonniers normalisés : On obtient les valeurs désaisonnalisées en divisant les valeurs réelles par le coefficient saisonnier : Valeur désaisonnalisée = Y / coefficient saisonnier normalisé Trimestre 1 Y = CA 5 Coeff. Saisonnier 0,53 Valeurs désaiso. 9,46 2 3 4 5 6 7 8 9 10 11 12 15,6 1,31 11,9 9,6 0,68 14,1 26,6 1,48 18 11 0,53 20,8 32,5 1,31 24,8 19,6 0,68 28,9 43,4 1,48 29,3 17 0,53 32,2 44,4 1,31 33,9 24 0,68 35,3 60,2 1,48 40,7 Vale urs dé s ais onnalis é e s 80 60 40 20 0 0 5 10 15 3° étape : Calcul du trend Pour déterminer le Trend, il suffit d’utiliser une méthode d’ajustement linéaire comme celle des moindres carrés sur les valeurs désaisonnalisées. On trouve une équation pour le Trend de la forme y=ax+b donc on a donc : Tendance = ax + b Page 3 sur 5 GEA : Statistiques – Séries chronologiques 4° étape : Prévisions Pour réaliser une prévision, il suffit dans un premier temps réaliser la prévision grâce à l'équation obtenue pour le trend, puis de multiplier par le coefficient saisonnier. Y prévisible = Tendance x coefficient saisonnier normalisé 4. Cas additif Dans le cas additif, nous pouvons adapter la méthode précédente basée sur les moyennes mobiles. On doit adapter les formules : Calcul des composantes saisonnières : Composante saisonnière = Y – Moyenne mobile Normalisation : Si la moyenne des coefficients saisonniers ne vaut pas 0, on normalise. Pour cela, on enlève à chaque coefficient saisonnier, la moyenne des coefficients saisonniers. On obtient alors les coefficients saisonniers normalisés. Coef saisonnier normalisé = coef saisonnier – moyenne des coefs saisonniers Puis on calcule les valeurs désaisonnalisées : Valeur désaisonnalisée = Y – coefficient saisonnier normalisé Pour faire des prévisions, on calcule la tendance (par la méthode des moindres carrés à partir des valeurs désaisonnalisées), puis on ajoute le coefficient saisonnier. Y prévisible = Tendance + coefficient saisonnier Une autre méthode est celle de Buys-Ballot, ci-dessous. Principe de Buys-Ballot Le filtre de Buys-Ballot concerne les séries chronologiques suivant un modèle additif et dont la tendance est linéaire. Il consiste à estimer les paramètres de ce modèle suivant le critère des moindres carrés, et permet ensuite, dans la mesure où les hypothèses sont respectées, d'effectuer des prévisions. Mathématiquement, il s’agit en fait d’une régression linéaire multiple particulière. Nous supposons donc que la série étudiée suit le modèle additif et que la tendance est linéaire : Y=at+b Pour les calculs, nous avons besoin du tableau suivant p colonnes Années i\ Trimestres j n lignes Trim. 1 … 2 … 3 … 4 … … … … m.1 … … … m.2 … … … m.3 … … … m.4 Total=mi. m1. Année 1 2 3 4 Total=m.j m2. m3. m4. m Pour exprimer la tendance en fonction de la ligne i (allant de 1 à n) et de la colonne j (allant de 1 à p) du tableau, nous établissons une relation et les variables t, i et j : t = (i-1) p + j variant de 1à 16. Le modèle complet est le suivant : Yi,j = a[ (i-1) p + j ] + b + Sj Le critère des moindres carrés consiste à déterminer les paramètres b, a, S1, S2, S3 et S4 de façon à minimiser la somme des carrés des différences ei,j = xij – [a[(i-1) p + j ] + b + Sj ] entre la valeur observée xij et la valeur estimée par le modèle : b [(i-1) p + j ] + a + Sj. On calculera les estimations des paramètres à l’aide des formules suivantes : a= 12 n n(n + 1) imi. − m ∑ pn(n²-1) i = 1 2 b=m- a(np+1) 2 p + 1 S j = m. j − m − a j − 2 avec les notations suivantes : m : moyenne de la totalité des observations mi. : moyenne des observations de la ligne i : moyenne « annuelle » m.j : moyenne des observations de la colonne j : « moyenne trimestrielle » Yi,j = a[ (i-1) p + j ] + b + Sj Page 4 sur 5 GEA : Statistiques – Séries chronologiques Cas pratique Pour illustrer la méthode de Buys-ballot, nous nous baserons sur l’évolution suivante représentant le nombre de clients dans une boutique de sports en fonction des trimestres : Années\ Trimestres 1 2 3 4 2001 1050 1300 1500 1300 2002 1050 1400 1750 1350 2003 1100 1550 1850 1450 2004 1150 1700 2000 1550 CA Nombre clients 2150 1950 1750 1550 1350 1150 950 750 0 5 10 15 20 Trim e s tre s : 2001-->2004 Pour les calculs, nous avons besoin du tableau suivant : Années i\ Trimestres j 1 2 3 4 mi. 1 1050 1300 1500 1300 1287,5 2 1050 1400 1750 1350 1387,5 3 1100 1550 1850 1450 1487,5 4 1150 1700 2000 1550 1600 m.j 1087,5 1487,5 1775,0 1412,5 m=1440,6 Après calcul des différents coefficients, nous arrivons sur notre exemple à la fonction d'ajustement suivante : -314.22 : 1er trimestre ème 59.84 : 2 trimestre Yi,k =25.94 ( 4(i-1)+k ) + 1220.16 + ème 321.41 : 3 trimestre -67.03 : 4ème trimestre Les prévisions sont alors possibles. Page 5 sur 5