Séries chronologiques

Transcription

Séries chronologiques
GEA : Statistiques – Séries chronologiques
Séries chronologiques
1. Définition et composantes
Ce sont des séries d'observations échelonnées dans le temps. On étudie les séries chronologiques pour :
• analyser un phénomène temporel en mettant en évidence essentiellement la tendance générale et les
fluctuations saisonnières
• élaborer un modèle permettant de faire de la prévision à court terme
On distingue 3 composantes dans une série chronologique :
• Une composante longue, observée sur une longue période : TREND ou TENDANCE : T
• Un mouvement saisonnier se reproduisant chaque année : S
• Des variations accidentelles aléatoires (conditions climatiques exceptionnelles, grève, …) : A
T:
S:
A:
Remarque : On introduit parfois une 4ème composante traduisant les périodes d’expansion et de récession à moyen
ou long terme. C’est un mouvement cyclique se traduisant par des oscillations de part et d’autre de la courbe du
trend : alternance.
Les schémas de décomposition les plus courants sont :
• Le schéma additif Y = T + S + A (on additionne les diverses composantes)
• Le schéma multiplicatif Y = T × S × A (chaque composante se traduit par un facteur)
2. schéma additif ou multiplicatif
Afin de faire la distinction entre schéma multiplicatif et additif, on peut se baser sur une méthode graphique.
On représente graphiquement les droites passant respectivement par les minimas et les maximas.
On obtient deux cas de figures :
Schéma additif : courbes parallèles.
Les oscillations sont constantes autour du trend et ne dépendent pas de la saison.
Schéma additif : Y=Trend+Saison
60
Données
50
40
30
20
10
0
0
2
4
6
8
10
12
14
Temps
Page 1 sur 5
GEA : Statistiques – Séries chronologiques
Schéma multiplicatif : courbes qui s’écartent (ou se rejoignent).
Les variations saisonnières augmentent (ou diminuent) avec la saison.
Données
Schéma multiplicatif : Y=Trend.Saison
70
60
50
40
30
20
10
0
0
2
4
6
8
10
12
14
Temps
Il existe de nombreuses méthodes permettant de déterminer le Trend et les coefficients saisonniers. Nous nous
limiterons à deux méthodes.
3. Cas multiplicatif
Nous essaierons de "chiffrer" le trend par l'intermédiaire d'une fonction affine et d'estimer les mouvements
saisonniers via les coefficients saisonniers multiplicatifs.
Nous allons étudier une approche basée sur les moyennes mobiles.
1ère étape : moyennes mobiles
Afin d’éliminer ou d’amortir les mouvements cycliques, saisonniers et accidentels, on utilise la technique des
moyennes mobiles. On procède ainsi en quelque sorte au lissage de la courbe.
Théorème : Les moyennes mobiles d’une série soumise à des variations saisonnières ne sont pas soumises à ces
variations si leur longueur est un multiple de la période.
Principe des moyennes mobiles :
Le principe de cette méthode est de calculer des moyennes arithmétiques successives de longueur p fixe à partir des
données originales. Chacune de ces moyennes obtenues correspondra au « milieu » de la période pour laquelle la
moyenne arithmétique vient d’être calculée.
Moyenne d’ordre p impair :
Exemple ordre 3 :
Valeur
Moyenne d’ordre 3
5
6
5+ 6+ 9
≈ 6, 67
3
9
6 + 9 + 15
= 10
3
15
Moyenne d’ordre pair : on réalise la moyenne sur p+1 valeurs avec des coefficients 1/2 aux deux extrémités.
Exemple ordre 4 :
Valeur
3
5
10
13
11
15
Moyenne d’ordre 3
3 + 5 + 10 + 13 + 11
5 + 10 + 13 + 11 + 15
2
2 = 8, 75
2
2 = 11
4
4
AUTRE METHODE : On peut déterminer le trend en se basant sur la méthode des moindres carrés.
2° étape : calcul des coefficients saisonniers.
Le coefficient saisonnier est dans notre cas multiplicatif. Y = Trend x Coefficient saisonnier
Les moyennes mobiles (proches du trend) vont nous permettre de calculer les composantes saisonnières (proches
des coefficients saisonniers).
Composante saisonnière = Y / moy. mobile
Page 2 sur 5
GEA : Statistiques – Séries chronologiques
Calcul des moyennes mobiles ordre 4 (car la périodicité est 4) puis calcul des composantes saisonnières :
Année
Trimestre
CA = Y
Moyenne mobile
Composante
Saisonnière
Année 1
1
5
2
15,6
Année 2
3
9,6
15
Année 3
4
1
2
3
4
1
2
26,6 11 32,5 19,6 43,4 17 44,4
17,8 21,2 24,5 27,4 29,6 31,7 34,3
3
24
4
60,2
0,64 1,49 0,52 1,33 0,72 1,47 0,54 1,29
Moyenne mobile M oye nne s m obile s
70
Données
60
50
40
30
20
10
0
0
5
Trim e s tre s
10
15
Pour déterminer les coefficients saisonniers, il suffit de réaliser la moyenne des composantes saisonnières sur
chaque saison puis de normaliser ces coefficients pour obtenir une moyenne de 1.
Moyenne des composantes saisonnières :
Trimestre
1
Coeff. Saisonnier =
0,52 + 0,54
= 0,53
Moyenne des composantes
2
saisonnières
2
3
4
1,31
0,68
1,48
Normalisation :
Si la moyenne des coefficients saisonniers ne vaut pas 1, on normalise. Pour cela, on divise chaque coefficient
saisonnier par la moyenne des coefficients saisonniers. On obtient alors les coefficients saisonniers normalisés.
Coeff .
Coeff. Normalisé =
Moyenne des coeff.
Calcul des valeurs désaisonnalisées à partir des coefficients saisonniers normalisés :
On obtient les valeurs désaisonnalisées en divisant les valeurs réelles par le coefficient saisonnier :
Valeur désaisonnalisée = Y / coefficient saisonnier normalisé
Trimestre
1
Y = CA
5
Coeff. Saisonnier 0,53
Valeurs désaiso. 9,46
2
3
4
5
6
7
8
9
10
11
12
15,6
1,31
11,9
9,6
0,68
14,1
26,6
1,48
18
11
0,53
20,8
32,5
1,31
24,8
19,6
0,68
28,9
43,4
1,48
29,3
17
0,53
32,2
44,4
1,31
33,9
24
0,68
35,3
60,2
1,48
40,7
Vale urs dé s ais onnalis é e s
80
60
40
20
0
0
5
10
15
3° étape : Calcul du trend
Pour déterminer le Trend, il suffit d’utiliser une méthode d’ajustement linéaire comme celle des moindres carrés sur
les valeurs désaisonnalisées. On trouve une équation pour le Trend de la forme y=ax+b donc on a donc :
Tendance = ax + b
Page 3 sur 5
GEA : Statistiques – Séries chronologiques
4° étape : Prévisions
Pour réaliser une prévision, il suffit dans un premier temps réaliser la prévision grâce à l'équation obtenue pour le
trend, puis de multiplier par le coefficient saisonnier.
Y prévisible = Tendance x coefficient saisonnier normalisé
4. Cas additif
Dans le cas additif, nous pouvons adapter la méthode précédente basée sur les moyennes mobiles.
On doit adapter les formules :
Calcul des composantes saisonnières :
Composante saisonnière = Y – Moyenne mobile
Normalisation :
Si la moyenne des coefficients saisonniers ne vaut pas 0, on normalise. Pour cela, on enlève à chaque coefficient
saisonnier, la moyenne des coefficients saisonniers. On obtient alors les coefficients saisonniers normalisés.
Coef saisonnier normalisé = coef saisonnier – moyenne des coefs saisonniers
Puis on calcule les valeurs désaisonnalisées :
Valeur désaisonnalisée = Y – coefficient saisonnier normalisé
Pour faire des prévisions, on calcule la tendance (par la méthode des moindres carrés à partir des valeurs
désaisonnalisées), puis on ajoute le coefficient saisonnier.
Y prévisible = Tendance + coefficient saisonnier
Une autre méthode est celle de Buys-Ballot, ci-dessous.
Principe de Buys-Ballot
Le filtre de Buys-Ballot concerne les séries chronologiques suivant un modèle additif et dont la tendance est
linéaire.
Il consiste à estimer les paramètres de ce modèle suivant le critère des moindres carrés, et permet ensuite, dans la
mesure où les hypothèses sont respectées, d'effectuer des prévisions. Mathématiquement, il s’agit en fait d’une
régression linéaire multiple particulière.
Nous supposons donc que la série étudiée suit le modèle additif et que la tendance est linéaire :
Y=at+b
Pour les calculs, nous avons besoin du tableau suivant
p colonnes
Années i\ Trimestres j
n
lignes
Trim. 1
…
2
…
3
…
4
…
…
…
…
m.1
…
…
…
m.2
…
…
…
m.3
…
…
…
m.4
Total=mi.
m1.
Année 1
2
3
4
Total=m.j
m2.
m3.
m4.
m
Pour exprimer la tendance en fonction de la ligne i (allant de 1 à n) et de la colonne j (allant de 1 à p) du tableau,
nous établissons une relation et les variables t, i et j : t = (i-1) p + j variant de 1à 16.
Le modèle complet est le suivant : Yi,j = a[ (i-1) p + j ] + b + Sj
Le critère des moindres carrés consiste à déterminer les paramètres b, a, S1, S2, S3 et S4 de façon à minimiser la
somme des carrés des différences ei,j = xij – [a[(i-1) p + j ] + b + Sj ] entre la valeur observée xij et la valeur estimée
par le modèle : b [(i-1) p + j ] + a + Sj.
On calculera les estimations des paramètres à l’aide des formules suivantes :
a=
12  n
n(n + 1) 
imi. −
m
∑

pn(n²-1)  i = 1
2

b=m-
a(np+1)
2
p + 1

S j = m. j − m − a  j −

2 

avec les notations suivantes :
m : moyenne de la totalité des observations
mi. : moyenne des observations de la ligne i : moyenne « annuelle »
m.j : moyenne des observations de la colonne j : « moyenne trimestrielle »
Yi,j = a[ (i-1) p + j ] + b + Sj
Page 4 sur 5
GEA : Statistiques – Séries chronologiques
Cas pratique
Pour illustrer la méthode de Buys-ballot, nous nous baserons sur l’évolution suivante représentant le nombre de
clients dans une boutique de sports en fonction des trimestres :
Années\ Trimestres
1
2
3
4
2001
1050
1300
1500
1300
2002
1050
1400
1750
1350
2003
1100
1550
1850
1450
2004
1150
1700
2000
1550
CA
Nombre clients
2150
1950
1750
1550
1350
1150
950
750
0
5
10
15
20
Trim e s tre s : 2001-->2004
Pour les calculs, nous avons besoin du tableau suivant :
Années i\ Trimestres j
1
2
3
4
mi.
1
1050
1300
1500
1300
1287,5
2
1050
1400
1750
1350
1387,5
3
1100
1550
1850
1450
1487,5
4
1150
1700
2000
1550
1600
m.j
1087,5
1487,5
1775,0
1412,5
m=1440,6
Après calcul des différents coefficients, nous arrivons sur notre exemple à la fonction d'ajustement suivante :
 -314.22 : 1er trimestre

ème
 59.84 : 2 trimestre
Yi,k =25.94 ( 4(i-1)+k ) + 1220.16 + 
ème
 321.41 : 3 trimestre
 -67.03 : 4ème trimestre

Les prévisions sont alors possibles.
Page 5 sur 5