Econométrie 1. Matière du cours 2. Questions / exercices

Transcription

Econométrie 1. Matière du cours 2. Questions / exercices
Econométrie
Cours 5
1. Matière du cours
• Syllabus : p. 70 - 95.
• Bouquin HGL (2008) : p. 75 - 88 + p. 93 - 97.
2. Questions / exercices
1- On considère à nouveau le cas particulier du modèle de régression linéaire simple
envisagé à l’exercice 4 des cours 1 et 2, ainsi qu’à l’exercice 1 des cours 3 et 4.
a- En quoi consisterait, pour le cas particulier de ce modèle, un estimateur/prédicteur de E(y0 ) et de y0 . Vérifiez la forme que prendraient
l’espérance et la variance des erreurs de prévision p̂0 et fˆ0 dans ce cas particulier, ainsi que le forme que prendrait un intervalle de prévision pour
E(y0 ) et un intervalle de prévision pour y0 . Que vous rappelle l’expression
obtenue pour l’intervalle de prévision pour E(y0 ) ? (conseil : considérez le
cas particulier où X0 est un scalaire égal à 1).
b- Vérifiez que lors de l’estimation d’un tel modèle (régression de y sur une
constante), on a toujours SCT = SCR, et donc un R2 égal à zéro.
2- Les propositions suivantes sont-elles vraies ou fausses ? Justifiez.
a- ŷ0 = β̂ 1 + β̂ 2 x0 est un prédicteur non biaisé de y0 = β 1 + β 2 x0 + e0 car
E(ŷ0 ) = y0 .
b- De l’estimation par MCO du modèle de régression simple P oidsi = β 1 +
β 2 T aillei + ei sur base d’un échantillon aléatoire de 253 étudiants de la
Faculté de médecine, on a obtenu comme intervalle de prévision à 95% pour
le poids (en kg) d’un individu mesurant 1, 72 m l’intervalle [52, 6; 74, 7].
On peut interpréter ce résultat en disant que chaque fois que l’on tire
un étudiant au hasard parmi les étudiants de la Faculté de médecine qui
1
2
mesurent 1, 72 m, il y a 95% de chance qu’il ait un poids compris entre
52, 6 kg et 74, 7 kg.
3- On considère le modèle :
prixi = β 1 + β 2 supi + ei
où : prixi = le prix de la maison i (en millions de Frs)
supi = la superficie de la maison i (en m2 )
L’estimation de ce modèle par MCO sur un échantillon 72 annonces parues en
1999 dans la région liégeoise a donné les résultats suivants :
Model 1:
OLS, using observations 1-72
Dependent variable: prix
const
sup
coefficient std. error t-ratio
p-value
-2.94
0.431
-6.821 2.64e-09 ***
0.052
0.021
2.476
0.0157 **
a- Calculez un intervalle de confiance à 95% pour β 2 .
b- Supposons que la variable prix ait été mesurée en milliers d’euros plutôt
qu’en millions de francs (1 euro = 40 frs). Dans ce cas de figure :
i- Quels auraient été les valeurs estimées β̂ 1 , β̂ 2 , s.ê.(β̂ 1 ) et s.ê.(β̂ 2 ) ?
ii- Quel aurait été l’intervalle de confiance à 95% pour β 2 ?
iii- Quel aurait été la P -valeur du t-test de H0 : β 2 = 0 contre H1 :
β2 = 0 ?
iv- La P -valeur du t-test de H0 : β 2 ≥ 0, 1 contre H1 : β 2 < 0, 1 auraitelle été modifiée ?
v- Le R2 de la régression aurait-il été modifié ?
vi- Comment se serait modifié tout intervalle de prévision pour le prix
d’une maison ayant une superficie donnée ?
c- Mêmes questions i. à vi. que ci-dessus, mais en supposant cette fois que
la variable sup ait été mesurée en ares plutôt qu’en m2 (1 are = 100 m2 ),
la variable prix étant toujours mesurée en millions de francs.
4- Les propositions suivantes sont-elles vraies ou fausses. Expliquez.
a- Si, dans le cadre d’un modèle de type lin - log : yi = β 1 + β 2 ln xi + ei , on
modifiait l’unité de mesure de yi , la valeur estimée du paramètre β 2 , le R2
de la régression et le t-test de H0 : β 2 = 0 contre H1 : β 2 = 0 resteraient
inchangés.
b- Si, dans le cadre d’un modèle de type log - lin : ln yi = β 1 + β 2 xi + ei , on
modifiait l’unité de mesure de xi , la valeur estimée du paramètre β 2 et le
R2 de la régression et le t-test de H0 : β 2 = 0 contre H1 : β 2 = 0 resteraient
inchangés.
c- Si, dans le cadre d’un modèle de type log - log : ln yi = β 1 + β 2 ln xi + ei ,
on modifiait les unités de mesure de yi et/ou de xi , la valeur estimée des
3
paramètres β 1 et β 2 de la régression resteraient inchangés.
d- Un modèle de régression simple de type lin - log : yi = β 1 + β 2 ln xi + ei
semble à première vue adéquat pour modéliser les observations représentées
par le graphique ci-dessous.
e- L’estimation par MCO sur un échantillon aléatoire de travailleurs du modèle ln Sali = β 1 + β 2 Educi + ei (Sali = salaire de l’individu i; Educi =
nbr. d’années d’étude de l’individu i) a donné pour le paramètre β 2 :
β̂ 2 = 0, 06. Sachant que le niveau d’éducation médian des individus repris
dans l’échantillon est de 13 années d’étude, on peut en déduire qu’une
estimation de l’élasticité du salaire par rapport au nbr. d’années d’étude
pour ce niveau médian d’éducation est donnée par 0, 06 × 13 = 0, 78.
5- On considère à nouveau l’échantillon de 113 observations de couples
poids / taille envisagé à l’exercice 8 du cours 1 et à l’exercice 7 des cours 3
et 4.
a- L’estimation par MCO du modèle poidsi = β 1 + β 2 taillei + ei donne :
Model 1:
OLS, using observations 1-113
Dependent variable: Poids
const
Taille
coefficient std. error
-121.681
13.492
1.066
0.077
Mean dependent var 64.65487
Sum squared resid
5550.858
R-squared
0.632711
t-ratio
-9.019
13.844
p-value
6.45e-015 ***
6.81e-026 ***
S.D. dependent var 11.61628
S.E. of regression
7.071614
Adjusted R-squared 0.629402
Covariance matrix of regression coefficients:
const
Taille
182.024 -1.038 const
0.006 Taille
Calculez un intervalle de prévision à 95% pour :
i- le poids moyen des individus mesurant 1, 75 m.
4
ii- le poids d’un individu mesurant 1, 75 m.
Expliquez d’où vient la forte différence d’étendue de ces deux intervalles
de prévision.
b- L’estimation par MCO d’un modèle log-log ln poidsi = β 1 +β 2 ln taillei +ei
donne :
Model 2:
OLS, using observations 1-113
Dependent variable: LNPoids
const
LNTaille
coefficient std. error
-11.326
1.003
2.998
0.194
Mean dependent var 4.152868
Sum squared resid
1.178941
R-squared
0.682076
t-ratio
-11.292
15.454
p-value
3.76e-020 ***
1.95e-029 ***
S.D. dependent var 0.181960
S.E. of regression
0.103059
Adjusted R-squared 0.679212
Covariance matrix of regression coefficients:
const LNTaille
1.0062 -0.1949
const
0.0378
LNTaille
i- Pourquoi peut-il être pertinent de considérer un modèle log-log
plutôt que standard (lin-lin) pour la relation entre poids et taille
des individus ? Un modèle log-lin pourrait-t-il aussi être pertinent ?
Et un modèle lin-log ? Répondez en vous appuyant notamment sur
le graphique reproduit à l’exercice 8 du cours 1.
ii- Quelle est l’interprétation des paramètres estimés β̂ 1 et β̂ 2 ?
iii- Calculez un intervalle de confiance à 95% pour l’élasticité du poids
d’un individu par rapport à sa taille. Comparez votre résultat à
celui obtenu à l’exercice 7 du cours 3.
iv- Calculez un intervalle de prévision à 95% pour le poids d’un individu mesurant 1, 75 m. Comparez votre résultat à celui obtenu cidessus sur base de l’estimation du modèle poidsi = β 1 +β 2 taillei +ei .