Econométrie 1. Matière du cours 2. Questions / exercices
Transcription
Econométrie 1. Matière du cours 2. Questions / exercices
Econométrie Cours 5 1. Matière du cours • Syllabus : p. 70 - 95. • Bouquin HGL (2008) : p. 75 - 88 + p. 93 - 97. 2. Questions / exercices 1- On considère à nouveau le cas particulier du modèle de régression linéaire simple envisagé à l’exercice 4 des cours 1 et 2, ainsi qu’à l’exercice 1 des cours 3 et 4. a- En quoi consisterait, pour le cas particulier de ce modèle, un estimateur/prédicteur de E(y0 ) et de y0 . Vérifiez la forme que prendraient l’espérance et la variance des erreurs de prévision p̂0 et fˆ0 dans ce cas particulier, ainsi que le forme que prendrait un intervalle de prévision pour E(y0 ) et un intervalle de prévision pour y0 . Que vous rappelle l’expression obtenue pour l’intervalle de prévision pour E(y0 ) ? (conseil : considérez le cas particulier où X0 est un scalaire égal à 1). b- Vérifiez que lors de l’estimation d’un tel modèle (régression de y sur une constante), on a toujours SCT = SCR, et donc un R2 égal à zéro. 2- Les propositions suivantes sont-elles vraies ou fausses ? Justifiez. a- ŷ0 = β̂ 1 + β̂ 2 x0 est un prédicteur non biaisé de y0 = β 1 + β 2 x0 + e0 car E(ŷ0 ) = y0 . b- De l’estimation par MCO du modèle de régression simple P oidsi = β 1 + β 2 T aillei + ei sur base d’un échantillon aléatoire de 253 étudiants de la Faculté de médecine, on a obtenu comme intervalle de prévision à 95% pour le poids (en kg) d’un individu mesurant 1, 72 m l’intervalle [52, 6; 74, 7]. On peut interpréter ce résultat en disant que chaque fois que l’on tire un étudiant au hasard parmi les étudiants de la Faculté de médecine qui 1 2 mesurent 1, 72 m, il y a 95% de chance qu’il ait un poids compris entre 52, 6 kg et 74, 7 kg. 3- On considère le modèle : prixi = β 1 + β 2 supi + ei où : prixi = le prix de la maison i (en millions de Frs) supi = la superficie de la maison i (en m2 ) L’estimation de ce modèle par MCO sur un échantillon 72 annonces parues en 1999 dans la région liégeoise a donné les résultats suivants : Model 1: OLS, using observations 1-72 Dependent variable: prix const sup coefficient std. error t-ratio p-value -2.94 0.431 -6.821 2.64e-09 *** 0.052 0.021 2.476 0.0157 ** a- Calculez un intervalle de confiance à 95% pour β 2 . b- Supposons que la variable prix ait été mesurée en milliers d’euros plutôt qu’en millions de francs (1 euro = 40 frs). Dans ce cas de figure : i- Quels auraient été les valeurs estimées β̂ 1 , β̂ 2 , s.ê.(β̂ 1 ) et s.ê.(β̂ 2 ) ? ii- Quel aurait été l’intervalle de confiance à 95% pour β 2 ? iii- Quel aurait été la P -valeur du t-test de H0 : β 2 = 0 contre H1 : β2 = 0 ? iv- La P -valeur du t-test de H0 : β 2 ≥ 0, 1 contre H1 : β 2 < 0, 1 auraitelle été modifiée ? v- Le R2 de la régression aurait-il été modifié ? vi- Comment se serait modifié tout intervalle de prévision pour le prix d’une maison ayant une superficie donnée ? c- Mêmes questions i. à vi. que ci-dessus, mais en supposant cette fois que la variable sup ait été mesurée en ares plutôt qu’en m2 (1 are = 100 m2 ), la variable prix étant toujours mesurée en millions de francs. 4- Les propositions suivantes sont-elles vraies ou fausses. Expliquez. a- Si, dans le cadre d’un modèle de type lin - log : yi = β 1 + β 2 ln xi + ei , on modifiait l’unité de mesure de yi , la valeur estimée du paramètre β 2 , le R2 de la régression et le t-test de H0 : β 2 = 0 contre H1 : β 2 = 0 resteraient inchangés. b- Si, dans le cadre d’un modèle de type log - lin : ln yi = β 1 + β 2 xi + ei , on modifiait l’unité de mesure de xi , la valeur estimée du paramètre β 2 et le R2 de la régression et le t-test de H0 : β 2 = 0 contre H1 : β 2 = 0 resteraient inchangés. c- Si, dans le cadre d’un modèle de type log - log : ln yi = β 1 + β 2 ln xi + ei , on modifiait les unités de mesure de yi et/ou de xi , la valeur estimée des 3 paramètres β 1 et β 2 de la régression resteraient inchangés. d- Un modèle de régression simple de type lin - log : yi = β 1 + β 2 ln xi + ei semble à première vue adéquat pour modéliser les observations représentées par le graphique ci-dessous. e- L’estimation par MCO sur un échantillon aléatoire de travailleurs du modèle ln Sali = β 1 + β 2 Educi + ei (Sali = salaire de l’individu i; Educi = nbr. d’années d’étude de l’individu i) a donné pour le paramètre β 2 : β̂ 2 = 0, 06. Sachant que le niveau d’éducation médian des individus repris dans l’échantillon est de 13 années d’étude, on peut en déduire qu’une estimation de l’élasticité du salaire par rapport au nbr. d’années d’étude pour ce niveau médian d’éducation est donnée par 0, 06 × 13 = 0, 78. 5- On considère à nouveau l’échantillon de 113 observations de couples poids / taille envisagé à l’exercice 8 du cours 1 et à l’exercice 7 des cours 3 et 4. a- L’estimation par MCO du modèle poidsi = β 1 + β 2 taillei + ei donne : Model 1: OLS, using observations 1-113 Dependent variable: Poids const Taille coefficient std. error -121.681 13.492 1.066 0.077 Mean dependent var 64.65487 Sum squared resid 5550.858 R-squared 0.632711 t-ratio -9.019 13.844 p-value 6.45e-015 *** 6.81e-026 *** S.D. dependent var 11.61628 S.E. of regression 7.071614 Adjusted R-squared 0.629402 Covariance matrix of regression coefficients: const Taille 182.024 -1.038 const 0.006 Taille Calculez un intervalle de prévision à 95% pour : i- le poids moyen des individus mesurant 1, 75 m. 4 ii- le poids d’un individu mesurant 1, 75 m. Expliquez d’où vient la forte différence d’étendue de ces deux intervalles de prévision. b- L’estimation par MCO d’un modèle log-log ln poidsi = β 1 +β 2 ln taillei +ei donne : Model 2: OLS, using observations 1-113 Dependent variable: LNPoids const LNTaille coefficient std. error -11.326 1.003 2.998 0.194 Mean dependent var 4.152868 Sum squared resid 1.178941 R-squared 0.682076 t-ratio -11.292 15.454 p-value 3.76e-020 *** 1.95e-029 *** S.D. dependent var 0.181960 S.E. of regression 0.103059 Adjusted R-squared 0.679212 Covariance matrix of regression coefficients: const LNTaille 1.0062 -0.1949 const 0.0378 LNTaille i- Pourquoi peut-il être pertinent de considérer un modèle log-log plutôt que standard (lin-lin) pour la relation entre poids et taille des individus ? Un modèle log-lin pourrait-t-il aussi être pertinent ? Et un modèle lin-log ? Répondez en vous appuyant notamment sur le graphique reproduit à l’exercice 8 du cours 1. ii- Quelle est l’interprétation des paramètres estimés β̂ 1 et β̂ 2 ? iii- Calculez un intervalle de confiance à 95% pour l’élasticité du poids d’un individu par rapport à sa taille. Comparez votre résultat à celui obtenu à l’exercice 7 du cours 3. iv- Calculez un intervalle de prévision à 95% pour le poids d’un individu mesurant 1, 75 m. Comparez votre résultat à celui obtenu cidessus sur base de l’estimation du modèle poidsi = β 1 +β 2 taillei +ei .