L`économétrie des panels
Transcription
L`économétrie des panels
Formation SPdS, Paris, 3 décembre 2004 L'économétrie des panels Alban THOMAS [email protected] 1 Introduction Données de panel : Séquence d'observations sur une population (ménages, entreprises, pays). En anglais : cross-sections over time ou pooled cross-section timeseries data. Fondamental : Deux dimensions (individuelle et temporelle). 1.1 Gains à fusionner des données dans les deux dimensions 1.1.1 Moins de collinéarité entre les variables explicatives En économie de la production et de la consommation, les prix sont diciles à utiliser : Séries temporelles : Les indices de prix agrégés sont très collinéaires ; Coupe instantanée : Pas susamment de variation de prix entre rmes ou individus. Avec données de panel, prise en compte des variations entre individus et périodes. Séries temporelles : pas d'information sur l'impact des caractéristiques individuelles (variables socio-économiques,...) ; Coupes instantanées : pas d'information sur les dynamiques d'ajustement. 2 1.1.2 Identication de termes individuels inobservables Sous certaines conditions (voir plus loin). Si le nombre d'observations est susamment grand, on peut estimer des termes d'hétérogénéité individuelle inobservable. 1.1.3 Réduction du biais (variables manquantes/inobservables) Avec le panel, facile de contrôler l'hétérogénéité inobservable entre les individus (d'où la popularité de ces méthodes). Exemple : Décision de production et ecacité des entreprises max = pQ C (; Q) où C p : prix de vente, Q : quantité C (:) : coût total de production. (; Q) = c(Q); produite, (Q) = AQ , p = @c@Q 1 : terme d'ecacité, (coût Cobb-Douglas) = ( + Q) (coût quadratique). Cas Cobb-Douglas : log Q = (log p log 0 1 1 1 A ). De la condition d'équilibre à l'équation estimable : Observations Qit; pit , hétérogenéité inobservable i , entreprise i, période t. ( ) log Qit = 1 1 (log pit log i A ) Problème d'identication : l'équation estimable est Q~ it = a0 + a1p~it + uit; i = 1; 2; : : : ; N; t = 1; 2; : : : ; T; 3 Q~ it = log Qit, p~it = log pit, a1 = 1=( 1), a0 = ( A E log i) =( 1), Euit = 0. Le modèle est identié si E log i = 0, i.e., Ei = 1. Sinon, A est biasé si i est négligé et E log i 6= 0. où Problème empirique : Corrélation possible entre prix de vente pit et ecacité i. 1.2 Analyse de variance Considérons le modèle yit = i + xiti + "it; i = 1; 2; : : : ; N; t = 1; 2; : : : ; Ti; où xit est scalaire, i et i sont des paramètres, et Ti : nombre de périodes disponibles pour l'individu i. Moments empiriques utiles : yi Sxxi = T X 1 = y Ti X t=1 (xit et Syyi = i T t=1 xi) ; 2 Ti X t=1 (yit it ; xi Sxyi = yi)2; T X 1 = x i T Ti X t=1 t=1 (xit it; xi)(yit i = 1; 2; : : : ; N: L'estimateur par Moindres Carrés est calculé par ^ i = Sxyi=Sxxi et 4 ^ i = yi xi^ ; yi); et la i est Somme des Carrés des Résidus (RSS) pour l'individu RSSi = Syyi 2 Sxyi =Sxxi; with (Ti 2) degrés de liberté: Considérons à présent un modèle restreint avec des ordonnées et des pentes constantes : yit = + xit + "it; que l'on obtient en imposant les conditions suivantes : 1 = 2 = = N (= ) 1 = 2 = = N (= ): Sous ces restrictions, l'estimateur des Moindres Carrés sera P N P Ti ^ = et ^ = y x^ , où 1 y = P N T ( i=1 t=1 xit PN PTi i=1 t=1 Ti N X X i i i=1 t=1 x)(yit y) (xit x)2 1 x = P N T yit; i i i=1 t=1 La Somme des Carrés des Résidus est hP P N Ti T N i XX i =1 t=1 yit RSS yit y 2 PN PTi = i=1 t=1 ( ( ) avec comme degrés de liberté : Ti N X X i=1 PN i=1 Ti 5 t=1 2. xit: y)(xit x) (xit x) 2 i2 ; Pour une majorité d'applications, le premier modèle est trop général et l'estimation demanderait un nombre important de périodes. Si l'hétérogénéité est aditive dans le modèle, on peut considérer la spécication suivante, avec pente constante mais ordonnées diérentes : yit = i + xit + "it: P P En minimisant i t (yit i xit )2 par rapport à i on obtient : XX i t (yit i xit ) = 0; XX i de sorte que ^ i = yi xi ^= et P La RSS a maintenant i Ti paramètres sont estimés). t xit(yit P P xit yit Pi Pt i t xit xit ( ( and , xit ) = 0; i yi) : xi) (N + 1) degrés de liberté (N + 1 C'est le modèle le plus utilisé dans les applications empiriques. 1.3 Quelques dénitions Panel typique : le nombre d'individu N périodes (T ) est petit. est grand et celui des Panel court (long) : quand T est petit (grand). Panel cylindré (balanced panel) : même nombre de périodes pour chaque individu. 6 Panel rotatif : un sous-échantillon d'individus est remplacé à chaque période. Les panels rotatifs peuvent être cylindrés ou non. Pseudo panel : obtenu par fusion de coupes instantanées à diérentes périodes, avec des individus diérents. Attrition : avec des panels longs, la probabilité que l'indivi- dual reste dans l'échantillon décroît avec le nombre de périodes (lassitude, déménagement, décès, faillite, etc.) 2 Le modèle linéaire 2.1 Notation 2.1.1 Notation sous forme scalaire yit = xit + uit; i = 1; 2; : : : ; N; t = 1; 2; : : : ; T; 1 où xit est un vecteur K de variables explicatives, est un vecteur K de paramètres, et uit est le résidu. yit et les composantes de xit varient à la fois entre les individus et dans le temps. ( 1) Composante de la variable dépendante inexpliquée par xit : uit = i + t + "it; où i est l'eet une erreur i.i.d. individuel, t est l' eet temporel, et "it est 7 Modèle à erreurs composées de type I : uit = i + "it. Modèle à erreurs composées de type II : uit = i + t + "it. Permet diérentes prédictions de yit sachant Xit : E (yitjxit) = xit; E (yitjxit; i) = xit + i pour l'individu i, E (yitjxit; t) = xit + t pour la période t, E (yitjxit; i; t) = xit + i + t pour l'individu i et la période t. 2.1.2 Notation sous forme matricielle Y = X + + + "; où Y; ; et " sont (NT 1), X est (NT K ). Convention : l'indice t est le plus rapide, l'indice i est le plus lent : 0 B B B B B B B B B B B B B B B B B B B B @ y11 2 1 .. . C C y1T C C y21 C C C .. C . C y2T C C .. C . C yit C C C .. C . C yN 1 C C .. A . yNT = 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 4 (1) X11 .. . X1(1)T (1) X21 .. . X2(1)T .. . Xit(1) .. . XN(1)1 .. . (1) XNT (K ) X11 .. . X1(KT ) (K ) X21 .. . X2(KT ) .. . Xit(K ) .. . XN(K1) .. . (K ) XNT 8 3 7 7 7 7 70 7 7 7B 7B 7B 7B 7B 7B 7B 7@ 7 7 7 7 7 7 7 5 1 2 1 C C .. C . C k C C .. C . A K +++" 2.1.3 Modèle sous forme vectorielle yi = Xi + i + + "i; i = 1; 2; : : : ; N; où yi is T 1, Xi est T K . Note : = (1; 2; : : : ; T )0 et i = (i ; i ; : : : ; i )0 sont (T 1). 2.1.4 Matrices et opérateurs usuels INT : matrice identité avec NT lignes et NT colonnes ; eT : vecteur T 1 de 1 ; B = IN (1=T )eT e0T : Opérateur Inter-individus (Bet- ween Groups) ; B = (1=N )eN e0N IT : Opérateur Inter-périodes (Between Periods) ; Q = INT IN (1=T )eT e0T = INT B: Q = INT (1=N )eN e0N IT = INT B : Opérateur Intra-individu (Within Groups) ; Opérateur Intra-période (Within Periods) ; B B = (1=NT )eNT e0NT : Calcule la moyenne dans la population. Hypothèse importante : Pas de terme constant dans le modèle. Sinon, utiliser B B pour décentrer toutes les variables. 9 Les opérateurs B sont utilisés pour calculer, à partir des vecteurs et matrices à NT lignes, les moyennes spéciques aux individus et aux périodes, qui sont aussi à NT lignes. Les opérateurs Q sont utilisés pour calculer les écarts à ces moyennes. 2.1.5 Propriétés importantes de ces opérateurs Symétrie, idempotence et orthogonalité Q0 = Q; B 0 = B; Q2 = Q; B 2 = B; BQ = QB = 0; Rang d'une matrice idempotente = sa trace 1) and rank(B ) = N: Décomposition de l'opérateur Q avec N = T = 2 : 02 1 0 0 0 3 1 B6 0 1 0 0 7 1 0 1 1 1 C C 6 7 Qy = B @4 0 0 1 0 5 0 1 2 1 1 Ay 0 0 0 1 1 2 0 1 1 0 0 30 y 1 y B y C 1 6 1 1 0 0 7B y C C 6 7B C =B @ y A 2 4 0 0 1 1 5@ y A y 0 0 1 1 y 0 1 0 1 y y +y B y C 1B y +y C C B C =B @ y A 2@ y +y A y y +y ) rank(Q) = N (T 11 11 12 12 21 21 22 22 11 11 12 12 11 12 21 21 22 22 21 22 Nous utiliserons aussi, dans la notation vectorielle BT =T eT e0T : Opérateur Between pour un seul individu ; = (1 ) 10 QT = IT (1=T )eT e0T = IT seul individu. BT : Opérateur Within pour un 2.2 Le modèle à eets xes de type I Terminologie : le modèle à eets xes ne signie pas que les eets individuels i ne sont pas aléatoires dans le vrai modèle ! Plutôt, l'estimation est menée conditionnellement à l'hétérogénéité inobservée : les i sont traités comme des paramètres à estimer. 2.2.1 L'estimateur en termes du théorème de Frisch-Waugh-Lovell L'inférence est conditionnelle aux eets individuels : les estimations sont obtenues en régressant Y sur X et des indicatrices individuelles. Soit E la matrice NT N des indicatrices individuelles : 2 3 1 61 6 61 6 60 6 60 6 60 E=6 6 . 6 .. 6 6 6 6 6 6 6 4 0 0 0 " 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 " 0 0 0 0 0 0 .. . 1 1 1 " (i = 1) (i = 2) (i = N ) 11 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 5 et considérons le modèle = X + E + " = W + u où W = [X; E ], = ( 0; 0)0, u = ". Y : Les paramètres estimés sont numériquement identiques dans les 2 procédures suivantes : Théorème de Frish-Waugh-Lovell ^ de ^MCO = (^ 0; ^0)0 = (W 0W ) ^ = (X X ) X Y ; où 0 1 0 1 W 0Y X = [I E (E 0E ) 1E 0]X = PE X; Y = [I E (E 0E ) 1E 0]Y = PE Y (résidus de la régression linéaire de X et Y sur E ). Mais E = IN eT , E 0 E = IN e0T eT = IN T , PE = I E (E 0E ) 1E 0 = I T1 E (IN )E 0 = I T1 (IN eT )(IN eT )0 = I IN T1 eT e0T = Q. ^ = (X X ) (X Y ) = (X 0PE0 PE X ) (X 0PE0 PE Y ) = (X 0QX ) (X 0QY ). Par conséquent, 0 0 1 1 1 Idée derrière la procédure d'estimation des eets xes : Eliminer les eets individuels , Eliminer les écarts spéciques aux individus (des variables) Transformation du modèle linéaire : X X yit , Y 1=T BY t yit = (xit = (X 1=T t xit) + uit BX ) + u Bu 12 , QY 1=T X t uit = QX + Qu: Estimateur par Moindres Carrés : ^ = [(QX )0(QX )] = (X 0QX ) 2.2.2 1 X 0 QY (QX )0QY = [X 0Q0QX ] (X 0Q0QY ) ^ ) = " (X 0QX ) . et V ar( 1 1 2 1 Interprétation comme un estimateur de covariance Modèle en forme vectorielle : 2 3 2 3 2 y1 6y 6 2 6 .. 4. yN 7 7 7 5 x1 6x 6 2 7 7 7 5 = 64 ... xN 2 eT 3 2 3 0T 7 6 7 0 T 7 + ... 75 + 664 e... T 775 0T 0T 6 6 6 4 1 3 2 0T " 60 7 6" + + 664 ... T 775 N + 664 ... eT 2 3 1 2 "N 7 7 7; 5 avec les hypothèses : E ("i) = 0; E ("i"0i) = "2IT ; E ("i"0j ) = 0 i 6= j: Les estimateurs MCO (Moindres Carrés Ordinaires) de s'obtiennent comme min N X i=1 "0 " i i = N X i=1 (yi xi )0(yi i i et i xi ) , ^ i = yi xi; i = 1; 2; : : : ; N; et, en substituant la dérivée partielle par rapport à , nous avons ^ = " N;T X i;t (xit xi)(xit xi)0 # 13 1 " N;T X i;t # (xit xi)(yit yi) : Cet estimateur est appelé L'estimateur de la covariance (covariance estimator), ou l'estimateur LSDV (Least-Square DummyVariable). est sans biais, convergent lorsque N ou T tend vers l'inni. Sa matrice de variance-covariance s'écrit " N # 1 X ^ V ar ^ où QT = ^ " = IT (1=T )eT e0T . 2 i=1 xiQT x0i ; ^ i est sans biais mais convergent seulement quand T 2.2.3 ! 1. Commentaires Transformation du modèle par ltrage de la composante individuelle ) les coecients associés aux régresseurs invariant dans le temps ne sont pas identiés. La procédure "Eets Fixes" utilise les variations les périodes pour chaque individu, d'où son nom. within entre Autre possibilité : la procédure Between, qui utilise les va- riations entre les individus : BY = BX + B + B"; ^ = [(BX )0(BX )] 1 (BX )0BY = [X 0 BX ] 1 X 0BY: Cet estimateur utilise les diérences entre les moyennes individuelles des variables du modèle. PT 1 Si X1 varie dans le temps seulement, BX1 t x1it i;t T i, et le terme constant (ordonnée à l'origine) n'est pas identié. =f g = x1 8 Une remarque concernant le calcul de l'estimateur de la variance-covariance. Dans le modèle QY = QX + Qu, les 14 logiciels statistiques diviseraient RSS par NT exclus). Mais dans le modèle Y X E divisée par N T K. ( = 1) + + K (eets xes + ", la RSS serait L'estimateur de la variance dans le modèle à eets xes doit être multiplié par NT K = N T K. ( )[ ( 1) ] Y Æ .............. . . . . . . . . . . . . . . ..... 3................. Within . . .... ............ . . . y . . . . . . . . 2. Between 1........... X 15 2.2.4 Tests de poolability et eets individuels Poolability Comme avant : yit = i + xiti + "it versus yit = i + xit + "it; mais maintenant xit est un vecteur 1 K . H0 : 1 = 2 = = N (= ) (K (N 1) contraintes). La statistique de test de Fisher est : (RRSS URSS )=K (N URSS=N (T K 1) 1) v F (K (N 1); N (T où RRSS : de la régression Within PN et URSS : i=1 RSSi où RSSi = = Syyi K 1)) ; 2 Sxyi =Sxxi. Test des eets individuels H0 : 1 = = N (= ). yit = + xit + "it (MCO) yit = i + xit + "it (Within): versus La statistique de test de Fisher est : (RRSS URSS )=(N 1) v F ((N URSS=(NT N K ) 1); NT N K )) ; où RRSS : provient de la régression MCO sur les données fusionnées (pooled data) et URSS : provient de la régression Within (LSDV) . 16 2.3 Le modèle à eets aléatoires 2.3.1 Notations et hypothèses Problème avec le modèle Eets Fixes : perte de (beaucoup de) degrés de liberté quand N . Approche diérente : traiter les eets individuels comme des eets aléatoires, i.e., l'inférence sur le modèle est marginale (non conditionnelle aux i ) par rapport à la population de tous les eets. !1 Hypothèses : i v IID(0; 2 ); "it v IID(0; "2); E (i"it) = E (ixit) = 0; avec E (ij ) = E ("it"sj ) = Ainsi cov t s. Soit 6= T "2 0 2 0 = j; si i sinon; = j et t = s; si i sinon: (uit; ujs) = + " si i = j et t = s, et si i = j et 2 2 2 = E (u u0 ) = i i une matrice (T On a 6 6 6 4 2 + " 2 2 + "2 2 2 2 .. . 2 2 3 2 2 .. . 2 + "2 7 7 7; 5 T ), pour chaque individu i, i = 1; 2; : : : ; N . = IN (eT e0T ) + " IT = IN (T BT ) + " (QT + BT ) E (uu0) = = IN T 2 2 2 17 2 QT = IT BT and BT = (1=T )eT e0T . Par conséquent, = IN 2 (T BT ) + "2(QT + BT ) = T 2 B + "2INT ou de façon équivalente : = "2 Q + (T 2 + "2 )B . puisque 2.3.2 Estimation par Moindres Carrés Généralisés du Modèle à Eets Aléatoires Forme générale : Y = X + U; with E (UU 0) = . Les Moindres Carrés Généralisés (MCG, GLS en anglais) fournissent des estimations ecaces (de variance minimum) de , 2 et "2, basées sur une structure connue de variance-covariance . 0 1 1 0 1 ^ MCG = X X X Y ^ MCG) = "2 X 0 1X et V ar( Calcul de 1 1 . : utilisation de la formule r = (" )r Q + (T + " )r B 2 2 2 pour un scalaire arbitraire r. On se base sur les propriétés d'idempotence et d'orthogonalité de Q and B . En particulier, des matrices utiles sont = 1 Q + T 1+ 1 2 2 " et 2 " B = 1 Q + (T +1 ) = B: " " ^ MCG = X 0 X X 0 Y On a " # " # = X0 X X0 Y : = 1 2 2 1 1 1 2 1 2 1 1 "2 1 "2 18 = où h X 0 (Q + B ) 1 X i 1 h X 0 (Q + B ) 1 = (T 2 + "2)="2 = 1 + T 2 ="2. i Y ; Les MCG comme des Moindres Carrés Pondérés. Prémultiplions le modèle par " 1=2 et utilisons la formule MCO : Y = X + u, où " 1=2 Y = " Y = Q + (" + T )1=2 B Y " 1=2 X = " X = Q + (" + T )1=2 B X; de sorte que Y = (Q + 1=2B )Y; X = (Q + 1=2B )X; et sous forme scalaire : 2.3.3 fyit g = (yit yi) + 1 2 = yi = yit fxitg = (xit xi) + 1 2 = xi = xit (1 p1 )yi (1 p1 )xi: Comparaison entre les MCG, MCO et Eets Fixes 1 ^ MCG = X 0 QX + X 0 BX 1 1 X 0QY + X 0 BY ^ W ithin = (X 0QX ) 1X 0QY; ^ Between = (X 0BX ) 1X 0 BY; de sorte que ^ MCG = S1^ W ithin + S2^ Between; 19 S1 = [X 0QX + 1 X 0BX ] 1X 0QX S2 = [X 0QX + 1 X 0BX ] 1 X BX . où et 0 (i) Si = 0, alors 1= = 1 et ^ MCG = ^ MCO . (ii) Si T ! 1, alors 1= ! 0 et ^ MCG ! ^ W ithin. (iii) Si 1= ! 1, alors ^ MCG ! ^ Between. (iv) V ar(^ W ithin) V ar(^ MCG) est une matrice semi-dénie 2 positive. (v) Si 2.3.4 1= ! 0, alors V ar(^ W ithin) ! V ar(^ MCG). Eets individuels xes ou aléatoires ? Problème crucial en économétrie des panels : comment traiter les eets i ? Comme des paramètres ou comme des eets aléatoires ? ) Si l'inférence est limitée aux individus spéciques dans l'échan- tillon : inférence conditionnelle, on utilise les Eets Fixes. Exemple : Les individus ne sont pas sélectionnés aléatoirement, ou bien toutes les entreprises dans un secteur donné sont sélectionnées. ) Si l'inférence porte sur la population totale : inférence margi- nale (non conditionelle), on utilise les Eets Aléatoires. Exemple : Les individus sont sélectionnés au hasard à partir d'une (grande) population (consommateurs). 20 En pratique Interprétation des eets dans le modèle économique ; Processus d'échantillonnage : purement aléatoire ou non ; Nombre d'individus (pays, régions, ménages,...) ; Interchangeabilité des individus ; Endogénéité des Xit (voir plus loin). Quelques critères de choix Lorsque l'on considère des eets xes individuels, procédure d'estimation Fixed-Eects ou Within. Avec des effets aléatoires, procédure d'estimation MCG (Moindres Carrés Généralisés). Terminologie L'estimateur MCG est une moyenne pondérée des estimateurs Within et Between, où le poids est l'inverse de la variance cor- respondante. L'estimateur Within néglige les variations entre les individus, l'estimateur Between néglige les variations temporelles pour un individu, et enn les MCO donnent un poids égal aux variations Within et Between. Note. Si le modèle contient une ordonnée à l'origine : yit = + xit + i + "it; on utilise B B B au lieu de B (pour éliminer ) dans les formules. 21 2.3.5 Estimateurs Best Quadratic Unbiased Estimators (BQU) des variances 2 Si les erreurs sont normales, les estimations BQU de s'obtiennent à partir de PN PT 2 ^ 2" = u0Qu=tr(Q) = i=1 \ et "2 (uit ui) N (T 1) t=1 N X 0 2 2 et " + T = u Bu=tr(B ) = T u2i =N; car tr(Q) = N (T 1) and tr(B ) = N . i=1 Mais en pratique, les uit sont inconnus et l'on doit estimer les variances à partir de uit . 1/ Wallace et Hussain (1969) : Utiliser les résidus MCO à la place des vrais u ; 2/ Amemiya (1971) : Utiliser les résidus estimés LSDV. On a 2 2 4 ^ p pNT (^" ^ = où 2 \ N (^ 2 " + T 2 2 " ) 2 ) v N 0; 20" 02 4 ; ^ " =T . 2 : Utiliser les erreurs quadratiques moyennes des régressions Within et Between. Erreur quadratique moyenne de la régression Within : 0 2 0 0 1 0 3/ Swamy et Arora (1972) ^ " = Y QY \ Y QX (X QX ) X QY =[N (T et de la régression Between : 0 0 "2 + T 2 = Y BY Y BX (X 0 BX ) 1X 0BY =[N 22 1) K] K 1]: Note : Ordonnée à l'origine dans les régresseurs Between (X ), pas dans la régression Within. (^ ^ ) PN 1 2 : Calculer 2 N 1 i=1 i i , où i sont des paramètres estimés associés aux indicatrices individuelles de la régression LSDV. Et "2 est estimé à partir de la régression Within. 4/ Nerlove (1971) ^ = ^ La méthode d'estimation MCG ci-dessus avec les composantes des variances remplacées par des estimateurs convergents : Feasible GLS , MCG Admissibles. 23 2.4 Exemple : Demande d'eau des ménages Utilisation des logiciels SAS et GAUSS. Dénition des variables : LCONSO : log de la consommation d'eau potable par tête ; LPRICE : log du prix moyen de l'eau distribué, par mètre cube ; LREVENUE : log du revenu par tête. Nombre d'observations : 696 (N = 116, T = 6). Equation linéaire en log : log Qit = i + log pit + log Rit + "it: Utilité : calculer les élasticités-prix et revenu : P p @ log Q = = ; = @Q @p Q @ log p R = 24 @Q R @ log Q = = : @R Q @ log R Exemple : Le logiciel Gauss c /* DYNTAB.PRG 16 01 2001 Residential water use */ new ; clear all ; library tscs,pgraph ; tscsset ;graphset ; output le=d :/dea/panel/dyntab.out reset ; output on ; n=116 ; t=6 ; load x[n*t,6]=d :/dea/panel/dyntab3.dat ; id=x[.,1] ; year=x[.,2] ; conso=ln(x[.,3]) ; price=ln(x[.,4]) ; revenue=ln(x[.,5]) ; precip=ln(x[.,6]) ; vnames="year","conso","price","revenue","precip","id" ; call saved(yearconsopricerevenueprecipid,"watle",vnames) ; y= conso ; x= price,revenue ; grp= id ; __title("Water demand equation") ; call tscs("watle",y,x,grp) ; 25 ===================================================================== TSCS Version 3.1.2 1/17/01 3 :51 pm ===================================================================== Data Set : watfile OLS DUMMY VARIABLE RESULTS Dependent variable : conso Observations : Number of Groups : Degrees of freedom : Residual SS : Std error of est : Total SS (corrected) : F = 35.033 P-value = Var price revenue Coef. -0.134245 0.024386 696 116 578 2.578 0.067 2.891 with 2,578 degrees of freedom 0.000 Std. Coef. -0.347461 0.035045 Group Number 1 2 3 ... 114 115 116 Std. Error 0.018447 0.033223 Dummy Variable 4.643484 4.876781 5.252595 ... ... ... 4.839490 4.858434 5.099257 t-Stat -7.277506 0.734009 Standard Error 0.365639 0.370063 0.369474 ... ... ... 0.365496 0.359065 0.366957 F-statistic for equality of dummy variables : F(115, 578) = 58.3964 P-value : 0.0000 26 P-Value 0.000 0.463 OLS ESTIMATE OF CONSTRAINED MODEL Dependent variable : conso Observations : 696 Number of Groups : 116 Degrees of freedom : 693 R-squared : 0.172 Rbar-squared : 0.170 Residual SS : 32.532 Std error of est : 0.217 Total SS (corrected) : 39.308 F = 72.175 with 3,693 degrees of freedom P-value = 0.000 Var Coef. Std. Coef. Std. Error t-Stat P-Value CONSTANT 1.164761 0.598014 1.947715 0.052 price -0.249873 -0.406149 0.022153 -11.279345 0.000 revenue 0.376643 0.257121 0.052746 7.140637 0.000 FULL, RESTRICTED, AND PARTIAL R-SQUARED TERMSDUMMY VARIABLES ARE CONSTRAINED TABLE OF R-SQUARED TERMS R-squaredfull model : 0.934 R-squaredconstrained model : 0.172 Partial R-squared : 0.921 FULL, RESTRICTED, AND PARTIAL R-SQUARED TERMSX VARIABLES ARE CONSTRAINED 27 TABLE OF R-SQUARED TERMS R-squaredfull model : 0.934 R-squaredconstrained model : 0.926 Partial R-squared : 0.108 GLS ERROR COMPONENTS RESULTS Dependent variable : conso Observations : 696 Number of Groups : 116 Degrees of freedom : 693 Residual SS : 3.135 Std error of est : 0.067 Total SS (corrected) : 3.517 F = 22047.870 with 3,693 degrees of freedom P-value = 0.000 Std. errors of error terms : Individual constant terms : 0.206 White noise error : 0.067 Var CONSTANT price revenue Coef. 4.687235 -0.149316 0.053560 Std. Coef. -0.363264 0.071009 Std. Error 0.355285 0.017623 0.032338 28 t-Stat 13.192903 -8.472974 1.656247 P-Value 0.000 0.000 0.098 Group Number 1 2 3 4 5 ... 112 113 114 115 116 Random Components -0.346522 -0.121608 0.250638 -0.020350 0.128761 ... ... ... 0.512636 -0.216224 -0.151243 -0.125587 0.104064 Lagrange Multiplier Test for Error Components Model Null hypothesis : Individual error components do not exist. Chi-squared statistic (1) : 1367.1014 P-value : 0.0000 29 3 Extensions 3.1 Le modèle linéaire de panel Type II La structure d'erreur est de la forme : uit = i + t + "it i = 1; 2; : : : ; N; t = 1; 2; : : : ; T; ou sous forme matricielle : U = (IN eT ) + (eN IT ) + "; avec = (1 ; : : : ; N )0 et = (1 ; : : : ; T )0 . 3.1.1 Le modèle à eets xes i et t sont traités comme des paramètres xes, l'inférence est menée conditionnellement aux N individus sur la période T. 3.1.2 1! Notations L'estimateur eets xes est obtenu en utilisant le nouvel opérateur : Q = IN IT IN (eT e0T =T ) de sorte que Qu = fuit u i utgit : (eN e0N =N ) IT ; En prenant la moyenne sur les individus, nous avons yt = xt + t + "t avec la contrainte N X i=1 i = 0: Et en prenant la moyenne sur les périodes : T X yi = xi + i + "i avec la contrainte t = 0; t=1 30 Les MCO sur les écarts aux moyennes donnent : ^ = (X 0QX ) 1X 0 QY; ^ i = yi xi^ ; ^t = yt xt^ : Si le modèle contient un terme constant, l'opérateur Q devient : Q = IN IT IN (eT e0T =T ) (eN e0N =N ) IT +(eN e0N =N ) (eT e0T =T ) de sorte que Qu = fuit u i ut + ugit, et l'estimateur Within est ^ = (X 0QX ) X 0QY; ^ i = (yi y) (xi x)^ ; ^t = (yt y) (xt x)^ : 1 Test des eets 1/ H0 : 1 = = N = = = T = 0. 1 Statistique de test de Fisher : (RRSS URSS )=(N + T 2) v F (k1; k2); URSS=[(N 1)(T 1) K ] où k1 = N + T 2; k = (N 1)(T 1) K ); 2 et URSS (RSS Non contrainte) : à partir du modèle Within, RRSS : (RSS contrainte) : à partir des MCO sur données fusionnées. 2/ H0 1 N étant donné t ;t T . : = = =0 6= 0 1 Statistique de test de Fisher : (RRSS URSS )=(N 1) v F (k ; k ); URSS=[(N 1)(T 1) K ] 1 31 2 où k1 = N 1; k = (N 1)(T 1) 2 K ); et URSS : du modèle Within, RRSS : de la régression avec indicatrices temporelles seulement : 3/ H0 : 1 (yit yt) = (xit xt) + (uit ut): = = T = 0 étant donné i 6= 0; i N 1. 1 Statistique de test de Fisher : (RRSS URSS )=(T 1) v F (k ; k ); URSS=[(N 1)(T 1) K ] 1 où k1 = T 1; k = (N 1)(T 1) 2 K ); 2 et URSS : du modèle Within, RRSS : de la régression Within comme dans le modèle de Type I : (yit yi) = (xit xi) + (uit ui): 32 3.1.3 Exemple : Fonction de production agricole (Hoch, 1962) Echantillon : 63 agriculteurs du Minnesota (US), sur la période 1946-1951. Estimation d'une fonction de production Cobb-Douglas : log P roduitit = + log T ravailit + log F oncierit + log Machinesit + log Engraisit: 0 1 2 3 4 Motivation pour incorporer des eets spéciques (dans uit) : Climat, identique a priori entre les exploitations (t ) ; Facteurs spéciques à l'exploitation (qualité du sol, savoir-faire, etc.) (i ). Tab. 1 Résultats d'estimation - Fonction de production Cobb- Douglas Estimation 1 (Travail) 2 (Foncier) 3 (Machines) 4 (Engrais) Somme des R 2 Hypothèse (I) (II) (III) i = t = 0 i = 0 t = 0 0.256 0.135 0.163 0.349 0.904 0.721 0.166 0.230 0.261 0.311 0.967 0.813 33 0.043 0.199 0.194 0.289 0.726 0.884 Exemple : Le logiciel SAS c *; * DYNTAB.SAS ; *; * Uses datafile DYNTAB3.DAT ; *; * Create library and file names ; * Change directory information below ; libname water 'd :/dea/panel' ; filename watfile 'd :/dea/panel/dyntab3.dat' ; * Create SAS table and read data from Ascii file ; data wat ; infile watfile ; input id year conso price revenue precip ; * Compute logs ; lconso=log(conso) ; lprice=log(price) ; lrevenue=log(revenue) ; run ; * Descriptive statistics ; proc means data=wat ;run ; * OLS regression ; proc reg data=wat ; model lconso = lprice lrevenue ; run ; * Model 1 : One-way Fixed effects ; 34 * cs=116 : Set the number of cross-sections ; * option /fixone : Set one-way Fixed-effect ; proc tscsreg data=wat cs=116 ; model lconso= lprice lrevenue /fixone ; run ; * Model 2 : Two-way Fixed effects ; * option /fixtwo : Set two-way Fixed-effect ; proc tscsreg data=wat cs=116 ; model lconso= lprice lrevenue /fixtwo ; run ; * Model 3 : One-way Random effects ; * option /ranone : Set one-way Random-effect ; proc tscsreg data=wat cs=116 ; model lconso= lprice lrevenue /ranone ; run ; * Model 4 : Two-way Random effects ; * option /rantwo Set Two-way Random-effect ; proc tscsreg data=wat cs=116 ; model lconso= lprice lrevenue /rantwo ; run ; * Model 5 : One-way Random effects with AR(1) ; * option /ranone parks rho Set One-way Random-effect ; * and compute RHO : Ar(1) parameter ; proc tscsreg data=wat cs=116 ; model lconso= lprice lrevenue /ranone parks rho ; run ; * Compute parameter estimates on each cross section ; proc sort data=wat ; by year ; 35 proc reg data=wat ; model lconso= lprice lrevenue ; by year ; run ; * Compute Within and Between estimates ; * using the MEANS procedure ; proc sort data=wat ; by id ; proc means data=wat noprint ; var lconso lprice lrevenue ; by id ; output out=out1 mean=mconso mprice mrevenue ; data out1 ;set out1 ; keep id mconso mprice mrevenue ; data wat ; merge wat out1 ; by id ; data wat ;set wat ; qconso=lconso-mconso ; qprice=lprice-mprice ; qrevenue=lrevenue-mrevenue ; * Within regression ; proc reg data=wat ; model qconso = qprice qrevenue ; run ; * Between regression ; proc reg data=wat ; model mconso = mprice mrevenue ; run ; 36 ESTIMATES USING TSCSREG PROCEDURE MODEL 1. ONE-WAY FIXED EFFECTS The SAS System 16 :15 Monday, January 22, 2001 3 TSCSREG Procedure Dependent Variable : LCONSO Model Description Estimation Method FIXONE Number of Cross Sections 116 Time Series Length 6 SSE MSE RSQ Model Variance 2.578099 DFE 578 0.00446 Root MSE 0.066786 0.9344 F Test for No Fixed Effects Numerator DF : 115 F value : 58.3964 Denominator DF : 578 Prob.>F : 0.0000 Variable CS 1 CS 2 CS 3 CS 4 CS 5 ... ... CS 112 CS 113 CS 114 CS 115 INTERCEP LPRICE LREVENUE DF 1 1 1 1 1 ... 1 1 1 1 1 1 1 Parameter Estimates Parameter Standard T for H0 : Estimate Error Parameter=0 -0.455773 0.039463 -11.549433 -0.222476 0.039923 -5.572620 0.153338 0.038900 3.941882 -0.131488 0.039174 -3.356518 0.027422 0.038890 0.705132 ... ... ... ... 0.420843 0.040309 10.440506 -0.322888 0.039376 -8.200102 -0.259767 0.038678 -6.716134 -0.240823 0.039379 -6.115479 5.099257 0.366957 13.896065 -0.134245 0.018447 -7.277506 0.024386 0.033223 0.734009 37 Prob > |T| 0.0001 0.0001 0.0001 0.0008 0.4810 ... 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.4632 Variable Label Cross Sec Cross Sec Cross Sec Cross Sec Cross Sec Cross Sec Cross Sec Cross Sec Cross Sec Intercept MODEL 2. TWO-WAY FIXED EFFECTS The SAS System 16 :15 Monday, January 22, 2001 7 TSCSREG Procedure Dependent Variable : LCONSO Model Description Estimation Method FIXTWO Number of Cross Sections 116 Time Series Length 6 SSE MSE RSQ Model Variance 2.205671 DFE 573 0.003849 Root MSE 0.062043 0.9439 F Test for No Fixed Effects Numerator DF : 120 F value : 65.6530 Denominator DF : 573 Prob.>F : 0.0000 Variable CS 1 CS 2 CS 3 ... CS 114 CS 115 TS 1 TS 2 TS 3 TS 4 TS 5 INTERCEP LPRICE LREVENUE DF 1 1 1 ... 1 1 1 1 1 1 1 1 1 1 Parameter Estimates Parameter Standard T for H0 : Estimate Error Parameter=0 -0.535192 0.040793 -13.119702 -0.302435 0.041809 -7.233670 0.120803 0.037066 3.259125 ... ... ... ... ... -0.288486 0.036463 -7.911820 -0.256215 0.036669 -6.987209 -0.102087 0.017883 -5.708681 -0.047565 0.016463 -2.889216 -0.030524 0.014486 -2.107135 -0.007359 0.012507 -0.588378 -0.025528 0.009992 -2.554900 6.316873 0.396540 15.929983 -0.251061 0.034210 -7.338896 -0.053316 0.033244 -1.603773 MODEL 3. ONE-WAY RANDOM EFFECTS 38 Prob > |T| 0.0001 0.0001 0.0012 ... 0.0001 0.0001 0.0001 0.0040 0.0355 0.5565 0.0109 0.0001 0.0001 0.1093 Variable Label Cross Sec Cross Sec Cross Sec Cross Sec Cross Sec Time Seri Time Seri Time Seri Time Seri Time Seri Intercept The SAS System 16 :15 Monday, January 22, 2001 11 TSCSREG Procedure Dependent Variable : LCONSO Model Description Estimation Method RANONE Number of Cross Sections 116 Time Series Length 6 Variance Component Estimates SSE 3.12498 DFE 693 MSE 0.004509 Root MSE 0.067152 RSQ 0.1087 Variance Component for Cross Sections Variance Component for Error 0.043243 0.004460 Hausman Test for Random Effects Degrees of Freedom : 2 m value : 14.4912 Prob. > m : 0.0007 Variable INTERCEP LPRICE LREVENUE DF 1 1 1 Parameter Estimate 4.692305 -0.149074 0.053077 Parameter Estimates Standard T for H0 : Error Parameter=0 0.354917 13.220844 0.017611 -8.465039 0.032306 1.642977 39 Prob > |T| 0.0001 0.0001 0.1008 Variable Label Intercept MODEL 4. TWO-WAY FIXED EFFECTS The SAS System 16 :15 Monday, January 22, 2001 12 TSCSREG Procedure Dependent Variable : LCONSO Model Description Estimation Method RANTWO Number of Cross Sections 116 Time Series Length 6 Variance Component Estimates SSE 2.707154 DFE 693 MSE 0.003906 Root MSE 0.062501 RSQ 0.0907 Variance Component for Cross Sections Variance Component for Time Series Variance Component for Error 0.043638 0.000746 0.003849 Hausman Test for Random Effects Degrees of Freedom : 2 m value : 22.2377 Prob. > m : 0.0000 Variable INTERCEP LPRICE LREVENUE DF 1 1 1 Parameter Estimate 5.674742 -0.225151 -0.018251 Parameter Estimates Standard T for H0 : Error Parameter=0 0.371984 15.255323 0.027604 -8.156464 0.032401 -0.563297 40 Prob > |T| 0.0001 0.0001 0.5734 Variable Label Intercept WITHIN REGRESSION USING PROC REG Source Model Error c Total Analysis Sum of DF Squares 2 0.31252 693 2.57810 695 2.89062 Root MSE Dep Mean C.V. Variable INTERCEP QPRICE QREVENUE DF 1 1 1 of Variance Mean Square F Value 0.15626 42.003 0.00372 0.06099 -0.00000 -1.291786E17 R-square Adj R-sq Prob>F 0.0001 0.1081 0.1055 Parameter Estimates Parameter Standard T for H0 : Estimate Error Parameter=0 -5.28092E-17 0.00231195 -0.000 -0.134245 0.01684666 -7.969 0.024386 0.03034107 0.804 Prob > |T| 1.0000 0.0001 0.4218 Variable Label BETWEEN REGRESSION USING PROC REG Source Model Error C Total DF 2 693 695 Analysis of Variance Sum of Mean Squares Square F Value 7.13103 3.56551 84.369 29.28684 0.04226 36.41786 Root MSE Dep Mean C.V. Variable INTERCEP MPRICE MREVENUE DF 1 1 1 Parameter Estimate -0.176444 -0.259461 0.494483 0.20557 4.99481 4.11576 R-square Adj R-sq 0.1958 0.1935 Parameter Estimates Standard T for H0 : Error Parameter=0 0.68091356 -0.259 0.02278084 -11.389 0.05958703 8.298 41 Prob>F 0.0001 Prob > |T| 0.7956 0.0001 0.0001 Variable Label 3.2 Panels non cylindrés 3.2.1 Introduction Dénition : Le nombre de périodes est diérent entre les individus. Pour l'individu i, nous avons Ti périodes, et le nombre total d'obPN servations est maintenant i=1 Ti (au lieu de NT auparavant). Exemples Entreprises : peuvent fermer, ou être des nouveaux entrants dans le secteur ; Consommateurs : peuvent démenager, décéder, refuser de répondre ; Salariés : Chômage, changement de statut, etc. Problème de l'attrition : la probabilité qu'un individu reste dans l'échantillon diminue au fur et à mesure que le nombre de périodes augmente. 3.2.2 Modèles à eets xes pour panels non-cylindrés Le modèle à eets xes de type I pour panel non-cylindré dérons le modèle non-cylindré avec T1 0 1 0 1 0 =1 3 et T0 = 2 1: Consi- 2 y11 x11 1 "11 B y12 C B x12 C B 1 C B "12 C B C B C B C B C B y13 C = B x13 C + B 1 C + B "13 C : B C B C B C B C @ y21 A @ x21 A @ 2 A @ "21 A y22 x22 2 "22 Pour éliminer , nous avons besoin d'un nouvel opérateur Within : 0 I e e = 3 0 Q = 3 3 3 0 I2 e2e02=2 42 2 = 6 6 6 6 4 2=3 1=3 1=3 0 0 3 1=3 2=3 1=3 0 0 77 1=3 1=3 2=3 0 0 77 ; 0 0 0 1=2 1=2 5 0 0 0 1=2 1=2 et la même procédure que dans le cas cylindré s'applique : où Q = diag(ITi ^ W ithin = (X 0 QX ) 1 X 0 QY eTi e0Ti =Ti)ji=1;2;:::;N . 43 4 Le modèle de panel augmenté Que sont les modèles de panel augmentés ? Implication pour l'estimation ? Techniques spéciales d'estimation lorsque les MCG ne sont plus appropriés. 4.1 Introduction Considérons le modèle yit = xit + zi + i + "it; i = 1; 2; : : : ; N; t = 1; 2; : : : ; T; 1 avec xit un vecteur K de régresseurs variant dans le temps et entre les individus, et zi un vecteur G de régresseurs spéciques à l'individu (invariant dans le temps). 1 Exemple : log SALAIRE = HEURES + EDUC + SEXE + i + "it: 1 1 2 Méthode d'estimation : Within : n'est pas identiable car = QX + (I B )Z + Q + Q" = QX + Q"; puisque BZ = Z . Seul est identiable. Mais une procédure en QY 2 étapes est possible : )^ 1/ Régression Within ; 2/ Régression Between sur yi xi^ = i + Zi + "i; 44 i = 1; 2; : : : ; N; pour estimer les . MCG : A la fois et sont identiables. 4.2 Choix entre Within et MCG L'un des critères de choix entre Within et MCG : présence de zi dans le modèle. Rappel : L'estimateur MCG est convergent et ecace à tion que les régresseurs soient exogènes : E (ixit) = 0 et E (izi) = 0 ( ^ MCG = + X X 1 2 0 X 1 8i; t: = xit + i + "it. ) 6= 0, alors les MCG ne Considérons le modèle non-augmenté yit Si xit est endogène dans le sens E i xit sont pas convergents : 0 1 1 = + X 0 Q + B X où = 1 + T =" , de sorte que la condi- 0 X X 0 1U Q + 1B U ; 2 Q + 1B U = [X 0Q" + X 0(B + B")=] = 0 + X 0B= + 0 = X 0= 6= 0; car E (X 0 ") = 0 and B = . Même problème avec le modèle augmenté, si E Z 0 . ( ) 6= 0 45 E (X 0) 6= 0 et/ou Conséquence importante en practique : Si les (certains) régresseurs sont endogènes, les estimateurs MCG ne sont pas convergents, mais les estimateurs Within le sont car est éliminé. Un autre critère de choix entre Within et MCG : Si régresseurs endogènes Choisir l'estimation Within (mais n'est pas identié) ; Si tous les régresseurs sont exogènes, utiliser les MCG (les plus ecaces). ) Trois problèmes demeurent : toujours pas identié, car dans la régression Between yi xi zi i "i, zi reste corrélé avec i. Si l'on utiliser les Within, tous les régresseurs sont traités comme endogènes (pas de distinction entre xit exogènes et endogènes). Les estimateurs Within ne sont pas ecaces. ^= + + 4.3 Un important test de l'endogénéité Hypothèse nulle : H0 : E (X 0 ) = E (Z 0) = 0 (exogénéité). Comparaison entre 2 estimateurs : H0 ^ MCG ^ W ithin Convergent, Convergent, ecace pas ecace Alternative Pas convergent Convergent Hausman (1978) : Même si les xit sont exogènes, les estimateurs MCG de ne sont pas convergents dans le modèle augmenté. Par 46 conséquent, on peut tester l'exogénéité en utilisant les paramètres estimés de seulement. Statistique de test de Hausman : Sous 0 h H0, HT = ^ W ithin ^ MCG V ar(^ W ithin) V ar(^ MCG ) ^ ^ W ithin MCG v (K ): i 1 2 Remarques ^ MCG et ^ W ithin doivent avoirh les mêmes dimensions. i La matrice de pondération V ar(^ W ithin) V ar(^ MCG) est positive : les MCG sont plus ecaces que les Within sous l'hypothèse nulle. V ar(^ MCG) "2(X 0QX ) 1. Rappel : = " (X 0QX + X 0BX ) 2 1 et V ar(^ w ) Interprétation du nombre de degrés de liberté du test : ( )=0 )=0 ) ( )=0 = L'estimateur Within est basé sur la condition E X 0QU , alors 0 1 0 que le MCG est basé sur E X U E X QU et 0 E X BU . Pour les MCG, nous ajoutons K conditions supplémentaires (en termes de B ) : rang de X . Le test d'Hausman utilise ces restrictions additionnelles. ( )=0 ( 47 ___ ____ ____ ____ ____tm /__ / ____/ / ____/ ___/ / /___/ / /___/ Statistics/Data Analysis ------------------------------------------------------------------------------log: E:\dea\panel\2004\energy.smcl log type: smcl opened on: 15 Apr 2004, 21:59:56 1 . use energy 2 . desc Contains data from energy.dta obs: 1,003 vars: 16 15 Apr 2004 21:59 size: 68,204 (93.0% of memory free) ------------------------------------------------------------------------------storage display value variable name type format label variable label ------------------------------------------------------------------------------pgn float %9.0g Prix gaz naturel eff float %9.0g Effectifs employes pk float %9.0g Prix electricite we float %9.0g Part cout energie : electricite wg float %9.0g Part cout energie : gaz wfl float %9.0g Part cout energie : fuel lourd wfd float %9.0g Part cout energie : fuel domestique wbp float %9.0g Part cout energie : Butane Propane lnpk float %9.0g Log prix electricite lnpgn float %9.0g Log prix gaz naturel, normalise par prix electricite lnpfl float %9.0g Log prix fuel lourd, normalise par prix electricite lnpfd float %9.0g Log prix fuel domestique, normalise par prix electricite lnpbp float %9.0g Log prix Butane-Propane, normalise par prix electricite annee float %9.0g Annee sire float %9.0g Identifiant entreprise leff float %9.0g Log effectifs employes ------------------------------------------------------------------------------Sorted by: sire annee 3 . sum Variable | Obs Mean Std. Dev. Min Max -------------+----------------------------------------------------pgn | 1003 1593.143 575.2697 649.3506 4935.065 eff | 1003 196.7009 165.1831 0 1200 pk | 1003 3591.579 12531.49 76 270000 we | 1003 .6535525 .1700342 .0755102 .989083 wg | 1003 .2682747 .1811665 .0017207 .9244898 wfl | 1003 .0336884 .1027124 0 .7529242 wfd | 1003 .0405599 .0892802 0 .5299442 wbp | 1003 .0039245 .0116155 0 .1561713 lnpk | 1003 7.536383 .2859703 6.365459 8.255204 lnpgn | 1003 -12.74313 1.400228 -18.18878 -9.613284 lnpfl | 1003 -12.56832 1.226006 -17.68294 -9.556078 lnpfd | 1003 -12.48682 1.189972 -17.26859 -9.694551 lnpbp | 1003 -12.45441 1.183546 -17.36138 -9.731269 annee | 1003 1990.54 3.847273 1983 1996 sire | 1003 5.49e+15 2.17e+15 5.48e+13 9.46e+15 leff | 1002 5.044025 .663634 3.332205 7.090077 4 . xtreg wg lnpgn lnpfl lnpfd lnpbp leff, i(sire) fe Fixed-effects (within) regression Group variable (i) : sire Number of obs Number of groups = = 1002 110 R-sq: Obs per group: min = avg = max = 1 9.1 14 within = 0.1410 between = 0.0733 overall = 0.0366 corr(u_i, Xb) = -0.1955 F(5,887) Prob > F = = 29.12 0.0000 -----------------------------------------------------------------------------wg | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------lnpgn | -.1537251 .0181908 -8.45 0.000 -.1894272 -.1180229 lnpfl | .1140461 .0207206 5.50 0.000 .073379 .1547132 lnpfd | -.0047182 .0254882 -0.19 0.853 -.0547425 .045306 lnpbp | .1014905 .0164493 6.17 0.000 .0692063 .1337747 leff | -.0160971 .0193974 -0.83 0.407 -.0541674 .0219731 _cons | 1.029037 .1338883 7.69 0.000 .7662621 1.291812 -------------+---------------------------------------------------------------sigma_u | .14842561 sigma_e | .09943612 rho | .69021761 (fraction of variance due to u_i) -----------------------------------------------------------------------------F test that all u_i=0: F(109, 887) = 12.30 Prob > F = 0.0000 5 . xtreg wg lnpgn lnpfl lnpfd lnpbp leff, i(sire) re Random-effects GLS regression Group variable (i) : sire Number of obs Number of groups = = 1002 110 R-sq: Obs per group: min = avg = max = 1 9.1 14 within = 0.1239 between = 0.4670 overall = 0.2909 Random effects u_i ~ Gaussian corr(u_i, X) = 0 (assumed) Wald chi2(5) Prob > chi2 = = 187.45 0.0000 -----------------------------------------------------------------------------wg | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------lnpgn | -.2144363 .0167928 -12.77 0.000 -.2473497 -.181523 lnpfl | .1528693 .0200142 7.64 0.000 .1136423 .1920964 lnpfd | .0070502 .0252708 0.28 0.780 -.0424797 .05658 lnpbp | .0799307 .0155383 5.14 0.000 .0494761 .1103852 leff | -.0083034 .0143499 -0.58 0.563 -.0364287 .0198219 _cons | .575301 .0904628 6.36 0.000 .3979972 .7526048 -------------+---------------------------------------------------------------sigma_u | .09913539 sigma_e | .09943612 rho | .49848553 (fraction of variance due to u_i) ------------------------------------------------------------------------------ 6 . xthausman Hausman specification test ---- Coefficients ---| Fixed Random wg | Effects Effects Difference -------------+----------------------------------------lnpgn | -.1537251 -.2144363 .0607113 lnpfl | .1140461 .1528693 -.0388232 lnpfd | -.0047182 .0070502 -.0117684 lnpbp | .1014905 .0799307 .0215598 leff | -.0160971 -.0083034 -.0077937 Test: Ho: difference in coefficients not systematic chi2( 5) = (b-B)'[S^(-1)](b-B), S = (S_fe - S_re) = 90.39 Prob>chi2 = 0.0000 7 . xtreg wg lnpgn lnpfl lnpfd lnpbp leff, i(sire) be Between regression (regression on group means) Group variable (i) : sire Number of obs Number of groups = = 1002 110 R-sq: Obs per group: min = avg = max = 1 9.1 14 within = 0.0950 between = 0.5116 overall = 0.3100 sd(u_i + avg(e_i.))= .109751 F(5,104) Prob > F = = 21.78 0.0000 -----------------------------------------------------------------------------wg | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------lnpgn | -.4574283 .0462411 -9.89 0.000 -.5491261 -.3657306 lnpfl | .1751386 .0940214 1.86 0.065 -.0113093 .3615866 lnpfd | .2341099 .1059095 2.21 0.029 .0240874 .4441324 lnpbp | .0808667 .0512214 1.58 0.117 -.0207073 .1824407 leff | -.0404652 .0212932 -1.90 0.060 -.0826905 .0017601 _cons | .7752163 .146705 5.28 0.000 .4842948 1.066138 ------------------------------------------------------------------------------ 8 . predict alpha,u 9 . log close log: E:\dea\panel\2004\energy.smcl log type: smcl closed on: 15 Apr 2004, 22:08:27 ------------------------------------------------------------------------------- 4.4 Estimation par la Variable Instrumentale : l'estimateur MCG de Hausman-Taylor 4.4.1 Estimation par la Variable Instrumentale Méthode alternative : Estimation IV ( Instrumental Variable). Dans un contexte de coupe instantanée avec N observations : Y = X + "; où W est une matrice Si K L, = E (X 0") 6= 0; E (W 0") = 0; N L d'instruments. [W 0(Y X )] = 0 , (W 0Y ) = (W 0X ) ^ = (W 0X ) W 0Y (Estimateur IV): 1 Si L > K , [W 0(Y X )] = 0 (L conditions sur et l'on construit la forme quadratique Y X où PW W W 0W 1W 0 ( ) (Y K paramètres) X )0W (W 0W ) 1W 0 = ( ) ) ^ = (X 0PW0 X ) (X 0PW Y ): 1 Note : en général, les instruments W ne proviennent pas de l'équation. 4.4.2 IV dans un contexte de panel Prise en compte de la structure de variance-covariance ( ) ; Trouver des instruments pertinents, non corrélés avec . Considérons le modèle augmenté général : Y = X + X + Z + Z + + "; 1 1 2 2 1 48 1 2 2 où X1 : X2 : Z1 : Z2 : N K1 exogène, varie selon i et t; N K2 endogène, varie selon i et t; N G1 exogène, varie selon i; N G2 endogène, varie selon i: Posons = (X10 ; X20 ; Z10 ; Z20 ) et = (10 ; 20 ; 10 ; 20 )0 . Forme générale d'un estimateur de la variable instrumentale 1=2 1=2 pour données de panel : Soit Y Y , X X , et 1=2 . Nous avons h i 1h i = = = = PW 0 1=2PW 1=2 PW Y 0 h Calcul de 4.4.3 ^ IV i = 0 1 h i 0 1=2PW 1=2Y : = : comme dans le cas MCG usuel. 1 2 Hypothèses d'exogénéité et une première matrice d'instruments ( )= ( )=0 Hypothèses d'exogénéité : E X10 E Z10 Des instruments évidents sont X1 et Z1 , pas susant car K1 G1 < K1 K2 G1 G2. Instruments supplémentaires : ne doicent pas être corrélés avec . Puisque est la source de l'endogénéity, toute variable non corrélée avec sera un instrument valide. Les meilleurs instruments valides sont fortement corrélés avec X2 et Z2 . QX1 et QX2 sont des instruments valides : E QX1 0 E X10 Q et E QX2 0 E X20 Q . ) 0 + + [( + + ) ]= [ ]=0 [( ) ]= [ X1, équivalent d'utiliser BX1 car nous devons avoir E [X10 1U ] = E [X10 (Q + 1B )U ] = E [X10 B (Q + 1B )U ] Pour 49 ]= puisque BQ = 0 et BB = B . Matrice d'instruments de Hausman-Taylor (1981) : = [QX ; QX ; BX ; Z ] = [QX ; QX ; X ; Z ]: Condition d'identication : Nous avons K + K + G + G paramètres à estimer, avec K + K + K + G instruments (K + K WHT 1 2 1 1 1 2 1 1 1 2 1 2 1 1 2 1 1 2 instruments dans QX ). Par conséquent, la condition d'identication est K1 G2 . 4.4.4 Des procédures plus ecaces : Amemiya-MaCurdy et BreuschMizon-Schmidt Utilisent le fait que si xit est exogène, nous pouvons partir des conditions : E xiti i; t au lieu de E x0ii . Amemiya et MaCurdy (1986) ( ( )=0 ) = 08 8 Amemiya et MaCurdy (1986) suggèrent d'utiliser la matrice X1 dans la liste des instruments : 2 x11 6x 6 11 6 ::: 6 6 6 x21 6 x21 X1 = 6 6 6 ::: 6 6 xN 1 6 6 xN 1 6 4 ::: xN 1 x12 x12 ::: x22 x22 ::: xN 2 xN 2 ::: xN 2 ::: ::: ::: ::: ::: ::: ::: ::: ::: ::: x1T x1T ::: x2T x2T ::: xNT xNT ::: xNT 50 (i = 1; t = 1) (i = 1; t = 2) ::: (i = 2; t = 1) (i = 2; t = 2) ::: (i = N; t = 1) (i = N; t = 2) ::: (i = N; t = T ) 3 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 5 QX1 = 0 et BX1 = X1. La matrice d'instruments est = [QX; X1; Z1], et un estimateur équivalent s'obtient en tel que WAM utilisant WAM = [QX; (QX ); BX ; Z ]; 1 1 où (QX1) est construit comme X1 ci-dessus. 1 Amemiya et MaCurdy : leur matrice d'instruments fournit un estimateur au moins aussi ecace que celui d'Hausman-Taylor, si i n'est pas corrélé avec les régrésseurs t. 8 ( ) [( : On ajoute QX1 à la liste des instruments de Hausman-Taylor, mais comme QX1 ; X1 est de rang K1, on ajoute seulement T K1 instruments. La condition d'identication est T K1 G2 . Condition d'identication ( 1) Breusch, Mizon et Schmidt (1989) ) ] Estimateur encore plus e- cace : basé sur les conditions E QX2it 0i i; t, au lieu de la condition 0 E QT X2i i . Pour BMS, l'estimateur est plus ecace si l'endogénéité dans X2 provient d'une composante invariant dans le temps. Matrice d'instruments de BMS : [( [( ) ]=08 8 ) ]=0 WBMS = [QX; (QX1); (QX2); BX1; Z1] où (QX1) et (QX2) sont construites de la même façon que X1 pour AM. ( ) : Avec BMS, on ajoute QX2 aux instruments de Amemiya-MaCurdy. La condition est alors T K1 T K2 G2. Comme précédemment, on ajoute seulement T K2 instruments, puisque QX2 n'est pas de rang plein, mais de rang égal à T K2. Condition d'identication ( ( 1) 1) ( 1) ( 51 ) + 4.5 Calcul de la matrice de variance-covariance matrix des estimateurs IV Problème ici : Les régresseurs endogènes peuvent fournir des estimateurs non convergents des composantes de la variance dans , en particulier le paramètre . La méthode suggérée par Hausman-Taylor (1981) procure des estimateurs convergents. Soit M1 le vecteur des moyennes individuelles du résidu Within : M1 = BY BX ^ W = B BX (X 0 QX ) 1X 0Q Y = Z + + B BX (X 0QX ) X 0Q "; = (X jX ), Z = (Z jZ ), et = ( ; ). Les 3 derniers 1 où X 1 2 1 2 1 2 termes ci-dessus peuvent être traités comme des résidus centrés, et il sut de trouver des instruments pour Z2 an d'estimer . L'estimateur IV de est ^B = (Z 0PC Z ) 1 (Z 0PC M ); 1 = où PC est la matrice de projection associée aux instruments C X1; Z1 . En utilisant les paramètres estimés W et B , on forme les résidus ( ^ ) u^W = QY QX ^ W and u^B = BY ^ BX ^ W Z ^B : Ces 2 vecteurs de résidus sont utilisés pour calculer les composantes de la variance comme dans le cas standard des Feasible GLS (MCG admissibles). 52 4.5.1 Procédure complète d'estimation MCG-IV Etape 1. Calculer les moyennes individuelles et les écarts à ces moyennes, BX , BY , QX et QY . Etape 2. Estimer les paramètres associés à X en utilisant les Within. Etape 3. Estimer B par la procédure IV ci-dessus. Etape 4. Calculer 2 et "2 à partir de uW et uB , et calculer T 2 =2" . Etape 5. Transformer les variables par la procédure MCG scalaire, e.g., Q B Y yit yi. Etape 6. Calculer la matrice de projection PW à partir de la matrice d'instruments W . Etape 7. Estimer les paramètres . ^ ^=1+ ^ ^ ( + p ) = (1 ^ p ) 4.6 Exemple : Equation de salaire 4.6.1 Spécication du modèle Théorie du Capital Humain : log w = F [X ; ; ED]; où w 1 : taux de salaire; : aptitude du travailleur (inobservée), X1 : variables supplémentaires (secteur, statut, etc.), et ED : niveau d'éducation. Des proxies pour l'aptitude peuvent être utilisée : nombre d'heures travaillées, expérience, etc. Objectif principal : estimer le gain marginal associé à ED : @w=@ED. Mais problème si l'aptitude du travailleur est constante au cours du temps et conditionne ED ? Le vrai modèle serait log w = F [X ; ; ED]; ED = G[; X ]; 1 2 53 où X2 sont des variables supplémentaires, spéciques à l'individu. Si l'aptitude est remplacée par des proxies Z , on a log w = F [X ; Z; ED] + U; ED = G[X ; Z ] + V; où U = F [X ; ; ED] F [X ; Z; ED] et V = G[X ; ] G[X ; Z ]. 1 2 1 2 2 1 2 Deux problèmes lorsque l'on estime la première équation en négligeant la seconde : Si des variables sont communes à X1 et X2 , biais d'endogénéité (à cause de ED) ; Si Z est corrélé avec des variables omises (expliquant l'aptitude), biais d'erreur de mesure. 4.6.2 Application : Rendements de l'éducation Echantillon utilisé : Panel Study of Income Dynamics (PSID), University of Michigan. Voir Baltagi et KhantiAkom 1990, Cornwell et Rupert 1988. 595 individus, sur la période 1976-1982 (7 périodes) : Chefs de ménage (hommes et femmes) agés de 18 à 65 en 1976, avec un salaire non-nul, employés dans des entreprises privées, hors-secteur agricole, pour les années 1976 à 1982. 54 Variables liées au statut de l'emploi LW AGE : log du salaire ; W KS : nombre de semaines travaillées dans l'année ; EXP : expérience professionnelle en années à la date de l'échantillon ; OCC : 1 si col bleu ; IND : 1 si travail dans l'industrie ; UNION : 1 si convention collective dans l'entreprise. Variables liées aux caractéristiques des chefs de famille SMSA : 1 si l'individu réside en zone urbaine ; SOUT H : 1 si l'individu réside dans le sud des Etats-Unis ; MS : Statut Marital, 1 si marié ; F EM : 1 si femme ; BLK : 1 si Noir ; ED : nombre d'années dans le système éducatif. Variables spéciques à l'individu : ED, BLK et F EM . Estimation du modèle non-augmenté (sans les Zi) Variables (EXP E , Variables IND). endogènes (car corrélées à l'aptitude) : X2 : EXP E , UNION , W KS , MS ) ; a priori exogènes : X1 : (OCC , SOUT H , SMSA, a priori 2 Modèle augmenté Yit = X1it1 + X2it2 + Z1i1 + Z2i2 + i + "it Variables a priori endogènes : Z2 : ED ; Variables a priori exogènes : Z1 : (BLK , F EM ). 55 Tab. 2 Echantillon 1 1976-1982. Statistiques descriptives Variable LW AGE EXP W KS OCC IND UNION SOUT H SMSA MS ED F EM BLK Moyenne Ecart-type Minimum Maximum 6.6763 0.4615 4.6052 8.5370 19.8538 10.9664 1.0000 51.0000 46.8115 5.1291 5.0000 52.0000 0.5112 0.4999 0.0000 1.0000 0.3954 0.4890 0.0000 1.0000 0.3640 0.4812 0.0000 1.0000 0.2903 0.4539 0.0000 1.0000 0.6538 0.4758 0.0000 1.0000 0.8144 0.3888 0.0000 1.0000 12.8454 2.7880 4.0000 17.0000 0.1126 0.3161 0.0000 1.0000 0.0723 0.2590 0.0000 1.0000 56 Tab. 3 Variable dépendante : log(salaire). Régresseurs exogènes seulement Constante OCC -0.0696 SOUTH -0.0052 SMSA -0.1287 IND 0.0317 Within MCG 0.0976 (0.0040) (0.02323) -0.0701 (0.02322) (0.05833) -0.0072 (0.05807) (0.03295) -0.1275 (0.03290) (0.02626) 0.0317 (0.02624) 2(4) = 0:551 Notes. Les écarts-types sont entre parenthèses. Tab. 4 variable dépendante : log(salaire). Variables endogènes seulement. Within MCG Constante 0.0561 (0.0024) EXPE 0.1136 (0.002467) 0.1133 (0.002466) EXPE2 -0.0004 (0.000054) -0.0004 (0.000054) WKS 0.0008 (0.0005994) 0.0008 (0.0005994) MS -0.0322 (0.01893) -0.0325 (0.01892) UNION 0.0301 (0.01480) 0.0300 (0.01479) 2(5) = 24:94 Notes. Les écarts-types sont entre parenthèses. 57 Tab. 5 Variable dépendante : log(salaire). Modèle aAugmenté. Constante OCC SOUTH SMSA IND EXPE EXPE2 WKS MS UNION FEM BLK ED -0.0214 -0.0018 -0.0424 0.0192 0.1132 -0.0004 0.0008 -0.0297 0.0327 Within (0.01378) (0.03429) (0.01942) (0.01544) (0.00247) (0.00005) (0.00059) (0.01898) (0.01492) 0.1866 -0.0243 0.0048 -0.0468 0.0148 0.1084 -0.0004 0.0008 -0.0391 0.0375 -0.1666 -0.2639 0.1373 MCG (0.01189) (0.01367) (0.03188) (0.01891) (0.01521) (0.00243) (0.00005) (0.00059) (0.01884) (0.01472) (0.12646) (0.15413) (0.01415) 2(9) = 495:3 Notes. Les écarts-types sont entre parenthèses. Tab. 6 Variable dépendante : log(salaire). Estimation IV Constante OCC SOUTH SMSA IND EXPE EXPE2 WKS MS UNION FEM BLK ED Test 0.1772 -0.0207 0.0074 -0.0418 0.0135 0.1131 -0.0004 0.0008 -0.0298 0.0327 -0.1309 -0.2857 0.1379 HT (0.017) (0.013) (0.031) (0.018) (0.015) (0.002) (0.005) (0.000) (0.018) (0.014) (0.126) (0.155) (0.021) 0.1781 -0.0208 0.0072 -0.0419 0.0136 0.1129 -0.0004 0.0008 -0.0300 0.0324 -0.1320 58 -0.2859 0.1372 AM (0.016) (0.013) (0.031) (0.018) (0.015) (0.002) (0.000) (0.000) (0.018) (0.014) (0.126) (0.155) (0.020) 0.1748 -0.0204 0.0077 -0.0423 0.0138 0.1127 -0.0004 0.0008 -0.0303 0.0326 -0.1337 -0.2793 0.1417 BMS (0.016) (0.013) (0.031) (0.018) (0.015) (0.002) (0.000) (0.000) (0.018) (0.014) (0.126) (0.155) (0.020) 2(3) = 5:23 2(13) = 19:29 2(13) = 12:23 Notes. Les écarts-types sont entre parenthèses. 5 Les modèles de panel dynamiques 5.1 Motivation Utilité des panels dynamiques : Etudier la dynamique d'ajustement dans les variables micro- et macro. ; Estimer des modèles économiques dans un cadre inter-temporel (cycle de vie, nance,...) 5.2 Le modèle dynamique à eets xes Modèle le plus simple : yit = yi;t 1 + i + "it; i = 1; 2; : : : ; N ; t = 1; 2; : : : ; T; = 1; 2; : : : ; N sont supposées ( ) = 0 8i; t, E ("it"js) = " ) = 0 8i; t. où les conditions initiales yi0; i connues. On fait l'hypothèse que E "it si i j; t s et 0 sinon, E i "it Par substitution répétée : = = ( yit = "it + "i;t 5.2.1 1 + "i;t + + 2 2 2 t 1 "i1 + 11 t i + t yi0: Biais de l'estimateur des eets xes L'estimateur Within s'écrit : PN PT ^ = ( i=1 t=1 yit PN PT i=1 t=1 yi)(yi;t yi; 1 (yi;t yi; ) ^ i = yi ^yi; ; 1 1 1 59 2 1 ); où T X 1 y y = i T t=1 Egalement, T X 1 yi; = yi;t T it ; 1 1 t=1 PN PT i=1 t=1 "it "i NT PN PT 1 i=1 t=1 yi;t NT ( 1 ^ = + plimN !1 N;T X NT i;t (yi;t yi; 1 1 ; t=1 )(yi;t ( 1 Cet estimateur existe si le dénominateur si le numerateur converge vers 0. Numerateur : 1 T X 1 "i = T "it: yi; 1 yi; 1 ) 1 2 ); 6= 0 et il est convergent N X 1 "i) = plim N yi; "i )("it i=1 1 car "it est auto-corrélé mais n'est pas corrélé avec i . On utilise T X T T T T yi; 1 = T1 +1 1 On a plim t=1 1 N N X i=1 yi;t 1) + = T1 11 yi + ( (1 ) 1 T "i + 1 "i + + "i;T : 1 T 1 0 = plim N1 1 N X i=1 i 2 2 yi; 1"i = plim ( 2 "2 = T2 1 T ( T X t=1 1 N "it (T 1) (1 60 1 "i T1 N X " T 1 X 1 t=1 i=1 ! "T 1 X 1 T 1 t=1 1 T + T : )2 1 T t T t #) "it #) "it 1 De façon similaire, on montre que plim NT 2 =1 " 2 PN;T i;t (yi;t 1 yi; 1 2 ( T 1) T + T 1 T (1 ) T 2 1 ) 2 2 En formant le rapport de ces 2 termes, le biais asymptotique est T plimN !1 (^ 1 (1 2)(T ) = T1 + 1 1 T1 11 1 T = O(1=T ): 1) 1 T (1 ) 1 Dans le modèle transformé (yit yi) = (yi;t 1 yi; 1 ) + ("it "i); la variable explicative est corrélée avec le résidu, et la corrélation est d'ordre =T . Par conséquent, l'estimateur des eets xes est biaisé dans le cas usuel où N est grand et T est petit. 1 61 Tab. 7 Biais asymptotique de l'estimateur des eets xes - Modèle dynamique 0.2 T 6 8 10 20 40 0.5 6 8 10 20 40 0.7 6 8 10 20 40 0.9 6 8 10 20 40 Biais Pourcent -0.2063 -103.1693 -0.1539 -76.9597 -0.1226 -61.3139 -0.0607 -30.3541 -0.0302 -15.0913 -0.2756 -55.1282 -0.2049 -40.9769 -0.1622 -32.4421 -0.0785 -15.6977 -0.0384 -7.6819 -0.3307 -47.2392 -0.2479 -35.4084 -0.1966 -28.0912 -0.0938 -13.3955 -0.0449 -6.4114 -0.3939 -43.7633 -0.3017 -33.5179 -0.2432 -27.0248 -0.1196 -13.2934 -0.0563 -6.2561 62 5.2.2 Estimation par la Variable Instrumentale Seule façon d'obtenir des estimateurs convergents de lorsque T est petit. Procédure diérente pour éliminer les eets individuels : on utilise les Diérences Premières au lieu de la transformation Within : (yit yi;t 1 ) = (yi;t yi;t ) + ("it yit = yi;t + "it; 1 "i;t 2 1 ) 1 et sous forme vectorielle : yi = yi; + "i; i = 1; 2; : : : ; N: 1 ! Dans ce modèle, yi;t 1 corrélé par construction avec "i;t 1 Besoin d'instruments qui soient non-corréles avec "it "i;t 1 mais corrélés avec yi;t 1 yi;t 2 . Seule possibilité dans le cadre d'une équation unique sans variables extérieures : utiliser les valeurs de la variable dépendante. ( ( ) ) En raison de la nature autorégressive du modèle, des instruments provenant de valeurs futures de yit ne sont pas envisageables, car yit est une fonction récursive de "it; "i;t 1; : : : ; "i1; i; yi0. Pour les valeurs retardées de la variable dépendante, on peut utiliser soit yi;t 2, soit yi;t 2 yi;t 3 : E [yi;t ("it E [(yi;t 2 2 ( "i;t yi;t ) )] = E ("i;t "it) E ("i;t "i;t ) = 0; )("it "i;t )] = E ["i;t ("it "i;t )] E ["i;t ("it "i;t )] = 0; yi;t )] = 0 E ("i;t ) = " ; )(yi;t yi;t )] = 0 E ("i;t ) = " : 1 2 3 1 2 1 2 1 3 E [yi;t (yi;t E [(yi;t yi;t 2 1 2 2 2 3 1 2 63 2 1 2 2 2 2 Les estimateurs IV sont convergents si PN PT N et/ou T !1: (y y )(y y ) ^ = PNi=1PT t=3 it i;t 1 i;t 2 i;t 3 i=1 t=3(yi;t 1 yi;t 2)(yi;t 2 yi;t 3) PN PT y y y ou PNi=1PT t=3 it i;t 1 i;t 2 : i=1 t=3 yi;t 1 yi;t 2 yi;t 2 Conclusion : Avec la transformation Within d'un modèle dynamique, même si i est éliminé, le biais d'endogénéité demeure pour T xé, car l'opérateur Q introduit des erreurs "is corrélées par construction avec la variable explicative (retardée). ^= ( ( ) ) Considérons maintenant un modèle plus général : yit = yi;t 1 + xit + zi + i + "it: Estimation IV : Etape 1. (yit Modèle en diérences premières yi;t 1 ) = (yi;t ou (yi;t Utiliser yi;t 2 yi;t 2 et estimer ) yi et estimer ^yi; 1 2 yi;t yi;t 3 2 ) + (xit xi;t 1 ) + "it "i;t 1: ) comme instrument pour (yi;t ; avec la procedure IV. Substituer premières : Etape 2. 1 1 ^ et ^ dans l'équation Between en diérences xi^ = zi + i + "i; i = 1; 2; : : : ; N; par MCO. 64 Etape 3. ^ 2" = ^ = 2 Estimer les composantes des variances : PN PT 1 N (T 2 (xit 1) PN i=1 N 1 i=1 t=1 i2 )^ h yi ^yi; xi;t 1 [(yit ; 1 yi;t 1 ) ^(yi;t zi ^ xi^ i2 ^ 1 yi;t 2 ) T " ; 1 2 Convergence de l'estimateur IV : L'estimateur IV de , et "2 sont convergents quand N ou ; L'estimateur IV de and 2 sont convergents seulement si , mais non convergents quand T est xé et N . !1 !1 !1 T T 5.3 Exemple : L'étude de Balestra-Nerlove Papier précurseur sur les modèles dynamiques en panel (1966). Demande des ménages pour le gaz naturel aux Etats-Unis, incluant a/ la demande due au remplacement des équipements fonctionnant au gaz, et b/ la demande liée à des variations dans le stock de ces équipements. Système de demande : Git = Git (1 r)Gi;t 1; Fit = Fit (1 r)Fi;t 1; Fit = a0 + a1Nit + a2Iit; Git = b0 + b1Pit + b2Fit ; où Git et Git sont respectivement la nouvelle et la demande réelle de gaz à la période t du ménage i, r est le taux de dépréciation des équipements, Fit et Fit sont respectivement la nouvelle et la 65 demande réelle pour les autres types d'énergie, Nit est la population totale, Iit est le revenu par tête, et Pit est le prix relatif du gaz. Après résolution du système, l'équation à estimer s'écrit : Git = 0 + 1Pit + 2Nit + 3Ni;t 1 +4Iit + 5Ii;t 1 + 6Gi;t 1; où Nit = Nit Ni;t 1 , Iit = Iit Ii;t 1 , et 6 = 1 r. Estimation : MCO, Within (LSDV) et GLS (avec l'hypothèse que les conditions initiales Gi0 sont xées). En accord avec la théorie, (ici, 6) est biaisé vers le haut par les MCO et vers le bas par les eets xes (Within). 66 Tab. 3 Résultats d'estimation, modèle de Balestra-Nerlove Paramètre 0 (Constante) 1 (Pit) 2 (Nit) 3 (Ni;t 1 ) 4 (Iit) 5 (Ii;t 6 (Gi;t 1 ) 1 ) MCO Within MCG -3.650 -4.091 (3.316) (11.544) -0.0451(*) -0.2026 -0.0879(*) (0.027) (0.0532) (0.0468) 0.0174(*) -0.0135 -0.00122 (0.0093) (0.0215) (0.0190) 0.00111(**) 0.0327(**) 0.00360(**) (0.00041) (0.0046) (0.00129) 0.0183(**) 0.0131 0.0170(**) (0.0080) (0.0084) (0.0080) 0.00326 0.0044 0.00354 (0.00197) (0.0101) (0.00622) 1.010(**) 0.6799(**) 0.9546(**) (0.014) (0.0633) (0.0372) Notes. N = 36, T = 11. Ecarts-types entre parenthèses. (*) et (**) : paramètre signicatif à 10% et 5% respectivement. 5.4 Estimateurs GMM pour panel dynamique 5.4.1 Introduction Estimation par Méthode des Moments Généralisés (GMM) comme alternative intéressante aux eets xes et MCG. Ses avantages sont évidents dans le cas de l'estimation des modèles dynamiques à données de panel. Modèle simple sans régresseurs exogènes : yit = yi;t 1 + uit; 67 uit = i + "it: Procédure par IC d'Anderson-Hsiao : estimateur convergent quand T est xe, basé sur le modèle en diérences premières. Deux désavantages : a) Dans les procédures IV, la matrice de variance-covariance est contrainte (homoscédasticité, pas d'auto-corrélation des erreurs) ; b) Seulement 1 instrument utilisé pour identier 1 paramètre (soit yi;t 2, soit yi;t 2 yi;t 3). 5.4.2 L'estimateur d'Arellano-Bond Article important : Arellano et Bond (Review of Economics and Statistics, 1991) : une procédedure robuste peut être utilisée (point a)) et plus de conditions d'orthogonalité (d'instruments) sont disponibles (point b)). Hypothèses du modèle (i) Pour tout i, "it n'est pas corrélé avec yi0 pour tout t ; (ii) Pour tout i, "it n'est pas is corrélé avec i , pour tout t ; (iii) Pour tout i, les "it ne sont pas mutuellement corrélés. Sous ces hypothèses, on a l'ensemble de conditions de moments : E (yisuit) = 0; t = 2; 3; : : : ; T; s = 0; 1; : : : ; t = = ( 2; 1) 2 où uit "it "it "i;t 1. C'est un ensemble de T T = conditions (comparer avec Anderson-Hsiao, où seulement 1 condition était disponible). Hypothèse importante : les conditions ci-dessus tiennent si les termes d'erreur " ne sont pas auto-corrélés, i.e., on doit avoir E "it"i;t+s , pour s ; . ( )=0 = 11 68 Si de l'auto-corrélation est présente, on a l'ensemble de conditions : E (yisuit) = 0; t = 3; : : : ; T; s = 0; 1; : : : ; t ( 1)( 2) 2 ce qui donne T T = conditions (on en perd Par substitution répétée, on a : 3; (T 1)). 1 t yit = "it + "i;t + "i;t + + "i + i + t yi ; 1 de sorte que yit = f ("it; "i;t ; : : : ; "i ; i ; yi ), et E (yi;t uit) = E (yi;t ("it "i;t )) = E ("i;t ("it "i;t )) = 0 car par hypothèse E (i"it) = E ("ityi ) = 0. 2 1 t 2 1 1 1 1 2 0 0 2 2 1 1 0 5.4.3 Mise en pratique de l'estimateur GMM On a besoin de a) 1 matrice d'instruments W ; b) 1 matrice de pondération initiale. La sous-matrice pour l'individu i est de la forme : 2 3 0 0 0 6 0 yi yi 0 0 0 0 6 60 0 0 y 0 i yi yi 0 Wi = 6 6. . . . . . . . . yi0 0 4 .. 0 .. .. . 7 7 7 7 7 5 1 .. .. 0 .. 1 .. 0 0 0 0 69 2 .. yi0 .. .. yi;T 2 Wi0ui = ui2 yi0 1 0 B ui3 yi0 C C B B ui3 yi1 C C B B ui4 yi0 C C B B ui4 yi1 C C B =B ui4 yi2 C C B de sorte que 0 B B B B B B B B B B B B B B B @ C C C C C A .. . uiT yi .. . 0 uiT yi;T et E (Wi0ui) = 0. B B B B B @ 2 (yi (yi (yi (yi (yi (yi 3 3 4 4 4 (yiT .. . yi;T 1 .. . (yiT 1 yi1) yi0 yi2) yi0 yi2) yi1 yi3) yi0 yi3) yi1 yi3) yi2 2 yi;T ( ) 1 C C C C C C C C C C C C C C C A ) yi 0 ) yi;T 2 Matrice de pondération initiale pour W 0 W 1 : est la matrice de variance-covariance de " (dans le modèle transformé). Si "it est homoscédastique, on a E ("it"i;t 1) = E [("it "i;t 1)("i;t 1 "i;t 2)] = "2 E ("2it) = E [("it "i;t 1)("it "i;t 1)] = 2"2 E ("it"i;t+1) = E [("it "i;t 1)("i;t+1 "it)] = "2 et pour chaque individu i, E (uiu0i) = "2H , où 2 H= ( 2 1 0 0 3 1 2 1 0 0 77 0 1 2 1 0 77 ; 6 6 6 6 6 .. 4 . .. . .. . .. . .. . .. . .. . .. 7 . 5 0 0 1 2 2)(T 2). Nous pouvons utiliser H pour calculer une matrice T la matrice de pondération initiale comme A1 = N X i=1 Wi0HWi: 70 Après calcul de l'estimateur GMM de première étape ^GMM = arg min u0W A W 0u 0 = y W A W 0y y0 W A W 0y ; 1 1 1 1 1 1 1 1 1 1 on peut calculer la matrice de pondération de 2e étape par : A2 = où ^ui = yi ^yi; 5.4.4 1 N X i=1 Wi0^ui^u0iWi; . Des procédures plus ecaces : Ahn-Schmidt, Blundell-Bond Ahn et Schmidt (1995) proposent T taires : 2 conditions supplémen- E (uiT uit) = 0; t = 2; 3; : : : ; T Avec Ahn-Schmidt et Arellano-Bond, on a T (T 1: 1)=2 + (T 2) conditions d'orthogonalité. Ahn-Schmidt montrent qu'elles représentent l'ensemble des conditions de moment impliquées par ces hypothèses. Hypothèses supplémentaires 8 ( ) 8 Sous l'hypothèse : i, V ar "2it est la même t, on a : E u2it est identique pour t ; ; : : : ; T . Ceci ajoute T conditions, et l'ensemble nal de conditions est, sous l'hypothèse d'homoscédasticité : Homoscédasticité ( ) =1 2 E (yisuit) = 0 t = 2; : : : ; T; s = 0; : : : ; t 2; E (yitui;t+1 yi;t+1ui;t+2) = 0 t = 1; : : : ; T 2; E (uiui;t+1) = 0 t = 1; : : : ; T 1; 71 1 = T PTt où ui 1 =1 uit. ( Quand on ajoute l'hypothèse de stationarité : Cov i; yit est la même t, cela ajoute 1 condition. L'ensemble complet de T T = T conditions est maintenant Stationarité ( 8 1) 2 + (2 2) E (yisuit) = 0 t = 2; : : : ; T; s = 0; : : : ; t 2; E (uiT yit) = 0 t = 1; : : : ; T 1; E (uityit ui;t yi;t ) = 0 t = 2; : : : ; T: 1 1 Avantage : cet ensemble est constitué uniquement de conditions linéaires. L'estimateur d'Ahn et Schmidt s'obtient en ajoutant à la matrice d'instruments d'Arellano-Bond le bloc suivant, pour l'individu i : 0 1 Wi = B B B @ yi2 0 ::: ::: yi3 yi3 0 ::: .. . 0 .. . .. . 0 0 .. . ui 0 0 ui .. . ::: ::: ::: yi;T .. . 1 0 .. . ::: ::: .. . 0 0 C C .. C : . A ::: ::: ui Comment tester la pertinence d'hypothèses additionnelles ? Soit W 1 la matrice d'instruments associée à l'ensemble de conditions à tester, et W 0 une matrice d'instruments associée à un ensemble 0 restreint de conditions valides. Soit et les estimateurs GMM obtenus avec les instruments W 0; W 1 et W 0 respectivement, ( ^ ^ ) J (^) et J (^ ) les valeurs des critères GMM correspondants. Alors, sous l'hypothèse nulle H0 : les conditions associées à W 1 0 sont valides, on a J (^) J (^ ) v 2(rank(W 1)): 0 72 ) 5.4.5 L'estimateur de Blundell-Bond Blundell et Bond (1998) suggère d'utiliser des conditions de moment linéaires basées sur des hypothèses portant sur les conditions initiales. Ils proposent E (uityi;t avec en plus, 1 ) = 0 t = 3; 4; : : : ; T; E (ui3yi2) = 0: Cette dernière condition, combinée avec celle plus haut, implique les restrictions non-linéaires d'Ahn et Schmidt (1995) E uit ui;t 1 ; t ; : : : ; T . Cela signie que nous avons la condition suivante de stationarité sur le modèle : ( 0 =3 yi0 = 1 i )= + "i : 0 (1 ) En d'autres termes, les écarts initiaux de i = ne doivent pas être corrélés au niveau de i = . L'estimateur GMM de Blundell et Bond combine les conditions d'Ahn et -Schmidt Wi avec leur nouveaux instruments dénis plus haut : 2 3 (1 ) 0 0 0 yi 0 0 0 yi Wi Wi+ = 6 6 6 6 6 .. 4 . 0 2 .. . .. . 0 3 .. . 0 0 0 0 0 yi;T 7 7 7 7; 7 5 1 pour estimer les paramètres dans un système à 2 équations : yi = yi; + "i yi = yi; + i + "i: 1 1 73 5.5 Exemple : Equation de demande d'énergie (gaz naturel) 74 ___ ____ ____ ____ ____tm /__ / ____/ / ____/ ___/ / /___/ / /___/ Statistics/Data Analysis ------------------------------------------------------------------------------log: E:\dea\panel\2004\energy3.smcl log type: smcl opened on: 15 Apr 2004, 22:49:23 1 . use energy 2 . set matsize 800 3 . tsset sire annee panel variable: time variable: sire, 5.481e+13 to 9.457e+15 annee, 1983 to 1996, but with gaps 4 . sort sire annee 5 . by sire : gen lag_we = we[_n - 1] (110 missing values generated) 6 . by sire : gen lag_wfl = wfl[_n - 1] (110 missing values generated) 7 . by sire : gen lag_wfd = wfd[_n - 1] (110 missing values generated) 8 . by sire : gen lag_wbp = wbp[_n - 1] (110 missing values generated) 9 . by sire : gen lag_wg = wg[_n - 1] (110 missing values generated) 10 . xtabond wg lag_we lag_wfl lag_wfd lag_wbp, twostep note: lag_wfl dropped due to collinearity Arellano-Bond dynamic panel data Group variable (i): sire Time variable (t): annee Number of obs Number of groups = = 770 94 Wald chi2(4) = 7881.35 min number of obs = max number of obs = mean number of obs = 1 12 8.191489 Two-step results -----------------------------------------------------------------------------wg | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------wg | LD | .8027447 .024249 33.10 0.000 .7552175 .8502718 lag_we | D1 | .447632 .022023 20.33 0.000 .4044678 .4907962 lag_wfd | D1 | .7429275 .02455 30.26 0.000 .6948104 .7910445 lag_wbp | D1 | 1.188523 .0898711 13.22 0.000 1.012379 1.364668 _cons | -.0054737 .0000973 -56.27 0.000 -.0056643 -.0052831 -----------------------------------------------------------------------------Warning: Arellano and Bond recommend using one-step results for inference on coefficients Sargan test of over-identifying restrictions: chi2(77) = 79.22 Prob > chi2 = 0.4089 Arellano-Bond test that average autocovariance in residuals of order 1 is 0: H0: no autocorrelation z = -3.20 Pr > z = 0.0014 Arellano-Bond test that average autocovariance in residuals of order 2 is 0: H0: no autocorrelation z = 0.35 Pr > z = 0.7294 11 . xtabond wg lag_we lag_wfl lag_wfd lag_wbp, twostep lags(2) note: lag_wfl dropped due to collinearity Arellano-Bond dynamic panel data Group variable (i): sire Time variable (t): annee Number of obs Number of groups = = 669 92 Wald chi2(5) = 26399.30 min number of obs = max number of obs = mean number of obs = 1 11 7.271739 Two-step results -----------------------------------------------------------------------------wg | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------wg | LD | 1.79913 .0475941 37.80 0.000 1.705847 1.892413 L2D | .0281091 .0012674 22.18 0.000 .0256251 .0305932 lag_we | D1 | 1.2724 .0446425 28.50 0.000 1.184902 1.359897 lag_wfd | D1 | 1.514443 .0516318 29.33 0.000 1.413247 1.61564 lag_wbp | D1 | 1.395866 .0594595 23.48 0.000 1.279328 1.512405 _cons | -.0000462 .0001437 -0.32 0.748 -.0003279 .0002355 -----------------------------------------------------------------------------Warning: Arellano and Bond recommend using one-step results for inference on coefficients Sargan test of over-identifying restrictions: chi2(75) = 81.48 Prob > chi2 = 0.2848 Arellano-Bond test that average autocovariance in residuals of order 1 is 0: H0: no autocorrelation z = -2.63 Pr > z = 0.0085 Arellano-Bond test that average autocovariance in residuals of order 2 is 0: H0: no autocorrelation z = -0.18 Pr > z = 0.8576 12 . log close log: E:\dea\panel\2004\energy3.smcl log type: smcl closed on: 15 Apr 2004, 22:52:17 ------------------------------------------------------------------------------- 6 Les modèles à choix discret 6.1 Bref rappel des modèles binaires à choix discret Modèles à variables dépendantes qualitatives : rappel dans le cas binaire, et pour une coupe instantanée. yi = xi + ui; i = 1; 2; : : : ; N; yi = 1 si yi > 0; yi = 0 si yi 0; yi et yi : respectivement la variable latente (inobservée) et la variable dépendante observée ; xi : vecteur 1 K de régresseurs. Le seuil 0 est arbitraire, car E (yi) est inconnu. 6.1.1 Modèle à Probabilité Linéaire E (yi) = P rob(yi = 1) = xi + ui: Non satisfaisant, car les probabilités prédites peuvent sortir de l'intervalle ; . 2 valeurs possibles pour le résidu ui : xi (quand yi ) ou ui xi (quand yi ). Hétéroscédasticité par construction, car V ar ui P rob yi xi 2 P rob yi =1 1) (1 [0 1] xi )2 = =0 ( = 0) ( ( )= 1 )+ = (1 xi ) ( xi ) + xi (1 xi ) = (1 xi )[( xi ) + xi (1 xi )] = xi (1 xi ): 2 2 75 2 ( = 6.1.2 Le modèle Logit Basé sur la distribution Logistique : exp(xi ) P rob(yi = 1) = (xi ) = 1+exp( xi ) ; 1 P rob(yi = 0) = 1 (xi ) = 1+exp( xi ) ; exp(xi ) Density : (xi ) = [1+exp( xi )]2 : Dans ce cas, 6.1.3 V ar(ui) = 2 =3. Le modèle Probit Basé sur la distribution Normale : ui est R xi = 1 xi N (0; 2) P rob(yi = 1) = = 1 p2 exp( 2ui2 ); R 1 p1 exp( u2i ); P rob(yi = 0) = 1 xi = x+i = 2 2 2 2 u Densité xi = p12 exp( 2i2 ): 2 Le paramètre n'est pas identié (apparaît dans le rapport = ) : est donc normalisé à 1. Méthode d'estimation : Maximum de Vraisemblance ^ = arg max N Y i=1 [P rob(yi = 1)]y [1 = arg min où i N Y i=1 P rob(yi = 0)]1 yi F (Æixi ); F (:) est la fonction de répartition ( ou ), et Æi = 2yi 76 1. Dans ces modèles, l'inference est conduite sur a) le signe des paramètres estimés ; b) les eets marginaux (@P rob yi =@xi . ( = 1) Passage aux données de panel. On considère sorte que uit ) = i + "it, de P rob(yit = 1) = P rob(yit > 0) = P rob("it > xit = P rob("it < xit + i) = F (xit + i): i ) 6.2 Modèle Logit pour données de panel 6.2.1 Statistiques susantes Considérons d'abord un modèle à eets xes. Esrimateur du Maximum de Vraisemblance (MV) : il faut estimer à la fois et i ; i ; : : : ; N , mais i et ne sont pas indépendants dans ces modèles non-linéaires. Si T est petit, l'estimateur MV de i n'est pas convergent et par conséquent, celui de ne l'est pas non plus. Les eets individuels i sont appelés paramètres incidentaux (leur nombre augmente avec N ). =1 Solution : Neyman et Scott (1948) posent le principe de l'estimation en présence de paramètres incidentaux . Supposons qu'il existe une statistique susante i pour , i ; ; : : : ; N , qui ne dépende pas de . Alors, la densité conditionnelle =1 2 f (yijxi; i; ) = f (yijxi; i; ) ; g(ijxi; i; ) ne dépend pas de i . Un estimateur convergent de ( j pour g i xi; i ; ) > 0; s'obtient alors en maximisant la 77 densité conditionnelle de (y ; : : : ; yN ) étant donné ( ; : : : ; N ) : 1 ^ = arg max Probabilité jointe yi : h P rob(yi) = exp i 1 N Y i=1 P QT t=1 f (yijxi; i; ): P + [1 + exp(xit + i)] T t=1 yit T t=1 yit xit i : Si nous résolvons les conditions du 1er ordre associées à la maximisation de la log-vraisemblance par rapport à : N X T @ log L X = @ i=1 t=1 exp(xit + i) + y x = 0; 1 + exp(xit + i) it it et par rapport à i : T X @ log L = @i , T X t=1 t=1 yit = exp(xit + i) + y = 0; 1 + exp(xit + i) it T X t=1 exp(xit + i) 1 + exp(xit + i) i = 1; 2; : : : ; N; i = 1; 2; : : : ; N: PT Par conséquent, une statistique susante pour i est : i t=1 yit . PT La probabilité que t yit s est : ( ! ) T X X T i s Q ditxit = ! exp( ) s!(T s)! [1 + exp( x + )] it i t 78 d2Bi = exp t=1 6.2.2 Probabilités conditionnelles La probabilité conditionnelle de yi étant donné i est : hP i exp P rob (yiji) = P d2Bi P ( t yit)!(T où exp T t=1 yit xit P T t=1 ditxit P t yit T! )! ; Bi est un ensemble d'indices pour l'individu i : Bi = ( (di ; di ; : : : ; diT )jdit = 0; 1 1 2 et T X t=1 dit = T X t=1 ) yit : L'ensemble Bi représente toutes les combinaisons possibles de yit PT pour l'individu i avec le même nombre de 1 que dans t yit . PT PT Les groupes pour lesquels ou T ont une t yit t yit probabilité de 1, et ne contribuent en rien à la log-vraisemblance. PT Seuls ensembles d'intérêt : lorsque yit s ; T ; il y a 1 =0 = = 2]0 [ ( Ts ) =T !=[s!(T s)!] éléments, qui correspondent à T distinctes, de valeur s. séquences Notes : La seconde expression ne dépend pas de et peut être éliminée ; Pour calculer la probabilité ci-dessus, il faut considérer pour chaque s toutes les séquences possibles de 0 et de 1. Exemple : si 79 T = 4 et s = 2, on aurait 6 cas possibles et 2 1 1 0 0 30 1 61 0 1 07 exp( x ) i ! 6 7 T X X 6 1 0 0 1 7 B exp(xi ) C 7B C exp ditxit = vec 6 6 0 1 1 0 7 @ exp(xi ) A 6 7 t d2B 40 1 0 15 exp(xi ) 0 0 1 1 1 2 i 6.2.3 3 =1 4 Exemple : T =2 + yi = 1. Soit (yi ; yi ) = (0; 1); (yi ; yi ) = (1; 0): Seule séquence d'intérêt : yi1 !i = 1 !i = 0 if if 2 1 2 1 2 On a la probabilité conditionnelle : P rob(!i = 1) P rob(!i = 0) + P rob(!i = 1) exp( i + yi2xi2 ) = [1 + exp( + x )][1 + exp( + x )] i i1 i i2 [1 + exp( i + xi1 )][1 + exp(i + xi2 )] exp(i + xi1 ) + exp(i + xi2 ) i + xi2 ) = exp( +exp( i xi1) + exp(i + xi2 ) xi2 xi1) ]) = 1 exp[( + exp[(xi2 xi1) ] = [(xi2 xi1) ]: Dans ce cas, Bi = fijyi1 + yi2 = 1g et la log-vraisemblance conditionnelle est log L = P rob(!i = 1jyi1 + yi2 = 1) = X i2Bi f!i log [(x i 2 xi1) ] + (1 !i) log f1 80 [(x i 2 xi1) ]gg : 2 En pratique, lorsque T > , nous devons considérer d'autres enP sembles de séquences possibles pour lesquelles Tt yit est le même. 6.3 Le modèle Probit On utilise traditionnellement le modèle Probit dans les cas des eets aléatoires (facilité de calcul). Considérons un modèle avec le terme d'erreur uit i "it, où i est issu d'une distribution G : et est indépendant des xi. Supposons que () = + V ar() = 2 ; V ar("it) = 1; Corr(uit; uis) = = La contribution à la vraisemblance de l'individu i est Li Z Æi1 xi1 Z ÆiT xiT = =2 1 1 1 2 1 + 2 : = P rob(yi) f (ui1; ui2; : : : ; uiT )dui1 duiT ; () où Æit yit et f : est la fonction de densité jointe des éléments dans ui . L'intégration de cette densité n'est pas raisonnable (numériquement, manque de précision) si T est grand, mais l'on peut travailler avec la densité conditionnelle, car conditionnellement à i , les uit sont indépendants : Z +1 f (ui1; ui2; : : : ; uiT ) = = Z 1 T 1Y + 1 t=1 f (ui1; ui2; : : : ; uiT ji )f (i)di f (uitji)f (i)di; 81 [0 (1 )] = (1+ ) où la densité de i est N ; = (rappel : 2 = 2 ). Butler et Mott (1982) montrent que l'on peut écrire Li comme " T # Z +1 Y 2 1 L (y ) = p i i 1 e ti t=1 p2 (Æitxit + Æitti p1 ) dti; qui est à présent une intégrale à 1 dimension qui peut facilement être calculée numériquement (algorithme d'intégration de GaussHermite). Désavantage de cette méthode : il faut imposer que la corrélation () est constante sur les périodes. 82 ___ ____ ____ ____ ____tm /__ / ____/ / ____/ ___/ / /___/ / /___/ Statistics/Data Analysis ------------------------------------------------------------------------------log: E:\dea\panel\2004\paper31.smcl log type: smcl opened on: 13 Apr 2004, 22:44:46 1 . clear 2 . use paper31 3 . sum Variable | Obs Mean Std. Dev. Min Max -------------+----------------------------------------------------pgn | 3892 2031.673 507.0337 649.3506 4935.065 eff | 3892 127.4245 124.4005 0 1200 pk | 3892 1854.373 8357.252 9 270000 we | 3892 .7526084 .1939825 .0755102 1 wg | 3892 .0691366 .1490749 0 .9244898 wfl | 3892 .0595062 .1532768 0 .8358098 wfd | 3892 .1048921 .1381208 0 .8143532 wbp | 3892 .0138567 .0599029 0 .7816901 lnpk | 3892 7.620966 .2802385 6.176086 8.751222 lnpgn | 3892 -4.36909 1.362804 -11.26895 -.1333181 lnpfl | 3892 -4.396743 1.319552 -10.76311 -.1630243 lnpfd | 3892 -4.372553 1.268942 -10.34875 -.2750275 lnpbp | 3892 -4.37296 1.285537 -10.44155 -.1853326 annee | 3892 1989.5 4.031647 1983 1996 sire | 3892 5.64e+15 2.28e+15 5.48e+13 9.98e+15 r | 3892 2.604573 .8067498 0 4 leff | 3891 4.447666 .9390137 2.302585 7.090077 4 . xtlogit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) fe note: multiple positive outcomes within groups encountered. note: 197 groups (2758 obs) dropped due to all positive or all negative outcomes. Iteration Iteration Iteration Iteration Iteration Iteration 0: 1: 2: 3: 4: 5: log log log log log log likelihood likelihood likelihood likelihood likelihood likelihood = = = = = = Conditional fixed-effects logit Group variable (i) : sire -440.50788 -244.73554 -218.80164 -214.75859 -214.58631 -214.58586 Number of obs Number of groups = = 1133 81 Obs per group: min = avg = max = Log likelihood LR chi2(5) Prob > chi2 = -214.58586 = = 13 14.0 14 482.63 0.0000 -----------------------------------------------------------------------------wg | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------lnpgn | -4.911574 .5046251 -9.73 0.000 -5.900621 -3.922527 lnpk | .8308617 .7184896 1.16 0.248 -.577352 2.239075 lnpfl | -1.406169 .6057111 -2.32 0.020 -2.593341 -.2189966 lnpfd | 2.446032 .7488206 3.27 0.001 .9783705 3.913693 leff | .3644786 .6587024 0.55 0.580 -.9265543 1.655512 ------------------------------------------------------------------------------ 5 . xtprobit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) re Fitting comparison model: Iteration Iteration Iteration Iteration Iteration 0: 1: 2: 3: 4: log log log log log likelihood likelihood likelihood likelihood likelihood = -2219.598 = -1491.5615 = -1424.133 = -1421.415 = -1421.408 Fitting full model: rho = 0.0 rho = 0.1 rho = 0.2 rho = 0.3 rho = 0.4 rho = 0.5 rho = 0.6 rho = 0.7 rho = 0.8 Iteration 0: Iteration 1: Iteration 2: Iteration 3: Iteration 4: Iteration 5: Iteration 6: Iteration 7: Iteration 8: Iteration 9: log log log log log log log log log log log log log log log log log log log likelihood likelihood likelihood likelihood likelihood likelihood likelihood likelihood likelihood likelihood likelihood likelihood likelihood likelihood likelihood likelihood likelihood likelihood likelihood = = = = = = = = = = = = = = = = = = = -1421.4078 -1140.8174 -1016.5969 -942.64415 -892.79813 -857.7847 -832.86653 -814.12095 -804.14302 -814.12092 -730.50278 -696.05937 -679.81218 -666.53806 -665.50986 -658.13604 -657.09612 -657.08286 -657.08286 Random-effects probit Group variable (i) : sire Number of obs Number of groups = = 3891 278 Random effects u_i ~ Gaussian Obs per group: min = 13 Log likelihood = -657.08286 Wald chi2(5) Prob > chi2 avg = max = 14.0 14 = = 405.09 0.0000 -----------------------------------------------------------------------------wg | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------lnpgn | -3.541549 .2524669 -14.03 0.000 -4.036375 -3.046723 lnpk | .9321749 .3466973 2.69 0.007 .2526607 1.611689 lnpfl | -.6432045 .2752501 -2.34 0.019 -1.182685 -.1037243 lnpfd | 2.488594 .3997656 6.23 0.000 1.705068 3.27212 leff | .4004405 .138137 2.90 0.004 .1296969 .6711841 _cons | -18.61093 3.124295 -5.96 0.000 -24.73443 -12.48742 -------------+---------------------------------------------------------------/lnsig2u | 1.970308 .1089466 1.756777 2.183839 -------------+---------------------------------------------------------------sigma_u | 2.678224 .1458918 2.407017 2.979989 rho | .8776442 .0116992 .8528055 .8987889 -----------------------------------------------------------------------------Likelihood ratio test of rho=0: chibar2(01) = 1528.65 Prob >= chibar2 = 0.000 6 . log close log: E:\dea\panel\2004\paper31.smcl log type: smcl closed on: 13 Apr 2004, 22:46:43 ------------------------------------------------------------------------------- Appendix 10. IV and GMM estimation with c Gauss /* IV2.PRG Instrumental variable estimation and GMM estimation Model y(it) = X(it)beta + Z(i) gamma We use Hausman-Taylor, Amemiya-MaCurdy, Breusch-Mizon-Schmidt instruments, both for IV and GMM */ new ;clear all ; /* You only need to change this block */ /* Define dimensions N : number of units, T=number of time periods nvar= Nb. of variables to be read k1 : Nb. of X1it, k2 : Nb. of X2it, g1= Nb. of Z1i, g2 : Nb. of Z2i kq= k1+k2, kb= k1+k2+g1+g2*/ n=595 ; t=7 ; nvar=13 ; k1=4 ; k2=5 ; g1=2 ; g2=1 ; kq=k1+k2 ; kb=k1+k2+g1+g2 ; et=ones(t,1) ; un=ones(n*t,1) ; unb=ones(n,1) ; /* Read data */ load x[n*t,nvar]=psid.dat ; output file=iv1.out reset ; expe=x[.,1] ; expe2=x[.,2] ; wks=x[.,3] ; 83 occ=x[.,4] ; ind=x[.,5] ; south=x[.,6] ; smsa=x[.,7] ; ms=x[.,8] ; fem=x[.,9] ; unioni=x[.,10] ; edu=x[.,11] ; blk=x[.,12] ; lwage=x[.,13] ; /* Define matrices X, Z and vector Y */ x1 = occsouthsmsaind ; x2 = expeexpe2wksmsunioni ; z1 = femblk ; z2 = edu ; y = lwage ; x = x1x2 ; z = z1z2 ; /* You don't need to change anything after this */ /* Compute Between and Within transformations : BX and QX Caution : keep that order for BXZ : X,Z,Y */ qx=with(xy) ; bxz=bet(xzy) ; by=bxz[.,cols(bxz)] ; bxz=bxz[.,1 :cols(bxz)-1] ; qy=qx[.,cols(qx)] ; qx=qx[.,1 :cols(qx)-1] ; /* Within regression and error term (uw) */ betaw=inv(qx'qx)*qx'qy ; uw=qy-qx*betaw ; /* Compute variance with instruments */ exob=unbxz ; gamb=inv(exob'exob)*(exob'by) ; 84 ub=by-exob*gamb ; sigep=uw'uw/(n*(t-1)-kq) ; sigq=sqrt(sigep*diag(inv(qx'qx))) ; a=x1z1 ; di=by-bxz[.,1 :kq]*betaw ; zz = unz1z2 ; gamhatw=inv(zz'*a*inv(a'*a)*a'*zz)*zz'*a*inv(a'*a)*a'*di ; s2=(1/(n*t))*(by-bxz[.,1 :kq]*betaw -zz*gamhatw)'*(by-bxz[.,1 :kq]*betaw-zz*gamhatw) ; sigal=s2-(1/t)*sigep ; theta=sqrt(sigep/(sigep+t*sigal)) ; /* GLS transformation and estimate Caution : keep the order 1,X1,X2,Z1,Z2 in matrix EXOG */ exog=gls(unx1x2z1z2y) ; yg=exog[.,cols(exog)] ; exog=exog[.,1 :cols(exog)-1] ; betagls=inv(exog'exog)*(exog'yg) ; siggls=sqrt(sigep*diag(inv(exog'exog))) ; /* HT */ aht=unqxbet(x1)z1 ; betaht=inv(exog'*aht*inv(aht'*aht)*aht'*exog)*exog'*aht*inv(aht'*aht) *aht'*yg ; sight=sqrt(sigep*diag(inv(exog'*aht*inv(aht'*aht)*aht'*exog))) ; /* AM */ x1s=tam(x1) ; aam=unqxx1sz1 ; betaam=inv(exog'*aam*inv(aam'*aam)*aam'*exog) ; betaam=betaam*exog'*aam*inv(aam'*aam)*aam'*yg ; sigam=sqrt(sigep*diag(inv(exog'*aam*inv(aam'*aam)*aam'*exog))) ; /* BMS */ 85 abms1=aamtbms(with(x2)) ; /* This is the general form for BMS instrument, it should work in most cases. But with the application to PSID data, we must drop some variables, see below. This means you have to delete ABMS1 below for your application */ /* Remove abms1 just below : */ abms1=unqxbet(x1)tbms(with(occsouthsmsaindmswksunioni))z1 ; betabms1=inv(exog'*abms1*inv(abms1'*abms1)*abms1'*exog) *exog'*abms1*inv(abms1'*abms1)*abms1'*yg ; sigbms1=sqrt(sigep*diag(inv(exog'*abms1*inv(abms1'*abms1)*abms1'*exog))) ; /* Compute variance-covariance matrices */ varq=sigep*inv(qx'qx) ; varg=sigep*inv(exog'*exog) ; varht=sigep*inv(exog'*aht*inv(aht'*aht)*aht'*exog) ; varam=sigep*inv(exog'*aam*inv(aam'*aam)*aam'*exog) ; varbms1=sigep*inv(exog'*abms1*inv(abms1'*abms1)*abms1'*exog) ; test1=(betagls[2 :kq+1]-betaw)'*inv(varq-varg[2 :kq+1,2 :kq+1]) ; test1=test1*(betagls[2 :kq+1]-betaw) ; test2=(betaht[2 :kq+1]-betaw)'*inv(varq-varht[2 :kq+1,2 :kq+1]) *(betaht[2 :kq+1]-betaw) ; test3=(betaht-betaam)'*inv(varht-varam)*(betaht-betaam) ; test4=(betaam-betabms1)'*inv(varam-varbms1)*(betaam-betabms1) ; output file=iv1.out reset ; output on ; "Within estimates " ; " Estimate standard error t-stat " ; betawsigqbetaw./sigq ; "GLS estimates" ; "sigma(alpha),sigma(epsilon),theta(=(sig(ep)/(sig(ep+t*sig(al)))**(1/2))" ; sigal sigep theta ; " Estimate standard error t-stat " ; betaglssigglsbetagls./siggls ; 86 "HT estimates " ; " Estimate standard error t-stat " ; betahtsightbetaht./sight ; "AM estimates " ; " Estimate standard error t-stat " ; betaamsigambetaam./sigam ; "BMS estimates " ; " Estimate standard error t-stat " ; betabms1sigbms1betabms1./sigbms1 ; "Hausman test statistics and p-value " ; "Within vs. GLS " ; test1cdfchic(test1,kq) ; "Within vs. HT " ; test2cdfchic(test2,k1-g2) ; "AM vs. HT " ; test3cdfchic(test3,cols(aam)-cols(aht)) ; "BMS vs. AM " ; test4cdfchic(test4,cols(abms1)-cols(aam)) ; /* GMM estimation */ b1,se1,b2,se2,sar = gmm(y,unx1x2z1z2,aht,1) ; "GMM-HT estimates " ; " Estimate standard error t-stat " ; b2se2b2./se2 ; "Hansen test and p-value " ; sar cdfchic(sar,cols(aht)-rows(b2)) ; b1,se1,b2,se2,sar = gmm(y,unx1x2z1z2,aam,1) ; "GMM-AM estimates " ; " Estimate standard error t-stat " ; b2se2b2./se2 ; "Hansen test and p-value " ; sar cdfchic(sar,cols(aam)-rows(b2)) ; b1,se1,b2,se2,sar = gmm(y,unx1x2z1z2,abms1,1) ; "GMM-BMS estimates " ; 87 " Estimate standard error t-stat " ; b2se2b2./se2 ; "Hansen test and p-value " ; sar cdfchic(sar,cols(abms1)-rows(b2)) ; output off ; proc bet(w) ; /* Compute BX from matrix w */ local i,term,betx ; term=reshape(w[.,1],n,t) ; term=meanc(term').*.et ; term=reshape(term,n*t,1) ; betx=term ; i=2 ; do until i>cols(w) ; term=reshape(w[.,i],n,t) ; term=reshape(meanc(term').*.et,n*t,1) ; betx=betxterm ; i=i+1 ; endo ; retp(betx) ; endp ; proc with(w) ; /* Compute Within transformation for matrix W */ retp(w-bet(w)) ; endp ; proc gls(w) ; /* GLS transformation */ local term ; term=w-(1-theta)*bet(w) ; retp(term) ; endp ; proc tam(w) ; /* AM transformation, stacking time observations */ local i,term,xstar ; term=reshape(w[.,1],n,t).*.et ; xstar=term ; 88 i=2 ; do until i>cols(w) ; term=reshape(w[.,i],n,t).*.et ; xstar=xstarterm ; i=i+1 ; endo ; retp(xstar) ; endp ; proc tbms(w) ; /* BMS transformation, stacking time observations but deleting last column */ local i,term,xstar ; term=reshape(w[.,1],n,t).*.et ; xstar=term[.,1 :cols(term)-1] ; i=2 ; do until i>cols(w) ; term=reshape(w[.,i],n,t).*.et ; xstar=xstarterm[.,1 :cols(term)-1] ; i=i+1 ; endo ; retp(xstar) ; endp ; proc (5)=gmm(y,x,z,d) ; local zx,w,w2,b,e,e2,b2,se,se2,sar2 ; zx = z'x ; if d==1 ; w = invpd(inw(z)) ; else ; w = invpd(z'z) ; endif ; b = invpd(zx'w*zx)*zx'w*z'y ; e = y-x*b ; w2 = ezw(e,z) ; se = invpd(zx'w*zx)*zx'w*w2*w*zx*invpd(zx'w*zx) ; 89 w = invpd(w2) ; se2 = invpd(zx'w*zx) ; b2 = se2*zx'w*z'y ; e2 = y-x*b2 ; sar2 = e2'z*w*z'e2 ; retp(b,sqrt(diag(se)),b2,sqrt(diag(se2)),sar2) ; endp ; proc ezw(e,z) ; local k,ez,T ; T = rows(e)/N ; k = cols(z) ; ez = reshape(e.*z,N,K*T)*(ones(T,1).*.eye(K)) ; retp(ez'ez) ; endp ; proc inw(z) ; local a,i,zi,zaz,T ; t = rows(z)/N ; a = eye(T) ; zaz = 0 ; i = 1; do until i>N ; zi = z[(i-1)*T+1 :i*T,.] ; zaz = zaz + zi'a*zi ; i = i+1 ; endo ; retp(zaz) ; endp ; 90 Appendix 11. DPD estimation with Gauss c /* DPD1.PRG Program for DPD (Dynamic Panel Data model) Method : Arellano-Bond */ /* Defines variables below as global */ clearg N,T,y,x,z,alpha,sco,hes,zgy,fake,mom,w ; /*Read data*/ n=595 ; t=7 ; nvar=13 ; load x[n*t,nvar]=d :/dea/panel/psid.dat ; lwage=x[.,13] ; wks=x[.,3] ; occ=x[.,4] ; clear x ; /* Create a (NxT) matrix for dependent var. */ y=reshape(lwage,n,t) ; /* Stack exogenous vars. */ x=wksocc ; /* Set top=0 for instruments from lagged Y's only ; top=1 to add instruments from X that are weakly exogenous and in level ; set top=2 to add for instruments from X that are strongly exogenous and in first-difference form */ top=2 ; /* Set AR1 to 0 for general case, and AR1 to 1 for serially correlated epsilon's of order 1 (E (epi tepi ; t + 1) <> 0) */ ar1=1 ; /* You don't need to change anything after this line */ /* Define identity matrices I(T-2) for AB and BB */ ddif = eye(T-2) ; /* Construct AB instrument matrix Z. 91 First component matrix : lagged Y's Recall : if AR1=1, restriction when epsilon's are serially correlated of order 1 */ z = (y[.,1]).*.ddif[.,1] ; j = 2; do until j>cols(ddif) ; z = z((y[.,1 :j]).*.ddif[.,j]) ; j = j+1 ; endo ; if ar1==1 ; z = (y[.,1]).*.ddif[.,1] ; j = 2; do until j>cols(ddif) ; z = z((y[.,1 :j-1]).*.ddif[.,j]) ; j = j+1 ; endo ; z=z[.,2 :cols(z)] ; endif ; /* Second component matrix : Instruments from X */ /* Delete this block if you want only instruments from y's */ if top==1 ; /* Weakly exogenous X's, in level */ toto=shapent(x[.,1]) ; z2 = (toto[.,1]).*.ddif[.,1] ; j = 2; do until j>cols(ddif) ; z2 = z2((toto[.,1 :j]).*.ddif[.,j]) ; j = j+1 ; endo ; i=2 ; do until i>cols(x) ; toto=shapent(x[.,i]) ; z2 =z2((toto[.,1]).*.ddif[.,1]) ; j = 2; do until j>cols(ddif) ; z2 = z2((toto[.,1 :j]).*.ddif[.,j]) ; 92 j = j+1 ; endo ; i=i+1 ; endo ; z=zz2 ; endif ; if top==2 ; /* Strongly exogenous X's, in first-difference form */ toto=shapent(x[.,1]) ; z2 = (toto[.,3]-toto[.,2]).*.ddif[.,1] ; j = 2; do until j>cols(ddif) ; z2 = z2((toto[.,j]-toto[.,j-1]).*.ddif[.,j]) ; j = j+1 ; endo ; i=2 ;do until i>cols(x) ; toto=shapent(x[.,i]) ; z2 = z2((toto[.,3]-toto[.,2]).*.ddif[.,1]) ; j = 2; do until j>cols(ddif) ; z2 = z2((toto[.,j]-toto[.,j-1]).*.ddif[.,j]) ; j = j+1 ; endo ; i=i+1 ; endo ; z=zz2 ; endif ; b1,se1,b2,se2,sar = gmm(vec((y[.,3 :T]-y[.,2 :T-1])'), vec((y[.,2 :T-1]-y[.,1 :T-2])') trans(x),z,1) ; output file = dpd1.out on ; "Arellano-Bond GMM estimates" ; if top ==0 ; "Instruments from lagged Y's only (TOP=0)" ; endif ; if top==1 ; 93 "Instruments from X are weakly exogenous and in level (TOP=1)" ; endif ; if top==2 ; "Instruments from X are strongly exogenous and first-differenced (TOP=2)" ; endif ; if ar1==1 ; "Restricted estimates : epsilon are serially correlated of order 1 (AR1=1)" ; endif ; " Estimate standard error t-stat" ; b2se2b2./se2 ; "Nb. of conditions (instruments) " cols(z) ; "Nb. of parameters " rows(b2) ; "Hansen specification test and p-value " ; sarcdfchic(sar,cols(z)-rows(b2)) ; output off ; proc shapent(w) ; /* Reshapes vector in NxT form */ retp(reshape(w,n,t)) ; endp ; proc trans(w) ; /* Transforms matrix X in First Difference */ local toto,i,xfd ; toto=reshape(w[.,1],n,t) ; toto=vec((toto[.,3 :T]-toto[.,2 :T-1])') ; xfd=toto ; i=2 ; do until i>cols(w) ; toto=reshape(w[.,i],n,t) ; toto=vec((toto[.,3 :T]-toto[.,2 :T-1])') ; xfd=xfdtoto ; i=i+1 ; endo ; retp(xfd) ; endp ; 94 proc (2)=ls(y,x) ; /* Computes OLS, returns White var-covar matrix */ local ixx,b,e,v ; ixx = invpd(x'x) ; b = ixx*x'y ; e = y-x*b ; v = ixx*(ezw(e,x))*ixx ; retp(b,v) ; endp ; proc ezw(e,z) ; local k,ez,T ; T = rows(e)/N ; k = cols(z) ; ez = reshape(e.*z,N,K*T)*(ones(T,1).*.eye(K)) ; retp(ez'ez) ; endp ; proc inw(z) ; local d,a,i,zi,zaz,T ; T = rows(z)/N ; d = zeros(T,1)(eye(T-1)|zeros(1,T-1)) ; a = 2*eye(T) - (d + d') ; zaz = 0 ; i = 1; do until i>N ; zi = z[(i-1)*T+1 :i*T,.] ; zaz = zaz + zi'a*zi ; i = i+1 ; endo ; retp(zaz) ; endp ; proc (5)=gmm(y,x,z,d) ; local zx,w,w2,b,e,e2,b2,se,se2,sar2 ; zx = z'x ; 95 if d==1 ; w = invpd(inw(z)) ; else ; w = invpd(z'z) ; endif ; b = invpd(zx'w*zx)*zx'w*z'y ; e = y-x*b ; w2 = ezw(e,z) ; se = invpd(zx'w*zx)*zx'w*w2*w*zx*invpd(zx'w*zx) ; w = invpd(w2) ; se2 = invpd(zx'w*zx) ; b2 = se2*zx'w*z'y ; e2 = y-x*b2 ; sar2 = e2'z*w*z'e2 ; retp(b,sqrt(diag(se)),b2,sqrt(diag(se2)),sar2) ; endp ; 96 Références bibliographiques T. Amemiya et T.E. MaCurdy, Instrumental-Variable Estimation of an Error-Components Model, Econometrica, 54(4), 869880, 1986. T.W. Anderson et C. Hsiao, Formulation and Estimation of Dynamic Models Using Panel Data, Journal of Econometrics, 18, 4782, 1982. M. Arellano et S. Bond, Some Tests of Specication for Panel Data : Monte Carlo Evidence and an Application to Employment Equations, Review of Economic Studies, 58, 277297, 1991. M. Arellano et O. Bover, Another Look at the Instrumental Variable Estimation of Error-Components Models, Journal of Econometrics, 68, 2951, 1995. M. Arellano, Panel data econometrics. Oxford Universiy Press, Oxford, 2003. P. Balestra et M. Nerlove, Pooling cross-section and time-series data in the estimation of a dynamic model : the demand for natural gas, Econometrica, 34, 585-612,1966. B.H. Baltagi, Econometric Analysis of Panel Data, J. Wiley, 1995. B.H. Baltagi, Specication issues, in The econometrics of panel data : Handbook of theory and applications, chap. 9, L. Ma97 tyas and P. Sevestre eds., Kluwer Academix Publishers, Dordrecht, 196-205, 1992. T.S. Breusch, G.E. Mizon et P. Schmidt, Ecient Estimation Using Panel Data, Econometrica, 57(3), 695-700, 1989. G. Chamberlain, Panel data, in Handbook of Econometrics, pp. 1247-1318, Z. Griliches and M. Intriligator eds., North- Holland, Amsterdam, 1984. B. Dormont, Introduction à l'Econométrie des Données de Panel, Editions du Centre National de la Recherche Scientique, Paris, 1989. L.P. Hansen, Large sample properties of generalized method of moments estimators, Econometrica, 50, 102-1054, 1982. J.A. Hausman, Specication Tests in Econometrics, Econometrica, 46(6), 12511271, 1978. J.A. Hausman et W.E. Taylor, Panel Data and Unobservable Individual Eects, Econometrica, 49(6), 13771398, 1981. C. Hsiao, Analysis of Panel Data, Cambridge University Press, 1986. L. Matyas et P. Sevestre, The Econometrics of Panel Data. Handbook of Theory and Applications, Kluwer Academic Publishers, 1992. 98 M. Nerlove, A note on error components models, Econometrica, 39, 383-396, 1971. W.K. Newey, Ecient estimation of models with conditional moment restrictions, in Handbook of Statistics, C.R. Rao and H.D. Vinod (Eds.), Vol. 11, Elsevier Science Publishers, 1993. P. Sevestre, Econométrie des données de panel. Dunod, Paris, 2002. P.A.V.B. Swamy et S.S. Arora, The exact nite sample properties of the estimators of coecients in the error components regression models, Econometrica, 40, 261-275, 1972. J.M. Wooldridge, Econometric analysis of cross section and panel data. MIT Press, Cambridge, 2003. 99