L`économétrie des panels

Transcription

L`économétrie des panels
Formation SPdS, Paris, 3 décembre 2004
L'économétrie des panels
Alban THOMAS
[email protected]
1
Introduction
Données de panel : Séquence d'observations sur une population
(ménages, entreprises, pays).
En anglais : cross-sections over time ou pooled cross-section timeseries data.
Fondamental : Deux dimensions (individuelle et temporelle).
1.1 Gains à fusionner des données dans les deux dimensions
1.1.1
Moins de collinéarité entre les variables explicatives
En économie de la production et de la consommation, les prix
sont diciles à utiliser :
Séries temporelles : Les indices de prix agrégés sont très collinéaires ;
Coupe instantanée : Pas susamment de variation de prix
entre rmes ou individus.
Avec données de panel, prise en compte des variations entre individus et périodes.
Séries temporelles : pas d'information sur l'impact des caractéristiques individuelles (variables socio-économiques,...) ;
Coupes instantanées : pas d'information sur les dynamiques
d'ajustement.
2
1.1.2
Identication de termes individuels inobservables
Sous certaines conditions (voir plus loin). Si le nombre d'observations est susamment grand, on peut estimer des termes
d'hétérogénéité individuelle inobservable.
1.1.3
Réduction du biais (variables manquantes/inobservables)
Avec le panel, facile de contrôler l'hétérogénéité inobservable
entre les individus (d'où la popularité de ces méthodes).
Exemple : Décision de production et ecacité des entreprises
max = pQ
C (; Q)
où C
p : prix de vente, Q : quantité
C (:) : coût total de production.
(; Q) = c(Q);
produite,
(Q) = AQ
, p = @c@Q
1
: terme d'ecacité,
(coût Cobb-Douglas)
= ( + Q) (coût quadratique).
Cas Cobb-Douglas : log Q = (log p log 0
1
1
1
A ).
De la condition d'équilibre à l'équation estimable :
Observations Qit; pit , hétérogenéité inobservable i , entreprise i, période t.
(
)
log Qit = 1 1 (log pit log i
A )
Problème d'identication : l'équation estimable est
Q~ it = a0 + a1p~it + uit; i = 1; 2; : : : ; N; t = 1; 2; : : : ; T;
3
Q~ it = log Qit,
p~it = log pit,
a1 = 1=( 1),
a0 = ( A E log i) =( 1), Euit = 0.
Le modèle est identié si E log i = 0, i.e., Ei = 1. Sinon, A est
biasé si i est négligé et E log i 6= 0.
où
Problème empirique : Corrélation possible entre prix de vente
pit et ecacité i. 1.2 Analyse de variance
Considérons le modèle
yit = i + xiti + "it;
i = 1; 2; : : : ; N; t = 1; 2; : : : ; Ti;
où xit est scalaire, i et i sont des paramètres, et Ti : nombre de
périodes disponibles pour l'individu i.
Moments empiriques utiles :
yi
Sxxi =
T
X
1
=
y
Ti
X
t=1
(xit
et
Syyi =
i
T
t=1
xi) ;
2
Ti
X
t=1
(yit
it ;
xi
Sxyi =
yi)2;
T
X
1
=
x
i
T
Ti
X
t=1
t=1
(xit
it;
xi)(yit
i = 1; 2; : : : ; N:
L'estimateur par Moindres Carrés est calculé par
^ i = Sxyi=Sxxi
et
4
^ i = yi
xi^ ;
yi);
et la
i est
Somme des Carrés des Résidus (RSS) pour l'individu
RSSi = Syyi
2
Sxyi
=Sxxi;
with
(Ti 2) degrés de liberté:
Considérons à présent un modèle restreint avec des ordonnées
et des pentes constantes :
yit = + xit + "it;
que l'on obtient en imposant les conditions suivantes :
1 = 2 = = N (= )
1 = 2 = = N (= ):
Sous ces restrictions, l'estimateur des Moindres Carrés sera
P N P Ti
^ =
et
^ = y x^ , où
1
y = P
N T
(
i=1 t=1 xit
PN PTi
i=1 t=1
Ti
N X
X
i i i=1 t=1
x)(yit y)
(xit x)2
1
x = P
N T
yit;
i i i=1 t=1
La Somme des Carrés des Résidus est
hP P
N
Ti
T
N
i
XX
i
=1
t=1 yit
RSS
yit y 2
PN PTi
=
i=1 t=1
(
(
)
avec comme degrés de liberté :
Ti
N X
X
i=1
PN
i=1 Ti
5
t=1
2.
xit:
y)(xit x)
(xit x)
2
i2
;
Pour une majorité d'applications, le premier modèle est trop
général et l'estimation demanderait un nombre important de périodes. Si l'hétérogénéité est aditive dans le modèle, on peut considérer la spécication suivante, avec pente constante mais ordonnées diérentes :
yit = i + xit + "it:
P P
En minimisant i t (yit i xit )2 par rapport à i
on obtient :
XX
i
t
(yit
i
xit ) = 0;
XX
i
de sorte que
^ i = yi
xi
^=
et P
La RSS a maintenant i Ti
paramètres sont estimés).
t
xit(yit
P P
xit yit
Pi Pt
i t xit xit
(
(
and
,
xit ) = 0;
i
yi)
:
xi)
(N + 1) degrés de liberté (N + 1
C'est le modèle le plus utilisé dans les applications empiriques.
1.3 Quelques dénitions
Panel typique : le nombre d'individu N
périodes (T ) est petit.
est grand et celui des
Panel court (long) : quand T est petit (grand).
Panel cylindré (balanced panel) : même nombre de périodes
pour chaque individu.
6
Panel rotatif : un sous-échantillon d'individus est remplacé à
chaque période. Les panels rotatifs peuvent être cylindrés ou non.
Pseudo panel : obtenu par fusion de coupes instantanées à
diérentes périodes, avec des individus diérents.
Attrition : avec des panels longs, la probabilité que l'indivi-
dual reste dans l'échantillon décroît avec le nombre de périodes
(lassitude, déménagement, décès, faillite, etc.)
2
Le modèle linéaire
2.1 Notation
2.1.1
Notation sous forme scalaire
yit = xit + uit; i = 1; 2; : : : ; N; t = 1; 2; : : : ; T;
1
où xit est un vecteur
K de variables explicatives, est un
vecteur K
de paramètres, et uit est le résidu.
yit et les composantes de xit varient à la fois entre les individus et
dans le temps.
( 1)
Composante de la variable dépendante inexpliquée par xit :
uit = i + t + "it;
où i est l'eet
une erreur i.i.d.
individuel, t est l' eet temporel, et "it est
7
Modèle à erreurs composées de type I : uit = i + "it.
Modèle à erreurs composées de type II : uit = i + t + "it.
Permet diérentes prédictions de yit sachant
Xit :
E (yitjxit) = xit;
E (yitjxit; i) = xit + i pour l'individu i,
E (yitjxit; t) = xit + t pour la période t,
E (yitjxit; i; t) = xit + i + t pour l'individu i et la période t.
2.1.2
Notation sous forme matricielle
Y = X + + + ";
où Y; ; et " sont (NT 1), X est (NT K ).
Convention : l'indice t est le plus rapide, l'indice i est le plus lent :
0
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
@
y11
2
1
..
.
C
C
y1T C
C
y21 C
C
C
..
C
.
C
y2T C
C
..
C
.
C
yit C
C
C
..
C
.
C
yN 1 C
C
..
A
.
yNT
=
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
4
(1)
X11
..
.
X1(1)T
(1)
X21
..
.
X2(1)T
..
.
Xit(1)
..
.
XN(1)1
..
.
(1)
XNT
(K )
X11
..
.
X1(KT )
(K )
X21
..
.
X2(KT )
..
.
Xit(K )
..
.
XN(K1)
..
.
(K )
XNT
8
3
7
7
7
7
70
7
7
7B
7B
7B
7B
7B
7B
7B
7@
7
7
7
7
7
7
7
5
1
2
1
C
C
.. C
. C
k C
C
.. C
. A
K
+++"
2.1.3
Modèle sous forme vectorielle
yi = Xi + i + + "i; i = 1; 2; : : : ; N;
où yi is T 1, Xi est T K .
Note : = (1; 2; : : : ; T )0 et i = (i ; i ; : : : ; i )0 sont (T 1).
2.1.4
Matrices et opérateurs usuels
INT : matrice identité avec NT lignes et NT colonnes ;
eT : vecteur T 1 de 1 ;
B = IN (1=T )eT e0T
:
Opérateur Inter-individus (Bet-
ween Groups) ;
B = (1=N )eN e0N IT :
Opérateur Inter-périodes (Between
Periods) ;
Q = INT
IN (1=T )eT e0T
= INT
B:
Q = INT (1=N )eN e0N IT = INT
B :
Opérateur Intra-individu (Within Groups) ;
Opérateur Intra-période (Within Periods) ;
B B = (1=NT )eNT e0NT :
Calcule la moyenne dans la population.
Hypothèse importante : Pas de terme constant dans le modèle.
Sinon, utiliser B B pour décentrer toutes les variables.
9
Les opérateurs B sont utilisés pour calculer, à partir des vecteurs
et matrices à NT lignes, les moyennes spéciques aux individus
et aux périodes, qui sont aussi à NT lignes.
Les opérateurs Q sont utilisés pour calculer les écarts à ces moyennes.
2.1.5
Propriétés importantes de ces opérateurs
Symétrie, idempotence et orthogonalité
Q0 = Q; B 0 = B; Q2 = Q; B 2 = B; BQ = QB = 0;
Rang d'une matrice idempotente = sa trace
1) and rank(B ) = N:
Décomposition de l'opérateur Q avec N = T = 2 :
02
1 0 0 0 3 1
B6 0 1 0 0 7
1 0 1 1 1 C
C
6
7
Qy = B
@4 0 0 1 0 5
0 1 2 1 1 Ay
0 0 0 1
1
2
0
1 1 0 0 30 y 1
y
B y C 1 6 1 1 0 0 7B y C
C
6
7B
C
=B
@ y A 2 4 0 0 1 1 5@ y A
y
0 0 1 1 y
0
1
0
1
y
y +y
B y C 1B y +y C
C
B
C
=B
@ y A 2@ y +y A
y
y +y
)
rank(Q) = N (T
11
11
12
12
21
21
22
22
11
11
12
12
11
12
21
21
22
22
21
22
Nous utiliserons aussi, dans la notation vectorielle
BT
=T eT e0T : Opérateur Between pour un seul individu ;
= (1 )
10
QT = IT (1=T )eT e0T = IT
seul individu.
BT
: Opérateur Within pour un
2.2 Le modèle à eets xes de type I
Terminologie : le modèle à eets xes ne signie pas que les
eets individuels i ne sont pas aléatoires dans le vrai modèle !
Plutôt, l'estimation est menée conditionnellement à l'hétérogénéité inobservée : les i sont traités comme des paramètres à
estimer.
2.2.1
L'estimateur en termes du théorème de Frisch-Waugh-Lovell
L'inférence est conditionnelle aux eets individuels : les estimations sont obtenues en régressant Y sur X et des indicatrices
individuelles.
Soit E la matrice NT N des indicatrices individuelles :
2
3
1
61
6
61
6
60
6
60
6
60
E=6
6
.
6 ..
6
6
6
6
6
6
6
4
0
0
0
"
0
0
0
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
"
0
0
0
0
0
0
..
.
1
1
1
"
(i = 1) (i = 2) (i = N )
11
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
5
et considérons le modèle
= X + E + " = W + u
où W = [X; E ], = ( 0; 0)0, u = ".
Y
: Les paramètres estimés sont
numériquement identiques dans les 2 procédures suivantes :
Théorème de Frish-Waugh-Lovell
^ de ^MCO = (^ 0; ^0)0 = (W 0W )
^ = (X X ) X Y ; où
0
1
0
1
W 0Y
X = [I E (E 0E ) 1E 0]X = PE X;
Y = [I E (E 0E ) 1E 0]Y = PE Y
(résidus de la régression linéaire de X et Y sur E ).
Mais E = IN eT , E 0 E = IN e0T eT = IN T
, PE = I E (E 0E ) 1E 0 = I T1 E (IN )E 0
= I T1 (IN eT )(IN eT )0 = I IN T1 eT e0T = Q.
^ = (X X ) (X Y ) = (X 0PE0 PE X ) (X 0PE0 PE Y )
= (X 0QX ) (X 0QY ).
Par conséquent, 0
0
1
1
1
Idée derrière la procédure d'estimation des eets xes :
Eliminer les eets individuels
,
Eliminer les écarts spéciques
aux individus
(des variables)
Transformation du modèle linéaire :
X
X
yit
,
Y
1=T
BY
t
yit = (xit
= (X
1=T
t
xit) + uit
BX ) + u Bu
12
,
QY
1=T
X
t
uit
= QX + Qu:
Estimateur par Moindres Carrés :
^ = [(QX )0(QX )]
= (X 0QX )
2.2.2
1
X 0 QY
(QX )0QY = [X 0Q0QX ] (X 0Q0QY )
^ ) = " (X 0QX ) .
et V ar(
1
1
2
1
Interprétation comme un estimateur de covariance
Modèle en forme vectorielle :
2
3 2
3
2
y1
6y
6 2
6 ..
4.
yN
7
7
7
5
x1
6x
6 2
7
7
7
5
= 64 ...
xN
2
eT
3
2
3
0T 7
6
7
0
T 7
+ ... 75 + 664 e... T 775 0T
0T
6
6
6
4
1
3
2
0T
"
60 7
6"
+ + 664 ... T 775 N + 664 ...
eT
2
3
1
2
"N
7
7
7;
5
avec les hypothèses :
E ("i) = 0; E ("i"0i) = "2IT ; E ("i"0j ) = 0 i 6= j:
Les estimateurs MCO (Moindres Carrés Ordinaires) de
s'obtiennent comme
min
N
X
i=1
"0 "
i i
=
N
X
i=1
(yi
xi )0(yi
i
i
et
i
xi )
, ^ i = yi xi;
i = 1; 2; : : : ; N;
et, en substituant la dérivée partielle par rapport à , nous avons
^ =
" N;T
X
i;t
(xit xi)(xit xi)0
#
13
1
" N;T
X
i;t
#
(xit xi)(yit yi)
:
Cet estimateur est appelé L'estimateur de la covariance (covariance estimator), ou l'estimateur LSDV (Least-Square DummyVariable). est sans biais, convergent lorsque N ou T tend vers
l'inni. Sa matrice de variance-covariance s'écrit
" N
# 1
X
^
V ar ^
où
QT
= ^ "
= IT (1=T )eT e0T .
2
i=1
xiQT x0i
;
^ i est sans biais mais convergent seulement quand T
2.2.3
! 1.
Commentaires
Transformation du modèle par ltrage de la composante individuelle ) les coecients associés aux régresseurs invariant dans le
temps ne sont pas identiés.
La procédure "Eets Fixes" utilise les variations
les périodes pour chaque individu, d'où son nom.
within entre
Autre possibilité : la procédure Between, qui utilise les va-
riations entre les individus :
BY = BX + B + B";
^ = [(BX )0(BX )] 1 (BX )0BY = [X 0 BX ] 1 X 0BY:
Cet estimateur utilise les diérences entre les moyennes individuelles des variables du modèle.
PT
1
Si X1 varie dans le temps seulement, BX1
t x1it i;t
T
i, et le terme constant (ordonnée à l'origine) n'est pas identié.
=f
g =
x1 8
Une remarque concernant le calcul de l'estimateur de la
variance-covariance. Dans le modèle QY = QX + Qu, les
14
logiciels statistiques diviseraient RSS par NT
exclus). Mais dans le modèle Y
X E divisée par N T
K.
(
=
1)
+ +
K (eets xes
+ ", la RSS serait
L'estimateur de la variance dans le modèle à eets xes doit être
multiplié par NT K = N T
K.
(
)[ (
1)
]
Y
Æ
..............
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.....
3.................
Within
.
.
....
............
.
.
.
y
.
.
.
.
.
.
.
.
2.
Between
1...........
X
15
2.2.4
Tests de poolability et eets individuels
Poolability
Comme avant :
yit = i + xiti + "it
versus
yit = i + xit + "it;
mais maintenant xit est un vecteur 1 K .
H0 : 1 = 2 = = N (= ) (K (N 1) contraintes).
La statistique de test de Fisher est :
(RRSS
URSS )=K (N
URSS=N (T K 1)
1) v F (K (N 1); N (T
où RRSS : de la régression Within
PN
et URSS :
i=1 RSSi où RSSi
=
= Syyi
K
1)) ;
2
Sxyi
=Sxxi.
Test des eets individuels
H0 : 1 = = N (= ).
yit = + xit + "it
(MCO)
yit = i + xit + "it
(Within):
versus
La statistique de test de Fisher est :
(RRSS
URSS )=(N 1)
v F ((N
URSS=(NT N K )
1); NT
N
K )) ;
où RRSS : provient de la régression MCO sur les données fusionnées (pooled data)
et URSS : provient de la régression Within (LSDV) .
16
2.3 Le modèle à eets aléatoires
2.3.1
Notations et hypothèses
Problème avec le modèle Eets Fixes : perte de (beaucoup de)
degrés de liberté quand N
. Approche diérente : traiter les
eets individuels comme des eets aléatoires, i.e., l'inférence sur
le modèle est marginale (non conditionnelle aux i ) par rapport
à la population de tous les eets.
!1
Hypothèses :
i v IID(0; 2 ); "it v IID(0; "2); E (i"it) = E (ixit) = 0;
avec
E (ij ) =
E ("it"sj ) =
Ainsi cov
t s.
Soit
6=
T
"2
0
2
0
= j;
si i
sinon;
= j et t = s;
si i
sinon:
(uit; ujs) = + " si i = j et t = s, et si i = j et
2
2
2
= E (u u0 ) =
i i
une matrice (T
On a
6
6
6
4
2
+ " 2
2 + "2
2
2
2
..
.
2
2
3
2
2
..
.
2 + "2
7
7
7;
5
T ), pour chaque individu i, i = 1; 2; : : : ; N .
= IN (eT e0T ) + " IT = IN (T BT ) + " (QT + BT )
E (uu0) = = IN T
2
2
2
17
2
QT = IT BT and BT = (1=T )eT e0T . Par conséquent,
= IN 2 (T BT ) + "2(QT + BT ) = T 2 B + "2INT
ou de façon équivalente : = "2 Q + (T 2 + "2 )B .
puisque
2.3.2
Estimation par Moindres Carrés Généralisés du Modèle à
Eets Aléatoires
Forme générale :
Y
= X + U;
with E
(UU 0) = .
Les Moindres Carrés Généralisés (MCG, GLS en anglais) fournissent des estimations ecaces (de variance minimum) de , 2
et "2, basées sur une structure connue de variance-covariance .
0 1 1 0 1
^ MCG = X X X Y
^ MCG) = "2 X 0
1X et V ar(
Calcul de
1
1
.
: utilisation de la formule
r = (" )r Q + (T + " )r B
2
2
2
pour un scalaire arbitraire r. On se base sur les propriétés d'idempotence et d'orthogonalité de Q and B .
En particulier, des matrices utiles sont
= 1 Q + T 1+ 1
2
2
"
et
2
"
B
= 1 Q + (T +1 ) = B:
"
"
^ MCG = X 0
X X 0
Y
On a " # " #
= X0 X X0 Y :
=
1 2
2
1
1
1
2 1 2
1
1
"2
1
"2
18
=
où
h
X 0 (Q + B )
1
X
i
1
h
X 0 (Q + B )
1
= (T 2 + "2)="2 = 1 + T 2 ="2.
i
Y ;
Les MCG comme des Moindres Carrés Pondérés. Prémultiplions le modèle par "
1=2 et utilisons la formule MCO :
Y = X + u, où
"
1=2
Y = " Y = Q +
(" + T )1=2 B Y
"
1=2
X = " X = Q +
(" + T )1=2 B X;
de sorte que Y = (Q + 1=2B )Y; X = (Q + 1=2B )X; et
sous forme scalaire :
2.3.3
fyit g = (yit yi) + 1 2
=
yi = yit
fxitg = (xit xi) + 1 2
=
xi = xit
(1 p1 )yi
(1 p1 )xi:
Comparaison entre les MCG, MCO et Eets Fixes
1
^ MCG = X 0 QX + X 0 BX
1
1
X 0QY + X 0 BY
^ W ithin = (X 0QX ) 1X 0QY; ^ Between = (X 0BX ) 1X 0 BY;
de sorte que
^ MCG = S1^ W ithin + S2^ Between;
19
S1 = [X 0QX + 1 X 0BX ] 1X 0QX
S2 = [X 0QX + 1 X 0BX ] 1 X BX
.
où
et
0
(i) Si = 0, alors 1= = 1 et ^ MCG = ^ MCO .
(ii) Si T ! 1, alors 1= ! 0 et ^ MCG ! ^ W ithin.
(iii) Si 1= ! 1, alors ^ MCG ! ^ Between.
(iv) V ar(^ W ithin) V ar(^ MCG) est une matrice semi-dénie
2
positive.
(v) Si
2.3.4
1= ! 0, alors V ar(^ W ithin) ! V ar(^ MCG).
Eets individuels xes ou aléatoires ?
Problème crucial en économétrie des panels : comment traiter
les eets i ? Comme des paramètres ou comme des eets aléatoires ?
) Si l'inférence est limitée aux individus spéciques dans l'échan-
tillon : inférence conditionnelle, on utilise les Eets Fixes. Exemple :
Les individus ne sont pas sélectionnés aléatoirement, ou bien toutes
les entreprises dans un secteur donné sont sélectionnées.
) Si l'inférence porte sur la population totale : inférence margi-
nale (non conditionelle), on utilise les Eets Aléatoires. Exemple :
Les individus sont sélectionnés au hasard à partir d'une (grande)
population (consommateurs).
20
En pratique
Interprétation des eets dans le modèle économique ;
Processus d'échantillonnage : purement aléatoire ou non ;
Nombre d'individus (pays, régions, ménages,...) ;
Interchangeabilité des individus ;
Endogénéité des Xit (voir plus loin).
Quelques critères de choix
Lorsque l'on considère des eets xes individuels,
procédure d'estimation Fixed-Eects ou Within. Avec des effets aléatoires, procédure d'estimation MCG (Moindres Carrés
Généralisés).
Terminologie
L'estimateur MCG est une moyenne pondérée des estimateurs
Within et Between,
où le poids est l'inverse de la variance cor-
respondante.
L'estimateur Within néglige les variations entre les individus, l'estimateur Between néglige les variations
temporelles pour un individu, et enn les MCO donnent un poids
égal aux variations Within et Between.
Note. Si le modèle contient une ordonnée à l'origine :
yit = + xit + i + "it;
on utilise B
B B au lieu de B (pour éliminer ) dans les formules.
21
2.3.5
Estimateurs Best Quadratic Unbiased Estimators (BQU)
des variances
2
Si les erreurs sont normales, les estimations BQU de
s'obtiennent à partir de
PN PT
2
^ 2" = u0Qu=tr(Q) =
i=1
\
et
"2
(uit ui)
N (T 1)
t=1
N
X
0
2
2
et " + T = u Bu=tr(B ) = T
u2i =N;
car
tr(Q) = N (T
1) and tr(B ) = N .
i=1
Mais en pratique, les uit sont inconnus et l'on doit estimer les
variances à partir de uit .
1/ Wallace et Hussain (1969) : Utiliser les résidus MCO à la place
des vrais u ;
2/ Amemiya (1971) : Utiliser les résidus estimés LSDV. On a
2
2
4
^
p
pNT (^"
^ =
où 2
\
N (^
2
" + T 2
2
" )
2 )
v N 0; 20" 02
4
;
^ " =T .
2
: Utiliser les erreurs quadratiques moyennes
des régressions Within et Between.
Erreur quadratique moyenne de la régression Within :
0
2
0
0
1
0 3/ Swamy et Arora (1972)
^ " = Y QY
\
Y QX (X QX ) X QY =[N (T
et de la régression Between :
0
0
"2 + T 2 = Y BY
Y BX (X 0 BX ) 1X 0BY =[N
22
1)
K]
K
1]:
Note : Ordonnée à l'origine dans les régresseurs Between (X ), pas
dans la régression Within.
(^ ^ )
PN
1
2
: Calculer 2
N 1 i=1 i i , où i sont
des paramètres estimés associés aux indicatrices individuelles de
la régression LSDV. Et "2 est estimé à partir de la régression Within.
4/ Nerlove (1971)
^ =
^
La méthode d'estimation MCG ci-dessus avec les composantes des
variances remplacées par des estimateurs convergents : Feasible
GLS , MCG Admissibles.
23
2.4 Exemple : Demande d'eau des ménages
Utilisation des logiciels SAS et GAUSS.
Dénition des variables :
LCONSO : log de la consommation d'eau potable par tête ;
LPRICE : log du prix moyen de l'eau distribué, par mètre cube ;
LREVENUE : log du revenu par tête.
Nombre d'observations : 696 (N
= 116, T = 6).
Equation linéaire en log :
log Qit = i + log pit + log Rit + "it:
Utilité : calculer les élasticités-prix et revenu :
P
p @ log Q
=
= ;
= @Q
@p Q @ log p
R =
24
@Q R @ log Q
=
= :
@R Q @ log R
Exemple : Le logiciel Gauss
c
/* DYNTAB.PRG 16 01 2001 Residential water use */
new ; clear all ;
library tscs,pgraph ;
tscsset ;graphset ;
output le=d :/dea/panel/dyntab.out reset ;
output on ;
n=116 ; t=6 ;
load x[n*t,6]=d :/dea/panel/dyntab3.dat ;
id=x[.,1] ;
year=x[.,2] ;
conso=ln(x[.,3]) ;
price=ln(x[.,4]) ;
revenue=ln(x[.,5]) ;
precip=ln(x[.,6]) ;
vnames="year","conso","price","revenue","precip","id" ;
call saved(yearconsopricerevenueprecipid,"watle",vnames) ;
y= conso ;
x= price,revenue ;
grp= id ;
__title("Water demand equation") ;
call tscs("watle",y,x,grp) ;
25
=====================================================================
TSCS Version 3.1.2 1/17/01 3 :51 pm
=====================================================================
Data Set : watfile
OLS DUMMY VARIABLE RESULTS Dependent variable : conso
Observations :
Number of Groups :
Degrees of freedom :
Residual SS :
Std error of est :
Total SS (corrected) :
F = 35.033
P-value =
Var
price
revenue
Coef.
-0.134245
0.024386
696
116
578
2.578
0.067
2.891
with 2,578 degrees of freedom
0.000
Std. Coef.
-0.347461
0.035045
Group Number
1
2
3
...
114
115
116
Std. Error
0.018447
0.033223
Dummy Variable
4.643484
4.876781
5.252595
... ... ...
4.839490
4.858434
5.099257
t-Stat
-7.277506
0.734009
Standard Error
0.365639
0.370063
0.369474
... ... ...
0.365496
0.359065
0.366957
F-statistic for equality of dummy variables :
F(115, 578) = 58.3964 P-value : 0.0000
26
P-Value
0.000
0.463
OLS ESTIMATE OF CONSTRAINED MODEL
Dependent variable : conso
Observations :
696
Number of Groups :
116
Degrees of freedom :
693
R-squared :
0.172
Rbar-squared :
0.170
Residual SS :
32.532
Std error of est :
0.217
Total SS (corrected) : 39.308
F = 72.175
with 3,693 degrees of freedom
P-value =
0.000
Var
Coef. Std. Coef. Std. Error
t-Stat
P-Value
CONSTANT
1.164761
0.598014
1.947715
0.052
price
-0.249873
-0.406149
0.022153 -11.279345
0.000
revenue
0.376643
0.257121
0.052746
7.140637
0.000
FULL, RESTRICTED, AND PARTIAL R-SQUARED TERMSDUMMY VARIABLES ARE CONSTRAINED
TABLE OF R-SQUARED TERMS
R-squaredfull model :
0.934
R-squaredconstrained model : 0.172
Partial R-squared :
0.921
FULL, RESTRICTED, AND PARTIAL R-SQUARED TERMSX VARIABLES ARE CONSTRAINED
27
TABLE OF R-SQUARED TERMS
R-squaredfull model :
0.934
R-squaredconstrained model : 0.926
Partial R-squared :
0.108
GLS ERROR COMPONENTS RESULTS
Dependent variable : conso
Observations :
696
Number of Groups :
116
Degrees of freedom :
693
Residual SS :
3.135
Std error of est :
0.067
Total SS (corrected) : 3.517
F = 22047.870
with 3,693 degrees of freedom
P-value =
0.000
Std. errors of error terms :
Individual constant terms : 0.206
White noise error : 0.067
Var
CONSTANT
price
revenue
Coef.
4.687235
-0.149316
0.053560
Std. Coef.
-0.363264
0.071009
Std. Error
0.355285
0.017623
0.032338
28
t-Stat
13.192903
-8.472974
1.656247
P-Value
0.000
0.000
0.098
Group Number
1
2
3
4
5
...
112
113
114
115
116
Random Components
-0.346522
-0.121608
0.250638
-0.020350
0.128761
... ... ...
0.512636
-0.216224
-0.151243
-0.125587
0.104064
Lagrange Multiplier Test for Error Components Model
Null hypothesis : Individual error components do not exist.
Chi-squared statistic (1) : 1367.1014
P-value :
0.0000
29
3
Extensions
3.1 Le modèle linéaire de panel Type II
La structure d'erreur est de la forme :
uit = i + t + "it
i = 1; 2; : : : ; N; t = 1; 2; : : : ; T;
ou sous forme matricielle :
U = (IN eT ) + (eN IT ) + ";
avec = (1 ; : : : ; N )0 et = (1 ; : : : ; T )0 .
3.1.1
Le modèle à eets xes
i
et t sont traités comme des paramètres xes, l'inférence est
menée conditionnellement aux N individus sur la période
T.
3.1.2
1!
Notations
L'estimateur eets xes est obtenu en utilisant le nouvel opérateur :
Q = IN IT IN (eT e0T =T )
de sorte que Qu = fuit u
i utgit :
(eN e0N =N ) IT ;
En prenant la moyenne sur les individus, nous avons
yt = xt + t + "t
avec la contrainte
N
X
i=1
i = 0:
Et en prenant la moyenne sur les périodes :
T
X
yi = xi + i + "i avec la contrainte
t = 0;
t=1
30
Les MCO sur les écarts aux moyennes donnent :
^ = (X 0QX ) 1X 0 QY;
^ i = yi xi^ ;
^t = yt xt^ :
Si le modèle contient un terme constant, l'opérateur Q devient :
Q = IN IT
IN (eT e0T =T )
(eN e0N =N ) IT
+(eN e0N =N ) (eT e0T =T )
de sorte que Qu = fuit u
i ut + ugit, et l'estimateur Within
est
^ = (X 0QX ) X 0QY;
^ i = (yi y) (xi x)^ ;
^t = (yt y) (xt x)^ :
1
Test des eets
1/
H0 : 1 = = N
= = = T = 0.
1
Statistique de test de Fisher :
(RRSS
URSS )=(N + T 2)
v F (k1; k2);
URSS=[(N 1)(T 1) K ]
où
k1 = N + T
2; k = (N 1)(T 1)
K );
2
et
URSS (RSS Non contrainte) : à partir du modèle Within,
RRSS : (RSS contrainte) : à partir des MCO sur données fusionnées.
2/ H0 1
N
étant donné t
;t T .
:
= =
=0
6= 0 1
Statistique de test de Fisher :
(RRSS URSS )=(N 1) v F (k ; k );
URSS=[(N 1)(T 1) K ]
1
31
2
où
k1 = N
1; k = (N 1)(T 1)
2
K );
et
URSS : du modèle Within,
RRSS : de la régression avec indicatrices temporelles seulement :
3/
H0 : 1
(yit yt) = (xit xt) + (uit ut):
= = T = 0 étant donné i 6= 0; i N 1.
1
Statistique de test de Fisher :
(RRSS URSS )=(T 1) v F (k ; k );
URSS=[(N 1)(T 1) K ]
1
où
k1 = T
1; k = (N 1)(T 1)
2
K );
2
et
URSS : du modèle Within,
RRSS : de la régression Within comme dans le modèle de Type I :
(yit yi) = (xit xi) + (uit ui):
32
3.1.3
Exemple : Fonction de production agricole (Hoch, 1962)
Echantillon : 63 agriculteurs du Minnesota (US), sur la période
1946-1951.
Estimation d'une fonction de production Cobb-Douglas :
log P roduitit = + log T ravailit + log F oncierit
+ log Machinesit + log Engraisit:
0
1
2
3
4
Motivation pour incorporer des eets spéciques (dans uit) :
Climat, identique a priori entre les exploitations (t ) ;
Facteurs spéciques à l'exploitation (qualité du sol, savoir-faire,
etc.) (i ).
Tab.
1 Résultats d'estimation - Fonction de production Cobb-
Douglas
Estimation
1 (Travail)
2 (Foncier)
3 (Machines)
4 (Engrais)
Somme des R 2
Hypothèse
(I)
(II)
(III)
i = t = 0 i = 0 t = 0
0.256
0.135
0.163
0.349
0.904
0.721
0.166
0.230
0.261
0.311
0.967
0.813
33
0.043
0.199
0.194
0.289
0.726
0.884
Exemple : Le logiciel SAS
c
*;
* DYNTAB.SAS ;
*;
* Uses datafile DYNTAB3.DAT ;
*;
* Create library and file names ;
* Change directory information below ;
libname water 'd :/dea/panel' ;
filename watfile 'd :/dea/panel/dyntab3.dat' ;
* Create SAS table and read data from Ascii file ;
data wat ;
infile watfile ;
input id year conso price revenue precip ;
* Compute logs ;
lconso=log(conso) ; lprice=log(price) ;
lrevenue=log(revenue) ;
run ;
* Descriptive statistics ;
proc means data=wat ;run ;
* OLS regression ;
proc reg data=wat ;
model lconso = lprice lrevenue ;
run ;
* Model 1 : One-way Fixed effects ;
34
* cs=116 : Set the number of cross-sections ;
* option /fixone : Set one-way Fixed-effect ;
proc tscsreg data=wat cs=116 ;
model lconso= lprice lrevenue /fixone ;
run ;
* Model 2 : Two-way Fixed effects ;
* option /fixtwo : Set two-way Fixed-effect ;
proc tscsreg data=wat cs=116 ;
model lconso= lprice lrevenue /fixtwo ;
run ;
* Model 3 : One-way Random effects ;
* option /ranone : Set one-way Random-effect ;
proc tscsreg data=wat cs=116 ;
model lconso= lprice lrevenue /ranone ;
run ;
* Model 4 : Two-way Random effects ;
* option /rantwo Set Two-way Random-effect ;
proc tscsreg data=wat cs=116 ;
model lconso= lprice lrevenue /rantwo ;
run ;
* Model 5 : One-way Random effects with AR(1) ;
* option /ranone parks rho Set One-way Random-effect ;
* and compute RHO : Ar(1) parameter ;
proc tscsreg data=wat cs=116 ;
model lconso= lprice lrevenue /ranone parks rho ;
run ;
* Compute parameter estimates on each cross section ;
proc sort data=wat ;
by year ;
35
proc reg data=wat ;
model lconso= lprice lrevenue ;
by year ;
run ;
* Compute Within and Between estimates ;
* using the MEANS procedure ;
proc sort data=wat ;
by id ;
proc means data=wat noprint ;
var lconso lprice lrevenue ;
by id ;
output out=out1 mean=mconso mprice mrevenue ;
data out1 ;set out1 ;
keep id mconso mprice mrevenue ;
data wat ;
merge wat out1 ;
by id ;
data wat ;set wat ;
qconso=lconso-mconso ; qprice=lprice-mprice ;
qrevenue=lrevenue-mrevenue ;
* Within regression ;
proc reg data=wat ;
model qconso = qprice qrevenue ;
run ;
* Between regression ;
proc reg data=wat ;
model mconso = mprice mrevenue ;
run ;
36
ESTIMATES USING TSCSREG PROCEDURE
MODEL 1. ONE-WAY FIXED EFFECTS
The SAS System 16 :15 Monday, January 22, 2001 3
TSCSREG Procedure
Dependent Variable : LCONSO
Model Description
Estimation Method
FIXONE
Number of Cross Sections 116
Time Series Length
6
SSE
MSE
RSQ
Model Variance
2.578099 DFE
578
0.00446
Root MSE 0.066786
0.9344
F Test for No Fixed Effects
Numerator DF :
115 F value : 58.3964
Denominator DF : 578 Prob.>F : 0.0000
Variable
CS 1
CS 2
CS 3
CS 4
CS 5
... ...
CS 112
CS 113
CS 114
CS 115
INTERCEP
LPRICE
LREVENUE
DF
1
1
1
1
1
...
1
1
1
1
1
1
1
Parameter Estimates
Parameter Standard T for H0 :
Estimate
Error
Parameter=0
-0.455773 0.039463 -11.549433
-0.222476 0.039923 -5.572620
0.153338
0.038900 3.941882
-0.131488 0.039174 -3.356518
0.027422
0.038890 0.705132
...
...
... ...
0.420843
0.040309 10.440506
-0.322888 0.039376 -8.200102
-0.259767 0.038678 -6.716134
-0.240823 0.039379 -6.115479
5.099257
0.366957 13.896065
-0.134245 0.018447 -7.277506
0.024386
0.033223 0.734009
37
Prob > |T|
0.0001
0.0001
0.0001
0.0008
0.4810
...
0.0001
0.0001
0.0001
0.0001
0.0001
0.0001
0.4632
Variable
Label
Cross Sec
Cross Sec
Cross Sec
Cross Sec
Cross Sec
Cross Sec
Cross Sec
Cross Sec
Cross Sec
Intercept
MODEL 2. TWO-WAY FIXED EFFECTS
The SAS System 16 :15 Monday, January 22, 2001 7
TSCSREG Procedure
Dependent Variable : LCONSO
Model Description
Estimation Method
FIXTWO
Number of Cross Sections 116
Time Series Length
6
SSE
MSE
RSQ
Model Variance
2.205671 DFE
573
0.003849 Root MSE 0.062043
0.9439
F Test for No Fixed Effects
Numerator DF :
120 F value : 65.6530
Denominator DF : 573 Prob.>F : 0.0000
Variable
CS 1
CS 2
CS 3
...
CS 114
CS 115
TS 1
TS 2
TS 3
TS 4
TS 5
INTERCEP
LPRICE
LREVENUE
DF
1
1
1
...
1
1
1
1
1
1
1
1
1
1
Parameter Estimates
Parameter Standard T for H0 :
Estimate
Error
Parameter=0
-0.535192 0.040793 -13.119702
-0.302435 0.041809 -7.233670
0.120803
0.037066 3.259125
... ...
...
... ...
-0.288486 0.036463 -7.911820
-0.256215 0.036669 -6.987209
-0.102087 0.017883 -5.708681
-0.047565 0.016463 -2.889216
-0.030524 0.014486 -2.107135
-0.007359 0.012507 -0.588378
-0.025528 0.009992 -2.554900
6.316873
0.396540 15.929983
-0.251061 0.034210 -7.338896
-0.053316 0.033244 -1.603773
MODEL 3. ONE-WAY RANDOM EFFECTS
38
Prob > |T|
0.0001
0.0001
0.0012
...
0.0001
0.0001
0.0001
0.0040
0.0355
0.5565
0.0109
0.0001
0.0001
0.1093
Variable
Label
Cross Sec
Cross Sec
Cross Sec
Cross Sec
Cross Sec
Time Seri
Time Seri
Time Seri
Time Seri
Time Seri
Intercept
The SAS System 16 :15 Monday, January 22, 2001 11
TSCSREG Procedure
Dependent Variable : LCONSO
Model Description
Estimation Method
RANONE
Number of Cross Sections 116
Time Series Length
6
Variance Component Estimates
SSE 3.12498
DFE
693
MSE 0.004509 Root MSE 0.067152
RSQ 0.1087
Variance Component for Cross Sections
Variance Component for Error
0.043243
0.004460
Hausman Test for Random Effects
Degrees of Freedom : 2
m value : 14.4912 Prob. > m : 0.0007
Variable
INTERCEP
LPRICE
LREVENUE
DF
1
1
1
Parameter
Estimate
4.692305
-0.149074
0.053077
Parameter Estimates
Standard T for H0 :
Error
Parameter=0
0.354917 13.220844
0.017611 -8.465039
0.032306 1.642977
39
Prob > |T|
0.0001
0.0001
0.1008
Variable
Label
Intercept
MODEL 4. TWO-WAY FIXED EFFECTS
The SAS System 16 :15 Monday, January 22, 2001 12
TSCSREG Procedure
Dependent Variable : LCONSO
Model Description
Estimation Method
RANTWO
Number of Cross Sections 116
Time Series Length
6
Variance Component Estimates
SSE 2.707154 DFE
693
MSE 0.003906 Root MSE 0.062501
RSQ 0.0907
Variance Component for Cross Sections
Variance Component for Time Series
Variance Component for Error
0.043638
0.000746
0.003849
Hausman Test for Random Effects
Degrees of Freedom : 2
m value : 22.2377 Prob. > m : 0.0000
Variable
INTERCEP
LPRICE
LREVENUE
DF
1
1
1
Parameter
Estimate
5.674742
-0.225151
-0.018251
Parameter Estimates
Standard T for H0 :
Error
Parameter=0
0.371984 15.255323
0.027604 -8.156464
0.032401 -0.563297
40
Prob > |T|
0.0001
0.0001
0.5734
Variable
Label
Intercept
WITHIN REGRESSION USING PROC REG
Source
Model
Error
c Total
Analysis
Sum of
DF
Squares
2
0.31252
693 2.57810
695 2.89062
Root MSE
Dep Mean
C.V.
Variable
INTERCEP
QPRICE
QREVENUE
DF
1
1
1
of Variance
Mean
Square
F Value
0.15626 42.003
0.00372
0.06099
-0.00000
-1.291786E17
R-square
Adj R-sq
Prob>F
0.0001
0.1081
0.1055
Parameter Estimates
Parameter
Standard
T for H0 :
Estimate
Error
Parameter=0
-5.28092E-17 0.00231195 -0.000
-0.134245
0.01684666 -7.969
0.024386
0.03034107 0.804
Prob > |T|
1.0000
0.0001
0.4218
Variable
Label
BETWEEN REGRESSION USING PROC REG
Source
Model
Error
C Total
DF
2
693
695
Analysis of Variance
Sum of
Mean
Squares
Square
F Value
7.13103
3.56551 84.369
29.28684 0.04226
36.41786
Root MSE
Dep Mean
C.V.
Variable
INTERCEP
MPRICE
MREVENUE
DF
1
1
1
Parameter
Estimate
-0.176444
-0.259461
0.494483
0.20557
4.99481
4.11576
R-square
Adj R-sq
0.1958
0.1935
Parameter Estimates
Standard
T for H0 :
Error
Parameter=0
0.68091356 -0.259
0.02278084 -11.389
0.05958703 8.298
41
Prob>F
0.0001
Prob > |T|
0.7956
0.0001
0.0001
Variable
Label
3.2 Panels non cylindrés
3.2.1
Introduction
Dénition : Le nombre de périodes est diérent entre les individus.
Pour l'individu i, nous avons Ti périodes, et le nombre total d'obPN
servations est maintenant i=1 Ti (au lieu de NT auparavant).
Exemples
Entreprises : peuvent fermer, ou être des nouveaux entrants dans
le secteur ;
Consommateurs : peuvent démenager, décéder, refuser de répondre ;
Salariés : Chômage, changement de statut, etc.
Problème de l'attrition : la probabilité qu'un individu reste dans
l'échantillon diminue au fur et à mesure que le nombre de périodes
augmente.
3.2.2
Modèles à eets xes pour panels non-cylindrés
Le modèle à eets xes de type I pour panel non-cylindré
dérons le modèle non-cylindré avec T1
0
1 0
1
0
=1
3 et T0 = 2 1:
Consi-
2
y11
x11
1
"11
B y12 C B x12 C
B 1 C B "12 C
B
C B
C
B
C B
C
B y13 C = B x13 C + B 1 C + B "13 C :
B
C B
C
B
C B
C
@ y21 A @ x21 A
@ 2 A @ "21 A
y22
x22
2
"22
Pour éliminer , nous avons besoin d'un nouvel opérateur Within :
0
I
e
e
=
3
0
Q = 3 3 3
0
I2 e2e02=2
42
2
=
6
6
6
6
4
2=3 1=3 1=3 0 0 3
1=3 2=3 1=3 0 0 77
1=3 1=3 2=3 0 0 77 ;
0 0 0 1=2 1=2 5
0 0 0 1=2 1=2
et la même procédure que dans le cas cylindré s'applique :
où
Q = diag(ITi
^ W ithin = (X 0 QX ) 1 X 0 QY
eTi e0Ti =Ti)ji=1;2;:::;N .
43
4
Le modèle de panel augmenté
Que sont les modèles de panel augmentés ? Implication pour l'estimation ? Techniques spéciales d'estimation lorsque les MCG ne
sont plus appropriés.
4.1 Introduction
Considérons le modèle
yit = xit + zi + i + "it; i = 1; 2; : : : ; N; t = 1; 2; : : : ; T;
1
avec xit un vecteur
K de régresseurs variant dans le temps et
entre les individus, et zi un vecteur
G de régresseurs spéciques à l'individu (invariant dans le temps).
1
Exemple :
log SALAIRE = HEURES + EDUC + SEXE + i + "it:
1
1
2
Méthode d'estimation :
Within : n'est pas identiable car
= QX + (I B )Z + Q + Q" = QX + Q";
puisque BZ = Z . Seul est identiable. Mais une procédure en
QY
2 étapes est possible :
)^
1/ Régression Within
;
2/ Régression Between sur
yi
xi^ = i + Zi + "i;
44
i = 1; 2; : : : ; N;
pour estimer les .
MCG : A la fois et sont identiables.
4.2 Choix entre Within et MCG
L'un des critères de choix entre Within et MCG : présence de
zi dans le modèle.
Rappel : L'estimateur MCG est convergent et ecace à
tion que les régresseurs soient exogènes :
E (ixit) = 0
et
E (izi) = 0
(
^ MCG = + X X
1
2
0
X
1
8i; t:
= xit + i + "it.
) 6= 0, alors les MCG ne
Considérons le modèle non-augmenté yit
Si xit est endogène dans le sens E i xit
sont pas convergents :
0 1 1
= + X 0 Q + B X où = 1 + T =" , de sorte que
la condi-
0
X
X 0 1U
Q + 1B U ;
2
Q + 1B U = [X 0Q" + X 0(B + B")=]
= 0 + X 0B= + 0 = X 0= 6= 0;
car E (X 0 ") = 0 and B = .
Même problème avec le modèle augmenté, si
E Z 0
.
( ) 6= 0
45
E (X 0) 6= 0 et/ou
Conséquence importante en practique
: Si les (certains)
régresseurs sont endogènes, les estimateurs MCG ne sont pas
convergents, mais les estimateurs Within le sont car est éliminé.
Un autre critère de choix entre Within et MCG :
Si régresseurs endogènes
Choisir l'estimation Within (mais n'est pas identié) ;
Si tous les régresseurs sont exogènes, utiliser les MCG (les plus
ecaces).
)
Trois problèmes demeurent :
toujours pas identié, car dans la régression Between
yi xi zi i "i,
zi reste corrélé avec i.
Si l'on utiliser les Within, tous les régresseurs sont traités comme
endogènes (pas de distinction entre xit exogènes et endogènes).
Les estimateurs Within ne sont pas ecaces.
^=
+ +
4.3 Un important test de l'endogénéité
Hypothèse nulle : H0 : E (X 0 ) = E (Z 0) = 0 (exogénéité).
Comparaison entre 2 estimateurs :
H0
^ MCG
^ W ithin
Convergent,
Convergent,
ecace
pas ecace
Alternative Pas convergent Convergent
Hausman (1978) : Même si les xit sont exogènes, les estimateurs
MCG de ne sont pas convergents dans le modèle augmenté. Par
46
conséquent, on peut tester l'exogénéité en utilisant les paramètres
estimés de seulement.
Statistique de test de Hausman : Sous
0 h
H0,
HT = ^ W ithin ^ MCG V ar(^ W ithin) V ar(^ MCG )
^
^
W ithin MCG v (K ):
i
1
2
Remarques
^ MCG et ^ W ithin doivent avoirh les mêmes dimensions. i
La matrice de pondération V ar(^ W ithin) V ar(^ MCG) est
positive : les MCG sont plus ecaces que les Within sous l'hypothèse nulle.
V ar(^ MCG)
"2(X 0QX ) 1.
Rappel :
= " (X 0QX + X 0BX )
2
1
et
V ar(^ w )
Interprétation du nombre de degrés de liberté du test :
(
)=0
)=0 ) (
)=0
=
L'estimateur Within est basé sur la condition E X 0QU
, alors
0
1
0
que le MCG est basé sur E X
U
E X QU
et
0
E X BU
.
Pour les MCG, nous ajoutons K conditions supplémentaires (en
termes de B ) : rang de X . Le test d'Hausman utilise ces restrictions additionnelles.
(
)=0
( 47
___ ____ ____ ____ ____tm
/__
/
____/
/
____/
___/
/
/___/
/
/___/
Statistics/Data Analysis
------------------------------------------------------------------------------log: E:\dea\panel\2004\energy.smcl
log type: smcl
opened on: 15 Apr 2004, 21:59:56
1 . use energy
2 . desc
Contains data from energy.dta
obs:
1,003
vars:
16
15 Apr 2004 21:59
size:
68,204 (93.0% of memory free)
------------------------------------------------------------------------------storage display
value
variable name
type
format
label
variable label
------------------------------------------------------------------------------pgn
float %9.0g
Prix gaz naturel
eff
float %9.0g
Effectifs employes
pk
float %9.0g
Prix electricite
we
float %9.0g
Part cout energie : electricite
wg
float %9.0g
Part cout energie : gaz
wfl
float %9.0g
Part cout energie : fuel lourd
wfd
float %9.0g
Part cout energie : fuel
domestique
wbp
float %9.0g
Part cout energie : Butane Propane
lnpk
float %9.0g
Log prix electricite
lnpgn
float %9.0g
Log prix gaz naturel, normalise
par prix electricite
lnpfl
float %9.0g
Log prix fuel lourd, normalise
par prix electricite
lnpfd
float %9.0g
Log prix fuel domestique,
normalise par prix electricite
lnpbp
float %9.0g
Log prix Butane-Propane,
normalise par prix electricite
annee
float %9.0g
Annee
sire
float %9.0g
Identifiant entreprise
leff
float %9.0g
Log effectifs employes
------------------------------------------------------------------------------Sorted by: sire annee
3 . sum
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------pgn |
1003
1593.143
575.2697
649.3506
4935.065
eff |
1003
196.7009
165.1831
0
1200
pk |
1003
3591.579
12531.49
76
270000
we |
1003
.6535525
.1700342
.0755102
.989083
wg |
1003
.2682747
.1811665
.0017207
.9244898
wfl |
1003
.0336884
.1027124
0
.7529242
wfd |
1003
.0405599
.0892802
0
.5299442
wbp |
1003
.0039245
.0116155
0
.1561713
lnpk |
1003
7.536383
.2859703
6.365459
8.255204
lnpgn |
1003
-12.74313
1.400228 -18.18878 -9.613284
lnpfl |
1003
-12.56832
1.226006 -17.68294 -9.556078
lnpfd |
1003
-12.48682
1.189972 -17.26859 -9.694551
lnpbp |
1003
-12.45441
1.183546 -17.36138 -9.731269
annee |
1003
1990.54
3.847273
1983
1996
sire |
1003
5.49e+15
2.17e+15
5.48e+13
9.46e+15
leff |
1002
5.044025
.663634
3.332205
7.090077
4 . xtreg wg lnpgn lnpfl lnpfd lnpbp leff, i(sire) fe
Fixed-effects (within) regression
Group variable (i) : sire
Number of obs
Number of groups
=
=
1002
110
R-sq:
Obs per group: min =
avg =
max =
1
9.1
14
within = 0.1410
between = 0.0733
overall = 0.0366
corr(u_i, Xb)
= -0.1955
F(5,887)
Prob > F
=
=
29.12
0.0000
-----------------------------------------------------------------------------wg |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lnpgn | -.1537251
.0181908
-8.45
0.000
-.1894272
-.1180229
lnpfl |
.1140461
.0207206
5.50
0.000
.073379
.1547132
lnpfd | -.0047182
.0254882
-0.19
0.853
-.0547425
.045306
lnpbp |
.1014905
.0164493
6.17
0.000
.0692063
.1337747
leff | -.0160971
.0193974
-0.83
0.407
-.0541674
.0219731
_cons |
1.029037
.1338883
7.69
0.000
.7662621
1.291812
-------------+---------------------------------------------------------------sigma_u | .14842561
sigma_e | .09943612
rho | .69021761
(fraction of variance due to u_i)
-----------------------------------------------------------------------------F test that all u_i=0:
F(109, 887) =
12.30
Prob > F = 0.0000
5 . xtreg wg lnpgn lnpfl lnpfd lnpbp leff, i(sire) re
Random-effects GLS regression
Group variable (i) : sire
Number of obs
Number of groups
=
=
1002
110
R-sq:
Obs per group: min =
avg =
max =
1
9.1
14
within = 0.1239
between = 0.4670
overall = 0.2909
Random effects u_i ~ Gaussian
corr(u_i, X)
= 0 (assumed)
Wald chi2(5)
Prob > chi2
=
=
187.45
0.0000
-----------------------------------------------------------------------------wg |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lnpgn | -.2144363
.0167928
-12.77
0.000
-.2473497
-.181523
lnpfl |
.1528693
.0200142
7.64
0.000
.1136423
.1920964
lnpfd |
.0070502
.0252708
0.28
0.780
-.0424797
.05658
lnpbp |
.0799307
.0155383
5.14
0.000
.0494761
.1103852
leff | -.0083034
.0143499
-0.58
0.563
-.0364287
.0198219
_cons |
.575301
.0904628
6.36
0.000
.3979972
.7526048
-------------+---------------------------------------------------------------sigma_u | .09913539
sigma_e | .09943612
rho | .49848553
(fraction of variance due to u_i)
------------------------------------------------------------------------------
6 . xthausman
Hausman specification test
---- Coefficients ---|
Fixed
Random
wg |
Effects
Effects
Difference
-------------+----------------------------------------lnpgn | -.1537251
-.2144363
.0607113
lnpfl |
.1140461
.1528693
-.0388232
lnpfd | -.0047182
.0070502
-.0117684
lnpbp |
.1014905
.0799307
.0215598
leff | -.0160971
-.0083034
-.0077937
Test:
Ho:
difference in coefficients not systematic
chi2(
5) = (b-B)'[S^(-1)](b-B), S = (S_fe - S_re)
=
90.39
Prob>chi2 =
0.0000
7 . xtreg wg lnpgn lnpfl lnpfd lnpbp leff, i(sire) be
Between regression (regression on group means)
Group variable (i) : sire
Number of obs
Number of groups
=
=
1002
110
R-sq:
Obs per group: min =
avg =
max =
1
9.1
14
within = 0.0950
between = 0.5116
overall = 0.3100
sd(u_i + avg(e_i.))=
.109751
F(5,104)
Prob > F
=
=
21.78
0.0000
-----------------------------------------------------------------------------wg |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lnpgn | -.4574283
.0462411
-9.89
0.000
-.5491261
-.3657306
lnpfl |
.1751386
.0940214
1.86
0.065
-.0113093
.3615866
lnpfd |
.2341099
.1059095
2.21
0.029
.0240874
.4441324
lnpbp |
.0808667
.0512214
1.58
0.117
-.0207073
.1824407
leff | -.0404652
.0212932
-1.90
0.060
-.0826905
.0017601
_cons |
.7752163
.146705
5.28
0.000
.4842948
1.066138
------------------------------------------------------------------------------
8 . predict alpha,u
9 . log close
log: E:\dea\panel\2004\energy.smcl
log type: smcl
closed on: 15 Apr 2004, 22:08:27
-------------------------------------------------------------------------------
4.4 Estimation par la Variable Instrumentale : l'estimateur MCG de Hausman-Taylor
4.4.1
Estimation par la Variable Instrumentale
Méthode alternative : Estimation IV ( Instrumental Variable).
Dans un contexte de coupe instantanée avec N observations :
Y
= X + ";
où W est une matrice
Si K L,
=
E (X 0") 6= 0; E (W 0") = 0;
N L d'instruments.
[W 0(Y X )] = 0 , (W 0Y ) = (W 0X )
^ = (W 0X ) W 0Y
(Estimateur IV):
1
Si L > K ,
[W 0(Y
X )] = 0
(L conditions sur
et l'on construit la forme quadratique
Y X où PW W W 0W 1W 0
(
)
(Y
K
paramètres)
X )0W (W 0W ) 1W 0
= ( )
) ^ = (X 0PW0 X ) (X 0PW Y ):
1
Note : en général, les instruments W ne proviennent pas de l'équation.
4.4.2
IV dans un contexte de panel
Prise en compte de la structure de variance-covariance (
) ;
Trouver des instruments pertinents, non corrélés avec .
Considérons le modèle augmenté général :
Y
= X + X + Z + Z + + ";
1
1
2
2
1
48
1
2
2
où
X1 :
X2 :
Z1 :
Z2 :
N K1 exogène, varie selon i et t;
N K2 endogène, varie selon i et t;
N G1 exogène, varie selon i;
N G2 endogène, varie selon i:
Posons = (X10 ; X20 ; Z10 ; Z20 ) et = (10 ; 20 ; 10 ; 20 )0 .
Forme générale d'un estimateur de la variable instrumentale
1=2
1=2
pour données de panel : Soit Y Y , X
X , et
1=2
. Nous avons
h
i 1h
i
=
=
=
= PW 0
1=2PW 1=2
PW Y 0
h
Calcul de
4.4.3
^ IV
i
=
0
1
h
i
0
1=2PW 1=2Y :
= : comme dans le cas MCG usuel.
1 2
Hypothèses d'exogénéité et une première matrice d'instruments
(
)= (
)=0
Hypothèses d'exogénéité : E X10 E Z10 Des instruments évidents sont X1 et Z1 , pas susant car
K1 G1 < K1 K2 G1 G2.
Instruments supplémentaires : ne doicent pas être corrélés avec .
Puisque est la source de l'endogénéity, toute variable non corrélée avec sera un instrument valide. Les meilleurs instruments
valides sont fortement corrélés avec X2 et Z2 .
QX1 et QX2 sont des instruments valides : E QX1 0 E X10 Q
et E QX2 0 E X20 Q
.
)
0
+
+
[(
+ +
) ]= [
]=0
[(
) ]= [
X1, équivalent d'utiliser BX1 car nous devons avoir
E [X10 1U ] = E [X10 (Q + 1B )U ] = E [X10 B (Q + 1B )U ]
Pour
49
]=
puisque
BQ = 0 et BB = B .
Matrice d'instruments de Hausman-Taylor (1981) :
= [QX ; QX ; BX ; Z ] = [QX ; QX ; X ; Z ]:
Condition d'identication : Nous avons K + K + G + G paramètres à estimer, avec K + K + K + G instruments (K + K
WHT
1
2
1
1
1
2
1
1
1
2
1
2
1
1
2
1
1
2
instruments dans QX ). Par conséquent, la condition d'identication est K1 G2 .
4.4.4
Des procédures plus ecaces : Amemiya-MaCurdy et BreuschMizon-Schmidt
Utilisent le fait que si xit est exogène, nous pouvons partir des conditions : E xiti
i; t au
lieu de E x0ii
.
Amemiya et MaCurdy (1986)
(
(
)=0
) = 08 8
Amemiya et MaCurdy (1986) suggèrent d'utiliser la matrice
X1 dans la liste des instruments :
2
x11
6x
6 11
6 :::
6
6
6 x21
6
x21
X1 = 6
6
6 :::
6
6 xN 1
6
6 xN 1
6
4 :::
xN 1
x12
x12
:::
x22
x22
:::
xN 2
xN 2
:::
xN 2
:::
:::
:::
:::
:::
:::
:::
:::
:::
:::
x1T
x1T
:::
x2T
x2T
:::
xNT
xNT
:::
xNT
50
(i = 1; t = 1)
(i = 1; t = 2)
:::
(i = 2; t = 1)
(i = 2; t = 2)
:::
(i = N; t = 1)
(i = N; t = 2)
:::
(i = N; t = T )
3
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
5
QX1 = 0 et BX1 = X1. La matrice d'instruments est
= [QX; X1; Z1], et un estimateur équivalent s'obtient en
tel que
WAM
utilisant
WAM
= [QX; (QX ); BX ; Z ];
1
1
où (QX1) est construit comme X1 ci-dessus.
1
Amemiya et MaCurdy : leur matrice d'instruments fournit un
estimateur au moins aussi ecace que celui d'Hausman-Taylor, si
i n'est pas corrélé avec les régrésseurs t.
8
(
)
[(
: On ajoute QX1 à la liste des instruments de Hausman-Taylor, mais comme QX1 ; X1 est de
rang K1, on ajoute seulement T
K1 instruments. La condition d'identication est T K1 G2 .
Condition d'identication
(
1)
Breusch, Mizon et Schmidt (1989)
)
]
Estimateur encore plus e-
cace : basé sur les conditions
E QX2it 0i
i; t, au lieu de la condition
0
E QT X2i i
.
Pour BMS, l'estimateur est plus ecace si l'endogénéité dans X2
provient d'une composante invariant dans le temps. Matrice d'instruments de BMS :
[(
[(
) ]=08 8
) ]=0
WBMS = [QX; (QX1); (QX2); BX1; Z1]
où (QX1) et (QX2) sont construites de la même façon que X1
pour AM.
(
)
: Avec BMS, on ajoute QX2 aux instruments de Amemiya-MaCurdy. La condition est alors T K1
T
K2 G2. Comme précédemment, on ajoute seulement
T
K2 instruments, puisque QX2 n'est pas de rang plein,
mais de rang égal à T
K2.
Condition d'identication
(
(
1)
1)
(
1)
(
51
)
+
4.5 Calcul de la matrice de variance-covariance matrix
des estimateurs IV
Problème ici : Les régresseurs endogènes peuvent fournir des estimateurs non convergents des composantes de la variance dans ,
en particulier le paramètre .
La méthode suggérée par Hausman-Taylor (1981) procure des estimateurs convergents.
Soit
M1 le vecteur des moyennes individuelles du résidu Within :
M1 = BY
BX ^ W
= B
BX (X 0 QX ) 1X 0Q Y
= Z + + B BX (X 0QX ) X 0Q ";
= (X jX ), Z = (Z jZ ), et = ( ; ). Les 3 derniers
1
où X
1
2
1
2
1
2
termes ci-dessus peuvent être traités comme des résidus centrés,
et il sut de trouver des instruments pour Z2 an d'estimer .
L'estimateur IV de est
^B = (Z 0PC Z )
1
(Z 0PC M );
1
=
où PC est la matrice de projection associée aux instruments C
X1; Z1 . En utilisant les paramètres estimés W et B , on forme
les résidus
(
^
)
u^W
= QY
QX ^ W
and u^B = BY
^
BX ^ W
Z ^B :
Ces 2 vecteurs de résidus sont utilisés pour calculer les composantes de la variance comme dans le cas standard des Feasible
GLS (MCG admissibles).
52
4.5.1
Procédure complète d'estimation MCG-IV
Etape 1. Calculer les moyennes individuelles et les écarts à
ces moyennes, BX , BY , QX et QY .
Etape 2. Estimer les paramètres associés à X en utilisant
les Within.
Etape 3. Estimer B par la procédure IV ci-dessus.
Etape 4. Calculer 2 et "2 à partir de uW et uB , et calculer
T 2 =2" .
Etape 5. Transformer les variables par la procédure MCG
scalaire, e.g., Q
B Y yit
yi.
Etape 6. Calculer la matrice de projection PW à partir de la
matrice d'instruments W .
Etape 7. Estimer les paramètres .
^
^=1+ ^ ^
( +
p
) =
(1
^
p
)
4.6 Exemple : Equation de salaire
4.6.1
Spécication du modèle
Théorie du Capital Humain :
log w = F [X ; ; ED];
où w
1
: taux de salaire;
: aptitude du travailleur (inobservée), X1 : variables supplémentaires (secteur, statut, etc.), et ED : niveau d'éducation. Des
proxies pour l'aptitude peuvent être utilisée : nombre d'heures travaillées, expérience, etc.
Objectif principal : estimer le gain marginal associé à ED : @w=@ED.
Mais problème si l'aptitude du travailleur est constante au cours
du temps et conditionne ED ? Le vrai modèle serait
log w = F [X ; ; ED];
ED = G[; X ];
1
2
53
où X2 sont des variables supplémentaires, spéciques à l'individu.
Si l'aptitude
est remplacée par des proxies Z , on a
log w = F [X ; Z; ED] + U;
ED = G[X ; Z ] + V;
où U = F [X ; ; ED] F [X ; Z; ED] et
V = G[X ; ] G[X ; Z ].
1
2
1
2
2
1
2
Deux problèmes lorsque l'on estime la première équation en négligeant la seconde :
Si des variables sont communes à X1 et X2 , biais d'endogénéité
(à cause de ED) ;
Si Z est corrélé avec des variables omises (expliquant l'aptitude),
biais d'erreur de mesure.
4.6.2
Application : Rendements de l'éducation
Echantillon utilisé : Panel Study of Income Dynamics (PSID), University of Michigan. Voir Baltagi et KhantiAkom 1990, Cornwell
et Rupert 1988.
595 individus, sur la période 1976-1982 (7 périodes) : Chefs de
ménage (hommes et femmes) agés de 18 à 65 en 1976, avec un salaire non-nul, employés dans des entreprises privées, hors-secteur
agricole, pour les années 1976 à 1982.
54
Variables liées au statut de l'emploi
LW AGE : log du salaire ;
W KS : nombre de semaines travaillées dans l'année ;
EXP : expérience professionnelle en années à la date
de
l'échantillon ;
OCC : 1 si col bleu ;
IND : 1 si travail dans l'industrie ;
UNION : 1 si convention collective dans l'entreprise.
Variables liées aux caractéristiques des chefs de famille
SMSA : 1 si l'individu réside en zone urbaine ;
SOUT H : 1 si l'individu réside dans le sud des Etats-Unis ;
MS : Statut Marital, 1 si marié ;
F EM : 1 si femme ;
BLK : 1 si Noir ;
ED : nombre d'années dans le système éducatif.
Variables spéciques à l'individu : ED, BLK et F EM .
Estimation du modèle non-augmenté (sans les Zi)
Variables
(EXP E ,
Variables
IND).
endogènes (car corrélées à l'aptitude) : X2 :
EXP E , UNION , W KS , MS ) ;
a priori exogènes : X1 : (OCC , SOUT H , SMSA,
a priori
2
Modèle augmenté
Yit = X1it1 + X2it2 + Z1i1 + Z2i2 + i + "it
Variables a priori endogènes : Z2 : ED ;
Variables a priori exogènes : Z1 : (BLK , F EM ).
55
Tab.
2 Echantillon 1 1976-1982. Statistiques descriptives
Variable
LW AGE
EXP
W KS
OCC
IND
UNION
SOUT H
SMSA
MS
ED
F EM
BLK
Moyenne Ecart-type Minimum Maximum
6.6763
0.4615
4.6052
8.5370
19.8538
10.9664
1.0000
51.0000
46.8115
5.1291
5.0000
52.0000
0.5112
0.4999
0.0000
1.0000
0.3954
0.4890
0.0000
1.0000
0.3640
0.4812
0.0000
1.0000
0.2903
0.4539
0.0000
1.0000
0.6538
0.4758
0.0000
1.0000
0.8144
0.3888
0.0000
1.0000
12.8454
2.7880
4.0000
17.0000
0.1126
0.3161
0.0000
1.0000
0.0723
0.2590
0.0000
1.0000
56
Tab.
3 Variable dépendante : log(salaire). Régresseurs exogènes
seulement
Constante
OCC
-0.0696
SOUTH
-0.0052
SMSA
-0.1287
IND
0.0317
Within
MCG
0.0976 (0.0040)
(0.02323) -0.0701 (0.02322)
(0.05833) -0.0072 (0.05807)
(0.03295) -0.1275 (0.03290)
(0.02626) 0.0317 (0.02624)
2(4) = 0:551
Notes. Les écarts-types sont entre parenthèses.
Tab.
4 variable dépendante : log(salaire). Variables endogènes
seulement.
Within
MCG
Constante
0.0561 (0.0024)
EXPE
0.1136 (0.002467) 0.1133 (0.002466)
EXPE2
-0.0004 (0.000054) -0.0004 (0.000054)
WKS
0.0008 (0.0005994) 0.0008 (0.0005994)
MS
-0.0322 (0.01893)
-0.0325 (0.01892)
UNION
0.0301 (0.01480)
0.0300 (0.01479)
2(5) = 24:94
Notes. Les écarts-types sont entre parenthèses.
57
Tab.
5 Variable dépendante : log(salaire). Modèle aAugmenté.
Constante
OCC
SOUTH
SMSA
IND
EXPE
EXPE2
WKS
MS
UNION
FEM
BLK
ED
-0.0214
-0.0018
-0.0424
0.0192
0.1132
-0.0004
0.0008
-0.0297
0.0327
Within
(0.01378)
(0.03429)
(0.01942)
(0.01544)
(0.00247)
(0.00005)
(0.00059)
(0.01898)
(0.01492)
0.1866
-0.0243
0.0048
-0.0468
0.0148
0.1084
-0.0004
0.0008
-0.0391
0.0375
-0.1666
-0.2639
0.1373
MCG
(0.01189)
(0.01367)
(0.03188)
(0.01891)
(0.01521)
(0.00243)
(0.00005)
(0.00059)
(0.01884)
(0.01472)
(0.12646)
(0.15413)
(0.01415)
2(9) = 495:3
Notes. Les écarts-types sont entre parenthèses.
Tab.
6 Variable dépendante : log(salaire). Estimation IV
Constante
OCC
SOUTH
SMSA
IND
EXPE
EXPE2
WKS
MS
UNION
FEM
BLK
ED
Test
0.1772
-0.0207
0.0074
-0.0418
0.0135
0.1131
-0.0004
0.0008
-0.0298
0.0327
-0.1309
-0.2857
0.1379
HT
(0.017)
(0.013)
(0.031)
(0.018)
(0.015)
(0.002)
(0.005)
(0.000)
(0.018)
(0.014)
(0.126)
(0.155)
(0.021)
0.1781
-0.0208
0.0072
-0.0419
0.0136
0.1129
-0.0004
0.0008
-0.0300
0.0324
-0.1320
58
-0.2859
0.1372
AM
(0.016)
(0.013)
(0.031)
(0.018)
(0.015)
(0.002)
(0.000)
(0.000)
(0.018)
(0.014)
(0.126)
(0.155)
(0.020)
0.1748
-0.0204
0.0077
-0.0423
0.0138
0.1127
-0.0004
0.0008
-0.0303
0.0326
-0.1337
-0.2793
0.1417
BMS
(0.016)
(0.013)
(0.031)
(0.018)
(0.015)
(0.002)
(0.000)
(0.000)
(0.018)
(0.014)
(0.126)
(0.155)
(0.020)
2(3) = 5:23 2(13) = 19:29 2(13) = 12:23
Notes. Les écarts-types sont entre parenthèses.
5
Les modèles de panel dynamiques
5.1 Motivation
Utilité des panels dynamiques :
Etudier la dynamique d'ajustement dans les variables micro- et
macro. ;
Estimer des modèles économiques dans un cadre inter-temporel
(cycle de vie, nance,...)
5.2 Le modèle dynamique à eets xes
Modèle le plus simple :
yit = yi;t
1
+ i + "it;
i = 1; 2; : : : ; N ; t = 1; 2; : : : ; T;
= 1; 2; : : : ; N sont supposées
( ) = 0 8i; t, E ("it"js) = "
) = 0 8i; t.
où les conditions initiales yi0; i
connues. On fait l'hypothèse que E "it
si i j; t s et 0 sinon, E i "it
Par substitution répétée :
=
=
(
yit = "it + "i;t
5.2.1
1
+ "i;t + +
2
2
2
t
1
"i1
+ 11
t
i + t yi0:
Biais de l'estimateur des eets xes
L'estimateur Within s'écrit :
PN PT
^ =
(
i=1 t=1 yit
PN PT
i=1 t=1
yi)(yi;t
yi;
1
(yi;t yi; )
^ i = yi ^yi; ;
1
1
1
59
2
1
);
où
T
X
1
y
y =
i
T
t=1
Egalement,
T
X
1
yi; =
yi;t
T
it ;
1
1
t=1
PN PT
i=1 t=1 "it "i
NT
PN PT
1
i=1 t=1 yi;t
NT
(
1
^ = +
plimN !1
N;T
X
NT
i;t
(yi;t
yi;
1
1
;
t=1
)(yi;t
(
1
Cet estimateur existe si le dénominateur
si le numerateur converge vers 0.
Numerateur :
1
T
X
1
"i = T "it:
yi;
1
yi;
1
)
1
2
);
6= 0 et il est convergent
N
X
1
"i) = plim N yi; "i
)("it
i=1
1
car "it est auto-corrélé mais n'est pas corrélé avec i . On utilise
T
X
T
T
T T
yi;
1
= T1
+1 1
On a
plim
t=1
1
N
N
X
i=1
yi;t
1)
+
= T1 11 yi + ( (1
)
1
T
"i +
1 "i + + "i;T :
1
T 1
0
= plim N1
1
N
X
i=1
i
2
2
yi; 1"i = plim
(
2
"2
= T2
1
T
(
T
X
t=1
1
N
"it
(T 1)
(1
60
1
"i T1
N
X
"
T 1
X
1
t=1
i=1
! "T 1
X
1
T
1
t=1
1
T + T
:
)2
1
T t
T t
#)
"it
#)
"it
1
De façon similaire, on montre que plim NT
2
=1
"
2
PN;T
i;t
(yi;t
1
yi;
1
2
(
T 1) T + T
1 T (1 ) T
2
1
)
2
2
En formant le rapport de ces 2 termes, le biais asymptotique est
T
plimN !1 (^
1 (1 2)(T
) = T1 + 1 1 T1 11 1
T
= O(1=T ):
1) 1 T (1 )
1
Dans le modèle transformé
(yit yi) = (yi;t
1
yi;
1
) + ("it "i);
la variable explicative est corrélée avec le résidu, et la corrélation
est d'ordre =T . Par conséquent, l'estimateur des eets xes est
biaisé dans le cas usuel où N est grand et T est petit.
1
61
Tab.
7 Biais asymptotique de l'estimateur des eets xes - Modèle
dynamique
0.2
T
6
8
10
20
40
0.5 6
8
10
20
40
0.7 6
8
10
20
40
0.9 6
8
10
20
40
Biais Pourcent
-0.2063 -103.1693
-0.1539 -76.9597
-0.1226 -61.3139
-0.0607 -30.3541
-0.0302 -15.0913
-0.2756 -55.1282
-0.2049 -40.9769
-0.1622 -32.4421
-0.0785 -15.6977
-0.0384
-7.6819
-0.3307 -47.2392
-0.2479 -35.4084
-0.1966 -28.0912
-0.0938 -13.3955
-0.0449
-6.4114
-0.3939 -43.7633
-0.3017 -33.5179
-0.2432 -27.0248
-0.1196 -13.2934
-0.0563
-6.2561
62
5.2.2
Estimation par la Variable Instrumentale
Seule façon d'obtenir des estimateurs convergents de lorsque T
est petit. Procédure diérente pour éliminer les eets individuels :
on utilise les Diérences Premières au lieu de la transformation
Within :
(yit
yi;t
1
) = (yi;t yi;t ) + ("it
yit = yi;t + "it;
1
"i;t
2
1
)
1
et sous forme vectorielle :
yi = yi; + "i;
i = 1; 2; : : : ; N:
1
!
Dans ce modèle, yi;t 1 corrélé par construction avec "i;t 1
Besoin d'instruments qui soient non-corréles avec "it "i;t 1 mais
corrélés avec yi;t 1 yi;t 2 . Seule possibilité dans le cadre d'une
équation unique sans variables extérieures : utiliser les valeurs
de la variable dépendante.
(
(
)
)
En raison de la nature autorégressive du modèle, des instruments
provenant de valeurs futures de yit ne sont pas envisageables, car
yit est une fonction récursive de "it; "i;t 1; : : : ; "i1; i; yi0.
Pour les valeurs retardées de la variable dépendante, on peut utiliser soit yi;t 2, soit yi;t 2 yi;t 3 :
E [yi;t ("it
E [(yi;t
2
2
(
"i;t
yi;t
)
)] = E ("i;t "it) E ("i;t "i;t ) = 0;
)("it "i;t )] = E ["i;t ("it "i;t )]
E ["i;t ("it "i;t )] = 0;
yi;t )] = 0 E ("i;t ) = " ;
)(yi;t yi;t )] = 0 E ("i;t ) = " :
1
2
3
1
2
1
2
1
3
E [yi;t (yi;t
E [(yi;t yi;t
2
1
2
2
2
3
1
2
63
2
1
2
2
2
2
Les estimateurs IV sont convergents si
PN PT
N
et/ou
T
!1:
(y y )(y
y )
^ = PNi=1PT t=3 it i;t 1 i;t 2 i;t 3
i=1 t=3(yi;t 1 yi;t 2)(yi;t 2 yi;t 3)
PN PT
y y
y
ou
PNi=1PT t=3 it i;t 1 i;t 2 :
i=1 t=3 yi;t 1 yi;t 2 yi;t 2
Conclusion : Avec la transformation Within d'un modèle dynamique, même si i est éliminé, le biais d'endogénéité demeure
pour T xé, car l'opérateur Q introduit des erreurs "is corrélées
par construction avec la variable explicative (retardée).
^=
(
(
)
)
Considérons maintenant un modèle plus général :
yit = yi;t
1
+ xit + zi + i + "it:
Estimation IV :
Etape 1.
(yit
Modèle en diérences premières
yi;t
1
) = (yi;t
ou (yi;t
Utiliser yi;t 2
yi;t 2 et estimer
)
yi
et estimer
^yi;
1
2
yi;t
yi;t
3
2
) + (xit
xi;t
1
) + "it
"i;t 1:
) comme instrument pour (yi;t
; avec la procedure IV.
Substituer
premières :
Etape 2.
1
1
^ et ^ dans l'équation Between en diérences
xi^ = zi + i + "i; i = 1; 2; : : : ; N;
par MCO.
64
Etape 3.
^ 2" =
^ =
2
Estimer les composantes des variances :
PN PT
1
N (T
2
(xit
1)
PN
i=1
N
1
i=1
t=1
i2
)^
h
yi ^yi;
xi;t
1
[(yit
;
1
yi;t
1
) ^(yi;t
zi ^ xi^
i2
^
1
yi;t
2
)
T " ;
1
2
Convergence de l'estimateur IV :
L'estimateur IV de , et "2 sont convergents quand N ou
;
L'estimateur IV de and 2 sont convergents seulement si
, mais non convergents quand T est xé et N
.
!1
!1
!1
T
T
5.3 Exemple : L'étude de Balestra-Nerlove
Papier précurseur sur les modèles dynamiques en panel (1966).
Demande des ménages pour le gaz naturel aux Etats-Unis, incluant a/ la demande due au remplacement des équipements fonctionnant au gaz, et b/ la demande liée à des variations dans le
stock de ces équipements.
Système de demande :
Git = Git (1 r)Gi;t 1;
Fit = Fit (1 r)Fi;t 1;
Fit = a0 + a1Nit + a2Iit;
Git = b0 + b1Pit + b2Fit ;
où Git et Git sont respectivement la nouvelle et la demande réelle
de gaz à la période t du ménage i, r est le taux de dépréciation
des équipements, Fit et Fit sont respectivement la nouvelle et la
65
demande réelle pour les autres types d'énergie, Nit est la population totale, Iit est le revenu par tête, et Pit est le prix relatif du gaz.
Après résolution du système, l'équation à estimer s'écrit :
Git = 0 + 1Pit + 2Nit + 3Ni;t 1
+4Iit + 5Ii;t 1 + 6Gi;t 1;
où
Nit = Nit
Ni;t
1
,
Iit = Iit
Ii;t
1
, et
6 = 1 r.
Estimation : MCO, Within (LSDV) et GLS (avec l'hypothèse que
les conditions initiales Gi0 sont xées).
En accord avec la théorie, (ici, 6) est biaisé vers le haut par les
MCO et vers le bas par les eets xes (Within).
66
Tab.
3 Résultats d'estimation, modèle de Balestra-Nerlove
Paramètre
0 (Constante)
1 (Pit)
2 (Nit)
3 (Ni;t
1
)
4 (Iit)
5 (Ii;t
6 (Gi;t
1
)
1
)
MCO
Within
MCG
-3.650
-4.091
(3.316)
(11.544)
-0.0451(*)
-0.2026
-0.0879(*)
(0.027)
(0.0532)
(0.0468)
0.0174(*)
-0.0135
-0.00122
(0.0093)
(0.0215)
(0.0190)
0.00111(**) 0.0327(**) 0.00360(**)
(0.00041)
(0.0046)
(0.00129)
0.0183(**)
0.0131 0.0170(**)
(0.0080)
(0.0084)
(0.0080)
0.00326
0.0044
0.00354
(0.00197)
(0.0101)
(0.00622)
1.010(**) 0.6799(**) 0.9546(**)
(0.014)
(0.0633)
(0.0372)
Notes. N = 36, T = 11. Ecarts-types entre parenthèses. (*) et (**) : paramètre signicatif à 10% et 5% respectivement.
5.4 Estimateurs GMM pour panel dynamique
5.4.1
Introduction
Estimation par Méthode des Moments Généralisés (GMM) comme
alternative intéressante aux eets xes et MCG. Ses avantages
sont évidents dans le cas de l'estimation des modèles dynamiques
à données de panel.
Modèle simple sans régresseurs exogènes :
yit = yi;t
1
+ uit;
67
uit = i + "it:
Procédure par IC d'Anderson-Hsiao : estimateur convergent quand
T est xe, basé sur le modèle en diérences premières.
Deux désavantages :
a) Dans les procédures IV, la matrice de variance-covariance est
contrainte (homoscédasticité, pas d'auto-corrélation des erreurs) ;
b) Seulement 1 instrument utilisé pour identier 1 paramètre (soit
yi;t 2, soit yi;t 2 yi;t 3).
5.4.2
L'estimateur d'Arellano-Bond
Article important : Arellano et Bond (Review of Economics
and Statistics, 1991) : une procédedure robuste peut être utilisée
(point a)) et plus de conditions d'orthogonalité (d'instruments)
sont disponibles (point b)).
Hypothèses du modèle
(i) Pour tout i, "it n'est pas corrélé avec yi0 pour tout t ;
(ii) Pour tout i, "it n'est pas is corrélé avec i , pour tout t ;
(iii) Pour tout i, les "it ne sont pas mutuellement corrélés.
Sous ces hypothèses, on a l'ensemble de conditions de moments :
E (yisuit) = 0; t = 2; 3; : : : ; T; s = 0; 1; : : : ; t
= =
(
2;
1) 2
où uit
"it "it "i;t 1. C'est un ensemble de T T
=
conditions (comparer avec Anderson-Hsiao, où seulement 1 condition était disponible).
Hypothèse importante : les conditions ci-dessus tiennent si les
termes d'erreur " ne sont pas auto-corrélés, i.e., on doit avoir
E "it"i;t+s
, pour s
; .
(
)=0
= 11
68
Si de l'auto-corrélation est présente, on a l'ensemble de conditions :
E (yisuit) = 0; t = 3; : : : ; T; s = 0; 1; : : : ; t
(
1)(
2) 2
ce qui donne T
T
= conditions (on en perd
Par substitution répétée, on a :
3;
(T 1)).
1
t
yit = "it + "i;t + "i;t + +
"i +
i + t yi ;
1 de sorte que yit = f ("it; "i;t ; : : : ; "i ; i ; yi ), et
E (yi;t uit) = E (yi;t ("it "i;t ))
= E ("i;t ("it "i;t )) = 0
car par hypothèse E (i"it) = E ("ityi ) = 0.
2
1
t
2
1
1
1
1
2
0
0
2
2
1
1
0
5.4.3
Mise en pratique de l'estimateur GMM
On a besoin de a) 1 matrice d'instruments W ;
b) 1 matrice de pondération initiale.
La sous-matrice pour l'individu i est de la forme :
2
3
0 0 0
6 0 yi yi 0
0 0 0
6
60 0 0 y
0
i yi yi 0
Wi = 6
6.
.
.
.
.
.
.
.
.
yi0
0
4 ..
0
..
..
.
7
7
7
7
7
5
1
..
..
0
..
1
..
0 0 0 0
69
2
..
yi0
..
..
yi;T
2
Wi0ui =
ui2 yi0 1 0
B
ui3 yi0 C
C B
B
ui3 yi1 C
C B
B
ui4 yi0 C
C B
B
ui4 yi1 C
C B
=B
ui4 yi2 C
C B
de sorte que
0
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
@
C
C
C
C
C
A
..
.
uiT yi
..
.
0
uiT yi;T
et E (Wi0ui) = 0.
B
B
B
B
B
@
2
(yi
(yi
(yi
(yi
(yi
(yi
3
3
4
4
4
(yiT
..
.
yi;T
1
..
.
(yiT
1
yi1) yi0
yi2) yi0
yi2) yi1
yi3) yi0
yi3) yi1
yi3) yi2
2
yi;T
( )
1
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
A
) yi
0
) yi;T
2
Matrice de pondération initiale pour W 0 W 1 : est la matrice
de variance-covariance de " (dans le modèle transformé). Si "it
est homoscédastique, on a
E ("it"i;t 1) = E [("it "i;t 1)("i;t 1 "i;t 2)] = "2
E ("2it) = E [("it "i;t 1)("it "i;t 1)] = 2"2
E ("it"i;t+1) = E [("it "i;t 1)("i;t+1 "it)] = "2
et pour chaque individu i, E (uiu0i) = "2H , où
2
H=
(
2 1 0 0 3
1 2 1 0 0 77
0 1 2 1 0 77 ;
6
6
6
6
6 ..
4 .
..
.
..
.
..
.
..
.
..
.
..
.
.. 7
. 5
0
0 1 2
2)(T 2). Nous pouvons utiliser H pour calculer
une matrice T
la matrice de pondération initiale comme
A1 =
N
X
i=1
Wi0HWi:
70
Après calcul de l'estimateur GMM de première étape
^GMM
= arg min
u0W A W 0u
0
= y W A W 0y y0 W A W 0y ;
1
1
1
1
1
1
1
1
1
1
on peut calculer la matrice de pondération de 2e étape par :
A2 =
où
^ui = yi ^yi;
5.4.4
1
N
X
i=1
Wi0^ui^u0iWi;
.
Des procédures plus ecaces : Ahn-Schmidt, Blundell-Bond
Ahn et Schmidt (1995) proposent T
taires :
2 conditions supplémen-
E (uiT uit) = 0; t = 2; 3; : : : ; T
Avec Ahn-Schmidt et Arellano-Bond, on a T (T
1:
1)=2 + (T 2)
conditions d'orthogonalité. Ahn-Schmidt montrent qu'elles représentent l'ensemble des conditions de moment impliquées par ces
hypothèses.
Hypothèses supplémentaires
8
( )
8
Sous l'hypothèse : i, V ar "2it est la même t,
on a : E u2it est identique pour t
; ; : : : ; T . Ceci ajoute T
conditions, et l'ensemble nal de conditions est, sous l'hypothèse
d'homoscédasticité :
Homoscédasticité
( )
=1 2
E (yisuit) = 0 t = 2; : : : ; T; s = 0; : : : ; t 2;
E (yitui;t+1 yi;t+1ui;t+2) = 0 t = 1; : : : ; T 2;
E (uiui;t+1) = 0 t = 1; : : : ; T 1;
71
1
= T PTt
où ui
1
=1
uit.
(
Quand on ajoute l'hypothèse de stationarité : Cov i; yit
est la même t, cela ajoute 1 condition. L'ensemble complet de
T T
=
T
conditions est maintenant
Stationarité
(
8
1) 2 + (2 2)
E (yisuit) = 0 t = 2; : : : ; T; s = 0; : : : ; t 2;
E (uiT yit) = 0 t = 1; : : : ; T 1;
E (uityit ui;t yi;t ) = 0 t = 2; : : : ; T:
1
1
Avantage : cet ensemble est constitué uniquement de conditions
linéaires.
L'estimateur d'Ahn et Schmidt s'obtient en ajoutant à la matrice
d'instruments d'Arellano-Bond le bloc suivant, pour l'individu i :
0
1
Wi =
B
B
B
@
yi2 0 ::: :::
yi3 yi3 0 :::
..
.
0
..
.
..
.
0
0
..
.
ui
0
0 ui
..
.
::: ::: :::
yi;T
..
.
1
0
..
.
:::
:::
..
.
0
0
C
C
.. C :
. A
::: ::: ui
Comment tester la pertinence d'hypothèses additionnelles ? Soit
W 1 la matrice d'instruments associée à l'ensemble de conditions
à tester, et W 0 une matrice d'instruments associée à un ensemble
0
restreint de conditions valides. Soit et les estimateurs GMM
obtenus avec les instruments W 0; W 1 et W 0 respectivement,
(
^ ^
)
J (^) et J (^ ) les valeurs des critères GMM correspondants.
Alors, sous l'hypothèse nulle H0 : les conditions associées à W 1
0
sont valides, on a
J (^) J (^ ) v 2(rank(W 1)):
0
72
)
5.4.5
L'estimateur de Blundell-Bond
Blundell et Bond (1998) suggère d'utiliser des conditions de moment linéaires basées sur des hypothèses portant sur les conditions
initiales. Ils proposent
E (uityi;t
avec en plus,
1
) = 0 t = 3; 4; : : : ; T;
E (ui3yi2) = 0:
Cette dernière condition, combinée avec celle plus haut, implique
les restrictions non-linéaires d'Ahn et Schmidt (1995) E uit ui;t 1
; t ; : : : ; T . Cela signie que nous avons la condition suivante
de stationarité sur le modèle :
( 0 =3
yi0 =
1
i
)=
+ "i :
0
(1
)
En d'autres termes, les écarts initiaux de i =
ne doivent
pas être corrélés au niveau de i =
.
L'estimateur GMM de Blundell et Bond combine les conditions
d'Ahn et -Schmidt Wi avec leur nouveaux instruments dénis plus
haut :
2
3
(1
)
0 0 0 yi 0 0 0 yi Wi
Wi+ =
6
6
6
6
6 ..
4 .
0
2
..
.
..
.
0
3
..
.
0
0
0
0
0 yi;T
7
7
7
7;
7
5
1
pour estimer les paramètres dans un système à 2 équations :
yi = yi; + "i
yi = yi; + i + "i:
1
1
73
5.5 Exemple : Equation de demande d'énergie (gaz naturel)
74
___ ____ ____ ____ ____tm
/__
/
____/
/
____/
___/
/
/___/
/
/___/
Statistics/Data Analysis
------------------------------------------------------------------------------log: E:\dea\panel\2004\energy3.smcl
log type: smcl
opened on: 15 Apr 2004, 22:49:23
1 . use energy
2 . set matsize 800
3 . tsset sire annee
panel variable:
time variable:
sire, 5.481e+13 to 9.457e+15
annee, 1983 to 1996, but with gaps
4 . sort sire annee
5 . by sire : gen lag_we = we[_n - 1]
(110 missing values generated)
6 . by sire : gen lag_wfl = wfl[_n - 1]
(110 missing values generated)
7 . by sire : gen lag_wfd = wfd[_n - 1]
(110 missing values generated)
8 . by sire : gen lag_wbp = wbp[_n - 1]
(110 missing values generated)
9 . by sire : gen lag_wg = wg[_n - 1]
(110 missing values generated)
10 . xtabond wg lag_we lag_wfl lag_wfd lag_wbp, twostep
note: lag_wfl dropped due to collinearity
Arellano-Bond dynamic panel data
Group variable (i): sire
Time variable (t): annee
Number of obs
Number of groups
=
=
770
94
Wald chi2(4)
=
7881.35
min number of obs =
max number of obs =
mean number of obs =
1
12
8.191489
Two-step results
-----------------------------------------------------------------------------wg
|
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------wg
|
LD |
.8027447
.024249
33.10
0.000
.7552175
.8502718
lag_we
|
D1 |
.447632
.022023
20.33
0.000
.4044678
.4907962
lag_wfd
|
D1 |
.7429275
.02455
30.26
0.000
.6948104
.7910445
lag_wbp
|
D1 |
1.188523
.0898711
13.22
0.000
1.012379
1.364668
_cons
| -.0054737
.0000973
-56.27
0.000
-.0056643
-.0052831
-----------------------------------------------------------------------------Warning: Arellano and Bond recommend using one-step results for
inference on coefficients
Sargan test of over-identifying restrictions:
chi2(77) =
79.22
Prob > chi2 = 0.4089
Arellano-Bond test that average autocovariance in residuals of order 1 is 0:
H0: no autocorrelation
z = -3.20
Pr > z = 0.0014
Arellano-Bond test that average autocovariance in residuals of order 2 is 0:
H0: no autocorrelation
z =
0.35
Pr > z = 0.7294
11 . xtabond wg lag_we lag_wfl lag_wfd lag_wbp, twostep lags(2)
note: lag_wfl dropped due to collinearity
Arellano-Bond dynamic panel data
Group variable (i): sire
Time variable (t): annee
Number of obs
Number of groups
=
=
669
92
Wald chi2(5)
=
26399.30
min number of obs =
max number of obs =
mean number of obs =
1
11
7.271739
Two-step results
-----------------------------------------------------------------------------wg
|
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------wg
|
LD |
1.79913
.0475941
37.80
0.000
1.705847
1.892413
L2D |
.0281091
.0012674
22.18
0.000
.0256251
.0305932
lag_we
|
D1 |
1.2724
.0446425
28.50
0.000
1.184902
1.359897
lag_wfd
|
D1 |
1.514443
.0516318
29.33
0.000
1.413247
1.61564
lag_wbp
|
D1 |
1.395866
.0594595
23.48
0.000
1.279328
1.512405
_cons
| -.0000462
.0001437
-0.32
0.748
-.0003279
.0002355
-----------------------------------------------------------------------------Warning: Arellano and Bond recommend using one-step results for
inference on coefficients
Sargan test of over-identifying restrictions:
chi2(75) =
81.48
Prob > chi2 = 0.2848
Arellano-Bond test that average autocovariance in residuals of order 1 is 0:
H0: no autocorrelation
z = -2.63
Pr > z = 0.0085
Arellano-Bond test that average autocovariance in residuals of order 2 is 0:
H0: no autocorrelation
z = -0.18
Pr > z = 0.8576
12 . log close
log: E:\dea\panel\2004\energy3.smcl
log type: smcl
closed on: 15 Apr 2004, 22:52:17
-------------------------------------------------------------------------------
6
Les modèles à choix discret
6.1 Bref rappel des modèles binaires à choix discret
Modèles à variables dépendantes qualitatives : rappel dans le cas
binaire, et pour une coupe instantanée.
yi = xi + ui; i = 1; 2; : : : ; N;
yi = 1
si yi > 0;
yi = 0
si yi 0;
yi et yi : respectivement la variable latente (inobservée) et la variable dépendante observée ; xi : vecteur 1 K de régresseurs. Le
seuil 0 est arbitraire, car E (yi) est inconnu.
6.1.1
Modèle à Probabilité Linéaire
E (yi) = P rob(yi = 1) = xi + ui:
Non satisfaisant, car les probabilités prédites peuvent sortir de l'intervalle ; . 2 valeurs possibles pour le résidu ui :
xi (quand
yi
) ou ui
xi (quand yi
). Hétéroscédasticité par
construction, car V ar ui
P rob yi
xi 2 P rob yi
=1
1) (1
[0 1]
xi )2
=
=0
( = 0) (
( )=
1
)+
= (1 xi ) ( xi ) + xi (1 xi )
= (1 xi )[( xi ) + xi (1 xi )]
= xi (1 xi ):
2
2
75
2
( =
6.1.2
Le modèle Logit
Basé sur la distribution Logistique :
exp(xi )
P rob(yi = 1) = (xi ) = 1+exp(
xi ) ;
1
P rob(yi = 0) = 1 (xi ) = 1+exp(
xi ) ;
exp(xi )
Density : (xi ) = [1+exp(
xi )]2 :
Dans ce cas,
6.1.3
V ar(ui) = 2 =3.
Le modèle Probit
Basé sur la distribution Normale : ui est
R
xi = 1
xi N (0; 2)
P rob(yi = 1) = = 1 p2 exp( 2ui2 );
R
1 p1 exp( u2i );
P rob(yi = 0) = 1 xi = x+i =
2 2
2
2
u
Densité xi = p12 exp( 2i2 ):
2
Le paramètre n'est pas identié (apparaît dans le rapport = ) :
est donc normalisé à 1.
Méthode d'estimation : Maximum de Vraisemblance
^ = arg max
N
Y
i=1
[P rob(yi = 1)]y [1
= arg min
où
i
N
Y
i=1
P rob(yi = 0)]1
yi
F (Æixi );
F (:) est la fonction de répartition ( ou ), et Æi = 2yi
76
1.
Dans ces modèles, l'inference est conduite sur a) le signe des paramètres estimés ; b) les eets marginaux (@P rob yi
=@xi .
( = 1)
Passage aux données de panel. On considère
sorte que
uit
)
= i + "it, de
P rob(yit = 1) = P rob(yit > 0) = P rob("it > xit
= P rob("it < xit + i) = F (xit + i):
i )
6.2 Modèle Logit pour données de panel
6.2.1
Statistiques susantes
Considérons d'abord un modèle à eets xes.
Esrimateur du Maximum de Vraisemblance (MV) : il faut estimer
à la fois et i ; i
; : : : ; N , mais i et ne sont pas indépendants dans ces modèles non-linéaires. Si T est petit, l'estimateur
MV de i n'est pas convergent et par conséquent, celui de ne
l'est pas non plus. Les eets individuels i sont appelés paramètres
incidentaux (leur nombre augmente avec N ).
=1
Solution : Neyman et Scott (1948) posent le principe de l'estimation en présence de paramètres incidentaux . Supposons qu'il
existe une statistique susante i pour , i
; ; : : : ; N , qui ne
dépende pas de .
Alors, la densité conditionnelle
=1 2
f (yijxi; i; ) =
f (yijxi; i; )
;
g(ijxi; i; )
ne dépend pas de i .
Un estimateur convergent de
( j
pour g i xi; i ; ) > 0;
s'obtient alors en maximisant la
77
densité conditionnelle de
(y ; : : : ; yN ) étant donné ( ; : : : ; N ) :
1
^ = arg max
Probabilité jointe yi :
h
P rob(yi) =
exp
i
1
N
Y
i=1
P
QT
t=1
f (yijxi; i; ):
P
+
[1 + exp(xit + i)]
T
t=1 yit
T
t=1 yit xit
i
:
Si nous résolvons les conditions du 1er ordre associées à la maximisation de la log-vraisemblance par rapport à :
N X
T
@ log L X
=
@
i=1 t=1
exp(xit + i) + y x = 0;
1 + exp(xit + i) it it
et par rapport à i :
T X
@ log L
=
@i
,
T
X
t=1
t=1
yit =
exp(xit + i) + y = 0;
1 + exp(xit + i) it
T X
t=1
exp(xit + i) 1 + exp(xit + i)
i = 1; 2; : : : ; N;
i = 1; 2; : : : ; N:
PT
Par conséquent, une statistique susante pour i est : i
t=1 yit .
PT
La probabilité que t yit s est :
(
! )
T
X
X
T
i s
Q
ditxit =
! exp( )
s!(T s)!
[1
+
exp(
x
+
)]
it
i
t
78
d2Bi
=
exp
t=1
6.2.2
Probabilités conditionnelles
La probabilité conditionnelle de yi étant donné i est :
hP
i
exp
P rob (yiji) = P
d2Bi
P
(
t yit)!(T
où
exp
T
t=1 yit xit P
T
t=1 ditxit
P
t yit
T!
)! ;
Bi est un ensemble d'indices pour l'individu i :
Bi =
(
(di ; di ; : : : ; diT )jdit = 0; 1
1
2
et
T
X
t=1
dit =
T
X
t=1
)
yit :
L'ensemble Bi représente toutes les combinaisons possibles de yit
PT
pour l'individu i avec le même nombre de 1 que dans
t yit .
PT
PT
Les groupes pour lesquels
ou
T ont une
t yit
t yit
probabilité de 1, et ne contribuent en rien à la log-vraisemblance.
PT
Seuls ensembles d'intérêt : lorsque
yit
s
; T ; il y a
1
=0
=
= 2]0 [
( Ts ) =T !=[s!(T
s)!] éléments, qui correspondent à T
distinctes, de valeur s.
séquences
Notes :
La seconde expression ne dépend pas de et peut être éliminée ;
Pour calculer la probabilité ci-dessus, il faut considérer pour
chaque s toutes les séquences possibles de 0 et de 1. Exemple : si
79
T
= 4 et s = 2, on aurait 6 cas possibles et
2
1 1 0 0 30
1
61 0 1 07
exp(
x
)
i
!
6
7
T
X
X
6 1 0 0 1 7 B exp(xi ) C
7B
C
exp
ditxit = vec 6
6 0 1 1 0 7 @ exp(xi ) A
6
7
t
d2B
40 1 0 15
exp(xi )
0 0 1 1
1
2
i
6.2.3
3
=1
4
Exemple :
T =2
+ yi = 1. Soit
(yi ; yi ) = (0; 1);
(yi ; yi ) = (1; 0):
Seule séquence d'intérêt : yi1
!i = 1
!i = 0
if
if
2
1
2
1
2
On a la probabilité conditionnelle :
P rob(!i = 1)
P rob(!i = 0) + P rob(!i = 1)
exp(
i + yi2xi2 )
= [1 + exp( + x )][1 + exp( + x )]
i
i1
i
i2
[1
+
exp(
i + xi1 )][1 + exp(i + xi2 )]
exp(i + xi1 ) + exp(i + xi2 )
i + xi2 )
= exp( +exp(
i xi1) + exp(i + xi2 )
xi2 xi1) ])
= 1 exp[(
+ exp[(xi2 xi1) ] = [(xi2 xi1) ]:
Dans ce cas, Bi = fijyi1 + yi2 = 1g et la log-vraisemblance conditionnelle est log L =
P rob(!i = 1jyi1 + yi2 = 1) =
X
i2Bi
f!i log [(x i
2
xi1) ] + (1 !i) log f1
80
[(x i
2
xi1) ]gg :
2
En pratique, lorsque T > , nous devons considérer d'autres enP
sembles de séquences possibles pour lesquelles Tt yit est le même.
6.3 Le modèle Probit
On utilise traditionnellement le modèle Probit dans les cas des
eets aléatoires (facilité de calcul).
Considérons un modèle avec le terme d'erreur uit
i "it, où
i est issu d'une distribution G : et est indépendant des xi. Supposons que
()
= +
V ar() = 2 ; V ar("it) = 1; Corr(uit; uis) = =
La contribution à la vraisemblance de l'individu i est Li
Z Æi1 xi1 Z ÆiT xiT =
=2
1
1
1
2
1 + 2 :
= P rob(yi)
f (ui1; ui2; : : : ; uiT )dui1 duiT ;
()
où Æit
yit
et f : est la fonction de densité jointe des éléments dans ui .
L'intégration de cette densité n'est pas raisonnable (numériquement, manque de précision) si T est grand, mais l'on peut travailler avec la densité conditionnelle, car conditionnellement à i ,
les uit sont indépendants :
Z +1
f (ui1; ui2; : : : ; uiT ) =
=
Z
1
T
1Y
+
1 t=1
f (ui1; ui2; : : : ; uiT ji )f (i)di
f (uitji)f (i)di;
81
[0 (1 )]
=
(1+ )
où la densité de i est N ; =
(rappel : 2 =
2 ).
Butler et Mott (1982) montrent que l'on peut écrire Li comme
" T
#
Z +1
Y
2
1
L (y ) = p
i
i
1
e
ti
t=1
p2
(Æitxit + Æitti p1 )
dti;
qui est à présent une intégrale à 1 dimension qui peut facilement
être calculée numériquement (algorithme d'intégration de GaussHermite). Désavantage de cette méthode : il faut imposer que la
corrélation () est constante sur les périodes.
82
___ ____ ____ ____ ____tm
/__
/
____/
/
____/
___/
/
/___/
/
/___/
Statistics/Data Analysis
------------------------------------------------------------------------------log: E:\dea\panel\2004\paper31.smcl
log type: smcl
opened on: 13 Apr 2004, 22:44:46
1 . clear
2 . use paper31
3 . sum
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------------pgn |
3892
2031.673
507.0337
649.3506
4935.065
eff |
3892
127.4245
124.4005
0
1200
pk |
3892
1854.373
8357.252
9
270000
we |
3892
.7526084
.1939825
.0755102
1
wg |
3892
.0691366
.1490749
0
.9244898
wfl |
3892
.0595062
.1532768
0
.8358098
wfd |
3892
.1048921
.1381208
0
.8143532
wbp |
3892
.0138567
.0599029
0
.7816901
lnpk |
3892
7.620966
.2802385
6.176086
8.751222
lnpgn |
3892
-4.36909
1.362804 -11.26895 -.1333181
lnpfl |
3892
-4.396743
1.319552 -10.76311 -.1630243
lnpfd |
3892
-4.372553
1.268942 -10.34875 -.2750275
lnpbp |
3892
-4.37296
1.285537 -10.44155 -.1853326
annee |
3892
1989.5
4.031647
1983
1996
sire |
3892
5.64e+15
2.28e+15
5.48e+13
9.98e+15
r |
3892
2.604573
.8067498
0
4
leff |
3891
4.447666
.9390137
2.302585
7.090077
4 . xtlogit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) fe
note: multiple positive outcomes within groups encountered.
note: 197 groups (2758 obs) dropped due to all positive or
all negative outcomes.
Iteration
Iteration
Iteration
Iteration
Iteration
Iteration
0:
1:
2:
3:
4:
5:
log
log
log
log
log
log
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
=
=
=
=
=
=
Conditional fixed-effects logit
Group variable (i) : sire
-440.50788
-244.73554
-218.80164
-214.75859
-214.58631
-214.58586
Number of obs
Number of groups
=
=
1133
81
Obs per group: min =
avg =
max =
Log likelihood
LR chi2(5)
Prob > chi2
= -214.58586
=
=
13
14.0
14
482.63
0.0000
-----------------------------------------------------------------------------wg |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lnpgn | -4.911574
.5046251
-9.73
0.000
-5.900621
-3.922527
lnpk |
.8308617
.7184896
1.16
0.248
-.577352
2.239075
lnpfl | -1.406169
.6057111
-2.32
0.020
-2.593341
-.2189966
lnpfd |
2.446032
.7488206
3.27
0.001
.9783705
3.913693
leff |
.3644786
.6587024
0.55
0.580
-.9265543
1.655512
------------------------------------------------------------------------------
5 . xtprobit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) re
Fitting comparison model:
Iteration
Iteration
Iteration
Iteration
Iteration
0:
1:
2:
3:
4:
log
log
log
log
log
likelihood
likelihood
likelihood
likelihood
likelihood
= -2219.598
= -1491.5615
= -1424.133
= -1421.415
= -1421.408
Fitting full model:
rho = 0.0
rho = 0.1
rho = 0.2
rho = 0.3
rho = 0.4
rho = 0.5
rho = 0.6
rho = 0.7
rho = 0.8
Iteration 0:
Iteration 1:
Iteration 2:
Iteration 3:
Iteration 4:
Iteration 5:
Iteration 6:
Iteration 7:
Iteration 8:
Iteration 9:
log
log
log
log
log
log
log
log
log
log
log
log
log
log
log
log
log
log
log
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
-1421.4078
-1140.8174
-1016.5969
-942.64415
-892.79813
-857.7847
-832.86653
-814.12095
-804.14302
-814.12092
-730.50278
-696.05937
-679.81218
-666.53806
-665.50986
-658.13604
-657.09612
-657.08286
-657.08286
Random-effects probit
Group variable (i) : sire
Number of obs
Number of groups
=
=
3891
278
Random effects u_i ~ Gaussian
Obs per group: min =
13
Log likelihood
= -657.08286
Wald chi2(5)
Prob > chi2
avg =
max =
14.0
14
=
=
405.09
0.0000
-----------------------------------------------------------------------------wg |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lnpgn | -3.541549
.2524669
-14.03
0.000
-4.036375
-3.046723
lnpk |
.9321749
.3466973
2.69
0.007
.2526607
1.611689
lnpfl | -.6432045
.2752501
-2.34
0.019
-1.182685
-.1037243
lnpfd |
2.488594
.3997656
6.23
0.000
1.705068
3.27212
leff |
.4004405
.138137
2.90
0.004
.1296969
.6711841
_cons | -18.61093
3.124295
-5.96
0.000
-24.73443
-12.48742
-------------+---------------------------------------------------------------/lnsig2u |
1.970308
.1089466
1.756777
2.183839
-------------+---------------------------------------------------------------sigma_u |
2.678224
.1458918
2.407017
2.979989
rho |
.8776442
.0116992
.8528055
.8987889
-----------------------------------------------------------------------------Likelihood ratio test of rho=0: chibar2(01) = 1528.65 Prob >= chibar2 = 0.000
6 . log close
log: E:\dea\panel\2004\paper31.smcl
log type: smcl
closed on: 13 Apr 2004, 22:46:43
-------------------------------------------------------------------------------
Appendix 10. IV and GMM estimation with
c
Gauss
/* IV2.PRG Instrumental variable estimation and GMM estimation
Model y(it) = X(it)beta + Z(i) gamma
We use Hausman-Taylor, Amemiya-MaCurdy, Breusch-Mizon-Schmidt instruments,
both for IV and GMM */
new ;clear all ;
/* You only need to change this block */
/* Define dimensions
N : number of units, T=number of time periods
nvar= Nb. of variables to be read
k1 : Nb. of X1it, k2 : Nb. of X2it, g1= Nb. of Z1i, g2 : Nb. of Z2i
kq= k1+k2, kb= k1+k2+g1+g2*/
n=595 ;
t=7 ;
nvar=13 ;
k1=4 ;
k2=5 ;
g1=2 ;
g2=1 ;
kq=k1+k2 ;
kb=k1+k2+g1+g2 ;
et=ones(t,1) ;
un=ones(n*t,1) ;
unb=ones(n,1) ;
/* Read data */
load x[n*t,nvar]=psid.dat ;
output file=iv1.out reset ;
expe=x[.,1] ;
expe2=x[.,2] ;
wks=x[.,3] ;
83
occ=x[.,4] ;
ind=x[.,5] ;
south=x[.,6] ;
smsa=x[.,7] ;
ms=x[.,8] ;
fem=x[.,9] ;
unioni=x[.,10] ;
edu=x[.,11] ;
blk=x[.,12] ;
lwage=x[.,13] ;
/* Define matrices X, Z and vector Y */
x1 = occsouthsmsaind ;
x2 = expeexpe2wksmsunioni ;
z1 = femblk ;
z2 = edu ;
y = lwage ;
x = x1x2 ;
z = z1z2 ;
/* You don't need to change anything after this */
/* Compute Between and Within transformations : BX and QX
Caution : keep that order for BXZ : X,Z,Y */
qx=with(xy) ;
bxz=bet(xzy) ;
by=bxz[.,cols(bxz)] ;
bxz=bxz[.,1 :cols(bxz)-1] ;
qy=qx[.,cols(qx)] ;
qx=qx[.,1 :cols(qx)-1] ;
/* Within regression and error term (uw) */
betaw=inv(qx'qx)*qx'qy ;
uw=qy-qx*betaw ;
/* Compute variance with instruments */
exob=unbxz ;
gamb=inv(exob'exob)*(exob'by) ;
84
ub=by-exob*gamb ;
sigep=uw'uw/(n*(t-1)-kq) ;
sigq=sqrt(sigep*diag(inv(qx'qx))) ;
a=x1z1 ;
di=by-bxz[.,1 :kq]*betaw ;
zz = unz1z2 ;
gamhatw=inv(zz'*a*inv(a'*a)*a'*zz)*zz'*a*inv(a'*a)*a'*di ;
s2=(1/(n*t))*(by-bxz[.,1 :kq]*betaw
-zz*gamhatw)'*(by-bxz[.,1 :kq]*betaw-zz*gamhatw) ;
sigal=s2-(1/t)*sigep ;
theta=sqrt(sigep/(sigep+t*sigal)) ;
/* GLS transformation and estimate
Caution : keep the order 1,X1,X2,Z1,Z2 in matrix EXOG */
exog=gls(unx1x2z1z2y) ;
yg=exog[.,cols(exog)] ;
exog=exog[.,1 :cols(exog)-1] ;
betagls=inv(exog'exog)*(exog'yg) ;
siggls=sqrt(sigep*diag(inv(exog'exog))) ;
/* HT */
aht=unqxbet(x1)z1 ;
betaht=inv(exog'*aht*inv(aht'*aht)*aht'*exog)*exog'*aht*inv(aht'*aht)
*aht'*yg ;
sight=sqrt(sigep*diag(inv(exog'*aht*inv(aht'*aht)*aht'*exog))) ;
/* AM */
x1s=tam(x1) ;
aam=unqxx1sz1 ;
betaam=inv(exog'*aam*inv(aam'*aam)*aam'*exog) ;
betaam=betaam*exog'*aam*inv(aam'*aam)*aam'*yg ;
sigam=sqrt(sigep*diag(inv(exog'*aam*inv(aam'*aam)*aam'*exog))) ;
/* BMS */
85
abms1=aamtbms(with(x2)) ;
/* This is the general form for BMS instrument, it should work in most
cases. But with the application to PSID data, we must drop some variables,
see below. This means you have to delete ABMS1 below for your application
*/
/* Remove abms1 just below : */
abms1=unqxbet(x1)tbms(with(occsouthsmsaindmswksunioni))z1 ;
betabms1=inv(exog'*abms1*inv(abms1'*abms1)*abms1'*exog)
*exog'*abms1*inv(abms1'*abms1)*abms1'*yg ;
sigbms1=sqrt(sigep*diag(inv(exog'*abms1*inv(abms1'*abms1)*abms1'*exog))) ;
/* Compute variance-covariance matrices */
varq=sigep*inv(qx'qx) ; varg=sigep*inv(exog'*exog) ;
varht=sigep*inv(exog'*aht*inv(aht'*aht)*aht'*exog) ;
varam=sigep*inv(exog'*aam*inv(aam'*aam)*aam'*exog) ;
varbms1=sigep*inv(exog'*abms1*inv(abms1'*abms1)*abms1'*exog) ;
test1=(betagls[2 :kq+1]-betaw)'*inv(varq-varg[2 :kq+1,2 :kq+1]) ;
test1=test1*(betagls[2 :kq+1]-betaw) ;
test2=(betaht[2 :kq+1]-betaw)'*inv(varq-varht[2 :kq+1,2 :kq+1])
*(betaht[2 :kq+1]-betaw) ;
test3=(betaht-betaam)'*inv(varht-varam)*(betaht-betaam) ;
test4=(betaam-betabms1)'*inv(varam-varbms1)*(betaam-betabms1) ;
output file=iv1.out reset ;
output on ;
"Within estimates " ;
" Estimate standard error t-stat " ;
betawsigqbetaw./sigq ;
"GLS estimates" ;
"sigma(alpha),sigma(epsilon),theta(=(sig(ep)/(sig(ep+t*sig(al)))**(1/2))" ;
sigal sigep theta ;
" Estimate standard error t-stat " ;
betaglssigglsbetagls./siggls ;
86
"HT estimates " ;
" Estimate standard error t-stat " ;
betahtsightbetaht./sight ;
"AM estimates " ;
" Estimate standard error t-stat " ;
betaamsigambetaam./sigam ; "BMS estimates " ;
" Estimate standard error t-stat " ;
betabms1sigbms1betabms1./sigbms1 ;
"Hausman test statistics and p-value " ;
"Within vs. GLS " ;
test1cdfchic(test1,kq) ;
"Within vs. HT " ;
test2cdfchic(test2,k1-g2) ;
"AM vs. HT " ;
test3cdfchic(test3,cols(aam)-cols(aht)) ;
"BMS vs. AM " ;
test4cdfchic(test4,cols(abms1)-cols(aam)) ;
/* GMM estimation */
b1,se1,b2,se2,sar = gmm(y,unx1x2z1z2,aht,1) ;
"GMM-HT estimates " ;
" Estimate standard error t-stat " ;
b2se2b2./se2 ;
"Hansen test and p-value " ;
sar cdfchic(sar,cols(aht)-rows(b2)) ;
b1,se1,b2,se2,sar = gmm(y,unx1x2z1z2,aam,1) ;
"GMM-AM estimates " ;
" Estimate standard error t-stat " ;
b2se2b2./se2 ;
"Hansen test and p-value " ;
sar cdfchic(sar,cols(aam)-rows(b2)) ;
b1,se1,b2,se2,sar = gmm(y,unx1x2z1z2,abms1,1) ;
"GMM-BMS estimates " ;
87
" Estimate standard error t-stat " ;
b2se2b2./se2 ;
"Hansen test and p-value " ;
sar cdfchic(sar,cols(abms1)-rows(b2)) ;
output off ;
proc bet(w) ;
/* Compute BX from matrix w */
local i,term,betx ;
term=reshape(w[.,1],n,t) ;
term=meanc(term').*.et ;
term=reshape(term,n*t,1) ;
betx=term ;
i=2 ;
do until i>cols(w) ;
term=reshape(w[.,i],n,t) ;
term=reshape(meanc(term').*.et,n*t,1) ;
betx=betxterm ;
i=i+1 ;
endo ;
retp(betx) ;
endp ;
proc with(w) ;
/* Compute Within transformation for matrix W */
retp(w-bet(w)) ;
endp ;
proc gls(w) ;
/* GLS transformation */
local term ; term=w-(1-theta)*bet(w) ;
retp(term) ;
endp ;
proc tam(w) ;
/* AM transformation, stacking time observations */
local i,term,xstar ;
term=reshape(w[.,1],n,t).*.et ;
xstar=term ;
88
i=2 ;
do until i>cols(w) ;
term=reshape(w[.,i],n,t).*.et ;
xstar=xstarterm ;
i=i+1 ;
endo ;
retp(xstar) ;
endp ;
proc tbms(w) ;
/* BMS transformation, stacking time observations but deleting last column
*/
local i,term,xstar ;
term=reshape(w[.,1],n,t).*.et ;
xstar=term[.,1 :cols(term)-1] ;
i=2 ;
do until i>cols(w) ;
term=reshape(w[.,i],n,t).*.et ;
xstar=xstarterm[.,1 :cols(term)-1] ;
i=i+1 ;
endo ;
retp(xstar) ;
endp ;
proc (5)=gmm(y,x,z,d) ;
local zx,w,w2,b,e,e2,b2,se,se2,sar2 ;
zx = z'x ;
if d==1 ;
w = invpd(inw(z)) ;
else ;
w = invpd(z'z) ;
endif ;
b = invpd(zx'w*zx)*zx'w*z'y ;
e = y-x*b ;
w2 = ezw(e,z) ;
se = invpd(zx'w*zx)*zx'w*w2*w*zx*invpd(zx'w*zx) ;
89
w = invpd(w2) ;
se2 = invpd(zx'w*zx) ;
b2 = se2*zx'w*z'y ;
e2 = y-x*b2 ;
sar2 = e2'z*w*z'e2 ;
retp(b,sqrt(diag(se)),b2,sqrt(diag(se2)),sar2) ;
endp ;
proc ezw(e,z) ;
local k,ez,T ;
T = rows(e)/N ;
k = cols(z) ;
ez = reshape(e.*z,N,K*T)*(ones(T,1).*.eye(K)) ;
retp(ez'ez) ;
endp ;
proc inw(z) ;
local a,i,zi,zaz,T ;
t = rows(z)/N ;
a = eye(T) ;
zaz = 0 ;
i = 1;
do until i>N ;
zi = z[(i-1)*T+1 :i*T,.] ;
zaz = zaz + zi'a*zi ;
i = i+1 ;
endo ;
retp(zaz) ;
endp ;
90
Appendix 11. DPD estimation with Gauss
c
/* DPD1.PRG Program for DPD (Dynamic Panel Data model)
Method : Arellano-Bond */
/* Defines variables below as global */
clearg N,T,y,x,z,alpha,sco,hes,zgy,fake,mom,w ;
/*Read data*/
n=595 ; t=7 ; nvar=13 ;
load x[n*t,nvar]=d :/dea/panel/psid.dat ;
lwage=x[.,13] ;
wks=x[.,3] ;
occ=x[.,4] ;
clear x ;
/* Create a (NxT) matrix for dependent var. */
y=reshape(lwage,n,t) ;
/* Stack exogenous vars. */
x=wksocc ;
/* Set top=0 for instruments from lagged Y's only ;
top=1 to add instruments from X that are weakly exogenous and in level ;
set top=2 to add for instruments from X that are strongly exogenous and
in first-difference form */
top=2 ;
/* Set AR1 to 0 for general case, and AR1 to 1
for serially correlated epsilon's of order 1 (E (epi tepi ; t + 1) <> 0) */
ar1=1 ;
/* You don't need to change anything after this line */
/* Define identity matrices I(T-2) for AB and BB */
ddif = eye(T-2) ;
/* Construct AB instrument matrix Z.
91
First component matrix : lagged Y's
Recall : if AR1=1, restriction when epsilon's are serially correlated
of order 1 */
z = (y[.,1]).*.ddif[.,1] ;
j = 2;
do until j>cols(ddif) ;
z = z((y[.,1 :j]).*.ddif[.,j]) ;
j = j+1 ;
endo ;
if ar1==1 ;
z = (y[.,1]).*.ddif[.,1] ;
j = 2;
do until j>cols(ddif) ;
z = z((y[.,1 :j-1]).*.ddif[.,j]) ;
j = j+1 ;
endo ;
z=z[.,2 :cols(z)] ;
endif ;
/* Second component matrix : Instruments from X */
/* Delete this block if you want only instruments from y's */
if top==1 ;
/* Weakly exogenous X's, in level */
toto=shapent(x[.,1]) ;
z2 = (toto[.,1]).*.ddif[.,1] ;
j = 2;
do until j>cols(ddif) ;
z2 = z2((toto[.,1 :j]).*.ddif[.,j]) ;
j = j+1 ;
endo ;
i=2 ;
do until i>cols(x) ;
toto=shapent(x[.,i]) ;
z2 =z2((toto[.,1]).*.ddif[.,1]) ;
j = 2;
do until j>cols(ddif) ;
z2 = z2((toto[.,1 :j]).*.ddif[.,j]) ;
92
j = j+1 ;
endo ;
i=i+1 ;
endo ;
z=zz2 ;
endif ;
if top==2 ;
/* Strongly exogenous X's, in first-difference form */
toto=shapent(x[.,1]) ;
z2 = (toto[.,3]-toto[.,2]).*.ddif[.,1] ;
j = 2;
do until j>cols(ddif) ;
z2 = z2((toto[.,j]-toto[.,j-1]).*.ddif[.,j]) ;
j = j+1 ;
endo ;
i=2 ;do until i>cols(x) ;
toto=shapent(x[.,i]) ;
z2 = z2((toto[.,3]-toto[.,2]).*.ddif[.,1]) ;
j = 2;
do until j>cols(ddif) ;
z2 = z2((toto[.,j]-toto[.,j-1]).*.ddif[.,j]) ;
j = j+1 ;
endo ;
i=i+1 ;
endo ;
z=zz2 ;
endif ;
b1,se1,b2,se2,sar = gmm(vec((y[.,3 :T]-y[.,2 :T-1])'),
vec((y[.,2 :T-1]-y[.,1 :T-2])')
trans(x),z,1) ;
output file = dpd1.out on ;
"Arellano-Bond GMM estimates" ;
if top ==0 ;
"Instruments from lagged Y's only (TOP=0)" ;
endif ;
if top==1 ;
93
"Instruments from X are weakly exogenous and in level (TOP=1)" ;
endif ;
if top==2 ;
"Instruments from X are strongly exogenous and first-differenced (TOP=2)" ;
endif ;
if ar1==1 ;
"Restricted estimates : epsilon are serially correlated of order 1 (AR1=1)" ;
endif ;
" Estimate standard error t-stat" ;
b2se2b2./se2 ;
"Nb. of conditions (instruments) " cols(z) ;
"Nb. of parameters " rows(b2) ;
"Hansen specification test and p-value " ;
sarcdfchic(sar,cols(z)-rows(b2)) ;
output off ;
proc shapent(w) ;
/* Reshapes vector in NxT form */
retp(reshape(w,n,t)) ;
endp ;
proc trans(w) ;
/* Transforms matrix X in First Difference */
local toto,i,xfd ;
toto=reshape(w[.,1],n,t) ;
toto=vec((toto[.,3 :T]-toto[.,2 :T-1])') ;
xfd=toto ;
i=2 ;
do until i>cols(w) ;
toto=reshape(w[.,i],n,t) ;
toto=vec((toto[.,3 :T]-toto[.,2 :T-1])') ;
xfd=xfdtoto ;
i=i+1 ;
endo ;
retp(xfd) ;
endp ;
94
proc (2)=ls(y,x) ;
/* Computes OLS, returns White var-covar matrix */
local ixx,b,e,v ;
ixx = invpd(x'x) ;
b = ixx*x'y ;
e = y-x*b ;
v = ixx*(ezw(e,x))*ixx ;
retp(b,v) ;
endp ;
proc ezw(e,z) ;
local k,ez,T ;
T = rows(e)/N ;
k = cols(z) ;
ez = reshape(e.*z,N,K*T)*(ones(T,1).*.eye(K)) ;
retp(ez'ez) ;
endp ;
proc inw(z) ;
local d,a,i,zi,zaz,T ;
T = rows(z)/N ;
d = zeros(T,1)(eye(T-1)|zeros(1,T-1)) ;
a = 2*eye(T) - (d + d') ;
zaz = 0 ;
i = 1;
do until i>N ;
zi = z[(i-1)*T+1 :i*T,.] ;
zaz = zaz + zi'a*zi ;
i = i+1 ;
endo ;
retp(zaz) ;
endp ;
proc (5)=gmm(y,x,z,d) ;
local zx,w,w2,b,e,e2,b2,se,se2,sar2 ;
zx = z'x ;
95
if d==1 ;
w = invpd(inw(z)) ;
else ;
w = invpd(z'z) ;
endif ;
b = invpd(zx'w*zx)*zx'w*z'y ;
e = y-x*b ;
w2 = ezw(e,z) ;
se = invpd(zx'w*zx)*zx'w*w2*w*zx*invpd(zx'w*zx) ;
w = invpd(w2) ;
se2 = invpd(zx'w*zx) ;
b2 = se2*zx'w*z'y ;
e2 = y-x*b2 ;
sar2 = e2'z*w*z'e2 ;
retp(b,sqrt(diag(se)),b2,sqrt(diag(se2)),sar2) ;
endp ;
96
Références bibliographiques
T. Amemiya et T.E. MaCurdy, Instrumental-Variable Estimation of an Error-Components Model, Econometrica, 54(4), 869—880,
1986.
T.W. Anderson et C. Hsiao, Formulation and Estimation of
Dynamic Models Using Panel Data, Journal of Econometrics, 18,
47—82, 1982.
M. Arellano et S. Bond, Some Tests of Specication for Panel
Data : Monte Carlo Evidence and an Application to Employment
Equations, Review of Economic Studies, 58, 277—297, 1991.
M. Arellano et O. Bover, Another Look at the Instrumental Variable Estimation of Error-Components Models, Journal of Econometrics, 68, 29—51, 1995.
M. Arellano, Panel data econometrics. Oxford Universiy Press,
Oxford, 2003.
P. Balestra et M. Nerlove, Pooling cross-section and time-series
data in the estimation of a dynamic model : the demand for natural gas, Econometrica, 34, 585-612,1966.
B.H. Baltagi, Econometric Analysis of Panel Data, J. Wiley,
1995.
B.H. Baltagi, Specication issues, in The econometrics of panel data : Handbook of theory and applications, chap. 9, L. Ma97
tyas and P. Sevestre eds., Kluwer Academix Publishers, Dordrecht,
196-205, 1992.
T.S. Breusch, G.E. Mizon et P. Schmidt, Ecient Estimation
Using Panel Data, Econometrica, 57(3), 695-700, 1989.
G. Chamberlain, Panel data, in Handbook of Econometrics, pp.
1247-1318, Z. Griliches and M. Intriligator eds., North- Holland,
Amsterdam, 1984.
B. Dormont, Introduction à l'Econométrie des Données de Panel, Editions du Centre National de la Recherche Scientique, Paris, 1989.
L.P. Hansen, Large sample properties of generalized method of
moments estimators, Econometrica, 50, 102-1054, 1982.
J.A. Hausman, Specication Tests in Econometrics, Econometrica, 46(6), 1251—1271, 1978.
J.A. Hausman et W.E. Taylor, Panel Data and Unobservable
Individual Eects, Econometrica, 49(6), 1377—1398, 1981.
C. Hsiao, Analysis of Panel Data, Cambridge University Press,
1986.
L. Matyas et P. Sevestre, The Econometrics of Panel Data.
Handbook of Theory and Applications, Kluwer Academic Publishers, 1992.
98
M. Nerlove, A note on error components models, Econometrica,
39, 383-396, 1971.
W.K. Newey, Ecient estimation of models with conditional
moment restrictions, in Handbook of Statistics, C.R. Rao and
H.D. Vinod (Eds.), Vol. 11, Elsevier Science Publishers, 1993.
P. Sevestre, Econométrie des données de panel. Dunod, Paris,
2002.
P.A.V.B. Swamy et S.S. Arora, The exact nite sample properties of the estimators of coecients in the error components
regression models, Econometrica, 40, 261-275, 1972.
J.M. Wooldridge, Econometric analysis of cross section and panel data. MIT Press, Cambridge, 2003.
99