Exogénéité, instrumentation et sur-identification
Modèle structurel simple :
\[ y_i = \beta x_i + \gamma'w_i + u_i \]
Problème : \(\operatorname{Cov}(x_i, u_i) \neq 0\)
⟶ estimateur MCO biaisé et non convergent
Idée VI : trouver des instruments \(z_i\) tels que :
On empile les données :
Conditions clés :
\[ E[Z'u] = 0 \quad\text{(validité des instruments)} \]
\[ \operatorname{rang}(E[Z'X]) = K \quad\text{(pertinence + identification)} \]
Cas possibles :
Sous-identifié : \(L < K\)
⟶ pas assez d’instruments, le modèle n’est pas identifié
Exactement identifié : \(L = K\)
⟶ autant d’instruments que de variables endogènes
Sur-identifié : \(L > K\)
⟶ plus d’instruments que nécessaire
⟶ on dispose d’information supplémentaire sur les conditions d’orthogonalité \(E[Z'u]=0\)
Quand \(L > K\), plusieurs “combinaisons” d’instruments pourraient identifier \(\beta\).
Si tous les instruments sont valides, toutes ces manières d’identifier \(\beta\) devraient donner la même vraie valeur.
Intuition :
Les conditions d’exogénéité imposées par les instruments supplémentaires sont des restrictions supplémentaires sur le modèle.
On peut alors tester si ces restrictions supplémentaires sont compatibles avec les données.
⟶ C’est l’objet du test de sur-identification de Sargan.
On estime le modèle par VI (2SLS) et on obtient les résidus :
\[ \hat{u}_i = y_i - \hat{y}_i \]
Si les instruments sont vraiment exogènes, on doit avoir :
\[ E[z_{ji} \hat{u}_i] = 0 \quad \text{pour tous les instruments } j \]
Le test de Sargan vérifie donc dans les données si les résidus \(\hat{u}_i\) sont “orthogonaux” aux instruments \(Z\).
Idée pratique : si on peut expliquer les résidus par les instruments, alors ces derniers sont probablement corrélés aux erreurs, donc invalides.
Supposons que l’on a estimé le modèle par 2SLS :
\[ y = X\hat{\beta}_{2SLS} + \hat{u} \]
Étapes :
Étape 1 : estimer le modèle VI (2SLS) et récupérer les résidus \(\hat{u}\).
Étape 2 : régresser \(\hat{u}\) sur tous les instruments \(Z\) (et en pratique aussi les exogènes inclus dans \(X\)) :
\[ \hat{u}_i = \delta_0 + Z_i'\delta + v_i \]
Étape 3 : récupérer le \(R^2\) de cette régression, noter \(R^2_{\hat{u}\sim Z}\).
Statistique de Sargan :
\[ J = n \times R^2_{\hat{u}\sim Z} \]
où \(n\) est la taille de l’échantillon.
Sous les hypothèses suivantes :
alors, sous \(H_0\) (tous les instruments sont valides) :
\[ J \overset{a}{\sim} \chi^2_{L-K} \]
Hypothèse nulle \(H_0\) : tous les instruments sont exogènes
\(\Rightarrow E[Z'u] = 0\)
Hypothèse alternative \(H_1\) : au moins un instrument est invalidé
(corrélé aux erreurs, mauvaise spécification, etc.)
Attention : le test repose sur plusieurs hypothèses :
On calcule \(J = nR^2\) et la p-value associée à \(\chi^2_{L-K}\).
p-value élevée (par ex. > 5%) :
p-value faible (par ex. < 5%) :
⚠️ Le test ne dit pas quel instrument est invalide, uniquement s’il y a un problème global.
La statistique de Sargan est valable uniquement sous homoscédasticité.
En présence d’hétéroscédasticité (très fréquente en données micro ou panel), on utilise la version robuste :
En pratique :
Modèle :
\[ y_i = \beta x_i + \gamma'w_i + u_i \]
On a :
Statistique de Sargan :
Imaginons que l’on obtienne :
Interprétation :
Si au contraire :
alors :
Le test de Sargan ne teste pas :
Il peut rejeter \(H_0\) non pas parce qu’un instrument est “mauvais”, mais parce que :
Ne pas interpréter “non rejet de \(H_0\)” comme une preuve que les instruments sont parfaits : c’est seulement “on ne détecte pas d’invalidité”.
Rappel :
Le test de Sargan :
Interprétation en termes de moments :
1- Appliquez le test d’exogénéité de Nakamura et Nakamura en utilisant trois ensembles d’instruments :
i)- motheduc (éducation de la mère)
ii)- motheduc et fatheduc (éducation du père)
iii)- motheduc, fatheduc et huseduc (éducation du mari)
Comme le TD, d’abord appliquer le 2SLS dans Eviews, puis réaliser le test nakamura nakamura dans les IV tests. Dans quels cas le test est intéressant?
2- Si cela vous semble pertinent, appliquez les doubles moindres carrés (DMC) en utilisant les trois ensembles d’instruments.
Se baser sur le test de nakamura!!!
3- Appliquez, lorsque cela est possible, le test de sur-identification de Sargan.
Si le test de Nakamura a révélé un DMC dans lequel il y avait plus de un instrument, appliquer le test de suridentification.
4- Réalisez un test de White sur les estimations DMC et appliquez, si besoin est, la procédure de correction de White. Qu’en concluez- vous ?
Vous savez faire les tests, pour la correction, allez fouiller dans les options des estimations AVANT de lancer l’estimation.
Econométrie - L3