Économétrie — TD 6

Endogénéité & Méthode des Variables Instrumentales

Author

Pierre Beaucoral

1 Introduction

Ce polycopié reprend les notions des slides (TD 6) et les développe avec des explications, exemples simulés et schémas produits en R. Objectifs:
1) Rappeler les hypothèses MCO et la notion d’exogénéité;
2) Identifier trois sources d’endogénéité (omission, causalité inverse, erreur de mesure);
3) Introduire la méthode des variables instrumentales (2SLS/DMC), les tests (faiblesse, Sargan/Hansen, DWH) et l’implémentation EViews.

Note

Notation. On note \(Y\) la variable expliquée, \(X\) la(les) variable(s) potentiellement endogène(s), \(Z\) l’instrument (ou le vecteur d’instruments), \(W\) les contrôles exogènes, et \(u\)/\(\\varepsilon\) l’erreur.

2 Rappel MCO (BLUE) et exogénéité

Hypothèses MCO usuelles (modèle linéaire) :

  • \(\mathbb{E}[u_i]=0\)

  • \(\mathrm{Var}(u_i)=\sigma^2\) (homoscédasticité) ;

  • \(\mathrm{Cov}(u_i,u_j)=0\) (pas d’autocorrélation) ;

  • \(\mathrm{Cov}(X, u)=0\) (exogénéité).

Figure 1: Intuition : si \(X\) est corrélé au choc \(u\), l’OLS attribue à \(X\) ce qui vient de \(u\) → biais.

Conséquence clé : si \(\mathrm{Cov}(X,u)\neq 0\), l’estimateur MCO de l’effet causal de \(X\) sur \(Y\) est biaisé (et non convergent).

3 Origines de l’endogénéité (avec schémas)

3.1 Omission d’une variable pertinente

Vrai modèle \(Y=\beta_0+\beta_1 X_1+\beta_2 X_2+u\), mais on omet \(X_2\) et on estime \(Y=\beta_0+\beta_1 X_1+u\). Si \(X_1\) est corrélé avec \(X_2\), alors \(\mathrm{Cov}(X_1,u)\neq 0\) et \(\hat\beta_1^{OLS}\) est biaisé.

# A tibble: 3 × 7
# Groups:   group [3]
  group         term  estimate std.error statistic  p.value where 
  <chr>         <chr>    <dbl>     <dbl>     <dbl>    <dbl> <chr> 
1 A (faible X2) x        0.852    0.0323     26.4  4.32e-85 within
2 B (fort X2)   x        0.829    0.0282     29.4  3.61e-96 within
3 Pooled        x       -0.129    0.0340     -3.79 1.66e- 4 pooled
Figure 2: Omission d’une variable: régressions séparées par un facteur latent → pente OLS “moyenne” biaisée.

Sens du biais (mémo) :

\(\mathrm{corr}(X_1,X_2)>0\) \(\mathrm{corr}(X_1,X_2)<0\)
\(\beta_2>0\) biais positif biais négatif
\(\beta_2<0\) biais négatif biais positif

3.2 Causalité inverse

Boucle de rétroaction : \(Y\to X\) et \(X\to Y\).
Ex. dette publique ↔︎ croissance.

Causalité inverse générique X ↔︎ Y avec exemples économiques

Effet sur \(\hat\beta_1^{OLS}\) : il « récupère » une partie du retour \(Y\to X\).

3.3 Erreur de mesure sur \(X\)

On observe \(\tilde X = X + \nu\). L’OLS de \(Y\sim \tilde X\) subit un biais d’atténuation (vers 0).

Figure 3: Erreur de mesure sur X : la pente OLS avec Xbruité est plus faible (biais d’atténuation).

4 Variables instrumentales (VI) et 2SLS

4.1 Principe

But : utiliser un instrument \(Z\) pour isoler la variation exogène de \(X\).

  • Pertinence : \(\mathrm{Cov}(Z,X)\neq 0\) (1ʳᵉ étape explicative).
  • Exogénéité exclue : \(\mathrm{Cov}(Z,u)=0\) (Z n’affecte Y que via X).

Procédure 2SLS :
1) \(X = \pi_0 + \pi_1 Z + W'\pi + v\) → obtenir \(\hat X\) ;
2) \(Y = \beta_0 + \beta_1 \hat X + W'\gamma + u\).

Figure 4: Causalité inverse : X → Y et Y → X. Z est un instrument valide s’il n’affecte Y que via X.

Lecture attendue : \(\hat\beta^{OLS}\) sur \(X\) est biaisé (ici vers le haut, car \(X\) corrélé à \(u\)). L’estimateur 2SLS se rapproche de la vraie valeur (\(1{.}5\)) si \(Z\) est suffisamment pertinent et valide.

4.2 Instruments faibles (pertinence)

On regarde le F de 1ʳᵉ étape (régression de \(X\) sur \(Z\) et \(W\)) ; règle pratique usuelle : \(F>10\).

4.3 Validité de l’instrument (exogénéité)

Si l’on dispose de plus d’instruments que de variables endogènes (sur‑id), on peut tester l’orthogonalité (Sargan/Hansen‑J).

Caution

Rappel : ces tests ne remplacent jamais l’argument économique.

5 Faut‑il instrumenter ? (DWH / Nakamura–Nakamura)

Tester si l’estimation OLS est cohérente :
- \(H_0\) : MCO non biaisé (\(\beta^{OLS}\approx\beta^{2SLS}\)) → on préfère OLS (plus précis).
- \(H_A\) : MCO biaisé → on préfère 2SLS.

Tip

Décision : si le résidu de 1ʳᵉ étape est significatif, on rejette \(H_0\) (OLS biaisé) et l’on retient la spécification 2SLS.

6 Schémas/organigrammes utiles

Figure 5: Organigramme (stabilité/ruptures & instruments)

7 Mise en œuvre dans EViews (rappel)

  • 2SLS/IV : Quick → Estimate EquationMethod: TSLS.
  • Endogeneity test (DWH) : View → IV Diagnostics and Tests → Regressor Endogeneity Test.
  • Weak instruments : View → IV Diagnostics and Tests → Weak Instrument Diagnostics.
  • Instrument orthogonality : View → IV Diagnostics and Tests → Instrument Orthogonality Test.

8 Questions de TD

8.1 Q1 — Charger le workfile

Chargez le workfile Marshall (contient offre1–offre4, p1–p4, Y, W).

Afficher la réponse

EViews. File → Open → Workfile puis sélectionnez Marshall.wf*.
Vérifiez les séries (aperçu, stats descriptives : View → Descriptive Statistics).

8.2 Q2 — Estimations MCO

Estimez offre1 = c + β p1, offre2 = c + β p2, offre3 = c + β p3 et
offre4 = c + β p4 + π W (avec W exogène).

Afficher la réponse

Quick → Estimate Equation puis entrez :
offre1 c p1 ; offre2 c p2 ; offre3 c p3 ; offre4 c p4 W.
Notez signe/magnitude de \(\hat\beta\), p‑values, \(R^2\), résidus.
Rappel : si \(\mathrm{Cov}(P,\varepsilon)\neq 0\), OLS biaisé.

8.3 Q3 — Test d’exogénéité (Nakamura & Nakamura / DWH)

Avec Y comme instrument des prix, testez l’exogénéité des variables de prix.

Afficher la réponse

Dans EViews : View → IV Diagnostics and Tests → Regressor Endogeneity Test.
\(H_0\) : exogénéité. Si stat. (χ²/F) significative → rejeter \(H_0\) (prix endogène).

8.4 Q4 — Estimation en VI (2SLS)

Si nécessaire, estimez les équations d’offre en 2SLS avec Y instrument (et W exogène dans offre4).

Afficher la réponse

Quick → Estimate EquationMethod: TSLS.
Endogènes : p1 (ou p2/p3/p4). Instruments : Y (+ W en exogène).
Diagnostics : F 1ʳᵉ étape (faiblesse), Hansen/Sargan (sur‑id), DWH (faut‑il instrumenter ?).

9 Points clés à retenir

  • Identifier la source d’endogénéité oriente la solution (contrôles, interactions, VI…).
  • 2SLS corrige le biais si \(Z\) est pertinent et valide.
  • Diagnostics : F 1ʳᵉ étape, Hansen/Sargan, DWH.
  • L’argument économique reste central (au‑delà des seuls tests).