Économétrie — TD 6

Endogénéité et Méthode des Variables Instrumentales

Pierre Beaucoral
Code
library(knitr)
knit_hooks$set(optipng = hook_optipng)

1 Introduction

1.1 Objectif du TD

  • Rappeler les hypothèses des MCO et la notion d’exogénéité.
  • Identifier trois sources d’endogénéité (omission, causalité inverse, erreur de mesure).
  • Introduire la méthode des variables instrumentales (2SLS/DMC) : pertinence, exogénéité des instruments, et tests associés. :contentReferenceoaicite:0

2 Rappel MCO (BLUE)

2.1 Hypothèses clés (linéaire, MCO)

  • \(\mathbb{E}[u_i]=0\)
  • \(\mathrm{Var}(u_i)=\sigma^2\) (homoscédasticité)
  • \(\mathrm{Cov}(u_i,u_j)=0\) (pas d’autocorrélation)
  • \(\mathrm{Cov}(X,\varepsilon)=0\) (exogénéité)

Note

Si \(\mathrm{Cov}(X,\varepsilon)\neq 0\), l’estimateur MCO est biaisé et non convergent : il ne mesure pas l’effet causal de \(X\) sur \(Y\).

3 Origines de l’endogénéité

3.1 (1) Omission d’une variable pertinente

Vrai modèle : \(Y_i=\beta_0+\beta_1 X_{1i}+\beta_2 X_{2i}+\varepsilon_i\).
Mais on estime : \(Y_i=\beta_0+\beta_1 X_{1i}+\varepsilon_i\) avec \(X_{1}\) corrélé à \(X_{2}\).

Sens du biais sur \(\hat\beta_1\) :

\(\mathrm{corr}(X_1,X_2)>0\) \(\mathrm{corr}(X_1,X_2)<0\)
\(\beta_2>0\) + (vers le haut) − (vers le bas)
\(\beta_2<0\) +

L’omission « pousse » \(\hat\beta_1\) dans le sens de la corrélation entre \(X_1\) et la variable manquante \(X_2\).

3.2 (2) Causalité inverse

On estime \(Y_i=\beta_0+\beta_1 X_i+\varepsilon_i\) alors qu’en réalité \(X_i=\gamma_0+\gamma_1 Y_i+\gamma_2 Z_i+\nu_i\) (boucle de rétroaction).

Exemple : croissance du PIB \(\leftrightarrow\) dette publique.

Sens du biais (sur \(\hat\beta_1\)) :

\(\gamma_1>0\) \(\gamma_1<0\)
\(\beta_1>0\) +
\(\beta_1<0\) +

L’effet estimé « récupère » une partie du retour \(Y\to X\).

3.3 (3) Erreur de mesure sur \(X\)

On souhaite \(Y_i=\beta_0+\beta_1 X_i+\varepsilon_i\), mais on observe \(\tilde X_i=X_i+\nu_i\).

Alors : \(Y_i=\beta_0+\beta_1 \tilde X_i +(\varepsilon_i-\beta_1\nu_i)\), d’où \(\tilde X\) corrélée à l’erreur composite.

Conséquence : biais d’atténuation (vers 0) sur \(\hat\beta_1\).

4 Variables instrumentales (VI)

4.1 Principe (2SLS / DMC)

But : isoler la variation exogène de \(X\) avec un instrument \(Z\).

  1. 1ʳᵉ étape : régresser \(X\) sur \(Z\) (et autres contrôles), obtenir \(\hat X\).
  2. 2ᵉ étape : remplacer \(X\) par \(\hat X\) dans l’équation de \(Y\).
  3. Recalculer des écarts-types adaptés (2SLS).

Conditions pour \(Z\) :

  • Pertinence : \(\mathrm{Cov}(Z,X)\neq 0\) (pouvoir explicatif).

  • Exogénéité exclue : \(Z\) n’affecte \(Y\) que via \(X\) (\(\mathrm{Cov}(Z,\varepsilon)=0\)).

4.2 Pertinence : instruments faibles

  • Vérifier la 1ʳᵉ étape : test \(F\) des instruments.
  • Règle pratique : \(F>10\) \(\Rightarrow\) pertinence acceptable.
  • Plusieurs instruments faibles aggravent le biais.
  • (EViews) View → IV Diagnostics and Tests → Weak Instrument Diagnostics.

4.3 Exogénéité de l’instrument

  • L’instrument ne doit pas être corrélé à \(Y\) autrement que via \(X\).
  • Tests de sur-identification (si \(q>p\)) : Sargan (homoscédasticité) / Hansen-J (robuste).
  • Statistique \(\chi^2(k)\) avec \(k\) = nb de restrictions (sur-id).
  • (EViews) View → IV Diagnostics and Tests → Instrument Orthogonality Test.

Tip

En pratique, on dispose rarement de sur-identification « confortable »; la justification théorique de \(Z\) reste centrale.

4.4 Faut-il instrumenter ? (DWH)

  • Perte de précision avec VI : vérifier si l’instrumentation est nécessaire.
  • Durbin–Wu–Hausman (a.k.a. Nakamura–Nakamura) :
    • \(H_0\) : MCO non biaisé (\(\beta^{\mathrm{MCO}} \approx \beta^{\mathrm{DMC}}\))
    • \(H_A\) : MCO biaisé (\(\beta^{\mathrm{MCO}} \ne \beta^{\mathrm{DMC}}\))
  • Statistique \(\chi^2(k)\) avec \(k\) = nb de variables endogènes.
  • (EViews) View → IV Diagnostics and Tests → Regressor Endogeneity Test.

5 En pratique (guidelines)

  • Identification d’abord : quelles sources d’endogénéité ?
    Quel sens du biais attendu ?
  • Choix de l’instrument :
    • Pourquoi est-il corrélé à \(X\) (pertinence) ?
    • Pourquoi est-il exogène (validité) ?
  • Les tests (faiblesse, Hansen/Sargan, DWH) aident, mais ne remplacent pas l’argument économique.

6 Annexes

6.1 Schéma 2SLS (rappel)

  1. \(X = \pi_0 + \pi_1 Z + W'\pi + v\) (1ʳᵉ étape)
  2. \(Y = \beta_0 + \beta_1 \hat X + W'\gamma + u\) (2ᵉ étape)
  • \(Z\) : instruments ; \(W\) : contrôles exogènes.
  • Conditions : \(\mathrm{rank}([Z,W])\) suffisant ; \(\mathrm{Cov}(Z,u)=0\).

6.2 Tables « sens du biais » (récapitulatif)

6.2.1 Omission d’une variable

\(\mathrm{corr}(X_1,X_2)>0\) \(\mathrm{corr}(X_1,X_2)<0\)
\(\beta_2>0\) +
\(\beta_2<0\) +

6.2.2 Causalité inverse

\(\gamma_1>0\) \(\gamma_1<0\)
\(\beta_1>0\) +
\(\beta_1<0\) +

6.3 Références « dans EViews »

  • Weak instruments : View → IV Diagnostics and Tests → Weak Instrument Diagnostics
  • Orthogonality (Sargan/Hansen) : View → IV Diagnostics and Tests → Instrument Orthogonality Test
  • Endogeneity (DWH) : View → IV Diagnostics and Tests → Regressor Endogeneity Test

7 Questions TD

7.1 Q1 — Charger le workfile

7.2 Énoncé

Chargez le workfile Marshall (contient offre1–offre4, p1–p4, Y, W).

Afficher la réponse
  • File → Open → Workfile puis sélectionner Marshall.wf*.
  • Vérifier les séries dans l’arborescence (double-clic pour aperçu).
  • (Option) View → Descriptive Statistics → Histogram and stats pour un coup d’œil rapide.

8 Q2 — Estimations MCO

8.1 Énoncé

Estimez les fonctions d’offre par MCO :
pour i = 1 à 3: offrei = α + β Pi + ε
et offre4 = α + β P4 + π W + ε, avec W exogène.

Afficher la réponse
  • Quick → Estimate Equation, puis entrer la spécification :
    • offre1 c p1
    • offre2 c p2
    • offre3 c p3
    • offre4 c p4 W
  • Noter : \(\hat\beta\) (signe, magnitude), \(R^2\), p-values, et résidus.

Caution

Rappel : si \(\mathrm{Cov}(P,\varepsilon)\neq 0\) (ex. offre_i ⇄ p_i), MCO est biaisé. On vérifiera ensuite avec des tests d’exogénéité.

9 Q3 — Test d’exogénéité (Nakamura & Nakamura / DWH)

9.1 Énoncé

Indiquez, à l’aide du test de Nakamura & Nakamura, le caractère exogène des variables de prix, en prenant comme instrument le revenu Y.

Afficher la réponse

9.2 Intuition

  • \(H_0\): exogénéité du prix dans l’équation d’offre (MCO non biaisé).
  • \(H_A\): endogénéité → préférer VI (2SLS).

9.3 Mise en œuvre (EViews)

  • Estime l’équation en IV/2SLS (voir Q4) pour récupérer les résidus nécessaires, ou utilise directement :
    • Quick → Estimate EquationMethod: TSLS/IV,
    • onglet View → IV Diagnostics and Tests → Regressor Endogeneity Test (Durbin–Wu–Hausman / Nakamura–Nakamura).
  • Décision : si la stat. \(\chi^2\) (ou F) est significative, rejeter \(H_0\) → le prix est endogène.

10 Q4 — Estimations en Variables Instrumentales (2SLS)

10.1 Énoncé

Estimez, si nécessaire, les fonctions d’offre à l’aide de la méthode des variables instrumentales, en utilisant Y comme instrument.

Afficher la réponse

10.2 Rappel 2SLS (schéma)

  1. 1ʳᵉ étape : \(P_i = \pi_0 + \pi_1 Y + v\) ⇒ obtenir \(\widehat{P}_i\).
  2. 2ᵉ étape : \(\text{offre}_i = \alpha + \beta \widehat{P}_i + u\).
  3. Écarts-types robustes si hétéroscédasticité (option White).

10.3 Guide (EViews)

  • Quick → Estimate EquationMethod: TSLS – Two Stage Least Squares.
  • List of endogenous: p1 (ou p2/p3/p4).
  • Instrument list: Y (ajouter W pour offre4).
  • View → IV Diagnostics and Tests :
    • Weak Instrument Diagnostics (F 1ʳᵉ étape > 10 souhaitable),
    • Instrument Orthogonality Test (Hansen-J/Sargan), si sur-id.