Économétrie — TD 4

Les tests d’hypothèses économétriques

Pierre Beaucoral

1 Rappel de cours

1.1 Les hypothèses des estimations MCO

  • L’estimateur des Moindres Carrés Ordinaires est le meilleur estimateur linéaire sous certaines hypothèses

Note

  • On dit qu’il est BLUE (Best Linear Unbiased Estimator)

  • Néanmoins il est sensible aux observations extrêmes

  • Ces hypothèses concernent les termes d’erreurs ( \(\varepsilon\) ):

    • Normalité des résidus: \(\varepsilon \leadsto N(0,\sigma_{\varepsilon}^2)\)

    • Espérance nulle: \(E(\varepsilon_{i})=0\)

    • Homoscédasticité: \(V(\varepsilon_{i})=\sigma^2=\text{constante}\)

    • Indépendance sérielle: \(Cov(\varepsilon_{i},\varepsilon_{j})=0,\quad \forall i\neq j\)

      (Absence de corrélation entre les résidus)

    • Orthogonalité des résidus (ou exogénéité): \(Cov(x_{i},\varepsilon_{i})=0\)


1.2 Précisions sémantiques

  • On distingue les propriétés sur petits échantillons et grands échantillons. Les propriétés sur petits échantillons:

    • L’estimateur est sans biais si \(E(\hat{\beta})=\beta\).

    • L’estimateur est à variance minimale si \(Var(\hat{\beta}) \leq Var(\tilde{\beta})\)

      avec \(\tilde{\beta}\) un autre estimateur sans biais de \(\beta\).

    • L’estimateur est efficace s’il remplit ces deux propriétés

  • Sur grands échantillons:

    • L’estimateur est convergent si la variance de \(\beta\) tend vers 0 quand N tend vers l’infini:

      \(\lim_{N \to \infty} Var(\beta)=0\)

1.3 Hypothèse et propriétés des estimateurs

Propriété / Hypothèse Problème si non respectée Test(s) associé(s) Méthode(s) de correction
Absence de biais (orthogonalité) Biais dans les estimations ; non-convergence Instrumentation (variables instrumentales)
Efficience (sphéricité des erreurs) Estimation non efficace (mais pas de biais) - Homoscédasticité : tests de Breusch–Pagan, White- Absence d’autocorrélation sérielle : tests de Durbin–Watson, Breusch–Godfrey - Correction de White (robust std. errors)- HAC (Newey–West)
  • Ce TD se concentre uniquement sur le problème d’éfficience

1.4 Les tests d’hypothèses

  • Objectif :
    • Voir si le modèle est économétriquement correct.
  • Comment ?
    • En vérifiant que les erreurs respectent les hypothèses des MCO et que l’estimateur est efficace (BLUE).

    • En particulier, les tests se concentrent sur cinq hypothèses :

      1. Normalité des résidus : \(ε ~ N(0, σ²_ε)\)
      2. Espérance nulle : \(E(εᵢ) = 0\)
      3. Homoscédasticité : \(Var(εᵢ) = σ²\) (constante)
      4. Indépendance sérielle : \(Cov(εᵢ, εⱼ) = 0\) pour tout \(i ≠ j\)
      5. Orthogonalité des résidus : \(Cov(xᵢ, εᵢ) = 0\)
  • Remarque :
    • H2 est respectée par construction de l’estimateur MCO.
    • H5 fait l’objet d’un traitement particulier (cf. Semestre 2).

1.5 Les tests d’hypothèses

Hypothèse Test(s) associé(s) Traité ?
H1 : Normalité Test de Bera–Jarque
H3 : Homoscédasticité Test de Goldfeld–Quandt
Test de Breusch–Pagan
Test de White
H4 : Indépendance sérielle Test de Durbin–Watson
Test de Breusch–Godfrey

2 La normalité des erreurs

2.1 Le test de Bera–Jarque

  • La normalité des écarts aléatoires est utile pour mettre en œuvre les tests de sphéricité.

  • Le test utilisé est celui de Bera–Jarque.

  • Ce test repose sur deux indicateurs :

    • Skewness \(η\) : mesure l’asymétrie de la distribution
      ( \(η\) doit être = 0).
    • Kurtosis \(υ\) : représente l’aplatissement de la distribution
      ( \(υ\) doit être = 3).

2.2 Le test de Bera–Jarque

  • La statistique BJ calculée est :

    BJ = N [ η² / 6 + (υ – 3)² / 24 ] → suit une loi χ²(2)

  • Hypothèses testées :

    • H₀ : BJ = 0 → la distribution suit une loi normale
    • H₁ : BJ ≠ 0 → la distribution ne suit pas une loi normale
  • Règle de décision :
    Si BJ > χ²(2)₍th₎ (≈ 6 au seuil de 5 %),
    ⇒ on rejette H₀.

2.3 Le test de Bera–Jarque (dans EViews)

  • Pour administrer le test via l’interface graphique :

    1. Ouvrir la fenêtre de l’équation.
    2. Aller dans View → Residual Diagnostic.
    3. Choisir Histogram – Normality Test pour lancer le test de BJ.
    4. Lire et interpréter les résultats.

    Tip

    Remarque : la procédure est identique pour les autres tests de sphéricité,
    à l’exception de l’étape 3.

3 Homoscédasticité

  • L’homoscédasticité suppose que la variance est constante : \(Var(εᵢ) = σ²\).
    L’hétéroscédasticité apparaît généralement lorsque la taille des erreurs est proportionnelle aux valeurs prises par une variable explicative.

  • Si cette hypothèse n’est pas respectée :

    • l’estimateur MCO reste sans biais,
    • mais il n’est plus à variance minimale (moins efficace).
  • Tests pour vérifier cette hypothèse :

    • Goldfeld–Quandt (non présenté)
    • Breusch–Pagan
    • White

3.1 Test de Breusch–Pagan

  • Logique : vérifier si la variance des résidus dépend des variables explicatives.

  • Modèle estimé :

    • \(Yᵢ = β₀ + β₁ Xᵢ + β₂ Zᵢ + εᵢ\)
    • \(ε̂ᵢ = Yᵢ – β̂₀ – β̂₁ Xᵢ – β̂₂ Zᵢ\)
  • Hypothèses :

    • \(H₀\) : \(Var(ε̂ᵢ) = σ²\) (la variance ne dépend pas des variables explicatives)
    • \(H₁\) : \(Var(ε̂ᵢ) = σᵢ² = θ₀ + θ₁ Xᵢ + θ₂ Zᵢ + ωᵢ\)
      ( \(θ₁ et θ₂ ≠ 0\) → variance liée aux variables explicatives)

    Tip

    Remarque : la variance des erreurs est approximée par les résidus au carré : \(Var(εᵢ) ≈ ε̂ᵢ²\).

3.2 Test de Breusch–Pagan : procédure

  1. Estimer le modèle par MCO.

  2. Calculer les résidus au carré : \(ε̂ᵢ²\).

  3. Régression de test :

    \(ε̂ᵢ² = θ₀ + θ₁ Xᵢ + θ₂ Zᵢ + ωᵢ.\)

  4. Examiner le pouvoir explicatif via le R² de cette équation :

    • Statistique \(BP = N × R²\) → suit une loi \(χ²(K – 1)\), K = nombre de paramètres.
    • Règle : si \(BP ≥ χ²_th\)rejet de \(H₀\).

Note

Intuition : sous homoscédasticité, R² → 0, donc X et Z n’expliquent pas la variance des résidus.

3.3 Test de White

  • Même logique et démarche que Breusch–Pagan, mais avec une représentation plus flexible de l’hétéroscédasticité.

  • Hypothèses :

    • \(H₀ : Var(ε̂ᵢ) = σ²\)
    • \(H₁ : Var(ε̂ᵢ) = σᵢ² = θ₀ + θ₁ Xᵢ + θ₂ Zᵢ + θ₃ Xᵢ² + θ₄ Xᵢ Zᵢ + θ₅ Zᵢ² + ωᵢ\)
      (les coefficients θ sont conjointement ≠ 0)
  • Équation de test : \(ε̂ᵢ² = θ₀ + θ₁ Xᵢ + θ₂ Zᵢ + θ₃ Xᵢ² + θ₄ Xᵢ Zᵢ + θ₅ Zᵢ² + ωᵢ.\)

3.4 Statistiques du test de White

  • Statistique principale :
    • \(W = N × R² → loi χ²(K – 1)\), K = nombre de paramètres (ici 6).
  • Version petits échantillons (F-test) :
    • \(W = ((SCR_r – SCR_nr) / SCR_r) × (N – k) / (k – 1) → F(k – 1, N – k)\)
      • \(SCR_r\): somme des carrés des résidus en régressant ε̂ᵢ² sur constante seule.
      • \(SCR_nr\): idem mais sur l’équation de test.
      • k : nombre de paramètres sous H₀ (ici 3).
  • Règle de décision : si \(W ≥ χ²_th ⇒ rejet de H₀\).

3.5 Mise en œuvre sous EViews

  • Les tests de Breusch–Pagan et de White sont directement programmés :
    • View → Residual Diagnostic → Heteroskedasticity Tests
      • Breusch–Pagan–Godfrey : test de Breusch–Pagan
      • White : test de White

4 Indépendance sérielle

  • L’indépendance sérielle est nécessaire pour garantir que l’estimateur des MCO soit efficace (variance minimale).

  • Indépendance sérielle = absence d’autocorrélation des erreurs:

    \(Cov(εₜ, εₛ) = 0, ∀ t ≠ s\)

  • Ce problème concerne surtout les séries temporelles.

  • Tests usuels :

    • Durbin–Watson
    • Breusch–Godfrey

4.1 Test de Durbin–Watson

  • Premier test développé, avec des conditions restrictives :
    • Il faut une constante dans le modèle.

    • Le nombre d’observations doit être supérieur à 15.

    • La variable expliquée retardée ne doit pas être introduite dans le modèle.

    • Pas de données manquantes.

    • On ne peut tester que l’autocorrélation issue d’un processus AR(1) :

      \(εₜ = ρ εₜ₋₁ + υₜ.\)

  • Ce test a servi de base à de nombreux autres tests d’autocorrélation.

4.2 Hypothèses du test

  • \(H₀ : Yₜ = β₀ + β₁ Xₜ + β₂ Zₜ + εₜ\)

  • \(H₁ : Yₜ = β₀ + β₁ Xₜ + β₂ Zₜ + εₜ\)
    avec \(εₜ = ρ εₜ₋₁ + υₜ.\)

  • Sous H₁, l’écart aléatoire est corrélé dans le temps.

  • Statistique de Durbin–Watson :

    \(DW = Σₜ₌₂ᵀ (ε̂ₜ – ε̂ₜ₋₁)² / Σₜ₌₁ᵀ ε̂ₜ² ≈ 2 (1 – ρ̂)\)

  • Cette statistique est directement fournie par EViews dans le tableau de régression.

4.3 Interprétation

  • La statistique DW ne suit pas une loi standard : \(0 ≤ DW ≤ 4\).
  • Les auteurs ont tabulé des valeurs critiques : \(D_L et D_U (D_L < D_U).\)

Lecture :

Zone Interprétation
[0, D_L] Rejet H₀ : autocorrélation positive
(D_L, D_U) Zone d’incertitude
[D_U, 2] Acceptation H₀
[2, 4 – D_U] Acceptation H₀
(4 – D_U, 4 – D_L) Zone d’incertitude
[4 – D_L, 4] Rejet H₀ : autocorrélation négative
  • Test imparfait en raison de la zone de doute et des conditions restrictives.
  • Dans la table DW, les colonnes dépendent du nombre de paramètres du modèle hors constante.

4.4 Test de Breusch–Godfrey

  • Breusch et Godfrey ont développé un test de maximum de vraisemblance plus flexible :

    • permet de tester des processus autorégressifs d’ordre ≥ 1.
  • Exemple d’un processus d’ordre 2 :

    • \(H₀ : Yₜ = β₀ + β₁ Xₜ + β₂ Zₜ + εₜ\)
    • \(H₁ : Yₜ = β₀ + β₁ Xₜ + β₂ Zₜ + εₜ\)
      avec \(εₜ = ρ₁ εₜ₋₁ + ρ₂ εₜ₋₂ + υₜ.\)
  • Équation de test : \(ε̂ₜ = ρ₁ ε̂ₜ₋₁ + ρ₂ ε̂ₜ₋₂ + θ₁ Xₜ + θ₂ Zₜ + ωₜ.\)

  • Statistique : \(BG = T × R²\) → suit une loi \(χ²(t)\), où t est l’ordre du processus autorégressif (ici 2).

  • Règle de décision :
    Rejeter \(H₀\) si \(BG ≥ χ²_th\).

  • Procédure sous EViews :

    • View → Residual Diagnostic → Serial correlation LM test.
    • Choisir le nombre de retards (lags) à tester.

5 Correction des écarts aléatoires

  • Les tests de sphéricité permettent de vérifier si les résidus sont :

    • hétéroscédastiques,
    • et/ou autocorrélés dans le temps.
  • Dans les deux cas, il faut appliquer une correction pour améliorer l’efficience de l’estimateur.
    (Il existe de nombreuses méthodes, selon le type de problème rencontré.)

  • Sous EViews (cf. Araujo et al., 2007) :

    • Menu : Estimate → Options → Coefficient covariance matrix.
    • En cas d’hétéroscédasticité :
      • choisir White.
    • En cas d’autocorrélation sérielle et/ou d’hétéroscédasticité :
      • choisir HAC (Newey–West).

6 Questions – Réponses (TD4)

6.1 Importez le fichier de travail sur les compagnies aériennes.

6.2 Estimez l’équation suivante par les MCO :

\(log(Pass_i) =\beta_0 + \beta_1 Fatal_Passagers_i + \beta_2 NonFatal_Passagers_i + \beta_3 Low_cost_i \ + \beta_4 Public_i + \beta_5 Inter_i + \beta_6 Age_i + \beta_7 Trafic_nat_i + \beta_8 Trafic_dest_i +\varepsilon_i\)

6.3 Homoscédasticité

· Qu’est-ce que l’homoscédasticité et quel problème induit son non-respect pour les MCO ?

Afficher la réponse

Homoscédasticité = la variance de l’erreur est constante pour toutes les valeurs des régressseurs :

\(\mathrm{Var}(u_i\mid X)=\sigma^2\) pour tout \(i\).

Si cette hypothèse est violée (hétéroscédasticité) :

  • Les estimateurs MCO \(\hat\beta\)​ restent sans biais et consistants si \(E[u\mid X]=0\) tient, mais ils ne sont plus efficaces (plus BLUE) : il existe de meilleurs estimateurs (GLS/WLS).

  • Les écarts-types MCO “classiques” sont fausséstests t/F et IC peuvent être trompeurs (trop optimistes ou trop prudents).

  • Conséquence pratique majeure : mauvaise inférence.

Que faire ?

  • Utiliser des erreurs-types robustes à l’hétéroscédasticité (HC0–HC3/“White”).

6.4 Homoscédasticité

· A l’aide des tests de Goldfeld et Quandt, de Breusch-Pagan-Koenker et de White, que peut-on conclure quant à l’homoscédasticité du terme d’erreurs ?

Afficher la réponse

6.5 Correction(s)

· En fonction des résultats des divers tests, proposez une correction le cas échéant.

Afficher la réponse

6.6 Correction(s)

· Vos conclusions quant à l’effet des accidents mortels et non mortels sont-elles modifiées ?

Afficher la réponse