Gestion et exploration de la base de données (EViews)
Ces commandes se tapent dans la fenêtre de commande d’EViews.
Commande | Description | Exemple |
---|---|---|
group |
Créer un groupe de variables | group nom x y |
scalar |
Créer un scalaire et faire des calculs | scalar k = 3*6 |
matrix |
Créer une matrice et faire des calculs (matriciels) | (cf. Help) |
genr |
Générer une variable | (cf. plus bas) |
rename |
Renommer une variable | rename x y (renomme x en y) |
delete |
Effacer un ou plusieurs objets | delete x y |
smpl |
Sélectionner un sous-échantillon | smpl if x<10 |
Vous êtes souvent amenés à créer de nouvelles variables ou à en changer l’échelle.
Il existe deux types de variables :
Variable continue
prend n’importe quelle valeur sur un intervalle donné.
Variable discrète
ne prend qu’un nombre fini de valeurs.
Note
Nota : les variables binaires (0/1) sont un cas particulier.
Commande générale :
genr nouveau_nom = opération
genr lnx = log(x)
Warning
Attention : saisir la ligne de commande dans la fenêtre de commande.
Formule mathématique | EViews |
---|---|
\(x + a\) | x+a |
\(x - a\) | x-a |
\(x \cdot a\) | x*a |
\(x / a\) | x/a |
\(x^a\) | x^a |
\(\ln(x)\) | log(x) |
\(e^x\) | exp(x) |
Une variable muette est discrète 0/1 (binaire).
Exemples : - (=1) si l’individu est une femme, (0) sinon. - (=1) si le pays est OCDE, (0) sinon.
Deux méthodes :
genr nouveau = x > A
genr jeune = age <= 25
Objectif : riche vaut 1 si pibtete > 10000
, 0 sinon.
genr riche = 0
smpl if pibtete > 10000
genr riche = 1
smpl @all
Une variable discrète prend un nombre limité de valeurs (0, 1, …, n).
- Peut venir d’un classement (ex. classes de revenus).
- Peut coder un choix limité (pays d’immigration, parti politique, notes…).
Note
Remarque : une muette est un cas particulier de discrète.
Deux méthodes :
Exemple : classes d’âge (
\[ \begin{array}{l} classes= \begin{cases} 0 & si \quad age \leq 25 \\ 1 & si \quad 25 < age \leq 35 \\ 2 & si \quad 35 < age \leq 45 \\ 3 & si \quad 45 < age \\ \end{cases} \end{array} \]
)
Dans la fenêtre de commande :
genr dummy1 = age > 25
genr dummy2 = age > 35
genr dummy3 = age > 45
genr classes = dummy1 + dummy2 + dummy3
On réplique la méthode 2 des muettes :
genr classes = 0
smpl if condition1
→ genr classes = 1
→ smpl @all
smpl if condition2
→ genr classes = 2
→ smpl @all
Le but des statistiques descriptives est de décrire les variables.
Étape cruciale pour :
- connaître sa base,
- avoir une première idée des relations existantes.
Étude d’une variable | Étude d’une relation entre variables |
---|---|
Tableaux : statistiques descriptives | Coefficients de corrélation |
Figures : histogramme, boîte à moustache, évolution | Nuage de points, droite de régression |
Ouvrir la fenêtre de la série (double-clic).
View → Descriptive statistics & Tests → Stats Table
View → Graph
Test d’égalité de moyennes :
View → Descriptive statistics & Tests → Stats by classification
- Choisir la modalité via Series/Group for classify.
Graphiques par modalité :
- Option Categorical graph dans Graph type.
- Renseigner la modalité dans factors — series defining categories.
Ouvrir les séries ensemble : sélectionner les variables → Open → as Group
.
View → Covariance analysis
View → Graph → Scatter
Explorer les différents graphiques et choisir celui qui illustre le mieux votre propos.
Pour enregistrer les objets : Freeze et nommer (Name).
Proc → Copy to Clipboard
(ou Ctrl+C)Object → View Options → Copy to Clipboard
On créer le fichier workfile et on fait : file → workfile et ensuite on fait
file → Import → import from file.
genr Accidents = fatal + non_fatal
Commande :
genr Acc_pass = Accidents / passagers
Utilité : Rapporter le nombre d’accidents au nombre de passagers permet d’évaluer le risque d’accident par passager, offrant un indicateur plus précis de la sécurité des compagnies, indépendamment de leur taille. Autrement dit, cela permet d’évaluer de manière précise la probabilité d’accident par rapport au nombre total de passagers.
genr Dummy_acc = accidents >= 1
genr Dummy_fatal = fatal >= 1 genr Dummy_non_fatal = non_fatal >= 1
Pour voir la distribution, on utilise un histogramme.
Dans EViews : on clique sur la variable passagers → View → Graph → Distribution → OK.
Pour copier-coller : Proc → Copy to Clipboard (ou Ctrl+C) ou Object → View Options → Copy to Clipboard, puis coller dans un document Word (.doc).
L’histogramme montre une distribution asymétrique à droite, indiquant que la plupart des valeurs sont concentrées à gauche, tandis qu’il y a quelques valeurs élevées moins fréquentes à droite. Cet histogramme montre une distribution très asymétrique avec une concentration élevée des données à gauche, ce qui indique que la majorité des valeurs observées sont faibles. À l’inverse, on observe que les valeurs plus élevées sont rares, avec quelques points dispersés à droite (points aberrants).
Dans EViews :
Ouvrir la série passagers
→ View → Descriptive statistics & Tests → Stats by classification
.
Dans Series/Group for classify, sélectionner la variable indiquant :
(i) s’il y a eu au moins un accident,
(ii) s’il y a eu au moins un accident mortel.
Valider pour obtenir les tableaux de statistiques et, si souhaité, les graphes par modalité (Graph type → Categorical graph).
Interprétation : Comparer les statistiques (moyenne, médiane, etc.) et les graphiques permet de voir si le nombre de passagers transportés est distribué différemment selon qu’il y a eu un accident ou un accident mortel.
On observe généralement une différence nette des moyennes : les compagnies ayant connu un (ou un accident mortel) présentent en moyenne un volume de passagers plus élevé, ce qui suggère qu’elles sont plus grandes et donc exposées à un risque absolu d’accident plus important.
Création de l’âge : genr age = 2013 - annee
Corrélation : sélectionner les deux variables en Group → View → Covariance analysis → Statistics = Correlation.
On a un coefficient de corrélation de -0,1709 qui indique une faible corrélation positive entre les deux variables étudiées (relation faible, peut ne pas être significative).
Nuage de points : sélectionner les deux variables → View → Graph → Scatter. Les points montent de gauche à droite (tendance conjointe) et des points qui s’écartent du nuage principal peuvent indiquer des valeurs aberrantes.
Econométrie - L3