Transcript Chapitre 2

Chapitre 2
Les indices
Chapitre 2 : Les indices
1. Définition et propriétés
En sciences sociales, les grandeurs varient dans
l’espace et dans le temps :
- Dans le temps, puisqu’elles prennent des
valeurs différentes à différentes dates.
- Dans l’espace, puisqu’elles prennent des
valeurs différentes d’une région à l’autre.
Ce n’est pas toujours facile de pouvoir comparer
des grandeurs. EX :
X
Y
2000
2005
53 492
64190
1,20
128
154
1,20
Chapitre 2
Pour faciliter la comparaison, on a recours à la notion
d’indice.
Définition : Un indice, c’est un rapport positif ou nul
Il existe des indices synthétiques, qui sont des rapports
obtenus avec des grandeurs complexes (composés de
plusieurs indices simples).
Ex: l’indice des prix est un indice qui résume l’évolution
des prix de grandeurs hétérogènes (prix du chocolat et
prix d’un vidéoprojecteur). La difficulté est l’agrégation
de ces grandeurs si différentes.
Chapitre 2
2. Les indices simples
Notons la date t=0 : date de base (situation
de base) et la date t : date ou période
courante. Soit deux valeurs V0 (valeur de
départ) et Vt (valeur d’arrivée), on appelle
- indice simple ou élémentaire
It
/ 0
Vt

V0
- indice simple base 100 :
It/0 
Vt
V0
 100
Chapitre 2
Exemple : Evolution d’un prix entre 2000 et
2005 (base 100 en 2000)
I 2005
/ 2000

Pr ix 2005
Pr ix 2000
 100
Chapitre 2
Exemple : Rapport d’un prix entre la
Région parisienne (RP) et la France
entière(FR) (base 100 pour l’ensemble
de la France)
I RP / FR 
Pr ix RP
Pr ix FR
 100
Chapitre 2
3. Décomposition d’indices
I 2 /1 
 I 2 / 1 
V2
 100
V1
I2/0
 100
I1/ 0
I 2005 / 2002 
I 2005 / 2000
I 2002 / 2000
 100
Chapitre 2
3.1 Propriétés des indices élémentaires
- La circularité entre t=1 et t=2
 I 2 / 0  I 2 / 1  I 1 / 0 
En généralisant :
1
100
 I t / 0  I t / t '  I t ' / 0 
1
100
Chapitre 2
On se ramène à l’expression précédente :
It /t' 
It/0
 100
I t '/ 0
Pour comparer deux grandeurs simples, il suffit de
faire le rapport de leurs indices.
Généralisation :  I  100  I 1 / 0  I 2 / 1  I 3 / 2  ...  I t / t 1 
t/0


 100
100
100
100 
Chapitre 2
- La réversibilité
Quand on inverse le rôle de la base et de la
période courante, l’indice élémentaire
s’inverse à 10 4 près.
I t / 0  I 0 / t  10
4
Chapitre 2
Propriété secondaire : Produits d’indices
Si a=bxc
I t / 0  a   I t / 0 b   I t / 0  c  
1
100
EX : RT=PxQ (indice des prix et indice des
quantités=indice de la recette totale)
Chapitre 2
4. Les indices synthétiques
Un indice synthétique résume une série d’indices
élémentaires
Les indices synthétiques les plus utilisés
Valeur=prix x quantité
L’indice de la valeur s’écrit :
I t / 0  pq  

i
i
i
0
i
0
pt qt
i

i
p q
 100
Chapitre 2
Le problème de cet indice, c’est qu’on ne peut
attribuer la cause de l’évolution : ce peut être
toute combinaison des prix ou des quantités. Il
faut ainsi éliminer l’influence des prix pour
calculer un indice des quantités et éliminer
l’influence des quantités pour calculer un indice
des prix.
Par exemple pour un indice simple des prix d’un
i
i
bien :
p q
I t / 0  pq  
t
i
0
p q
0
i
0
 100
Chapitre 2
Indice synthétique des prix
It/0  p  

i
i
i
0
i
0
pt q0
 100
i

p q
i
Indice synthétique des quantités
I t / 0 q  

i
i
i
0
i
0
p0qt
i

i
p q
 100
Chapitre 2
Exemple de calculs d’indices synthétiques
(de prix et de quantités) avec trois biens
prix
B1
B2
B3
0
2
0,07
0,14
10
20
35
50
quantités
dates
0
2
B1
B2
B3
30
20
0,5
0,4
0,15
0,11
dates
Chapitre 2
1. Calculer l’indice d’évolution de la valeur
de B1
2. Calculer l’indice synthétique des prix
3. Calculer l’indice synthétique des
quantités
Chapitre 2
Exemple de la propriété de circularité : trouver
IND2007/2006
 I t / 0  I t / t '  I t ' / 0 
1
100
It /t' 
ou
Prix de X
150 €
210 €
230 €
It/0
 100
I t '/ 0
dates
2005
2006
2007
indices
100
140
153,3
Chapitre 3
Le modèle Linéaire Simple
(La méthode des moindres
carrés ordinaires)
1. PRESENTATION DU MODELE
Définition
La régression est l’outil le plus utilisé pour estimer
une équation linéaire.
La régression permet de décrire et d’évaluer la
relation entre une variable dépendante et une
(ou plusieurs) variable(s) indépendante(s).
La variable dépendante est définie par y et la
variables indépendantes par x.
– Dans le modèle de régression simple, k=1.
– Dans le modèle de régression multiple, k>1.
I. PRESENTATION DU MODELE
Définition
Quelques noms pour les variables y et x.
y
variable dépendante
variable à expliquer
x
variable indépendante
variable de contrôle
variable explicative
(régresseur)
Dans une régression, la variable y et la ou les variables x
sont traitées de manière asymétrique.
– La variable y est supposée être aléatoire ou ‘stochastique’. Elle
possède une distribution de probabilité.
– La ou les variables x sont supposée(s) avoir des valeurs fixes
d’un échantillon à l’autre (elles ne sont pas aléatoires).
I. PRESENTATION DU MODELE
Définition
Dans le modèle de régression simple, il n’y a
qu’une une seule variable x (k=1).
Le modèle de régression linéaire simple peut être
spécifié de la manière suivante:
– Pour des données temporelles (t=1,…,n)
– yt = a0 + a1xt + εt
– Pour des données en coupe transversale (i=1,…,N)
– yi = a0 + a1xi + εi
I. PRESENTATION DU MODELE
Le Rôle de e
La relation spécifiée entre y et x ne peut pas être
déterministe.
– Il nous est impossible de connaître le modèle ‘vrai’ de
régression pour y: E(y|x) = a0 + a1x : Il est (souvent)
impossible (ou trop coûteux) d’observer la totalité de
la population de Y et X.
Comme le modèle spécifié ne sera jamais
rigoureusement exact, un terme aléatoire e
(aussi appelé ‘terme d’erreur’) est ajouté.
– Ce terme est et restera inconnu. On ne pourra en
obtenir qu’une estimation (e).
I. PRESENTATION DU MODELE
Le Rôle de e
Le terme aléatoire synthétise:
1. Une erreur de spécification
• La variable explicative peut ne pas être suffisante pour
rendre compte de la totalité du phénomène expliqué.
(Le terme aléatoire synthétise l’ensemble des informations non
explicitées dans le modèle)
2. Une erreur de mesure
• Les données ne représentent pas exactement le
phénomène.
• Il y a des données manquantes.
3. Une erreur de fluctuation d’échantillonnage
Les observations comprises dans l’échantillon, et donc les
estimations, peuvent être différentes.
I. PRESENTATION DU MODELE
Conséquence du terme aléatoire
Comme les valeurs vraies de a0 et a1 ne sont pas
connues, elles doivent être estimées.
– On dérive les formules des estimateurs de a0 et a1,
notés respectivement â0 et â1.
• L’estimation de a est la valeur particulière que prend
l’estimateur â pour un échantillon donné.
• Le modèle de régression linéaire estimé peut
s’écrire:
– y = â0 + â1x + e
â0 et â1 possèdent une distribution de probabilité : (
a0 et a1 sont des constantes).
â0 et â1 suivent les mêmes lois de distribution que y et
e.
II. ESTIMATION DES PARAMETRES
La méthode des MCO (moindres
carrés ordinaires)
• La méthode la plus souvent
utilisée pour estimer les
paramètres a0 et a1 est la
méthode des Moindres Carrés
Ordinaires (MCO/OLS).
– Elle consiste à ajuster un
nuage de points à l’aide d’une
droite en minimisant la
distance au carré entre
chaque valeur observée et la
droite.
– Cette distance mesure le
résidu (l’erreur/la partie non
expliquée)
pour chaque observation:
•
e8  y 8  yˆ 8  0
y
e5  y 5  yˆ 5  0
x
De manière analytique, il s’agit de minimiser la
Somme des Carrés des Résidus (SCR/RSS),
c.à.d. : Min
e
n
a 0 , a1

2
t
t 1
or, e t  ( y t  a 0  a 1 x t )
2
2
n
Posons
L 

( y t  a 0  a1 x t )
2
t 1
• Minimisons la fonction L, évaluée en â1 et â2,
en dérivant par rapport à chacun des deux
paramètres:
 L ( â 0 , â1 )
a0
 L ( â 0 , â1 )
 a1
  2  ( y t  aˆ 0  aˆ1 x t )  0
(1)
t
  2  x t ( y t  aˆ 0  aˆ1 x t )  0 (2)
t
II. ESTIMATION DES PARAMETRES
La méthode des MCO
On obtient l’estimateur de a0 à partir de la
première équation comme suit :

ˆ0  a
ˆ1 x t )  0
( yt  a
t


ˆ0  a
ˆ1  x t  0
yt  na
t
t

 n
t
n

yt
ˆ0  a
ˆ1 n
 na
ˆ0  a
ˆ1 n x  0
 ny  na

ˆ0  a
ˆ1 x  0
y  a
ˆ0  y  a
ˆ1 x
 a
xt
 0
t
n
Calcul des estimateurs
L’estimateur de a1 est obtenu à partir de la
seconde comme suit:
 x ( y  aˆ  aˆ x )  0
t
t
0
1
t
t
aˆ 0 , on a :  x t ( y t  y  aˆ 1 x  aˆ1 x t )  0
En utilisant
t
 x (y
t
t
 y )  aˆ 1  x t ( x  x t )  0
t
aˆ 1 
A 



 xt ( yt  y )
x (x  x)


t
t
B
Calcul des estimateurs
• On formule l’estimateur de a1 en terme de
variance-covariance :
 x y   x y  nx y  nx y
y

  x y   x y  nx
  xy   (x y
n
A
t
t
t
t
t

B

 (x

t
t
t
2

x  2nx  nx 
2
t
 (xt  2 xt x  x ) 
2
t
 xt y  x yt  x y )
 x )( y t  y )
x  nx 
2
t
t
2
2
2
 ( xt  x )
2

x
2
t
x

 2nx
n
t
 nx
2
Calcul des estimateurs
• En remplaçant A et B par leur valeur, on obtient:
aˆ1 
 (x
t
 x )( y t  y )
t
 (x
t
 x)
2

Cov ( X , Y )
V (X )
t
Car en divisant chaque terme par (n-1), on a
 (x
t
 x )( y t  y )
t
aˆ 1 
( n  1)
 (x
t
 x)
t
( n  1)
2

ˆ y , x
ˆ x2
Calcul des estimateurs
• Le coefficient de régression mesure
l’impact d’une variation (c.à.d. l’effet
propre/partiel) de la variable indépendante
sur la variable dépendante.
• â1=DY/DX (coefficient de régression de Y sur X)
Régression ≠ corrélation
1.
2.
En matière de corrélation, les variables sont traitées de
manière SYMETRIQUE (elles sont aléatoires).
–
Le coefficient de corrélation, r, ne dépend pas de la
manière dont sont traitées X et Y.
• Si y = a0 + a1x + e, rY,X = ˆ x , y /( ˆ xˆ y )
• Si x = a’0 + a’1y + e, rX,Y = ˆ x , y /( ˆ xˆ y )
â1, le coefficient de régression de y sur x, n’est pas égal à r,
le coefficient de corrélation entre y et x.
ˆ y , x
ˆ xˆ y
ˆ y , x
ˆ x ˆ y
r y , xˆ x ˆ y
ˆ y
aˆ1 


 r
2
2
ˆ
ˆ x
ˆ x
ˆ x
V ( xt )
Régression ≠ corrélation
N
 (x
r x,y 
i
 x )( y i  y )
N
 (x
i 1
ˆ xy
ˆ xˆ y
n 1

N

( xi  x )
i 1

N
( yi  y )

2
i 1
i 1
n 1
n 1
N
 (x
aˆ 1 
ˆ xy
2
ˆ x
i
 x )( y i  y )
N
 (x
i 1

n 1

N

( xi  x )
i 1
2
i
 x )( y i  y )
i 1
N

i 1
n 1
 x )( y i  y )
i 1

N
2
i
( xi  x )
2
N
( xi  x )
2

i 1
( yi  y )
2
ANALYSE DE LA VARIANCE
L’équation fondamentale de l’analyse de la
variance est:
 y
 y 
2
t
 y
 yˆ t  
2
t
t

 
t

 
SCT
SCR   e t
2
  yˆ
t
 y
2
t

 
SCE
t
• SCT = Somme des Carrés Totaux = variabilité totale
(SST = Total Sum of Squares).
• SCR = Somme des Carrés des Résidus = variabilité non
expliquée
(SSR = Residual Sum of Squares).
• SCE = Somme des Carrés Expliqués = variabilité expliquée
(SSE = Explained Sum of Squares).
ANALYSE DE LA VARIANCE
Plus la variabilité expliquée (SCE) est proche de la
variabilité totale (SCT), meilleur est l’ajustement
du nuage de points par la droite des MCO.
=> La variabilité de y autour de sa moyenne est bien
expliquée par la variable explicative .
Une mesure de la qualité d’ajustement est le
coefficient de détermination, R2 (avec R=ρ, le
coefficient de corrélation linéaire).
• R2=SCE/SCT
• R2=1-(SCR/SCT)
ANALYSE DE LA VARIANCE
• Les cas limites où R2=0 et R2=1
yt
yt
y
xt
xt
Exercice 1
Calcul d’un « trend » par les MCO.
Estimer l’équation yt = a0 + a1xt + εt avec les
données suivantes.
Années
2005
2006
2007
trimestres
1
2
3
4
1
2
3
4
1
2
3
4
y
2
0,5
3,5
1
5
2
5
3,5
6,5
4
7,5
5
x
1
2
3
4
5
6
7
8
9
10
11
12
Exercice 2
La relation prix/demande.
Prix de ventes en euros X
Quantités demandées Y
95
104
130
58
148
37
210
22
250
12
330
9
120
100
80
60
Série1
40
20
0
0
50
100
150
200
250
300
350
Exercice 2
1. Passer en Log. On pose u=log(x) et
v=log(y)
2. Calculer le coefficient de corrélation
linéaire
3. Calculer les estimateurs de a et b en
estimant V=aU+b+ε
4. Calculer la quantité demandé pour un
prix égal à 75 €
Exercice 3
Corrélation et équation d’analyse de la
variance
y
6
5
2
1
4
5
5
x
1,5
2,5
3,5
4,5
5,5
6,5
7,5
Exercice 3
1. Calculer le coefficient de corrélation
linéaire
2. Calculer les estimateurs de a et b en
estimant Y=aX+b+ε
3. Calculer les variance expliquées et
résiduelles
Exercice 3
7
6
5
4
3
2
1
0
0
1
2
3
4
5
6
7
8