Statistique Descriptive Chapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Tifawt.com.

Download Report

Transcript Statistique Descriptive Chapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Tifawt.com.

Statistique Descriptive
Chapitre 2: Paramètres de
tendance centrale
Pr. Abdelkrim EL MOUATASIM
EST & FSE de Guelmim
Maroc
Tifawt.com
Les paramètres statistiques ont
pour but de résumer, à partir de
quelques nombres clés,
l'essentiel de l'information
relative à l'observation d'une
variable quantitative.
Tifawt.com
Principales grandeurs économiques du
secteur industriel dérivé de la pêche
Indicateurs
A terre
En mer
Effective unités
391
353
Effective emplois
70 000
10 000
Production (en tonne)
343 000
64 500
Chiffre d’affaires (en Dh)
11 milliards
3,7 milliards
Source: Etude des schémas régionaux d’aménagement
du territoire des provinces duTifawt.com
sud, 2010.


On définira plusieurs sortes de paramètres :
Certains, comme la moyenne, seront dits de
tendance centrale car ils représentent une
valeur numérique autour de laquelle les
observations sont réparties.
D'autres, par exemple, seront dits de dispersion
car ils permettent de résumer le plus ou moins
grand étalement des observations de part et
d'autre de la tendance centrale.
Tifawt.com
Statistiques descriptives à une variable : paramètres de position
Objectifs de ce chapitre

Pouvoir résumer une
série de données par un
ou plusieurs paramètres
représentatifs (moyenne,
médiane…)
Tifawt.com
Paramètres de tendance centrale
Plan de la partie
Voici les chapitres que nous allons aborder :
1.
2.
3.
Mode.
Médiane.
Moyennes.
Tifawt.com
Introduction

Les tableaux et graphiques contiennent la
totalité des données : ils sont parfois durs à
interpréter.

On va chercher à résumer les données par
quelques valeurs numériques.

Dans cette partie, on s’intéresse aux
paramètres de tendance centrale, i.e. aux
paramètres mesurant le « centre » des séries
statistiques.
Tifawt.com
2.1 Le mode (Mo)
C'est la valeur dont la fréquence est la plus élevée.
Détermination du mode :

Cas d'une variable discrète : Le mode est
facilement repérable. Sur le tableau
statistique, c'est la valeur xi pour laquelle la
fréquence est la plus élevée
Tifawt.com
Exemple
Soit la série de chiffres
{8, 8, 8, 7, 4, 4, 4, 4, 4, 5, 5, 5, 5, 6}
La valeur la plus fréquente est le 4

Mode
Tifawt.com
Cas d'une variable continue :
les données sont groupées en classes ; on définit la
classe modale comme la classe correspondant à la
fréquence la plus élevée ni. En peut calculer le
Mode par la formule suivante:
Mo  x inf
i
Borne inférieure de la classe modale
d1=ni –ni-1
d1
a
d1  d 2
Amplitude de classe
d2=ni –ni+1
et
Tifawt.com
Exemple : Le Mode
(valeurs groupées)
[0.08,0.25] est la classe modale pour le débit .
D’après la formule de le mode
Mo = 0.08 + a(d1/(d1+d2))
avec a = 0.25-0.08 = 0.17
d1 = 22-0 = 22 et d2 = 22-8 = 14
donc Mo = 0.08 + 0.17*22/36
= 0.184
Tifawt.com

Si la distribution présente 2 ou plus maxima
relatifs, on dit qu'elle est bimodale ou
plurimodale.

Si la série n’a qu’un seul mode, elle est dite
unimodale.

On peut définir de même le mode pour un
caractère qualitatif.
Tifawt.com
Tifawt.com
2.2 La médiane : Me
Si la série brute des valeurs observées est triée par
ordre croissant :
La médiane Me d’un série statistique est la valeur
qui partage cette série en deux séries de même
effectif.
Tifawt.com
Tifawt.com


c'est-à-dire que
Si n est impair, soit n = 2 p + 1 ,
Me = x(p+1)
Si n est pair, soit n = 2 p, toute valeur de
l'intervalle médian [ x(p) ; x(p+1) ] répond à la
question.
Afin de définir Me de façon unique, on choisit
souvent
soit le centre de l'intervalle médian.
Tifawt.com


Par exemple, la
médiane de la série
de tailles ci-contre est
:
Me =
(m)
Aurait-elle été
différente si on avait
noté par erreur la plus
petite taille 0.55 m au
lieu de 1.55 ?
Tifawt.com
* Cas d'une variable continue:
Pour des données groupées en classes, la
classe médiane est la classe qui contient
la médiane. On détermine la médiane par
interpolation linéaire.
Tifawt.com

De manière générale, si a et b sont les
bornes de la classe contenant la médiane,
F(a) et F(b) les valeurs de la fréquence
cumulée croissante en a et b, alors
Tifawt.com
Dans le cas d'une variable groupée en classes, en peut
calculer la médiane par la formule suivante :
n
ai(  Ni 1 )
Me  L0  2
ni
Lo : Limite inférieure de la classe médiane
ai : Amplitude de la classe médiane
n : Nombre total des observations
Ni-1 effectif cumulé croissant de la classe inférieure à la
classe médiane
Tifawt.com
ni : effectif de la classe médiane
Salaire horaire
2-4
4-6
6-8
8-10
10-12
Total
ni
5
8
12
10
8
43
ni cumulées croissantes
5
13
25
34
43
La médiane est la valeur de rang (43 + 1) / 2 c’est
à dire 22, celle ci se trouve dans la classe 6-8, la
classe 6 - 8 est donc la classe médiane.
Me = 6 + 2(21.5 +13)/12
Tifawt.com
Tifawt.com
Moyenne Arithmétique
Population m (mean)

Echantillon x (average)
Appelée moyenne notée




x
Paramètre central qui concerne bien évidemment
uniquement des variables quantitatives.
Dans l’unité de la variable.
Calculable quelque soit la loi qui régit la distribution.
Suivant la forme de présentation des observations,
différentes formules de calcul peuvent être
employées.
Tifawt.com
Moyenne arithmétique

On note :
n : Nombre total de
mesures.
k : Nombre de valeurs
différentes
observées.
ni : Nombre
d’occurrences de la
valeur observée i.
fi : Fréquence relative
(pourcentage) de la
valeur observée i.
k
ni
n   ni fi 
n
i 1
T
k
 fi  1
i 1
n
k
k
i 1
i 1
i 1
 xi   ni xi  n  fi xi
T k
x    fi xi
n i 1
Tifawt.com
2.3 La moyenne arithmétique
La moyenne arithmétique d'une série statistique (xi,
ni) se calcule de la manière suivante :
La moyenne s'exprime toujours dans la même unité que
les observations xi . Elles peut être décimale, même si les
xi sont entiers par nature.
Tifawt.com
Nombre
d'appels xi
Fréquences
relative fi
% fi x 100
0
0.0208
2.08
1
0.1458
14.58
2
0.2396
23.96
3
0.2500
25.00
4
0.1875
18.75
5
0.0938
9.38
6
0.0625
6.25
Total :
1
100
Ainsi la moyenne arithmétique du nombre
d'appels reçus à un standard est : 2,97
appels
Tifawt.com
Plus généralement, lorsqu'on ne
dispose que de la distribution
regroupée en classes
Classes de
valeur
Effectifs
Centre de classe
[ e1 e2 [
n1
x1
[ e2 e3 [
n2
x2
...
...
...
[ ei ei+1 [
ni
xi = ei + ei+1 / 2
...
...
...
[ eK eK+1 [
nK
xK
Total :
n
Tifawt.com
on calculera la moyenne par :
xi étant le centre de classe.
Tifawt.com
Exemple

Soit la série correspondant aux tailles en cm
de 6 étudiants : 160,170,180,180, 190, 200.
n = 6; T = 160+170+180+180+190+200 = 1080
1080
x
 180 cm
6
Tifawt.com
Exemple
nombre nombre de
d'enfants familles
(xi)
(ni)
ni*xi
0
10
0
1
20
20
2
15
30
3
5
15
4
3
12
Total
53
77
Le nombre de familles enquêtées
est de 53.
Le nombre total d’enfants est
de 77.
La moyenne du nombre d’enfants
par famille est de 77/53 = 1,45.
Attention aux arrondis ici si on
arrondit à une décimale la
moyenne est de 1,5 enfants par
famille.
Tifawt.com
Remarque 1:
Pour plusieurs populations d'effectifs n1, n2, .....,
nk, de moyennes respectives :
moyenne globale = moyenne des moyennes
Tifawt.com
Comparons le salaire moyen dans 2 entreprises
Entreprise A :
1/ 3 de femmes , salaire moyen 8000Dh
2/3 hommes, salaire moyen 11000
Dans l'entreprise A le salaire moyen est de : ….
Entreprise B :
2/ 3 de femmes , salaire moyen 9000Dh
1/3 hommes, salaire moyen 12000
Dans l'entreprise B le salaire moyen est de : ….
Tifawt.com



On constate donc que le salaire moyen de
B est égal à celui de A. Pourtant le salaire
moyen des hommes est supérieur en B à
celui des hommes en A. Il en est de même
pour les femmes.
D'où vient ce résultat paradoxal ?
Il s'agit d'un effet de structure : cela vient
du fait que les femmes (au salaire plus
bas) sont plus nombreuses en B qu'en A.
Tifawt.com
Exemple

Les étudiants de première année de L1 santé sont répartis dans
3 amphithéâtres avec les données ci-dessous. Quelle est la
moyenne de l’âge en L1 santé ?
Effectifs
Amphi 1
1000
Amphi 2
500
Amphi 3
1000
Moyenne
de l'âge
en
années
18,1
19,5
18,3
Les effectifs étant différents dans les 3
groupes, la moyenne recherchée n’est pas la
moyenne des moyennes.
• On calcule le total de l’âge des 3 groupes
réunis : T = 18,1*1000+ 500*19,5+
18,3*1000 =46 150.
• L’effectif total est de 2 500.
• La moyenne recherchée est 46150/2500
=18,5 ans
Tifawt.com
Moyenne arithmétique

Propriétés :


Centre de gravité de la distribution.
La somme des écarts
n à la moyenne est nulle.
 ( x  xi )  0
i 1

La moyenne minimise les distances au carré
n
 ( A  xi )
2
i 1
Tifawt.com
3. Moyennes
Avantages

Elle a de bonnes propriétés calculatoires
comme la linéarité :
si x est la moyenne d’une série (xi, ni) alors
la moyenne de la série (axi+b, ni) est
ax  b  ax  b

Elle prend en compte l’ensemble des valeurs
(contrairement au mode).

Tifawt.com
3. Moyennes
Inconvénient
Elle est très sensible aux valeurs « extrêmes ».
Exemple : si dans votre entreprise les 10
salariés (dont vous faites partie) gagnent
chacun 1500€ par mois et que le patron
gagne lui 7000€ par mois, le salaire moyen
mensuel est de 2000€…
Tifawt.com
Exemple
Dans une entreprise de 100 salariés, le
salaire moyen est égal à 8 400 Dh.
Supposons qu'une erreur se soit glissée
lors de la transcription des salaires.
Monsieur Dahbi est crédité d'un salaire de
108 000 DH au lieu de 8 000 Dh.
De combien augmenterait la moyenne ?
Tifawt.com
La nouvelle moyenne est de : …….
Une seule valeur (sur 100) peut donc beaucoup
modifier la moyenne.
La moyenne arithmétique est
sensible aux valeurs extrêmes.
Tifawt.com
Les autres moyennes



Moyenne géométrique d'une série de valeurs
positives est la racine nième du produit des n
valeurs. Elle est toujours inférieure ou égale à la
moyenne arithmétique.
Moyenne harmonique d'une série de valeurs
positives est égale à l'inverse de la moyenne
des inverses.
Moyenne quadratique est la racine carré de la
moyenne arithmétique des carrés.
Tifawt.com
3. Moyennes
Moyenne géométrique
Avec les notations précédentes :
n1
k
G  x1
nk
 ...  xk
est la moyenne géométrique de la série
statistique.
Pour le calcul, on applique: Log G = n1Logx1+n2Logx2+….+nkLogxk
Tifawt.com
3. Moyennes
Exemple
L’essence a augmenté de 10% l’an dernier et
de 30% cette année. Quelle est le taux
d’augmentation annuelle ?
Ce n’est pas 20% ! La moyenne arithmétique
ne convient pas.
Si t est ce taux, on a bien sûr : 1 t  1,11,3
et donc t =0,196=19,6%.
La « bonne » moyenne est ici la moyenne

géométrique.
Tifawt.com
3. Moyennes
Moyenne harmonique
Toujours avec les notations précédentes :
n
H
 ni / x i
i
est la moyenne
harmonique de la série

statistique.
Tifawt.com
3. Moyennes
Exemple
Si je fais un trajet aller-retour avec une vitesse v1 à
l’aller et une vitesse v2 au retour, quelle est ma
vitesse moyenne sur l’ensemble du trajet ?
La réponse n’est pas
v1  v 2
2
2
Mais
1 1

v1 v 2
qui est la moyenne harmonique de

v1 et v2.

Tifawt.com


Positions respectives du mode, de la médiane et
de la moyenne pour une distribution unimodale.
Lorsque la distribution est symétrique les trois
paramètres sont confondus.
Lorsque la distribution est asymétrique, la
médiane est généralement située entre le mode
et la moyenne et plus proche de cette dernière.
Tifawt.com
Tifawt.com
Exemple


Ex: Absentéisme dans
le service Achats
Le mode
Jours
absentéisme
Nb.
employés
Fréquences
relative %
Fréquences
relative %
cumulées
0
5
19
19
La médiane
1
8
30
49
Médiane= 2
2
6
22
71
3
3
11
82
4
2
7
89
5
1
4
93
6
2
7
100




Le mode = 1
La moyenne
arithmétique

Moyenne = 2
 n
  n 
X    ni X i  /   ni 
 i 1
  i 1 
Tifawt.com
47
Quelle mesure de tendance
retenir ?




Tout dépend de ce
qu’on veut étudier.
Le mode: peu utilisé
Médiane: stable
Moyenne: informative
mais instable
Nb. employés / jours d'absentéisme
9
8
7
6
5
4
3
2
1
0
0
1
2
3
4
5
6
Tifawt.com
48