Document 7609786

Download Report

Transcript Document 7609786

Statistique et probabilités
au collège
Versailles
Mercredi 14 Janvier 2009
1
Des séries statistiques aux probabilités :
la progression dans les programmes du collège
6ème : Organisation et représentation de données
(tableaux, repérage sur un axe, diagrammes, graphiques)
5ème : Représentation et traitement de données
(classes, effectifs, fréquences, tableau de données,
représentations graphiques de données)
4ème : Traitement de données
(moyennes pondérées)
3ème : Statistique (caractéristiques de position)
Notion de probabilité
programmes
2
2
I. Statistique descriptive
A. Histogramme
• Le graphique
• Histogramme avec les TICE
• Histogramme et paramètre statistiques
3
Représentation graphique d’une série
statistique
• Variable quantitative discrète : diagramme en bâtons
Chaque modalité est représentée par une barre dont la
hauteur est proportionnelle à l’effectif.
• Série statistique continue : histogramme
Suite de rectangles contigus : chaque classe est
représentée par un rectangle dont l’aire est
proportionnelle à l’effectif.
4
Histogramme
1. Classes de même amplitude
• Repère orthogonal et modalités du caractère placées sur
l’axe des abscisses
• Chaque classe est représentée par un rectangle dont
l’aire est proportionnelle à l’effectif de la classe
concernée .
Toutes les bases ont la même dimension donc les
« hauteurs » des rectangles sont proportionnelles aux
effectifs.
5
Graphique
Exemple : dureté de pièces et Indice de Rockwell.xls
Indice de Rockwell
14
12
10
8
6
4
2
0
[50,51[
[51,52[
[52,53[
[53,54[
[54,55[
[55,56[
[56,57[
[57,58[
[58,59[
[59,60[
[60,61[
6
Histogramme
2. Classes d’amplitudes différentes
• Les bases des rectangles n’ont pas toutes la même
longueur.
• Les aires des rectangles sont proportionnelles aux effectifs
des classes.
• L’histogramme se construit dans un repère orthogonal en
portant sur l’axe des abscisses les bornes des classes et en
ordonnée des nombres « hauteurs » des rectangles
proportionnels aux densités d’effectifs (effectif/amplitude).
le coefficient de proportionnalité choisi est souvent min(Li)
qui est alors l’unité d’amplitude de classe.
Histogramme classes d’amplitudes différentes
7
Ancienneté du personnel cadre d’une entreprise
Histogramme réalisé avec sine qua non
8
B. Des paramètres pour caractériser une
série statistique
•
•
•
•
Mode
Moyenne(s)
Étendue
Quantiles
– Médiane
– Quartiles
– Déciles
9
1. Caractéristiques de tendance centrale ou de
position
Moyenne
Médiane
Définition : Soit S une série statistique quantitative discrète à une variable,
de taille n, n  N*, définie par S = {si}1  i  n, ordonnée dans l’ordre croissant.
On appelle médiane de S tout réel m tel que au moins 50 % des valeurs de
la série sont supérieures ou égales à m et au moins 50 % des valeurs de la
série sont inférieures ou égales à m.
Par exemple :
Soit S une série statistique quantitative discrète à une variable, de taille n,
n  N*, définie par S = {si}1  i  n, ordonnée dans l’ordre croissant.
Si n est impair, avec n = 2p + 1, p  N, alors sp + 1 est une médiane de S ;
Si n est pair, avec n = 2p, p  N*, alors (sp + sp + 1)/2 est une médiane de S.
10
Quartiles
Définition : Soit S une série statistique quantitative discrète à une
variable, de taille n, n  N*, définie par S = {si} 1  i  n, ordonnée dans
l’ordre croissant.
Le premier quartile Q1 de S est le plus petit élément a de S tel qu’au
moins 25% des valeurs de S soient inférieures ou égales à a.
Le troisième quartile Q3 de S est le plus petit élément a’ de S tel qu’au
moins 75% des valeurs de S soient inférieures ou égales à a’.
Les quartiles ne sont pas sensibles aux valeurs extrêmes.
Remarques :
• Un quartile est une valeur de la série.
• Le deuxième quartile Q2 de S est le plus petit élément a’’ de S tel qu’au
moins 50% des valeurs de la série soient inférieures ou égales à a’’.
• Q2 ne coïncide toujours pas avec la médiane !
11
1. Caractéristiques de tendance centrale ou de position
Leur choix dépend du contexte de l’étude.
• La moyenne est généralement pertinente si la série est longue
et relativement homogène.
• La médiane est très facile à obtenir mais sensible aux
fluctuations d’échantillonnage. Elle décrit bien la série et élimine
l’effet des valeurs aberrantes.
• Le mode indique la valeur la plus typique et intéressant dans le
cas de séries asymétriques.
Il est pertinent de faire apparaître tous ces paramètres sur les
représentations graphiques, cela permet une visualisation
synthétique de la série.
12
2. Caractéristiques de dispersion
L’étendue : max  min
L’écart interquartile : Q3  Q1
L’intervalle interquartile : [Q1 , Q3]
L’étendue est sensible aux valeurs extrêmes.
Les quartiles ne sont pas sensibles aux valeurs extrêmes.
13
3. Histogramme et paramètres statistiques
• Médiane : Une valeur médiane partage la population
observée en deux groupes de même effectif.
La surface totale « sous l’histogramme » représente la
population complète donc la droite d’équation x = Me
partage l’histogramme en deux parties de même aire
comme la médiane d’un triangle partage un triangle en
deux triangles de même aire.
14
3. Histogramme et paramètres statistiques
Ancienneté du personnel cadre d’une entreprise
distribution de l'ancienneté du personnel cadre d'une entreprise
y
19
12
9
8
9
3
5
6
7
8
9
D1
= 1,0 %
10
Q1
11
12
Med
13
Q3
14
15
D9
16
17
18
Histogramme réalisé avec sine qua non
15
19
Classe modale, mode
• Mode : modalité d’effectif maximal, donc représentée par
une barre de hauteur maximale.
• Classe modale : classe représentée par un rectangle de
hauteur maximale.
Une classe modale est donc une classe pour laquelle
c’est le quotient (effectif/amplitude) qui est maximal
alors que pour des classes d’amplitudes égales ou pour
les variables discrètes, les classes modales ou les
modes correspondent aux effectifs maxima.
Remarque : le quotient effectif/amplitude s’appelle la
densité d’effectif de la classe.
• Il peut exister plusieurs modes ou plusieurs classes
modales.
16