Séance 10 - L`analyse des données

Download Report

Transcript Séance 10 - L`analyse des données

© Benoit Duguay, 2013
Plan la séance 10
Analyse des données







Ressources Web
Analyse de fréquences
Mesures de position centrale
Mesures de dispersion
Mesures de forme
Utilisation du logiciel SPSS
Atelier
 Démonstration du logiciel SPSS
 Traitement des données recueillies avec SPSS
 Rencontre de chacune des équipes avec le professeur
© Benoit Duguay, 2013
Analyse statistique
Ressource Web
http://www.statcan.gc.ca/edu/powerpouvoir/toc-tdm/5214718-fra.htm
© Benoit Duguay, 2013
Analyse de fréquences (1 de 2)
 Fondement de l’analyse
statistique
 Analyse de la distribution
des réponses une variable
à la fois :
 Selon le nombre de réponses
(effectif)
 Selon le pourcentage de
réponses
 Présentation :
 Tableau
 Graphique
Source :
http://www.mineful.com/analytics/frequencydistribution-analysis.html
© Benoit Duguay, 2013
Analyse de fréquences (2 de 2)
 Permet d’évaluer
l’importance des réponses
manquantes :
 Pourcentage valide exclue les
réponses manquantes
 Permet d’évaluer la
présence de données hors
norme (anormales) :
 P. ex., la valeur 6 pour une
variable codifiée de 1 à 5
Source :
http://www.mineful.com/analytics/frequencydistribution-analysis.html
© Benoit Duguay, 2013
Tableau de fréquences
Variable Consommation
Consommation
Valid
Missing
Total
Plus
Comparable
Moins
Total
9
Frequency
30
110
32
172
3
175
Percent
17,1
62,9
18,3
98,3
1,7
100,0
Valid Percent
17,4
64,0
18,6
100,0
Cumulative
Percent
17,4
81,4
100,0
© Benoit Duguay, 2013
Graphique de fréquences
Variable Consommation
© Benoit Duguay, 2013
Mesures de position centrale
 Mode :
 Valeur la plus fréquente
 Certaines données peuvent
être bimodales
 Médiane :
 Valeur centrale d’un ensemble
ordonné de réponses
 Moyenne :
 Somme des réponses divisée
par le nombre de réponses
 Pour une courbe normale,
les trois valeurs sont
identiques et centrées sur
la courbe
Mode
Médiane
Moyenne
© Benoit Duguay, 2013
Mesures de position centrale en
fonction du type d’échelle utilisé
Échelle
Mesure de
tendance centrale
Nominale
Mode
Ordinale
Médiane, mode
D’intervalles
Moyenne, médiane
De proportions
(rapport, ratio)
Moyenne, médiane
Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2011), Études Marketing avec SPSS, 6e éd., Paris: Pearson Éducation France.
© Benoit Duguay, 2013
Problèmes avec la moyenne
 Statistique très affectée
par les valeurs extrêmes
 Moyenne unique seulement
hypothétique pour les
courbes bicéphales (voir cicontre)
 Souvent peu de réponses ,
voire aucune, près de la
moyenne (grands écarts
types)
 Ne pas exagérer la
précision :
 (5000+3000+2000)/3 =
3333
 3300 suffisant
45
40
35
30
25
20
15
10
5
0
Tiré et adapté de: McGown (1979), Marketing Research: Text and Cases, Cambridge : Winthrop Publishers
© Benoit Duguay, 2013
Mesures de dispersion
 Écart type (S) :
 Mesure de dispersion autour
de la moyenne
 La plus utilisée
 Variance = Moyenne des
carrés des écarts à la
moyenne
 Écart type = Racine carrée
de la variance
 Écart (ou étendue) :
 Différence entre les valeurs
maximale et minimale
Source :
http://www.socialresearchmethods.net/kb/statd
esc.php
© Benoit Duguay, 2013
Présentation de la moyenne et de l’écart
type pour plusieurs aspects d’une même
question
18
Nourriture
16
14
12
10
8
6
4
2
x(
ho
i
va
rié
té
de
sc
ho
i
va
r ié
té
de
sc
moyenne
de
sp
la
ts
eu
r
te
m
pé
ra
tu
re
bo
ur
ri
no
x(
re
té
pr
op
écart-type -
fra
ich
iss
on
s)
tu
rt i
o
po
de
sp
re
)
s
lat
ra
l
gé
né
ar
en
ce
ap
p
ns
0
écart-type +
Gracieuseté des étudiants suivants du EUT4108 H2009: Marie-Ève Aubry, Alexandre Champagne, Alexandra Fauteux, Mathieu Lavoie, Micheline Petit
© Benoit Duguay, 2013
Relation entre l’écart type et la
courbe normale
Mode
Médiane
Moyenne
-3
99%
-2
95%
Écart type =
-1
68%
Écart type =
+1
+2
68%
+3
95%
99%
© Benoit Duguay, 2013
Mesures de formes
 Symétrie (skewness) :
 mesure indiquant que les
déviations par rapport à la
moyenne sont plus importantes
dans une direction, à gauche (si
valeur positive), ou à droite (si
valeur négative)
 Symétrie d’une distribution
normale = 0
 Aplatissement (kurtosis) :
 Mesure indiquant que la courbe
de la distribution de fréquence
est plus plate (si valeur
négative), ou moins plate (si
valeur positive), par rapport à
une courbe normale
 Aplatissement d’une distribution
normale = 0
Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2011), Études Marketing avec SPSS, 6e éd., Paris: Pearson Éducation France.
© Benoit Duguay, 2013
Symétrie de la distribution
Distribution
asymétrique
Skewness =
négatif
Distribution
symétrique
Skewness = 0
Distribution
asymétrique
Skewness =
positif
Source : http://experimentaltheology.blogspot.ca/2012/03/central-tendency-inskewed.html
© Benoit Duguay, 2013
Aplatissement de la distribution
Source :
http://mvpprograms.com/help/mvpstats/distributions/Skewness
Kurtosis
© Benoit Duguay, 2013
La courbe de la variable Consommation
est-elle normale?
© Benoit Duguay, 2013
Statistiques de la
variable Consommation
Statistics
Consommation
N
Valid
Missing
Mean
Moyenne
Median
Médiane
Mode
Mode
Std. Deviation Écart type
Skewness
Symétrie
Std. Error of Skewness
Kurtosis
Aplatissement
Std. Error of Kurtosis
Range
Étendue
172
3
2,01
2,00
2
,602
-,004
,185
-,197
,368
2
© Benoit Duguay, 2013
La courbe de la variable Âge est-elle
normale?
© Benoit Duguay, 2013
Statistiques de la
variable Âge
Statistics
Âge
N
Moyenne
Valid
Missing
Mean
Médiane
Median
Mode
Mode
Écart type
Std. Deviation
Symétrie
Skewness
Std. Error of Skewness
Aplatissement
Kurtosis
Std. Error of Kurtosis
Étendue
Range
173
2
31,69
31,00
21
8,653
,709
,185
,298
,367
42
© Benoit Duguay, 2013
Utilisation du logiciel SPSS
 Importer des données du fichier Excel à SPSS
 Ajouter de nouvelles données une fois le fichier Excel
importé dans SPSS
 Identifier les variables et leurs valeurs, et la ou les valeurs
pour les données manquantes :
 Guide interactif « Comment identifier les variables et leurs valeurs »
 Créer une nouvelle variable avec des catégories :
 Guide interactif « Comment créer une variable avec des catégories »
 Réaliser les analyses de fréquences :
 Guide interactif « Comment réaliser une analyse des fréquences »
 Ressource Web :
 Site SPSS de l'Université de Sherbrooke
© Benoit Duguay, 2013
Atelier
 Démonstration du logiciel
SPSS
 Traitement des données
recueillies avec SPSS
 Rencontre de chacune des
équipes avec le professeur