Les procédures d`échantillonnage

Download Report

Transcript Les procédures d`échantillonnage

© Benoit Duguay, 2014
Plan la séance 5
Procédures d’échantillonnage







Terminologie
Étapes du processus d’échantillonnage
Méthodes d’échantillonnage
Échantillonnage sur internet
Quel type d’échantillonnage utiliser ?
Taille de l’échantillon
Atelier :
 Planification du processus d’échantillonnage
© Benoit Duguay, 2014
Terminologie
 Univers
 Échantillon
 Recensement
Graphique tiré et adapté de : Zikmund, W.G. 2003. Essentials of Marketing Research, 2nd ed. Mason (OH) : South-Western, 452 p.
© Benoit Duguay, 2014
Univers
 Population ou groupe
à l’étude
 Différentes entités :
 Citoyens
 Employés
 Clients
 Partenaires
 Fournisseurs
 Élément de l’univers
ou de la population :
 Entité individuelle d’un
groupe particulier
 Unité d’étude
© Benoit Duguay, 2014
Échantillon
 Sous-ensemble
d’un groupe plus
large
 Doit être
représentatif du
groupe plus large
Source :
http://courses.tlt.psu.edu/course/bio12/module03/2009/10/les
son-02-samples-and-populations.html
© Benoit Duguay, 2014
Recensement
 Enquête auprès de tous les
éléments d’une population
 En France, dans les communes
de 10 000 habitants ou plus :
 Un échantillon probabiliste
représentant environ 8 % de la
population est recensé chaque
année
 Au bout de 5 ans, l'ensemble du
territoire de chaque commune est
pris en compte, et 40 % environ
des habitants de ces communes
sont recensés
 http://www.insee.fr/fr/publics/de
fault.asp?page=communication/re
censement/particuliers/organisati
on.htm#complus
© Benoit Duguay, 2014
Étapes du processus
d’échantillonnage
Définir l’univers
Cadre d’échantillonnage
Méthodes d’échantillonnage
Procédure de sélection
Taille de l’échantillon
Sélection des éléments
Travail de terrain
Graphique tiré et adapté de : Zikmund, W.G. 2003. Essentials of Marketing Research, 2nd ed. Mason (OH) : South-Western, 452 p.
© Benoit Duguay, 2014
Définir l’univers
 À qui voulons-nous
parler ?
 Bien définir l’unité
d’étude, c’est-à-dire
l’élément que nous
voulons étudier dans
l’univers
© Benoit Duguay, 2014
Cadre d’échantillonnage
 Liste des éléments
composant l’univers,
p. ex. :
 Liste de clients
 Annuaire de téléphone
 Attention à l’erreur
d’exclusion
© Benoit Duguay, 2014
Méthodes d’échantillonnage
Méthodes
Non probabilistes
Probabilistes
De convenance
Aléatoire
simple
De jugement
Systématique
Boule de neige
Stratifié
Par quota
Grappes
Volontaire
Phases
multiples
Structuré
aléatoire
© Benoit Duguay, 2014
Échantillonnage non probabiliste
© Benoit Duguay, 2014
Échantillonnage de convenance
 Échantillon que le
chercheur a sous la
main, p. ex. :
 Une classe d’étudiants
ou une cafétéria pour
un sondage dans le
cadre d’un travail de
session
 Représentativité
limitée de l’échantillon
© Benoit Duguay, 2014
Échantillonnage de jugement
 Échantillon
sélectionné selon le
jugement d’une
personne
d’expérience, p. ex. :
 Les sous-groupes de la
population utilisés par
les médias pour prédire
les résultats le soir
d’une élection
 Marchés témoins pour
évaluer un nouveau
produit
Source :
http://www.ourbigearth.com/2011/05/02/getout-the-vote-federal-election-is-today/
© Benoit Duguay, 2014
Échantillonnage boule de neige
 Construction graduelle
d’un échantillon en
utilisant des références
obtenues des premiers
répondants
 Les premiers répondants
peuvent être sélectionnés
de façon aléatoire ou non
 Méthode utilisée lorsque
les répondants sont
difficiles à identifier
© Benoit Duguay, 2014
Échantillonnage par quota
 Échantillon dont les sous-groupes respectent les
proportions de chacun de ces groupes au sein de l’univers
étudié en fonction de caractéristiques précises, p. ex. l’âge
et le sexe
 À ne pas confondre avec l’échantillon stratifié (probabiliste)
Sexe
Âge
25 et -
26 à 50
51 et +
Total
H
11%
16%
22%
49%
F
10%
17%
24%
51%
Total
21%
33%
46%
100%
© Benoit Duguay, 2014
Échantillonnage volontaire
 Échantillon composé
de personnes auto
sélectionnées
 Par exemple : les
lecteurs d’un journal
ayant accepté de
participer à un
sondage réalisé par ce
journal auprès de tous
ses lecteurs
© Benoit Duguay, 2014
Échantillonnage structuré aléatoire
1 de 3
 Ce type d’échantillon n’est
pas considéré comme étant
probabiliste, mais il est
quand même considéré
comme étant scientifique
 Seule alternative pratique
en l’absence d’un cadre
d’échantillonnage
 Il s’agit de structurer la
population en fonction de
plusieurs critères bien
définis tels le jour, l’heure
et la localisation
géographique
Source :
http://zoom-travels.blogspot.ca/2012/08/fantasy-fridayssamba-at-carnival-rio.html
© Benoit Duguay, 2014
Échantillonnage structuré aléatoire
2 de 3
 Pour un festival par
exemple, on répartira la
cueillette de données sur
toute la durée de
l’événement (p. ex. : 3
jours)
 On sélectionnera les
répondants à différentes
heures, les mêmes chaque
jour (p. ex : 10h, 14h, 18h
et 22h)
Source :
http://zoom-travels.blogspot.ca/2012/08/fantasy-fridayssamba-at-carnival-rio.html
© Benoit Duguay, 2014
Échantillonnage structuré aléatoire
3 de 3
 On sélectionnera les
répondants de façon
systématique pour
introduire un effet
aléatoire (p. ex. : un
visiteur sur trois ou sur
quatre)
 Cette méthode est utilisée
par des chercheurs et des
étudiants de cycles
supérieurs et acceptée par
certaines instances
gouvernementales pour
justifier des demandes de
subvention
Source :
http://zoom-travels.blogspot.ca/2012/08/fantasy-fridayssamba-at-carnival-rio.html
© Benoit Duguay, 2014
Échantillonnage probabiliste
© Benoit Duguay, 2014
Échantillonnage aléatoire simple
 Échantillon construit à partir
d’une liste de l’univers, dans
laquelle chaque élément a une
chance égale d’être choisi
 Il peut être difficile d’obtenir
une liste de l’univers
 On utilise des tables de
hasard ou des numéros
générés au hasard par un
ordinateur pour sélectionner
les répondants
 Pour les petits échantillons,
on peut sélectionner les
répondants avec une roulette,
un boulier, des papiers dans
un chapeau…
 L’échantillon peut ne pas être
représentatif de la population
Source :
http://ccelearn.csus.edu/wasteclass/mod9/mod
9_05.html
© Benoit Duguay, 2014
Échantillonnage systématique
 Échantillon construit à partir d’une liste complète de l’univers
à l’étude, comme l’échantillon simple au hasard
 Les répondants sont sélectionnés à intervalle fixe, le premier
devant être sélectionné au hasard comme pour
l’échantillonnage aléatoire simple
Source : http://rchsbowman.wordpress.com/2009/08/16/statistics-notessampling-techniques-2/
© Benoit Duguay, 2014
Échantillonnage stratifié
 Échantillon dont les sous-groupes respectent les proportions
de chacun de ces groupes au sein de l’univers étudié en
fonction de caractéristiques précises, p. ex. l’âge et le sexe
 On utilise des tables de hasard ou des numéros générés au
hasard par un ordinateur pour sélectionner les répondants
dans chacune des strates
 À ne pas confondre avec l’échantillonnage par quota (non
probabiliste)
Genre
Classes d’âges
25 et -
26 à 50
51 et +
Total
H
11%
16%
22%
49%
F
10%
17%
24%
51%
Total
21%
33%
46%
100%
© Benoit Duguay, 2014
Échantillonnage par grappes
 Échantillon dont l’unité n’est plus l’élément de
l’univers qui est à l’étude mais un sous-groupe
(grappe) réunissant plusieurs de ces éléments
 Ces grappes sont composées d’éléments dont un
des points communs est la proximité
géographique
 Cette méthode vise à produire un échantillon
d’une façon économique tout en retenant les
caractéristiques d’un échantillon probabiliste
 Considéré comme échantillonnage probabiliste si
la sélection des grappes est aléatoire
© Benoit Duguay, 2014
Exemples de grappes
Population à l’étude :
Voyageur d’affaires
Montréal-Toronto
Grappes possibles :
Vols Montréal-Toronto
© Benoit Duguay, 2014
Échantillonnage en phases multiples
 Échantillon sélectionné en utilisant une combinaison de
plusieurs méthodes probabilistes, p. ex. l’échantillonnage
aréolaire (area sampling) :
 Diviser le Canada en provinces/villes/arrondissements/blocs
(échantillonnage stratifié)
 Sélectionner un certain nombre de blocs
 Recueillir les réponses de tous les répondants au sein des blocs
sélectionnés (échantillonnage par grappes)
© Benoit Duguay, 2014
Échantillonnage sur internet
(1 de 3)
 Échantillons non
probabilistes de
convenance pour les
sondages éclair
 Pour les sondages éclair, la
construction d’un gros
échantillon peut être très
rapide pour les sites
populaires
 Les méthodes probabilistes
les plus utilisées en ligne
sont :
 Échantillonnage aléatoire
simple
 Échantillonnage systématique
© Benoit Duguay, 2014
Échantillonnage sur internet
(2 de 3)
 Problème de
surreprésentation des
visiteurs fréquents
 Sélection aléatoire en
utilisant une fenêtre
intempestive « Pop-Up »…
 … mais les fureteurs évolués
bloquent les fenêtres
intempestives
 Utilisations de panels…
 … mais un panel n’est pas
toujours représentatif de la
population à l’étude
© Benoit Duguay, 2014
Échantillonnage sur internet
(3 de 3)
 Pour les sondages auprès
de la clientèle, utilisation
de numéros d’accès pour
empêcher les réponses
multiples du même
répondant
 Invitations à participer en
personne, par courrier, par
courriel ou sur un reçu de
caisse
 Certaines personnes ne
disposent pas d’un
ordinateur ou d’un accès
internet rapide
© Benoit Duguay, 2014
Quelle méthode d’échantillonnage
utiliser?
 Marge d’erreur et niveau
de confiance désirés
 Ressources humaines et
financières disponibles
 Contraintes de temps
 Disponibilité d’une liste de
l’univers
 Dispersion géographique
des répondants
 Nécessité d’effectuer des
projections à une
population plus large
© Benoit Duguay, 2014
Taille de l’échantillon
 N’est pas fonction de la taille de l’univers
 Représentativité
 Marge d’erreur et niveau de confiance
E 
A B
 ER 


 Z 
2
E = échantillon
A & B = partage des répondants (0,5 par défaut)
ER = erreur permise (3%, 4%, 5%,...)
Z = # d’écarts type vs niveau de confiance
(3 = 99%, 2 = 95%, 1 = 68%)
Tiré et adapté de: McGown, K.L., Marketing Research: Text and Cases, Winthrop Publishers, 1979, p. 143 165
© Benoit Duguay, 2014
Intervalle de confiance
MOYENNE
-3
99%
-2
95%
Écart type =
-1
68%
Écart type =
+1
+2
68%
Tiré et adapté de : Zikmund, W.G. 2003. Essentials of Marketing Research, 2nd ed. Mason (OH) : South-Western, 452 p.
+3
95%
99%
© Benoit Duguay, 2014
Taille de l’échantillon
 Pour le pire des
scénarios, un partage
50/50 des répondants
 Une marge d’erreur de
5%
 Un niveau de
confiance de 95%
(usuel)
 Taille de l’échantillon
= 400 répondants
E 
0 ,5  0 ,5
 0 , 05 


 2 
2
© Benoit Duguay, 2014
Taille de l’échantillon
 Supposons un partage
20/80 des répondants
 Une marge d’erreur de
5%
 Un niveau de
confiance de 95%
(usuel)
 Taille de l’échantillon
= 256 répondants
E 
0 , 2  0 ,8
 0 , 05 


 2 
2
© Benoit Duguay, 2014
Taille de l’échantillon
 Pour le pire des
scénarios, un partage
50/50 des répondants
 Une marge d’erreur de
5%
 On augmente le
niveau de confiance à
99%
 Taille de l’échantillon
= 900 répondants
E 
0 ,5  0 ,5
 0 , 05 


 3 
2
© Benoit Duguay, 2014
Taille de l’échantillon
 Pour le pire des
scénarios, un partage
50/50 des répondants
 On diminue la marge
d’erreur à 3%
 Un niveau de
confiance de 95%
 Taille de l’échantillon
= 1 111 répondants
E 
0 ,5  0 ,5
 0 , 03 


 2 
2
© Benoit Duguay, 2014
Taille de l’échantillon
 Pour le pire des
scénarios, un partage
50/50 des répondants
 On diminue la marge
d’erreur à 3%
 Un niveau de
confiance de 99%
 Taille de l’échantillon
= 2 500 répondants
E 
0 ,5  0 ,5
 0 , 03 


 3 
2
© Benoit Duguay, 2014
Atelier
 Planification du processus
d’échantillonnage