Les procédures d`échantillonnage
Download
Report
Transcript Les procédures d`échantillonnage
© Benoit Duguay, 2014
Plan la séance 5
Procédures d’échantillonnage
Terminologie
Étapes du processus d’échantillonnage
Méthodes d’échantillonnage
Échantillonnage sur internet
Quel type d’échantillonnage utiliser ?
Taille de l’échantillon
Atelier :
Planification du processus d’échantillonnage
© Benoit Duguay, 2014
Terminologie
Univers
Échantillon
Recensement
Graphique tiré et adapté de : Zikmund, W.G. 2003. Essentials of Marketing Research, 2nd ed. Mason (OH) : South-Western, 452 p.
© Benoit Duguay, 2014
Univers
Population ou groupe
à l’étude
Différentes entités :
Citoyens
Employés
Clients
Partenaires
Fournisseurs
Élément de l’univers
ou de la population :
Entité individuelle d’un
groupe particulier
Unité d’étude
© Benoit Duguay, 2014
Échantillon
Sous-ensemble
d’un groupe plus
large
Doit être
représentatif du
groupe plus large
Source :
http://courses.tlt.psu.edu/course/bio12/module03/2009/10/les
son-02-samples-and-populations.html
© Benoit Duguay, 2014
Recensement
Enquête auprès de tous les
éléments d’une population
En France, dans les communes
de 10 000 habitants ou plus :
Un échantillon probabiliste
représentant environ 8 % de la
population est recensé chaque
année
Au bout de 5 ans, l'ensemble du
territoire de chaque commune est
pris en compte, et 40 % environ
des habitants de ces communes
sont recensés
http://www.insee.fr/fr/publics/de
fault.asp?page=communication/re
censement/particuliers/organisati
on.htm#complus
© Benoit Duguay, 2014
Étapes du processus
d’échantillonnage
Définir l’univers
Cadre d’échantillonnage
Méthodes d’échantillonnage
Procédure de sélection
Taille de l’échantillon
Sélection des éléments
Travail de terrain
Graphique tiré et adapté de : Zikmund, W.G. 2003. Essentials of Marketing Research, 2nd ed. Mason (OH) : South-Western, 452 p.
© Benoit Duguay, 2014
Définir l’univers
À qui voulons-nous
parler ?
Bien définir l’unité
d’étude, c’est-à-dire
l’élément que nous
voulons étudier dans
l’univers
© Benoit Duguay, 2014
Cadre d’échantillonnage
Liste des éléments
composant l’univers,
p. ex. :
Liste de clients
Annuaire de téléphone
Attention à l’erreur
d’exclusion
© Benoit Duguay, 2014
Méthodes d’échantillonnage
Méthodes
Non probabilistes
Probabilistes
De convenance
Aléatoire
simple
De jugement
Systématique
Boule de neige
Stratifié
Par quota
Grappes
Volontaire
Phases
multiples
Structuré
aléatoire
© Benoit Duguay, 2014
Échantillonnage non probabiliste
© Benoit Duguay, 2014
Échantillonnage de convenance
Échantillon que le
chercheur a sous la
main, p. ex. :
Une classe d’étudiants
ou une cafétéria pour
un sondage dans le
cadre d’un travail de
session
Représentativité
limitée de l’échantillon
© Benoit Duguay, 2014
Échantillonnage de jugement
Échantillon
sélectionné selon le
jugement d’une
personne
d’expérience, p. ex. :
Les sous-groupes de la
population utilisés par
les médias pour prédire
les résultats le soir
d’une élection
Marchés témoins pour
évaluer un nouveau
produit
Source :
http://www.ourbigearth.com/2011/05/02/getout-the-vote-federal-election-is-today/
© Benoit Duguay, 2014
Échantillonnage boule de neige
Construction graduelle
d’un échantillon en
utilisant des références
obtenues des premiers
répondants
Les premiers répondants
peuvent être sélectionnés
de façon aléatoire ou non
Méthode utilisée lorsque
les répondants sont
difficiles à identifier
© Benoit Duguay, 2014
Échantillonnage par quota
Échantillon dont les sous-groupes respectent les
proportions de chacun de ces groupes au sein de l’univers
étudié en fonction de caractéristiques précises, p. ex. l’âge
et le sexe
À ne pas confondre avec l’échantillon stratifié (probabiliste)
Sexe
Âge
25 et -
26 à 50
51 et +
Total
H
11%
16%
22%
49%
F
10%
17%
24%
51%
Total
21%
33%
46%
100%
© Benoit Duguay, 2014
Échantillonnage volontaire
Échantillon composé
de personnes auto
sélectionnées
Par exemple : les
lecteurs d’un journal
ayant accepté de
participer à un
sondage réalisé par ce
journal auprès de tous
ses lecteurs
© Benoit Duguay, 2014
Échantillonnage structuré aléatoire
1 de 3
Ce type d’échantillon n’est
pas considéré comme étant
probabiliste, mais il est
quand même considéré
comme étant scientifique
Seule alternative pratique
en l’absence d’un cadre
d’échantillonnage
Il s’agit de structurer la
population en fonction de
plusieurs critères bien
définis tels le jour, l’heure
et la localisation
géographique
Source :
http://zoom-travels.blogspot.ca/2012/08/fantasy-fridayssamba-at-carnival-rio.html
© Benoit Duguay, 2014
Échantillonnage structuré aléatoire
2 de 3
Pour un festival par
exemple, on répartira la
cueillette de données sur
toute la durée de
l’événement (p. ex. : 3
jours)
On sélectionnera les
répondants à différentes
heures, les mêmes chaque
jour (p. ex : 10h, 14h, 18h
et 22h)
Source :
http://zoom-travels.blogspot.ca/2012/08/fantasy-fridayssamba-at-carnival-rio.html
© Benoit Duguay, 2014
Échantillonnage structuré aléatoire
3 de 3
On sélectionnera les
répondants de façon
systématique pour
introduire un effet
aléatoire (p. ex. : un
visiteur sur trois ou sur
quatre)
Cette méthode est utilisée
par des chercheurs et des
étudiants de cycles
supérieurs et acceptée par
certaines instances
gouvernementales pour
justifier des demandes de
subvention
Source :
http://zoom-travels.blogspot.ca/2012/08/fantasy-fridayssamba-at-carnival-rio.html
© Benoit Duguay, 2014
Échantillonnage probabiliste
© Benoit Duguay, 2014
Échantillonnage aléatoire simple
Échantillon construit à partir
d’une liste de l’univers, dans
laquelle chaque élément a une
chance égale d’être choisi
Il peut être difficile d’obtenir
une liste de l’univers
On utilise des tables de
hasard ou des numéros
générés au hasard par un
ordinateur pour sélectionner
les répondants
Pour les petits échantillons,
on peut sélectionner les
répondants avec une roulette,
un boulier, des papiers dans
un chapeau…
L’échantillon peut ne pas être
représentatif de la population
Source :
http://ccelearn.csus.edu/wasteclass/mod9/mod
9_05.html
© Benoit Duguay, 2014
Échantillonnage systématique
Échantillon construit à partir d’une liste complète de l’univers
à l’étude, comme l’échantillon simple au hasard
Les répondants sont sélectionnés à intervalle fixe, le premier
devant être sélectionné au hasard comme pour
l’échantillonnage aléatoire simple
Source : http://rchsbowman.wordpress.com/2009/08/16/statistics-notessampling-techniques-2/
© Benoit Duguay, 2014
Échantillonnage stratifié
Échantillon dont les sous-groupes respectent les proportions
de chacun de ces groupes au sein de l’univers étudié en
fonction de caractéristiques précises, p. ex. l’âge et le sexe
On utilise des tables de hasard ou des numéros générés au
hasard par un ordinateur pour sélectionner les répondants
dans chacune des strates
À ne pas confondre avec l’échantillonnage par quota (non
probabiliste)
Genre
Classes d’âges
25 et -
26 à 50
51 et +
Total
H
11%
16%
22%
49%
F
10%
17%
24%
51%
Total
21%
33%
46%
100%
© Benoit Duguay, 2014
Échantillonnage par grappes
Échantillon dont l’unité n’est plus l’élément de
l’univers qui est à l’étude mais un sous-groupe
(grappe) réunissant plusieurs de ces éléments
Ces grappes sont composées d’éléments dont un
des points communs est la proximité
géographique
Cette méthode vise à produire un échantillon
d’une façon économique tout en retenant les
caractéristiques d’un échantillon probabiliste
Considéré comme échantillonnage probabiliste si
la sélection des grappes est aléatoire
© Benoit Duguay, 2014
Exemples de grappes
Population à l’étude :
Voyageur d’affaires
Montréal-Toronto
Grappes possibles :
Vols Montréal-Toronto
© Benoit Duguay, 2014
Échantillonnage en phases multiples
Échantillon sélectionné en utilisant une combinaison de
plusieurs méthodes probabilistes, p. ex. l’échantillonnage
aréolaire (area sampling) :
Diviser le Canada en provinces/villes/arrondissements/blocs
(échantillonnage stratifié)
Sélectionner un certain nombre de blocs
Recueillir les réponses de tous les répondants au sein des blocs
sélectionnés (échantillonnage par grappes)
© Benoit Duguay, 2014
Échantillonnage sur internet
(1 de 3)
Échantillons non
probabilistes de
convenance pour les
sondages éclair
Pour les sondages éclair, la
construction d’un gros
échantillon peut être très
rapide pour les sites
populaires
Les méthodes probabilistes
les plus utilisées en ligne
sont :
Échantillonnage aléatoire
simple
Échantillonnage systématique
© Benoit Duguay, 2014
Échantillonnage sur internet
(2 de 3)
Problème de
surreprésentation des
visiteurs fréquents
Sélection aléatoire en
utilisant une fenêtre
intempestive « Pop-Up »…
… mais les fureteurs évolués
bloquent les fenêtres
intempestives
Utilisations de panels…
… mais un panel n’est pas
toujours représentatif de la
population à l’étude
© Benoit Duguay, 2014
Échantillonnage sur internet
(3 de 3)
Pour les sondages auprès
de la clientèle, utilisation
de numéros d’accès pour
empêcher les réponses
multiples du même
répondant
Invitations à participer en
personne, par courrier, par
courriel ou sur un reçu de
caisse
Certaines personnes ne
disposent pas d’un
ordinateur ou d’un accès
internet rapide
© Benoit Duguay, 2014
Quelle méthode d’échantillonnage
utiliser?
Marge d’erreur et niveau
de confiance désirés
Ressources humaines et
financières disponibles
Contraintes de temps
Disponibilité d’une liste de
l’univers
Dispersion géographique
des répondants
Nécessité d’effectuer des
projections à une
population plus large
© Benoit Duguay, 2014
Taille de l’échantillon
N’est pas fonction de la taille de l’univers
Représentativité
Marge d’erreur et niveau de confiance
E
A B
ER
Z
2
E = échantillon
A & B = partage des répondants (0,5 par défaut)
ER = erreur permise (3%, 4%, 5%,...)
Z = # d’écarts type vs niveau de confiance
(3 = 99%, 2 = 95%, 1 = 68%)
Tiré et adapté de: McGown, K.L., Marketing Research: Text and Cases, Winthrop Publishers, 1979, p. 143 165
© Benoit Duguay, 2014
Intervalle de confiance
MOYENNE
-3
99%
-2
95%
Écart type =
-1
68%
Écart type =
+1
+2
68%
Tiré et adapté de : Zikmund, W.G. 2003. Essentials of Marketing Research, 2nd ed. Mason (OH) : South-Western, 452 p.
+3
95%
99%
© Benoit Duguay, 2014
Taille de l’échantillon
Pour le pire des
scénarios, un partage
50/50 des répondants
Une marge d’erreur de
5%
Un niveau de
confiance de 95%
(usuel)
Taille de l’échantillon
= 400 répondants
E
0 ,5 0 ,5
0 , 05
2
2
© Benoit Duguay, 2014
Taille de l’échantillon
Supposons un partage
20/80 des répondants
Une marge d’erreur de
5%
Un niveau de
confiance de 95%
(usuel)
Taille de l’échantillon
= 256 répondants
E
0 , 2 0 ,8
0 , 05
2
2
© Benoit Duguay, 2014
Taille de l’échantillon
Pour le pire des
scénarios, un partage
50/50 des répondants
Une marge d’erreur de
5%
On augmente le
niveau de confiance à
99%
Taille de l’échantillon
= 900 répondants
E
0 ,5 0 ,5
0 , 05
3
2
© Benoit Duguay, 2014
Taille de l’échantillon
Pour le pire des
scénarios, un partage
50/50 des répondants
On diminue la marge
d’erreur à 3%
Un niveau de
confiance de 95%
Taille de l’échantillon
= 1 111 répondants
E
0 ,5 0 ,5
0 , 03
2
2
© Benoit Duguay, 2014
Taille de l’échantillon
Pour le pire des
scénarios, un partage
50/50 des répondants
On diminue la marge
d’erreur à 3%
Un niveau de
confiance de 99%
Taille de l’échantillon
= 2 500 répondants
E
0 ,5 0 ,5
0 , 03
3
2
© Benoit Duguay, 2014
Atelier
Planification du processus
d’échantillonnage