1 - F2SMH Toulouse - Université Paul Sabatier
Download
Report
Transcript 1 - F2SMH Toulouse - Université Paul Sabatier
TESTS NON
PARAMÉTRIQUES
UE 45.2
CHV
Pierre MORETTO,
Université Paul Sabatier, Toulouse III.
Tests non paramétriques
Conditions d’utilisation
Test sur les fréquences (Khi²)
Comparaisons d’échantillon:
Données
(Mann
Non appariées
& Withney)
Données
appariées
(Wilcoxon)
Condition d’utilisation
Les données sont dîtes non paramétriques lorsque:
Les
valeurs sont nominales, ordinales, d’intervalle ou de
rapport (Cf CH I)
Le nombre de sujets est insuffisant pour vérifier la
normalité de la distribution
La distribution n’est pas normale (Gaussienne)
Dans ces cas, les tests non paramétriques sont de
rigueur
Condition d’utilisation et utilités
Khi² non paramétrique: compare 2 ou plus séries de données
nominales arrangées en catégories pondérées par leurs
fréquences d’apparition.
Le U de Mann et Withney détermine la signification de la
différence entre 2 variables ordinales non appariées
Le test « W » de Wilcoxon : idem à U mais pour variables
appariées
Le Khi² (²) non paramétrique
Compare 2 ou plus séries de données nominales
arrangées en catégories pondérées par leurs
fréquences d’apparition.
Cas 1: Comparer distribution de contingences
d’1 variable nominale (types de chaussure)
Le Khi² (²) non paramétrique
Exemple:
Les chaussures de marque « X » sont classées de A à E suivant
leur niveau de technicité et leur coût de production.
Pour optimiser le gain, X sait qu’il doit vendre 10% de A, 30%
de B, 35 de C, 20% de D et 5% de F
Sur 141 chaussures, un magasin M vend finalement A(30),
B(57), C(32), D(15) et E(7).
Le magasin optimise-t-il son engagement vis-à-vis de la
marque X ?
Le Khi² (²) non paramétrique
Ce premier exemple illustre l’application du test à
une série de fréquences observées dans des
groupes (variable nominale).
Il s’agit ici de comparer les volumes de vente
attendus à ceux observés d’où ce premier tableau:
Ventes
Fréquence de
vente (N=141)
Fréquence
attendues
A
30
B
57
C
32
D
15
E
7
0,21
0,40
0,23
0,11
0,05
0,1
0,3
0,35
0,2
0,05
² non paramétrique
L’indice ² est calculé sur la base de la différence
entre Obs et Théo:
(Obs Théo )²
²
Théo
Appliqué à nos valeurs:
Ventes
Fréquence attendues
Ventes attendues
(O-T)²/T
Khi²
A
30
0,1
14
B
57
0,3
42
C
32
0,35
49
D
15
0,2
28
E
7
0,05
7
18
35,32
5
6
6
0
² non paramétrique
Détermination du Khi² théorique
Lecture au risque et ddl=catégories-1
Nb:
ici 5 catégories de A à E
² non paramétrique
Décision finale:
²
calculé est de 35
² théorique est de 13.28
² calculé >² théorique au risque considéré donc
la différence est significative au risque .
La magasin sera enjoint de revoir la promotion des
chaussures pour corriger ses ventes.
² non paramétrique
Compare 2 ou plus séries de données nominales
arrangées en catégories pondérées par leurs
fréquences d’apparition.
Cas 2: Comparer distribution de contingences sur
2 variables nominales (type d’entraînement et
niveaux d’habilété)
Le Khi² (²) non paramétrique
Exemple:
2 groupes de nageurs apprennent le Crawl grâce à
des méthodes différentes (A et B).
A la fin d’entraînements menés sur 5 semaines,
l’observateur classe les sujets en « Bons »,
« Moyens » et « Mauvais »
Niveaux d'habileté
Méthode
Bons
Moyens
Mauvais
A
15
27
13
B
21
19
12
² non paramétrique
Comment comparer ces 2 méthodes
d’apprentissage du crawl ?
1)
Considérer le classement niveau d’habileté toutes
méthodes confondues
2) En déduire une fréquence d’apparition théorique
Niveaux d'habileté
Méthode
Bons
Moyens
Mauvais
Total
A
15
27
13
55
B
21
19
12
52
Total
36
46
25
36/107 « bons »
Soit 34%
² non paramétrique
Niveaux d'habileté
Méthode
Bons
Moyens
Mauvais
Total
A
15
27
13
55
B
21
19
12
52
Total
36
46
25
107
% Attendus
0,34
0,43
0,23
Répété pour chaque niveaux d’habileté
Déduire un nombre de sujets théorique indépendant de
l’entraînement pour chaque groupe:
Ex: Théoriquement « Bons » en méthode A: 0.34*55=18.5
² non paramétrique
Effectifs Attendus
Méthode
Bons
Moyens
Mauvais
Total
A
18,50
23,64
12,85
55
B
17,50
22,36
12,15
52
Total
36
46
25
Déterminer un effectif théorique pour chaque groupe
² non paramétrique
Nous avons donc un effectif observé et un théorique
Observés
Méthode
A
B
Bons
15
21
Théorique
Méthode
A
B
Bons
18,50
17,50
Niveaux d'habileté
Moyens Mauvais
27
13
19
12
Moyens
23,64
22,36
Mauvais
12,85
12,15
Le test du ² va permettre de comparer ces 2
effectifs
² non paramétrique
L’indice est calculé sur la base de la différence
entre Obs et Théo:
(Obs Théo )²
²
Théo
Appliqué à nos valeurs:
Bons
Moyens
Mauvais
Observées
15
21
27
19
13
12
Théoriques
18,50
17,50
23,64
22,36
12,85
12,15
(O-T)²
12,28
12,28
11,26
11,26
0,02
0,02
(O-T)²/T
0,664
0,702
0,476
0,504
0,002
0,002
Khi²
2,35
² non paramétrique
Détermination du Khi² théorique
Lecture au risque et ddl=(ligne-1)*(colonne-1)
Nb: ligne et colonne du tableau
² non paramétrique
Décision finale:
²
calculé est de 2.35
² théorique est de 4.61
² calculé <² théorique au risque considéré donc
la différence n’est pas significative au risque .
La méthode d’apprentissage n’a pas d’effet sur la
maîtrise finale de l’habileté et les méthodes A et B
se valent.
Tests non paramétriques
Conditions d’utilisation
Test sur les fréquences (Khi²)
Comparaisons d’échantillon:
Données
Non appariées (Mann &
Withney)
Données appariées (Wilcoxon)
Test « U » de Mann et Withney
Compare 2 séries de variables ordinales ou
réelles non appariées et non gaussiennes.
Mann et Withney
Soit 2 échantillons x et y de nx et ny variables
ordinales,
x
11
21
25
52
71
y
22
43
72
91 116
79
Nx=
6
Ny=
5
Le test de Mann & Withney va comparer les rangs
des 2 séries de variables
Mann et Withney
Détermination des rangs
Arrangement par ordre
croissant des x et y
11 21 22 25 43
x/y
x
x
y
x
y
Rangs 1
2
3
4
5
52
x
6
71
x
7
72
y
8
79
x
9
91
y
10
116
y
11
Mann et Withney
Classement et calcul de l’indice « U »
x/y
Rangs
Nombre
de y<x
Nombre
de x<y
Arrangement par ordre croissant des x et y
11 21 22 25 43 52 71 72 79
x
x
y
x
y
x
x
y
x
1
2
3
4
5
6
7
8
9
0
0
1
2
2
3
2
91
y
10
116
y
11
3
5
6
6
8
Ux/y
22
Uy/x
Vérifications:
Ux/y+Uy/x=Nx*Ny 30
Mann & Withney
Hypothèse Ho correspondant à une alternance des
valeurs x et y implique que Uo=Nx.Ny/2
Dans la table des U, n1 est le plus petit des effectifs
(Nx et Ny)
5
n1
et n2-n1 est la différence des effectifs:
1
n2-n1
Détermination du « u » Théorique
À la colonne n1 et ligne n2-n1
Mann & Withney
Hypothèse Ho correspondant à une alternance des
valeurs x et y implique que Uo=Nx.Ny/2
Dans la table des U, n1 est le plus petit des effectifs
(Nx et Ny)
5
n1
et n2-n1 est la différence des effectifs:
1
n2-n1
3
Uthéorique, 0,05
1
Uthéorique, 0,01
donc
Le plus petit des 2 « U » est comparé à la valeur
théorique au risque
Mann & Withney
Règle de décision:
Si, au risque alpha, U (plus petit des Ux/y et Uy/x) <
Uthéorique alors les populations diffèrent
significativement.
Donc ici:
8>3 (ou 1) et la différence n’est pas significative au
risque de 5% (1%)
Test « W » de Wilcoxon
Compare 2 séries appariées de variables ordinales ou
réelles non gaussiennes.
Wilcoxon
Le début du test est identique à Mann & Withney
Classement et calcul de l’indice « W »
Arrangement par ordre croissant des x et y
11 21 22 25 43 52 71 72 79
x
x
y
x
y
x
x
y
x
1
2
3
4
5
6
7
8
9
x/y
Rangs
Rang de 1
y<x
Rang de
x<y
2
4
3
6
5
7
91
y
10
116
y
11
9
8
10
11
29
Wx/y
37
Wy/x
Wilcoxon vers Mann & Withney
Hypothèse Wo correspondant à une alternance des valeurs x
et y implique que Wo=nx.(N+1)/2
A ce niveau, il existe une équivalence entre « W » de
Wilcoxon et « U » de Mann et Withney.
1
U Wx nx .(nx 1)
2
Retour sur la règle de décision du « U »
Wilcoxon vers Mann & Withney
Règle de décision:
Si, au risque alpha, U (plus petit des Ux/y et Uy/x) <
Uthéorique alors les populations diffèrent
significativement.
Donc ici:
8>3 (ou 1) et la différence n’est pas significative au
risque de 5% (1%)
Merci de votre attention
Les cours sont en ligne sur le site du STAPS
L3_UE45.2.