1 - F2SMH Toulouse - Université Paul Sabatier

Transcript 1 - F2SMH Toulouse - Université Paul Sabatier

TESTS NON
PARAMÉTRIQUES
UE 45.2
CHV
Pierre MORETTO,
Université Paul Sabatier, Toulouse III.
Tests non paramétriques



Conditions d’utilisation
Test sur les fréquences (Khi²)
Comparaisons d’échantillon:
 Données
 (Mann
Non appariées
& Withney)
 Données
appariées
 (Wilcoxon)
Condition d’utilisation

Les données sont dîtes non paramétriques lorsque:
 Les
valeurs sont nominales, ordinales, d’intervalle ou de
rapport (Cf CH I)
 Le nombre de sujets est insuffisant pour vérifier la
normalité de la distribution
 La distribution n’est pas normale (Gaussienne)

Dans ces cas, les tests non paramétriques sont de
rigueur
Condition d’utilisation et utilités



Khi² non paramétrique: compare 2 ou plus séries de données
nominales arrangées en catégories pondérées par leurs
fréquences d’apparition.
Le U de Mann et Withney détermine la signification de la
différence entre 2 variables ordinales non appariées
Le test « W » de Wilcoxon : idem à U mais pour variables
appariées
Le Khi² (²) non paramétrique
Compare 2 ou plus séries de données nominales
arrangées en catégories pondérées par leurs
fréquences d’apparition.
Cas 1: Comparer distribution de contingences
d’1 variable nominale (types de chaussure)
Le Khi² (²) non paramétrique
Exemple:




Les chaussures de marque « X » sont classées de A à E suivant
leur niveau de technicité et leur coût de production.
Pour optimiser le gain, X sait qu’il doit vendre 10% de A, 30%
de B, 35 de C, 20% de D et 5% de F
Sur 141 chaussures, un magasin M vend finalement A(30),
B(57), C(32), D(15) et E(7).
Le magasin optimise-t-il son engagement vis-à-vis de la
marque X ?
Le Khi² (²) non paramétrique


Ce premier exemple illustre l’application du test à
une série de fréquences observées dans des
groupes (variable nominale).
Il s’agit ici de comparer les volumes de vente
attendus à ceux observés d’où ce premier tableau:
Ventes
Fréquence de
vente (N=141)
Fréquence
attendues
A
30
B
57
C
32
D
15
E
7
0,21
0,40
0,23
0,11
0,05
0,1
0,3
0,35
0,2
0,05
² non paramétrique

L’indice ² est calculé sur la base de la différence
entre Obs et Théo:
(Obs  Théo )²
²  
Théo

Appliqué à nos valeurs:
Ventes
Fréquence attendues
Ventes attendues
(O-T)²/T
Khi²
A
30
0,1
14
B
57
0,3
42
C
32
0,35
49
D
15
0,2
28
E
7
0,05
7
18
35,32
5
6
6
0
² non paramétrique


Détermination du Khi² théorique
Lecture au risque  et ddl=catégories-1
 Nb:
ici 5 catégories de A à E
² non paramétrique

Décision finale:
 ²
calculé est de 35
 ² théorique est de 13.28


² calculé >² théorique au risque considéré donc
la différence est significative au risque .
La magasin sera enjoint de revoir la promotion des
chaussures pour corriger ses ventes.
² non paramétrique
Compare 2 ou plus séries de données nominales
arrangées en catégories pondérées par leurs
fréquences d’apparition.
Cas 2: Comparer distribution de contingences sur
2 variables nominales (type d’entraînement et
niveaux d’habilété)
Le Khi² (²) non paramétrique



Exemple:
2 groupes de nageurs apprennent le Crawl grâce à
des méthodes différentes (A et B).
A la fin d’entraînements menés sur 5 semaines,
l’observateur classe les sujets en « Bons »,
« Moyens » et « Mauvais »
Niveaux d'habileté
Méthode
Bons
Moyens
Mauvais
A
15
27
13
B
21
19
12
² non paramétrique

Comment comparer ces 2 méthodes
d’apprentissage du crawl ?
 1)
Considérer le classement niveau d’habileté toutes
méthodes confondues
 2) En déduire une fréquence d’apparition théorique
Niveaux d'habileté
Méthode
Bons
Moyens
Mauvais
Total
A
15
27
13
55
B
21
19
12
52
Total
36
46
25
36/107 « bons »
Soit 34%
² non paramétrique
Niveaux d'habileté



Méthode
Bons
Moyens
Mauvais
Total
A
15
27
13
55
B
21
19
12
52
Total
36
46
25
107
% Attendus
0,34
0,43
0,23
Répété pour chaque niveaux d’habileté
Déduire un nombre de sujets théorique indépendant de
l’entraînement pour chaque groupe:
Ex: Théoriquement « Bons » en méthode A: 0.34*55=18.5
² non paramétrique
Effectifs Attendus

Méthode
Bons
Moyens
Mauvais
Total
A
18,50
23,64
12,85
55
B
17,50
22,36
12,15
52
Total
36
46
25
Déterminer un effectif théorique pour chaque groupe
² non paramétrique


Nous avons donc un effectif observé et un théorique
Observés
Méthode
A
B
Bons
15
21
Théorique
Méthode
A
B
Bons
18,50
17,50
Niveaux d'habileté
Moyens Mauvais
27
13
19
12
Moyens
23,64
22,36
Mauvais
12,85
12,15
Le test du ² va permettre de comparer ces 2
effectifs
² non paramétrique

L’indice est calculé sur la base de la différence
entre Obs et Théo:
(Obs  Théo )²
²  
Théo

Appliqué à nos valeurs:
Bons
Moyens
Mauvais
Observées
15
21
27
19
13
12
Théoriques
18,50
17,50
23,64
22,36
12,85
12,15
(O-T)²
12,28
12,28
11,26
11,26
0,02
0,02
(O-T)²/T
0,664
0,702
0,476
0,504
0,002
0,002
Khi²
2,35
² non paramétrique


Détermination du Khi² théorique
Lecture au risque  et ddl=(ligne-1)*(colonne-1)
 Nb: ligne et colonne du tableau
² non paramétrique

Décision finale:
 ²
calculé est de 2.35
 ² théorique est de 4.61


² calculé <² théorique au risque considéré donc
la différence n’est pas significative au risque .
La méthode d’apprentissage n’a pas d’effet sur la
maîtrise finale de l’habileté et les méthodes A et B
se valent.
Tests non paramétriques



Conditions d’utilisation
Test sur les fréquences (Khi²)
Comparaisons d’échantillon:
 Données
Non appariées (Mann &
Withney)
 Données appariées (Wilcoxon)
Test « U » de Mann et Withney
Compare 2 séries de variables ordinales ou
réelles non appariées et non gaussiennes.
Mann et Withney


Soit 2 échantillons x et y de nx et ny variables
ordinales,
x
11
21
25
52
71
y
22
43
72
91 116
79
Nx=
6
Ny=
5
Le test de Mann & Withney va comparer les rangs
des 2 séries de variables
Mann et Withney

Détermination des rangs
Arrangement par ordre
croissant des x et y
11 21 22 25 43
x/y
x
x
y
x
y
Rangs 1
2
3
4
5
52
x
6
71
x
7
72
y
8
79
x
9
91
y
10
116
y
11
Mann et Withney

Classement et calcul de l’indice « U »
x/y
Rangs
Nombre
de y<x
Nombre
de x<y
Arrangement par ordre croissant des x et y
11 21 22 25 43 52 71 72 79
x
x
y
x
y
x
x
y
x
1
2
3
4
5
6
7
8
9
0
0
1
2
2
3
2
91
y
10
116
y
11
3
5
6
6
8
Ux/y
22
Uy/x
Vérifications:
Ux/y+Uy/x=Nx*Ny 30
Mann & Withney

Hypothèse Ho correspondant à une alternance des
valeurs x et y implique que Uo=Nx.Ny/2
Dans la table des U, n1 est le plus petit des effectifs
(Nx et Ny)
5
n1
et n2-n1 est la différence des effectifs:
1
n2-n1
Détermination du « u » Théorique

À la colonne n1 et ligne n2-n1
Mann & Withney

Hypothèse Ho correspondant à une alternance des
valeurs x et y implique que Uo=Nx.Ny/2
Dans la table des U, n1 est le plus petit des effectifs
(Nx et Ny)
5
n1
et n2-n1 est la différence des effectifs:
1
n2-n1
3
Uthéorique, 0,05
1
Uthéorique, 0,01
donc

Le plus petit des 2 « U » est comparé à la valeur
théorique au risque 
Mann & Withney
Règle de décision:
Si, au risque alpha, U (plus petit des Ux/y et Uy/x) <
Uthéorique alors les populations diffèrent
significativement.
 Donc ici:
8>3 (ou 1) et la différence n’est pas significative au
risque de 5% (1%)

Test « W » de Wilcoxon
Compare 2 séries appariées de variables ordinales ou
réelles non gaussiennes.
Wilcoxon


Le début du test est identique à Mann & Withney
Classement et calcul de l’indice « W »
Arrangement par ordre croissant des x et y
11 21 22 25 43 52 71 72 79
x
x
y
x
y
x
x
y
x
1
2
3
4
5
6
7
8
9
x/y
Rangs
Rang de 1
y<x
Rang de
x<y
2
4
3
6
5
7
91
y
10
116
y
11
9
8
10
11
29
Wx/y
37
Wy/x
Wilcoxon vers Mann & Withney


Hypothèse Wo correspondant à une alternance des valeurs x
et y implique que Wo=nx.(N+1)/2
A ce niveau, il existe une équivalence entre « W » de
Wilcoxon et « U » de Mann et Withney.
1
U  Wx  nx .(nx  1)
2

Retour sur la règle de décision du « U »
Wilcoxon vers Mann & Withney
Règle de décision:
Si, au risque alpha, U (plus petit des Ux/y et Uy/x) <
Uthéorique alors les populations diffèrent
significativement.
 Donc ici:
8>3 (ou 1) et la différence n’est pas significative au
risque de 5% (1%)

Merci de votre attention
Les cours sont en ligne sur le site du STAPS
L3_UE45.2.