Transcript ASSOCIATION entre caractères qualitatifs
ASSOCIATION entre caractères qualitatifs
Professeur
Pascale FRIANT-MICHEL >
Faculté de Pharmacie [email protected]
ASSOCIATION entre CARACTERES QUALITATIFS I - INTRODUCTION (1)
• Etude de deux caractères
qualitatifs
population appartenant à une même Y a-t-il association entre ces caractères ou sont-ils indépendants ?
Remarque : lorsqu’on conclut à une indépendance des caractères, en raison même des fluctuations d’échantillonnage , les caractères peuvent se trouver associés dans une certaine proportion de cas • Problème : dans quelle mesure la proportion d’association observée est-elle significative ?
I - INTRODUCTION (2) • Réponse : méthode applicable au cas où les caractères (l’un ou l’autre ou les deux) existent sous plusieurs
modalités
Exemple :
caractère 1 : couleur des yeux . bleu . gris . marron . . . .
. Test du c 2 . c 2 d’indépendance caractère 2 : couleur des cheveux . blond . châtains . brun . . . .
II - TEST de x2 (1) II - TEST de
c 2
(1)
1.
Définition Tester l’ indépendance de deux caractères Comparer deux distributions : . les fréquences expérimentales observées . les fréquences théoriques 2. Principe du test a) disposer les fréquences expérimentales dans un tableau à double entrée, dit
tableau de contingence
différentes colonnes : diverses modalités de l’un des caractères
II – TEST de c 2 (2) II - TEST de x2 (2) différentes lignes : diverses modalités de l’autre caractère totaux des lignes et des colonnes : nombre d’individus présentant tel aspect de l’un des caractères, indépendamment de l’état de l’autre Soient k l le nombre de modalités du 1 er . . . . . .
caractère et 2 ème . . .
Un tableau de contingence permet de présenter de façon simple et claire les résultats concernant la répartition de deux caractères Cas particulier : tableau de contingence 2 x 2
II -TEST de c 2 (3) II - TEST de x2 (3) Car. 1 Car. 2 1 2 .
.
.
.
.
l Totaux 1 O 11 O 12 .
.
.
.
.
O 1l n’ 1 2 O 21 O 22 .
.
.
.
.
O 2l n’ 2 . . .
. . .
. . .
.
.
.
.
.
. . .
. . .
k O k1 O k2 .
.
.
.
.
O kl n’ k Totaux n 1 n 2 .
.
.
.
.
n l N
II - TEST de c 2 (4) II - TEST de x2 (4) b) . calculer les fréquences théoriques correspondant à l’indépendance rigoureuse des deux caractères
Exemple :
probabilité d’avoir un individu possédant le caractère 1 selon la 2 ème le caractère 2 selon la 1 ère modalité (1 2 ) et modalité (2 1 ) P th = p 12 . p 21 Or => p 12 n = N et P th n = .
N 2 n 1 p Or l’effectif théorique : T 21 donc T 21 = n 2 .
n 1 N = N . P th 21 = n 1
II - TEST de c 2 (5) II - TEST de x2 (5) . calculer : c) . k . l - 1 1 effectifs théoriques par ligne car . . .
r k 1 T r = n . . .
et colonne car l 1 T p = n’ définir le nombre de degrés de liberté n (nombre de termes indépendants) 1 degrés de liberté . par colonne pour l lignes, nous avons l 1 degrés de liberté donc : n = (k - 1) . (l - 1) d) calculer l’écart entre l’effectif observé et l’effectif théorique puis le c 2
III - FORMULES d
u c 2
III - FORMULES du x2
lorsque N ≥ 30 et n ≥ 5, la formule : O i c 2 = Ti 2 i T i de K. PEARSON reste légitime on utilise la formule de c 2 avec correction de continuité due à YATES : O i 0,5 2 c 2 = Ti i T i EXCLUSIVEMENT , lorsque tableau de contingence 2 x 2 ( n = 1)
de YATES
IV - EXEMPLE (1)
Le tableau suivant répertorie le nombre d’accidents en une année par classe d’âge des conducteurs dans un échantillon de 500 conducteurs de 18 à 50 ans. Age du conducteur Totaux 18 - 25 26 - 40 41 - 50 0 75 120 105 300 Nombre d’accidents 1 50 60 40 150 2 25 20 5 50 Totaux 150 200 150 500 Vérifier, au niveau de signification de 0,01, l’hypothèse selon laquelle le nombre d’accidents est indépendant de l’âge du conducteur.
IV - EXEMPLE (2) H o : Pas de relation entre l’âge des conducteurs et le nombre d’accidents Calcul des fréquences théoriques Age du conducteur Totaux Nombre d’accidents Totaux 0 1 2 18 - 25 26 - 40 41 - 50 75 50 25 150 90 120 120 105 45 60 15 20 60 40 20 5 200 150 90 45 15 300 150 50 500 Utilisation de la formule du c 2 sans correction de YATES
IV - EXEMPLE (3) c 2 75 = + 50 90 90 2 45 2 + 120 120 2 + 60 120 60 2 + 105 40 + 90 45 90 45 2 2 = + + 25 2 90 5 45 2 15 2 15 + 0 + + + 15 2 2 + 0 + 20 20 2 + 45 2 20 2 15 + 5 + 0 = 2,50 + 2,50 + 0,56 + 0,56 + 6,67 + 6,67 15 15 2 =
IV - EXEMPLE (4) n = (3 - 1) . (3 - 1) = 2 . 2 = 4 a = 1 % => c o 2 = 13,28 c 2 > c o 2 => l’hypothèse nulle est rejetée à 1 % de risque Conclusion : Il y a une relation entre le nombre d’accidents et l’âge du conducteur
L1 SANTE