ASSOCIATION entre caractères qualitatifs

Download Report

Transcript ASSOCIATION entre caractères qualitatifs

ASSOCIATION entre caractères qualitatifs

Professeur

Pascale FRIANT-MICHEL >

Faculté de Pharmacie [email protected]

ASSOCIATION entre CARACTERES QUALITATIFS I - INTRODUCTION (1)

• Etude de deux caractères

qualitatifs

population appartenant à une même Y a-t-il association entre ces caractères ou sont-ils indépendants ?

Remarque : lorsqu’on conclut à une indépendance des caractères, en raison même des fluctuations d’échantillonnage , les caractères peuvent se trouver associés dans une certaine proportion de cas • Problème : dans quelle mesure la proportion d’association observée est-elle significative ?

I - INTRODUCTION (2) • Réponse : méthode applicable au cas où les caractères (l’un ou l’autre ou les deux) existent sous plusieurs

modalités

Exemple :

caractère 1 : couleur des yeux . bleu . gris . marron . . . .

. Test du c 2 . c 2 d’indépendance caractère 2 : couleur des cheveux . blond . châtains . brun . . . .

II - TEST de x2 (1) II - TEST de

c 2

(1)

1.

Définition Tester l’ indépendance de deux caractères  Comparer deux distributions : . les fréquences expérimentales observées . les fréquences théoriques 2. Principe du test a) disposer les fréquences expérimentales dans un tableau à double entrée, dit

tableau de contingence

 différentes colonnes : diverses modalités de l’un des caractères

II – TEST de c 2 (2) II - TEST de x2 (2)  différentes lignes : diverses modalités de l’autre caractère  totaux des lignes et des colonnes : nombre d’individus présentant tel aspect de l’un des caractères, indépendamment de l’état de l’autre Soient k l le nombre de modalités du 1 er . . . . . .

caractère et 2 ème . . .

Un tableau de contingence permet de présenter de façon simple et claire les résultats concernant la répartition de deux caractères Cas particulier : tableau de contingence 2 x 2

II -TEST de c 2 (3) II - TEST de x2 (3) Car. 1 Car. 2 1 2 .

.

.

.

.

l Totaux 1 O 11 O 12 .

.

.

.

.

O 1l n’ 1 2 O 21 O 22 .

.

.

.

.

O 2l n’ 2 . . .

. . .

. . .

.

.

.

.

.

. . .

. . .

k O k1 O k2 .

.

.

.

.

O kl n’ k Totaux n 1 n 2 .

.

.

.

.

n l N

II - TEST de c 2 (4) II - TEST de x2 (4) b) . calculer les fréquences théoriques correspondant à l’indépendance rigoureuse des deux caractères

Exemple :

probabilité d’avoir un individu possédant le caractère 1 selon la 2 ème le caractère 2 selon la 1 ère modalité (1 2 ) et modalité (2 1 ) P th = p 12 . p 21 Or => p 12 n  = N et P th n  = .

N 2 n 1 p Or l’effectif théorique : T 21 donc T 21 = n  2 .

n 1 N = N . P th 21 = n 1 

II - TEST de c 2 (5) II - TEST de x2 (5) . calculer : c) . k . l - 1 1 effectifs théoriques par ligne car . . .

r  k  1 T r = n . . .

et colonne car  l  1 T p = n’  définir le nombre de degrés de liberté n (nombre de termes indépendants) 1 degrés de liberté . par colonne pour l lignes, nous avons l 1 degrés de liberté donc : n = (k - 1) . (l - 1) d) calculer l’écart entre l’effectif observé et l’effectif théorique puis le c 2

III - FORMULES d

u c 2

III - FORMULES du x2

 lorsque N ≥ 30 et n ≥ 5, la formule :  O i  c 2 =  Ti  2 i T i de K. PEARSON reste légitime  on utilise la formule de c 2 avec correction de continuité due à YATES :  O i  0,5  2 c 2 =  Ti  i T i EXCLUSIVEMENT , lorsque tableau de contingence 2 x 2 ( n = 1)

de YATES

IV - EXEMPLE (1)

Le tableau suivant répertorie le nombre d’accidents en une année par classe d’âge des conducteurs dans un échantillon de 500 conducteurs de 18 à 50 ans. Age du conducteur Totaux 18 - 25 26 - 40 41 - 50 0 75 120 105 300 Nombre d’accidents 1 50 60 40 150 2 25 20 5 50 Totaux 150 200 150 500 Vérifier, au niveau de signification de 0,01, l’hypothèse selon laquelle le nombre d’accidents est indépendant de l’âge du conducteur.

IV - EXEMPLE (2) H o : Pas de relation entre l’âge des conducteurs et le nombre d’accidents  Calcul des fréquences théoriques Age du conducteur Totaux Nombre d’accidents Totaux 0 1 2 18 - 25 26 - 40 41 - 50 75 50 25 150 90 120 120 105 45 60 15 20 60 40 20 5 200 150 90 45 15 300 150 50 500  Utilisation de la formule du c 2 sans correction de YATES

IV - EXEMPLE (3)      c 2  75  = +  50 90  90  2 45  2 +  120  120  2 +  60 120  60  2 +  105  40  +  90 45 90 45  2  2 = + +  25    2  90 5 45 2 15  2 15    + 0 + + + 15   2   2 + 0 +   20  20    2 + 45   2 20  2 15 +  5 + 0 = 2,50 + 2,50 + 0,56 + 0,56 + 6,67 + 6,67  15 15  2 =  

IV - EXEMPLE (4) n = (3 - 1) . (3 - 1) = 2 . 2 = 4 a = 1 % => c o 2 = 13,28 c 2 > c o 2 => l’hypothèse nulle est rejetée à 1 % de risque Conclusion : Il y a une relation entre le nombre d’accidents et l’âge du conducteur

L1 SANTE