Transcript Diaporama
POL1803: Analyse des techniques quantitatives Cours 10 L’analyse multivariée L’analyse causale La relation causale « Une association statistique ne peut être interprétée, sans de grandes précautions, comme une relation causale» (Raymond Boudon). La relation causale Deux variables peuvent être associées statistiquement, peuvent bouger ensemble, sans que l’une soit la cause de l’autre. Ex: Cigognes et bébés, Altitude et bénévolat La relation causale Trois conditions nécessaires pour qu’il y ait une relation causale entre X et Y: 1) La variable indépendante X survient avant la variable dépendante Y. La relation causale Trois conditions nécessaires pour qu’il y ait une relation causale entre X et Y: 2) Il y a une association statistique entre X et Y. La relation causale Trois conditions nécessaires pour qu’il y ait une relation causale entre X et Y: 3) L’association entre X et Y n’est pas due à une troisième variable. La relation causale Donc, la troisième condition implique qu’il faut: – douter de notre explication / hypothèse initiale, – trouver des explications alternatives de l’association statistique observée – et tenter de prouver que notre raisonnement initial était erroné. Le modèle causal « L’explication d’une association statistique consiste à introduire des variables supplémentaires de manière à dégager le modèle causal dans lequel elle s’insère» (Raymond Boudon). Le modèle causal Schéma initial: X Y Schéma causal complet: Z X Y L’introduction d’une variable contrôle: deux cas de figure Ajout d’une variable contrôle antécédente L’introduction d’une variable contrôle: deux cas de figure 1) Ajout d’une variable contrôle antécédente B C A B ? C A B C Variable contrôle antécédente Variable indépendante Variable dépendante L’introduction d’une variable contrôle: deux cas de figure 1) Ajout d’une variable contrôle antécédente Scolarité (B) Inform. pol. (C) Q. I. (A) Scolarité (B) ? Inform. pol. (C) A B C Variable contrôle antécédente Variable indépendante Variable dépendante Variable contrôle antécédente: trois scénarios Scénario A: B C A B C Nom du scénario: relation fallacieuse entre les variables indépendante et dépendante. Variable contrôle antécédente: trois scénarios Scénario A: Cigognes (B) Urbanisation (A) Naissances (C) Cigognes (B) Naissances (C) Exemple: l’urban. affecte les cigognes et les naiss., mais les cig. n’affectent pas les naiss. Variable contrôle antécédente: trois scénarios Scénario A: Altitude (B) Bénévolat (C) Revenu (A) Altitude (B) Bénévolat (C) Exemple: le revenu affecte l’altitude et le bénév., mais l’altitude n’affecte pas le bénév. Variable contrôle antécédente: trois scénarios Scénario B: B C A B C Nom du scénario: relation causale directe confirmée Variable contrôle antécédente: trois scénarios Scénario B: B C A B C Nom du scénario: relation causale directe confirmée Variable contrôle antécédente: trois scénarios Scénario B: B C A B C Nom du scénario: relation causale directe confirmée Variable contrôle antécédente: trois scénarios Scénario B: B C A B C Nom du scénario: relation causale directe confirmée Variable contrôle antécédente: trois scénarios Scénario B: Scolarité (B) Inform. pol. (C) Q. I. (A) Scolarité (B) Inform. pol. (C) Exemple: même après l’ajout du contrôle, la scolarité affecte malgré tout l’information. Variable contrôle antécédente: trois scénarios Lorsque l’on confirme une relation causale directe entre B et C: – on peut parler de reproduction de la relation initiale lorsque la force de celle-ci est demeurée la même dans le modèle causal. – on peut parler d’affaiblissement de la relation initiale lorsque la force de celle-ci est plus faible dans le modèle causal. Variable contrôle antécédente: trois scénarios Scénario C: B C A B C Nom du scénario: relation spécifiée ou effet d’interaction (lien causal B-C varie selon A). Variable contrôle antécédente: trois scénarios Scénario C: Intérêt (B) Participation (C) Âge (A) Intérêt (B) Participation (C) Exemple: l’intérêt affecte la participation, mais ce lien varie selon le niveau d’âge. Variable contrôle antécédente: trois scénarios Lorsque l’on découvre un effet d’interaction à la suite de l’introduction d’une variable contrôle antécédente alors qu’il y avait une association nulle initialement entre B et C: – on peut parler de variable dissimulatrice pour décrire la variable contrôle antécédente. L’introduction d’une variable contrôle: deux cas de figure Ajout d’une variable contrôle intermédiaire L’introduction d’une variable contrôle: deux cas de figure 2) Ajout d’une variable contrôle intermédiaire A C A B ? C A B C Variable indépendante Variable contrôle intermédiaire Variable dépendante L’introduction d’une variable contrôle: deux cas de figure 2) Ajout d’une variable contrôle intermédiaire Scolarité (A) Inform. pol. (C) Scolarité (A) Intérêt pol. (B) ? Inform. pol. (C) A B C Variable indépendante Variable contrôle intermédiaire Variable dépendante Une mise en pratique Un protocole pour l’analyse tabulaire multivariée Ajout d’une variable contrôle antécédente B C A B C A B C Variable contrôle antécédente Variable indépendante Variable dépendante 5 tableaux croisés, 5 gammas, 5 chi-carrés B C A B C Relation initiale: Relations de contrôle: Relation initiale contrôlée: B-C A-B, A-C A- B-C, A+ B-C 5 tableaux croisés, 5 gammas, 5 chi-carrés On résume les résultats en les inscrivant sur les deux schémas. Lorsqu’une association est nulle, on ne place pas de flèche entre les deux variables concernées. Le reste du temps, il y a une flèche. On place les gammas sur les flèches. On place une étoile à côté des gammas statistiq. significatifs (chi-carré > 3,84). Un exemple Schéma initial: Scolarité (B) Inform. pol. (C) Schéma causal complet: Q. I. (A) Scolarité (B) Inform. pol. (C) Un exemple Relation initiale (B-C): Scolarité Inform. politique Gamma: 0,69 Faible Élevée Élevée 30 70 Faible 70 30 Chi-carré: 4,8 Un exemple Schéma initial: Scolarité (B) 0,69* Inform. pol. (C) Schéma causal complet: Q. I. (A) Scolarité (B) Inform. pol. (C) Un exemple Relation de contrôle (A-B): Q.I. Faible Élevée Élevée 30 70 Faible 70 30 Scolarité Gamma: 0,69 Chi-carré: 4,8 Un exemple Schéma initial: Scolarité (B) 0,69* Inform. pol. (C) Schéma causal complet: Q. I. (A) 0,69* Scolarité (B) Inform. pol. (C) Un exemple Relation de contrôle (A-C): Q.I. Faible Élevée Élevée 30 70 Faible 70 30 Inform. politique Gamma: 0,69 Chi-carré: 4,8 Un exemple Schéma initial: Scolarité (B) 0,69* Inform. pol. (C) Schéma causal complet: Q. I. (A) 0,69* Scolarité (B) 0,69* Inform. pol. (C) Un exemple Relation initiale contrôlée (A-, B-C): Scolarité - Quotient intel. faible Inform. politique Gamma: Faible Élevée Élevée 15 15 Faible 55 15 0,57 Chi-carré: 4,1 Un exemple Schéma initial: Scolarité (B) 0,69* Inform. pol. (C) Schéma causal complet: Q. I. (A) 0,69* Scolarité (B) 0,57* 0,69* Inform. pol. (C) Un exemple Relation initiale contrôlée (A+, B-C): Scolarité - Quotient intel. élevé Inform. politique Gamma: Faible Élevée Élevée 15 55 Faible 15 15 0,57 Chi-carré: 4,1 Un exemple Schéma initial: Scolarité (B) 0,69* Inform. pol. (C) Schéma causal complet: Q. I. (A) 0,69* Scolarité (B) 0,57* 0,57* 0,69* Inform. pol. (C) 5 tableaux croisés, 5 gammas, 5 chi-carrés Exemple de la représentation des résultats: une relation fallacieuse. B 0,6* A 0,8* C B 0,7* C 5 tableaux croisés, 5 gammas, 5 chi-carrés Exemple de la représentation des résultats: une relation quasi-fallacieuse. B 0,6* A 0,8* C B 0,2 0,3 0,7* C 5 tableaux croisés, 5 gammas, 5 chi-carrés Exemple de la représentation des résultats: un lien causal direct confirmé. B 0,6* A 0,8* C B 0,4* 0,4* 0,7* C 5 tableaux croisés, 5 gammas, 5 chi-carrés Exemple de la représentation des résultats: un effet d’interaction. B 0,6* A 0,8* C B 0,3 0,8* 0,7* C 5 tableaux croisés, 5 gammas, 5 chi-carrés Exemple de la représentation des résultats: un effet d’interaction. B 0,6* A 0,8* C B 0,4* 0,8* 0,7* C Interprétation: étape par étape B C A B C 1) D’abord, la relation initiale (B-C): Quel type d’association statistique existe entre les variables indépendante et dépendante (direction, force)? Est-elle statistiquement significative? Interprétation: étape par étape B C A B C 2) Puis, les relations de contrôle (A-B, A-C): Quel type d’associations statistiques existent entre la variable contrôle et les variables indépendante et dépendante (direction, force)? Sont-elle significatives? Interprétation: étape par étape B C A B C 3) Ensuite, la relation initiale contrôlée (AB-C, A+ B-C): Quel type d’associations statistiques existent entre les variables indép. et dép. (direction, force) auprès de chaque niveau de la variable contrôle? Interprétation: étape par étape B C A B C Ces associations sont-elle statistiquement significatives? Sont-elles aussi fortes ou plus faibles que la relation initiale? Sontelles de force comparable l’une vis-à-vis l’autre (y a-t-il un effet d’interaction)? Interprétation: étape par étape B C A B C 4) Finalement, le modèle causal complet: Quel type de scénario est révélé par les données? Relation fallacieuse (quasi)? Relation causale directe confirmée? Relation causale spécifiée, effet d’interact.? Un exemple Schéma initial: Scolarité (B) 0,69* Inform. pol. (C) Schéma causal complet: Q. I. (A) 0,69* Scolarité (B) 0,57* 0,57* 0,69* Inform. pol. (C) Un exemple Interprétation (version rapide et aride): Dans le schéma initial, il y a une association positive, forte et significative entre la scolarité et le niveau d’inform. La variable contrôle, le quotient intellectuel, est reliée de façon positive, forte et significative à la scolarité et au niveau d’information. Un exemple Le lien entre les variables ind. et dép. est affecté par l’ajout de la var. contrôle. Lorsque que l’on tient compte du Q.I., l’association entre la scolarité et l’information est un peu affaiblie, mais elle demeure forte et significative. Il n’y a pas d’effet d’interaction, l’effet de la scolarité sur l’information est le même, peu importe le niveau de Q.I. Un exemple Le profil du modèle causal final correspond au scénario de la relation causale confirmée. On peut donc conclure qu’il y a effectivement une relation causale directe entre la scolarité et le niveau d’information. Parce qu’un individu est plus scolarisé, il risque de posséder un niveau d’information plus élevé.