Statistiques Séance 10 N. Yamaguchi Résumé de la séance précédente  Les ANOVA – À 1 facteur à n niveaux – À 1 facteur à mesures répétées –

Download Report

Transcript Statistiques Séance 10 N. Yamaguchi Résumé de la séance précédente  Les ANOVA – À 1 facteur à n niveaux – À 1 facteur à mesures répétées –

Statistiques

Séance 10 N. Yamaguchi

 

Résumé de la séance précédente

Les ANOVA – À 1 facteur à n niveaux – À 1 facteur à mesures répétées – À 2 facteurs (+ notion d’interaction) Les corrélations – Test paramétrique: Pearson – Test non paramétrique: Spearman

Rappel : corrélation de Spearman

 Prend en compte les rangs  Exercice sur Spearman

6 7 4 5 2 3 Sujet 1

Exercice

Note de maths 15 5 15 5 12 8 10 Note de français 18 10 10 11 16 12 14

Le Khi (Chi) 2

Ou χ2

Pourquoi faire?

 Comparer des distributions ou des formes de distributions  Etude des fréquences ou des effectifs impliquant des variables nominales. Pas de variables continues!

 Exemple du début : la BU.

Comparaison d’une distr observée et d’une distr théorique  Une seule variable nominale  On analyse une seule distribution.

 Question : est-elle homogène (= semblable à la distribution théorique)  H0: oui. Répartition homogène des effectifs.

Exemple (1) cf I. Lehiste

     Perception du contexte d’une phrase par 30 auditeurs.

Tableau pour la phrase lue isolément Comparaison avec la distrib théorique: répartition homogène des effectifs.

Note: variable nominale à 4 modalités (les rentrer comme une variable continue ds Statview) H0?

Procédure

  Données: comme une variable continue – Pas d’étiquettes!

– Pas besoin de rentrer la distribution théorique Analyse: – Analyse univariée > Khi 2 (désselectionner test-t) > rentrer la distrib théorique!!!

– Menu Analyse > test-t > Editer analyse > Khi 2

Résultats

 Valeur du Khi 2 à comparer avec p.

 Hypothèse nulle non rejetée  Conclusion?

 Mais…

Exemple (2ème partie)

 Même phrase lue à l’initiale. Distribution aléatoire?

 Données: on rajoute une colonne  Procédure : même chose. On peut assigner une autre variable!

 Résultats  Conclusion

Un autre cas du Chi 2

 Comparaison de 2 distributions indépendantes  Voir si les 2 distributions sont homogènes. (répartition de fréquences)  Hypothèse nulle: il n’y a pas de relation entre les fréquences des lignes et les fréquences des colonnes

Exemple

 Étude sur l’efficacité d’une méthode d’enseignement des langues: labo vs méthode traditionnelle Tableau de contingence

Calcul du Chi 2

 Tableau de contingence: la colonne ds laquelle un sujet se trouve (= réussite vs échec) est contingente (= dépend de) la ligne ds laquelle le sujet se trouve (= exp vs méthode trad)  H0: il n’y a pas de relation entre ligne et colonne

Calcul du Chi 2 (suite)

 Calcul de la fréquence attendue si H0 est vraie, pour chaque cellule du tableau:

Calcul du Chi 2 (suite)

 Résultat global par rapport à toutes les cellules.

 Procédure: – Données – Tableau de contigence > tableau résumé et Chi 2 des cellules

Résultats

 Tableau résumé – DDL : (C-1)(R-1) – Valeur Chi 2 et p – Résultats? H0?

 Chi 2 des cellules – Décomposition du Chi 2 global selon les cellules (contribution des cellules)

Exercice

 Étude de Butler sur la poésie de Sylvia Plath: distribution des longueurs de mots dans 2 de ses recueils Lgr mots « The Colossus » « Winter trees » 1 – 3 4 – 6 7 – 9 10 12 3473 3743 1272 285 3000 2674 753 165 >12 54 18

Exercice

 Quelle est H0?

 Quels sont les résultats?

Rappel! Quel test utiliser?

 Il faut connaître: – Le type de distribution: test paramétrique ou non paramétrique?

– Le nombre de variables et le nombre de leurs modalités – Le type de données: fréquences, mesures?

– Ce qu’on veut étudier!

1. Tester les différences entre groupes Groupes indépendants : ce ne sont pas les mêmes sujets!

 Paramétrique – 1 variable nominale à 2 modalités; mesures : test-t indépendant – (test-t univarié: moyenne théorique) – 1 variable nominale à 3 ou + modalités, mesures: ANOVA à 1 facteur à n niveaux

1. Tester les différences entre groupes  Paramétriques (suite): – 2 variables nominales: ANOVA à 2 facteurs  Non paramétriques: – 1 variable nominale à 2 modalités; mesures: test U de Mann-Whitney – 1 variable nominale à 3 ou + modalités, mesures: test des rangs de Kruskal Wallis

2. Tester les différences entre variables Mêmes sujets, mais conditions différentes  Paramétriques: – 1 variable continue (mesures), 1 variable indépendante (à 2 modalités = 2 conditions): test-t apparié – 1 variable continue (mesures), 1 variable indépendante (à 3 ou + modalités = 3 ou + conditions): ANOVA à mesures répétées

2. Tester les différences entre variables  Non paramétriques: – Mesures, 1 variable indépendante (à 2 modalités = 2 conditions): test des rangs de Wilcoxon – Fréquences / effectifs, 1 variable indépendante aux modalités dichotomiques: Chi 2

2. Tester les différences entre variables  Non paramétriques (suite) – 1 variable continue (mesures), 1 variable indépendante (à 3 ou + modalités = 3 ou + conditions): test de Friedman

3. Tester les relations entre variables  Paramétriques: corrélation de Pearson  Non paramétriques: corrélation des rangs de Spearman ou Chi 2 (fréquences / effectifs et variable à modalités catégorielles)