Statistiques Séance 10 N. Yamaguchi Résumé de la séance précédente Les ANOVA – À 1 facteur à n niveaux – À 1 facteur à mesures répétées –
Download ReportTranscript Statistiques Séance 10 N. Yamaguchi Résumé de la séance précédente Les ANOVA – À 1 facteur à n niveaux – À 1 facteur à mesures répétées –
Statistiques
Séance 10 N. Yamaguchi
Résumé de la séance précédente
Les ANOVA – À 1 facteur à n niveaux – À 1 facteur à mesures répétées – À 2 facteurs (+ notion d’interaction) Les corrélations – Test paramétrique: Pearson – Test non paramétrique: Spearman
Rappel : corrélation de Spearman
Prend en compte les rangs Exercice sur Spearman
6 7 4 5 2 3 Sujet 1
Exercice
Note de maths 15 5 15 5 12 8 10 Note de français 18 10 10 11 16 12 14
Le Khi (Chi) 2
Ou χ2
Pourquoi faire?
Comparer des distributions ou des formes de distributions Etude des fréquences ou des effectifs impliquant des variables nominales. Pas de variables continues!
Exemple du début : la BU.
Comparaison d’une distr observée et d’une distr théorique Une seule variable nominale On analyse une seule distribution.
Question : est-elle homogène (= semblable à la distribution théorique) H0: oui. Répartition homogène des effectifs.
Exemple (1) cf I. Lehiste
Perception du contexte d’une phrase par 30 auditeurs.
Tableau pour la phrase lue isolément Comparaison avec la distrib théorique: répartition homogène des effectifs.
Note: variable nominale à 4 modalités (les rentrer comme une variable continue ds Statview) H0?
Procédure
Données: comme une variable continue – Pas d’étiquettes!
– Pas besoin de rentrer la distribution théorique Analyse: – Analyse univariée > Khi 2 (désselectionner test-t) > rentrer la distrib théorique!!!
– Menu Analyse > test-t > Editer analyse > Khi 2
Résultats
Valeur du Khi 2 à comparer avec p.
Hypothèse nulle non rejetée Conclusion?
Mais…
Exemple (2ème partie)
Même phrase lue à l’initiale. Distribution aléatoire?
Données: on rajoute une colonne Procédure : même chose. On peut assigner une autre variable!
Résultats Conclusion
Un autre cas du Chi 2
Comparaison de 2 distributions indépendantes Voir si les 2 distributions sont homogènes. (répartition de fréquences) Hypothèse nulle: il n’y a pas de relation entre les fréquences des lignes et les fréquences des colonnes
Exemple
Étude sur l’efficacité d’une méthode d’enseignement des langues: labo vs méthode traditionnelle Tableau de contingence
Calcul du Chi 2
Tableau de contingence: la colonne ds laquelle un sujet se trouve (= réussite vs échec) est contingente (= dépend de) la ligne ds laquelle le sujet se trouve (= exp vs méthode trad) H0: il n’y a pas de relation entre ligne et colonne
Calcul du Chi 2 (suite)
Calcul de la fréquence attendue si H0 est vraie, pour chaque cellule du tableau:
Calcul du Chi 2 (suite)
Résultat global par rapport à toutes les cellules.
Procédure: – Données – Tableau de contigence > tableau résumé et Chi 2 des cellules
Résultats
Tableau résumé – DDL : (C-1)(R-1) – Valeur Chi 2 et p – Résultats? H0?
Chi 2 des cellules – Décomposition du Chi 2 global selon les cellules (contribution des cellules)
Exercice
Étude de Butler sur la poésie de Sylvia Plath: distribution des longueurs de mots dans 2 de ses recueils Lgr mots « The Colossus » « Winter trees » 1 – 3 4 – 6 7 – 9 10 12 3473 3743 1272 285 3000 2674 753 165 >12 54 18
Exercice
Quelle est H0?
Quels sont les résultats?
Rappel! Quel test utiliser?
Il faut connaître: – Le type de distribution: test paramétrique ou non paramétrique?
– Le nombre de variables et le nombre de leurs modalités – Le type de données: fréquences, mesures?
– Ce qu’on veut étudier!
1. Tester les différences entre groupes Groupes indépendants : ce ne sont pas les mêmes sujets!
Paramétrique – 1 variable nominale à 2 modalités; mesures : test-t indépendant – (test-t univarié: moyenne théorique) – 1 variable nominale à 3 ou + modalités, mesures: ANOVA à 1 facteur à n niveaux
1. Tester les différences entre groupes Paramétriques (suite): – 2 variables nominales: ANOVA à 2 facteurs Non paramétriques: – 1 variable nominale à 2 modalités; mesures: test U de Mann-Whitney – 1 variable nominale à 3 ou + modalités, mesures: test des rangs de Kruskal Wallis
2. Tester les différences entre variables Mêmes sujets, mais conditions différentes Paramétriques: – 1 variable continue (mesures), 1 variable indépendante (à 2 modalités = 2 conditions): test-t apparié – 1 variable continue (mesures), 1 variable indépendante (à 3 ou + modalités = 3 ou + conditions): ANOVA à mesures répétées
2. Tester les différences entre variables Non paramétriques: – Mesures, 1 variable indépendante (à 2 modalités = 2 conditions): test des rangs de Wilcoxon – Fréquences / effectifs, 1 variable indépendante aux modalités dichotomiques: Chi 2
2. Tester les différences entre variables Non paramétriques (suite) – 1 variable continue (mesures), 1 variable indépendante (à 3 ou + modalités = 3 ou + conditions): test de Friedman
3. Tester les relations entre variables Paramétriques: corrélation de Pearson Non paramétriques: corrélation des rangs de Spearman ou Chi 2 (fréquences / effectifs et variable à modalités catégorielles)