Transcript PSPP
Formation PSPP L’objectif général de cette formation est d’utiliser PSPP pour réaliser des analyses descriptives et explicatives. PSPP est un logiciel libre téléchargeable à http://pspp.awardspace.com/. Mais il ne permet pas de réaliser une analyse factorielle dans de bonnes conditions comme SPSS. 1. SAISIR LES NOMS DES VARIABLES Problème : Solution : NB : PSPP_formation.docx J’ai administré une enquête. Je souhaite maintenant saisir les données dans PSPP afin de réaliser des calculs statistiques. Avant de saisir les données, il faut préciser quelles sont les variables afin de créer les colonnes qui recevront les différentes réponses. Ouvrir PSPP Dans la fenêtre qui s’ouvre, cliquer en bas à gauche sur l’onglet Affichage des variables la fenêtre qui s’affiche va permettre de saisir les variables et de préciser leurs caractéristiques À la ligne 1, dans la colonne Nom > saisir : Identite > Tab Cliquer sur l’icône à droite de Numérique > cocher Chaîne > Valider Dans la colonne L (pour Largeur), saisir : 50 (taille maximale du texte) Dans la colonne Étiquette, saisir : Nom et prénom Dans la colonne Colonnes, saisir : 20 Dans la colonne Mesure, choisir Nominale Cliquer à la ligne 2, dans la colonne Nom > saisir : Classe Cliquer à droite de Numérique > cocher Chaîne > Valider Dans la colonne L, saisir : 15 Dans la colonne Étiquettes de valeur, cliquer sur l’icône à droite de Aucun(e) > dans la fenêtre Étiquette de valeurs, sous la rubrique Valeur, saisir 1 > sous la rubrique Valeur de l’étiquette saisir L3 MIIT > cliquer sur le pavé Ajouter Dans la rubrique Valeur, saisir : 2 > dans la rubrique Valeur de l’étiquette saisir : LP HR > cliquer sur le pavé Ajouter > Valider Dans la colonne Mesure, choisir Nominale Cliquer à la ligne 3, dans la colonne Nom > saisir : NivoInfo Dans la colonne Décimales, saisir 0 Dans la colonne Étiquette, saisir : Niveau d’informatique Dans la colonne Mesure, si nécessaire, choisir Echelle Vous devriez obtenir exactement ceci : Dans la colonne Mesure, trois types sont possibles : Nominales, Ordinales et Echelle. Une variable Échelle est une variable métrique (d’intervalles ou de proportion). 1/6 Y. CINOTTI 2. SAISIR DES DONNÉES Problème : Comment saisir les premières données Solution : En bas de la fenêtre, à gauche, cliquer sur l’onglet Affichage des données les trois variables créées précédemment sont devenues les en-tête des colonnes Saisir, comme dans une feuille de tableur, les données ci-dessous : Ctrl+S (ou menu Fichier > Enregistrer) > Chercher dans : Mes documents > Nom du fichier : Premier > Enregistrer un fichier Premier.sav apparaît dans Mes documents Réduire la fenêtre qui s’est ouverte qui précise l’opération de sauvegarde qui vient d’être réaliser 3. IMPORTER DES DONNÉES J’ai administré un questionnaire sur Internet. Je dispose désormais d’un fichier Excel. Comment puis-je importer les données dans PSPP ? Solution : Télécharger dans Mes documents le fichier EvalTic.xlsx à l’adresse http://tinyurl.com/csp4a2m Problème : Avec Excel Avec LibreOffice Ouvrir Excel > à partir d’Excel, ouvrir le Ouvrir LibreOffice > à partir de LibreOffichier EvalTic.xlsx > l’enregistrer au fice, ouvrir le fichier EvalTic.xlsx > l’enformat CSV (DOS) registrer au format Texte CSV Dans PSPP : menu Fichier > Import Data… > cliquer en bas à droite sur la flèche à droite de Texte Files > choisir Comma Separated Value Files > naviguer jusqu’au dossier où vous avez enregistré le fichier EvalTic.csv > sélectionner ce fichier > Ouvrir Suivant > cliquer sur la ligne 1 > en bas, cocher La première ligne sélectionnée contient les noms des variables > Suivant > Suivant > Appliquer 4. TRANSFORMER DES DONNÉES Problème : Solution : PSPP_formation.docx Dans la colonne Venues, au lieu de « jamais », « une seule fois » et « deux fois », je voudrais « 0 », « 1 » et « 2 » Menu Transformer > Recoder en une même variable… > dans la liste à gauche, cliquer sur Venues > cliquer sur la flèche vers la droite au milieu pour faire passer Venues sous Variables > cliquer sur le pavé Old and New Values… Sous Ancienne valeur, saisir : jamais > sous Nouvelle valeur, saisir : 0 > pavé Ajouter Sous Ancienne valeur, au lieu de jamais saisir : une seule fois > sous Nouvelle valeur, au lieu de 0 saisir : 1 > Ajouter Sous Ancienne valeur, saisir : deux fois > sous Nouvelle valeur, saisir : 2 > Ajouter Pavé Continuer > Valider > réduire la fenêtre apparue Cliquer, si nécessaire, en bas sur l’onglet Affichage des données > vérifier que, dans la colonne Venues, il n’y a plus désormais que de 0, 1 et 2. Cliquer, si nécessaire, en bas sur l’onglet Affichage des variables > à la ligne 8 (Venues), préciser que désormais la variable est de type numérique et la mesure une échelle 2/6 Y. CINOTTI 5. MODIFIER LES PROPRIÉTÉS DES VARIABLES Problème : Solution : En bas de la fenêtre, à gauche, cliquer sur l’onglet Affichage des variables. Je m’aperçois que les propriétés des variables ne sont pas correctes. Si nécessaire, en bas de la fenêtre, à gauche, cliquer sur l’onglet Affichage des variables Dans la colonne Type, à la ligne 8 (variable Venues), remplacer Chaîne par Numérique Dans la colonne Mesure, à la ligne 8 (variable Venues), remplacer Nominale par Échelle Dans la colonne Mesure, à la ligne 1 (variable Identite), remplacer Échelle par Nominales Ctrl+S > enregistrer le fichier sous le nom EvalTic.sav dans Mes documents1 il se peut que, curieusement, PSPP se ferme brusquement. Néanmoins, le fichier est bien enregistré. Il suffit de rouvrir PSPP et d’ouvrir le fichier EvalTic.sav. 6. TRIER LES DONNÉES Problème : Comment trier les réponses par classe, comme on peut le faire dans un tableur ? Solution : Cliquer en bas à gauche sur l’onglet Affichage des données Menu Données > Trier les observations... > dans la fenêtre Trier les observations, cliquer sur Classe > cliquer sur la flèche au milieu pour faire passer Classe sous Trier par : > Valider 7. RÉALISER UNE ANALYSE DE FRÉQUENCE SUR UNE VARIABLE NOMINALE Problème : Comment savoir combien d’étudiants de chaque classe ont répondu ? Solution : Menu Statistiques > Statistiques Descriptives > Fréquences… > cliquer sur la variable Classe > en cliquant sur la petite flèche vers la droite, la faire passer sous Variable(s) > sous la rubrique Statistiques, décocher toutes les cases puisque Classe est une variable nominale pour laquelle on ne peut réaliser des statistiques destinées aux variables métriques > Valider dans la fenêtre Sortie – PSPPIR…, sous FREQUENCIES, s’affichent un tableau des fréquences qui indique en particulier l’effectif en valeur absolue et en pourcentage. 8. RÉCUPÉRER DES RÉSULTATS DANS UN TRAITEMENT DE TEXTE Problème : Je récupérer le tableau pour l’intégrer dans un document sous traitement de texte. Solution : Dans la fenêtre Sortie – PSPPIR…, menu Fichier > Export… > Nom : EvalTic.html > Enregistrer dans le dossier : Mes documents > Enregistrer PSPP ne permet pas de travailler avec des fichiers au format de Microsoft Office. Il est NB cependant possible d’ouvrir avec Word ou LibreOffice Writer le fichier EvalTic.html. Le fichier EvalTic.html ne comporte pas que le tableau des fréquences, mais tout le contenu de la fenêtre Sortie – PSPPIRE visualisation en sortie. 1 EvalTic.sav doit absolument être enregistré dans le même dossier que le fichier EvalTic.csv. PSPP_formation.docx 3/6 Y. CINOTTI 9. RÉALISER DES ANALYSES DESCRIPTIVES SUR DES VARIABLES MÉTRIQUES Je veux connaître la moyenne, le maximum, le minimum, l’étendue et l’écart-type des variables NivoInfo et Progression. Solution : Revenir vers PSPP (fichier EvalTic.sav) Menu Statistiques > Statistiques Descriptives > Descriptives… > faire passer NivoInfo et Progression sous Variables : > sous la rubrique Statistiques, cocher Moyenne, Ecarttype, Minimum, Maximum et Intervalle > Valider Problème : dans la fenêtre Sortie – PSPPI…, sous DESCRIPTIVES, un tableau présente les statistiques demandées. 10. RÉALISER UN TABLEAU CROISÉ Problème : Comment croiser les données des variables NivoInfo et Progression (comme dans un tableau croisé dynamique avec Excel) ? Solution : Revenir vers fichier EvalTic.sav Menu Statistiques > Statistiques Descriptives > Tableaux croisés… > placer NivoInfo sous Ligne(s) > placer Progression sous Colonne(s) Pavé Cellules... > sous la rubrique Afficher l’observation, cocher uniquement Ligne > Continuer > Valider le tableau s’affiche dans la fenêtre Sortie – PSPPI… sous CROSSTABS Fermer le fichier EvalTic.sav > fermer la fenêtre Sortie – PSPPI… > 11. RÉALISER UNE ANALYSE FACTORIELLE DES CORRESPONDANCES Je dispose des résultats d’une enquête auprès de femmes et d’hommes. Il a été demandé aux individus s’ils étaient intéressés par le magasinage (le shopping en franglais). Cette enquête confirme-t-elle l’hypothèse intuitive que les femmes sont plus intéressées par le shopping que les hommes ? Solution : Télécharger dans Mes documents le fichier magasin.sav à l’URL http://tinyurl.com/bswggr5 Ouvrir le fichier téléchargé dans SPPS Menu Statistiques > Statistiques Descriptives > Tableaux croisés… > cliquer-glisser la variable intérêt pour le magasinage sous Ligne(s) > cliquer-glisser sexe de la personne sous Colonne(s) Problème : PSPP_formation.docx 4/6 Y. CINOTTI NB : Pavé Cellules... > sous la rubrique Afficher l’observation, cocher uniquement Colonne > Continuer Pavé Statistiques... > cocher Khi-Deux et Phi > Continuer > Valider Dans la fenêtre Tableaux croisés, la variable sexe est placée en colonne parce qu’il s’agit de la variable indépendante, celle qui a une influence sur la variable dépendante, intmag. 12. INTERPRÉTER LES RÉSULTATS D’UN ANALYSE FACTORIELLE DES CORRESPONDANCES Problème : Mais que signifie les résultats dans les tableaux obtenus ? Solution : Rappel : À la vue du premier tableau, les femmes semblent plus intéressées par le magasinage que les hommes. Les deux éléments intéressants dans ces tableaux sont entourés en rouge : – On appelle aussi « valeur p » le niveau de signification asymptotique. Si la valeur p est inférieure à 0,05 l’hypothèse est confirmée. C’est bien le cas ici puisque p = 0,00 (en réalité il y a des décimales, mais masquées). Le V de Cramer nous renseigne sur la force de la relation entre les deux variables. La valeur de V est généralement comprise entre 0 (pas de relation) et 1 (relation complète). Étant donné que le V de Cramer est de seulement 0,27, la relation est faible. On peut donc conclure que la relation entre le sexe et l’intérêt pour le magasinage est statistiquement significative (p = 0,00) mais faible (V = 0,27). L’analyse factorielle des correspondances ne doit être utilisée que pour des variables non métriques. 13. RÉALISER UNE ANALYSE DE CORRÉLATION Dans le questionnaire, il était aussi demandé aux répondants d’évaluer le plaisir qu’ils ressentaient à magasiner (faire du shopping). On peut émettre l’hypothèse intuitive que plus l’intérêt pour le magasinage est grand et plus le plaisir de magasiner l’est. Comment le vérifier ? Solution : Statistiques > Corrélation bivariée > étirer la fenêtre vers le haut et le bas pour voir plus de variables > faire passer à droite les variables intérêt pour le magasinage et plaisir ressenti à magasiner > Valider Problème : PSPP_formation.docx 5/6 Y. CINOTTI Rappel : On voit dans le tableau ci-dessus que la corrélation est de 0,53 et que la valeur p (signification bi-variée) est de ,00. On peut conclure qu’il y a une corrélation entre ces deux variables et confirmer l’hypothèse. L’analyse de corrélation ne doit être utilisée que pour des variables métriques. 14. RÉALISER UNE ANALYSE DE LA VARIANCE (ANOVA) Je veux vérifier l’hypothèse intuitive que le niveau de scolarité 2 n’a pas d’influence sur le plaisir de magasiner. Solution : Statistiques > Comparaison des Moyennes > ANOVA à 1 facteur… > faire passer la variable plaisir ressenti à magasiner sous Variable(s) dépendante(s) et la variable scolarité (recodifiée) sous Facteurs > sous la rubrique Statistiques, cocher Descriptives > Valider Problème : Dans le tableau Descriptives, on voit que les moyennes sont assez différentes suivant le niveau de scolarité. L’hypothèse semble devoir être rejetée. Afin de le prouver statistiquement, il faut d’abord calculer la grande moyenne de la manière suivante : (73 × 3,14 + 94 × 2,79 + 57 × 2,42) / 224 = 2,81 NB : Dans le tableau ANOVA, on voit que le test en F est égal à 7,51 donc supérieur à la grande moyenne (2,81). On peut en conclure que les différences de moyennes sont statistiquement significatives. Le test est significatif puisque la valeur p (Sig.) est de 0,00. L’ANOVA est adaptée pour étudier l’influence d’une variable nominale ou ordinale sur une variable métrique. Curieusement dans l’affichage des variables de magasin.sav, la variable scolarité (recodifiée) est caractérisée comme une variable métrique (Echelle) alors qu’il s’agit bien évidemment d’une variable ordinale. La codification est la suivante : 1 = primaire/secondaire, 2 = collégiale (jusqu’à bac +3) et 3 = universitaire (au-delà de bac+3). 2 PSPP_formation.docx 6/6 Y. CINOTTI