Transcript PSPP

Formation PSPP
L’objectif général de cette formation est d’utiliser PSPP pour réaliser des analyses descriptives et explicatives. PSPP est un logiciel libre téléchargeable à http://pspp.awardspace.com/. Mais il ne permet pas
de réaliser une analyse factorielle dans de bonnes conditions comme SPSS.
1. SAISIR LES NOMS DES VARIABLES
Problème :
Solution :




















NB :
PSPP_formation.docx
J’ai administré une enquête. Je souhaite maintenant saisir les données dans PSPP afin de
réaliser des calculs statistiques.
Avant de saisir les données, il faut préciser quelles sont les variables afin de créer les colonnes qui recevront les différentes réponses.
Ouvrir PSPP
Dans la fenêtre qui s’ouvre, cliquer en bas à gauche sur l’onglet Affichage des variables
 la fenêtre qui s’affiche va permettre de saisir les variables et de préciser leurs caractéristiques
À la ligne 1, dans la colonne Nom > saisir : Identite > Tab
Cliquer sur l’icône à droite de Numérique > cocher  Chaîne > Valider
Dans la colonne L (pour Largeur), saisir : 50 (taille maximale du texte)
Dans la colonne Étiquette, saisir : Nom et prénom
Dans la colonne Colonnes, saisir : 20
Dans la colonne Mesure, choisir Nominale
Cliquer à la ligne 2, dans la colonne Nom > saisir : Classe
Cliquer à droite de Numérique > cocher  Chaîne > Valider
Dans la colonne L, saisir : 15
Dans la colonne Étiquettes de valeur, cliquer sur l’icône à droite de Aucun(e) > dans la
fenêtre Étiquette de valeurs, sous la rubrique Valeur, saisir 1 > sous la rubrique Valeur de
l’étiquette saisir L3 MIIT > cliquer sur le pavé Ajouter
Dans la rubrique Valeur, saisir : 2 > dans la rubrique Valeur de l’étiquette saisir : LP HR
> cliquer sur le pavé Ajouter > Valider
Dans la colonne Mesure, choisir Nominale
Cliquer à la ligne 3, dans la colonne Nom > saisir : NivoInfo
Dans la colonne Décimales, saisir 0
Dans la colonne Étiquette, saisir : Niveau d’informatique
Dans la colonne Mesure, si nécessaire, choisir Echelle
Vous devriez obtenir exactement ceci :
 Dans la colonne Mesure, trois types sont possibles : Nominales, Ordinales et Echelle.
Une variable Échelle est une variable métrique (d’intervalles ou de proportion).
1/6
 Y. CINOTTI
2. SAISIR DES DONNÉES
Problème :
Comment saisir les premières données
Solution :  En bas de la fenêtre, à gauche, cliquer sur l’onglet Affichage des données  les trois variables créées précédemment sont devenues les en-tête des colonnes
 Saisir, comme dans une feuille de tableur, les données ci-dessous :


Ctrl+S (ou menu Fichier > Enregistrer) > Chercher dans : Mes documents > Nom du
fichier : Premier > Enregistrer  un fichier Premier.sav apparaît dans Mes documents
Réduire la fenêtre qui s’est ouverte qui précise l’opération de sauvegarde qui vient
d’être réaliser
3. IMPORTER DES DONNÉES
J’ai administré un questionnaire sur Internet. Je dispose désormais d’un fichier Excel.
Comment puis-je importer les données dans PSPP ?
Solution :  Télécharger dans Mes documents le fichier EvalTic.xlsx à l’adresse http://tinyurl.com/csp4a2m
Problème :



Avec Excel
Avec LibreOffice
Ouvrir Excel > à partir d’Excel, ouvrir le  Ouvrir LibreOffice > à partir de LibreOffichier EvalTic.xlsx > l’enregistrer au
fice, ouvrir le fichier EvalTic.xlsx > l’enformat CSV (DOS)
registrer au format Texte CSV
Dans PSPP : menu Fichier > Import Data… > cliquer en bas à droite sur la flèche à
droite de Texte Files > choisir Comma Separated Value Files > naviguer jusqu’au dossier où vous avez enregistré le fichier EvalTic.csv > sélectionner ce fichier > Ouvrir
Suivant > cliquer sur la ligne 1 > en bas, cocher  La première ligne sélectionnée contient les noms des variables > Suivant > Suivant > Appliquer
4. TRANSFORMER DES DONNÉES
Problème :
Solution : 






PSPP_formation.docx
Dans la colonne Venues, au lieu de « jamais », « une seule fois » et « deux fois », je voudrais « 0 », « 1 » et « 2 »
Menu Transformer > Recoder en une même variable… > dans la liste à gauche, cliquer
sur Venues > cliquer sur la flèche vers la droite au milieu pour faire passer Venues sous
Variables > cliquer sur le pavé Old and New Values…
Sous Ancienne valeur, saisir : jamais > sous Nouvelle valeur, saisir : 0 > pavé Ajouter
Sous Ancienne valeur, au lieu de jamais saisir : une seule fois > sous Nouvelle valeur,
au lieu de 0 saisir : 1 > Ajouter
Sous Ancienne valeur, saisir : deux fois > sous Nouvelle valeur, saisir : 2 > Ajouter
Pavé Continuer > Valider > réduire la fenêtre apparue
Cliquer, si nécessaire, en bas sur l’onglet Affichage des données > vérifier que, dans la
colonne Venues, il n’y a plus désormais que de 0, 1 et 2.
Cliquer, si nécessaire, en bas sur l’onglet Affichage des variables > à la ligne 8 (Venues), préciser que désormais la variable est de type numérique et la mesure une échelle
2/6
 Y. CINOTTI
5. MODIFIER LES PROPRIÉTÉS DES VARIABLES
Problème :
Solution : 




En bas de la fenêtre, à gauche, cliquer sur l’onglet Affichage des variables. Je m’aperçois que les propriétés des variables ne sont pas correctes.
Si nécessaire, en bas de la fenêtre, à gauche, cliquer sur l’onglet Affichage des variables
Dans la colonne Type, à la ligne 8 (variable Venues), remplacer Chaîne par Numérique
Dans la colonne Mesure, à la ligne 8 (variable Venues), remplacer Nominale par Échelle
Dans la colonne Mesure, à la ligne 1 (variable Identite), remplacer Échelle par Nominales
Ctrl+S > enregistrer le fichier sous le nom EvalTic.sav dans Mes documents1  il se
peut que, curieusement, PSPP se ferme brusquement. Néanmoins, le fichier est bien enregistré. Il suffit de rouvrir PSPP et d’ouvrir le fichier EvalTic.sav.
6. TRIER LES DONNÉES
Problème :
Comment trier les réponses par classe, comme on peut le faire dans un tableur ?
Solution :  Cliquer en bas à gauche sur l’onglet Affichage des données
 Menu Données > Trier les observations... > dans la fenêtre Trier les observations, cliquer sur Classe > cliquer sur la flèche au milieu pour faire passer Classe sous Trier
par : > Valider
7. RÉALISER UNE ANALYSE DE FRÉQUENCE SUR UNE VARIABLE NOMINALE
Problème :
Comment savoir combien d’étudiants de chaque classe ont répondu ?
Solution :  Menu Statistiques > Statistiques Descriptives > Fréquences… > cliquer sur la variable
Classe > en cliquant sur la petite flèche vers la droite, la faire passer sous Variable(s)
> sous la rubrique Statistiques, décocher toutes les cases puisque Classe est une variable
nominale pour laquelle on ne peut réaliser des statistiques destinées aux variables métriques > Valider  dans la fenêtre Sortie – PSPPIR…, sous FREQUENCIES, s’affichent un tableau des fréquences qui indique en particulier l’effectif en valeur absolue et
en pourcentage.
8. RÉCUPÉRER DES RÉSULTATS DANS UN TRAITEMENT DE TEXTE
Problème :
Je récupérer le tableau pour l’intégrer dans un document sous traitement de texte.
Solution :  Dans la fenêtre Sortie – PSPPIR…, menu Fichier > Export… > Nom : EvalTic.html >
Enregistrer dans le dossier : Mes documents > Enregistrer
 PSPP ne permet pas de travailler avec des fichiers au format de Microsoft Office. Il est
NB
cependant possible d’ouvrir avec Word ou LibreOffice Writer le fichier EvalTic.html.
 Le fichier EvalTic.html ne comporte pas que le tableau des fréquences, mais tout le contenu de la fenêtre Sortie – PSPPIRE visualisation en sortie.
1
EvalTic.sav doit absolument être enregistré dans le même dossier que le fichier EvalTic.csv.
PSPP_formation.docx
3/6
 Y. CINOTTI
9. RÉALISER DES ANALYSES DESCRIPTIVES SUR DES VARIABLES MÉTRIQUES
Je veux connaître la moyenne, le maximum, le minimum, l’étendue et l’écart-type des variables NivoInfo et Progression.
Solution :  Revenir vers PSPP (fichier EvalTic.sav)
 Menu Statistiques > Statistiques Descriptives > Descriptives… > faire passer NivoInfo
et Progression sous Variables : > sous la rubrique Statistiques, cocher Moyenne, Ecarttype, Minimum, Maximum et Intervalle > Valider
Problème :
 dans la fenêtre Sortie – PSPPI…, sous DESCRIPTIVES, un tableau présente les statistiques demandées.
10. RÉALISER UN TABLEAU CROISÉ
Problème :
Comment croiser les données des variables NivoInfo et Progression (comme dans un tableau croisé dynamique avec Excel) ?
Solution :  Revenir vers fichier EvalTic.sav
 Menu Statistiques > Statistiques Descriptives > Tableaux croisés… > placer NivoInfo
sous Ligne(s) > placer Progression sous Colonne(s)
 Pavé Cellules... > sous la rubrique Afficher l’observation, cocher uniquement  Ligne
> Continuer > Valider  le tableau s’affiche dans la fenêtre Sortie – PSPPI… sous
CROSSTABS
 Fermer le fichier EvalTic.sav > fermer la fenêtre Sortie – PSPPI… >
11. RÉALISER UNE ANALYSE FACTORIELLE DES CORRESPONDANCES
Je dispose des résultats d’une enquête auprès de femmes et d’hommes. Il a été demandé
aux individus s’ils étaient intéressés par le magasinage (le shopping en franglais). Cette
enquête confirme-t-elle l’hypothèse intuitive que les femmes sont plus intéressées par le
shopping que les hommes ?
Solution :  Télécharger dans Mes documents le fichier magasin.sav à l’URL
http://tinyurl.com/bswggr5
 Ouvrir le fichier téléchargé dans SPPS
 Menu Statistiques > Statistiques Descriptives > Tableaux croisés… > cliquer-glisser la
variable intérêt pour le magasinage sous Ligne(s) > cliquer-glisser sexe de la personne
sous Colonne(s)
Problème :
PSPP_formation.docx
4/6
 Y. CINOTTI

NB :
Pavé Cellules... > sous la rubrique Afficher l’observation, cocher uniquement  Colonne > Continuer
 Pavé Statistiques... > cocher  Khi-Deux et  Phi > Continuer > Valider
 Dans la fenêtre Tableaux croisés, la variable sexe est placée en colonne parce qu’il
s’agit de la variable indépendante, celle qui a une influence sur la variable dépendante,
intmag.
12. INTERPRÉTER LES RÉSULTATS D’UN ANALYSE FACTORIELLE DES CORRESPONDANCES
Problème :
Mais que signifie les résultats dans les tableaux obtenus ?
Solution : 
Rappel :
À la vue du premier tableau, les femmes semblent plus intéressées par le magasinage que
les hommes.
 Les deux éléments intéressants dans ces tableaux sont entourés en rouge :
– On appelle aussi « valeur p » le niveau de signification asymptotique. Si la valeur p
est inférieure à 0,05 l’hypothèse est confirmée. C’est bien le cas ici puisque p = 0,00
(en réalité il y a des décimales, mais masquées).
 Le V de Cramer nous renseigne sur la force de la relation entre les deux variables. La valeur de V est généralement comprise entre 0 (pas de relation) et 1 (relation complète).
Étant donné que le V de Cramer est de seulement 0,27, la relation est faible.
 On peut donc conclure que la relation entre le sexe et l’intérêt pour le magasinage est statistiquement significative (p = 0,00) mais faible (V = 0,27).
 L’analyse factorielle des correspondances ne doit être utilisée que pour des variables non
métriques.
13. RÉALISER UNE ANALYSE DE CORRÉLATION
Dans le questionnaire, il était aussi demandé aux répondants d’évaluer le plaisir qu’ils
ressentaient à magasiner (faire du shopping). On peut émettre l’hypothèse intuitive que
plus l’intérêt pour le magasinage est grand et plus le plaisir de magasiner l’est. Comment le vérifier ?
Solution :  Statistiques > Corrélation bivariée > étirer la fenêtre vers le haut et le bas pour voir plus
de variables > faire passer à droite les variables intérêt pour le magasinage et plaisir
ressenti à magasiner > Valider
Problème :
PSPP_formation.docx
5/6
 Y. CINOTTI

Rappel :
On voit dans le tableau ci-dessus que la corrélation est de 0,53 et que la valeur p (signification bi-variée) est de ,00. On peut conclure qu’il y a une corrélation entre ces deux
variables et confirmer l’hypothèse.
 L’analyse de corrélation ne doit être utilisée que pour des variables métriques.
14. RÉALISER UNE ANALYSE DE LA VARIANCE (ANOVA)
Je veux vérifier l’hypothèse intuitive que le niveau de scolarité 2 n’a pas d’influence sur le
plaisir de magasiner.
Solution :  Statistiques > Comparaison des Moyennes > ANOVA à 1 facteur… > faire passer la variable plaisir ressenti à magasiner sous Variable(s) dépendante(s) et la variable scolarité (recodifiée) sous Facteurs > sous la rubrique Statistiques, cocher  Descriptives
> Valider
Problème :

Dans le tableau Descriptives, on voit que les moyennes sont assez différentes suivant le
niveau de scolarité. L’hypothèse semble devoir être rejetée. Afin de le prouver statistiquement, il faut d’abord calculer la grande moyenne de la manière suivante :
(73 × 3,14 + 94 × 2,79 + 57 × 2,42) / 224 = 2,81

NB :
Dans le tableau ANOVA, on voit que le test en F est égal à 7,51 donc supérieur à la
grande moyenne (2,81). On peut en conclure que les différences de moyennes sont statistiquement significatives. Le test est significatif puisque la valeur p (Sig.) est de 0,00.
 L’ANOVA est adaptée pour étudier l’influence d’une variable nominale ou ordinale sur
une variable métrique.
Curieusement dans l’affichage des variables de magasin.sav, la variable scolarité (recodifiée) est caractérisée comme une variable métrique (Echelle) alors qu’il s’agit bien évidemment d’une variable ordinale. La codification est la suivante : 1 = primaire/secondaire, 2 = collégiale (jusqu’à bac +3) et 3 = universitaire (au-delà de bac+3).
2
PSPP_formation.docx
6/6
 Y. CINOTTI