Transcript Logiciel R
Logiciel R
R est un logiciel libre de traitement statistiques des données disponible http://cran.ch.r-project.org/ Windows 95 et plus Linux Le programme de "base“ Des librairies complémentaires
Installation de R
Aller dans le site http://cran.ch.r-project.org/ Aller dans downlaod, télécharger le logiciel et la documentation
Installation de R
Une fois le fichier téléchargé, installez en cliquant sur le fichier et en prenant l’option «exécuter»
Logiciel R
Comment travaille R?
Console de calcul Fenêtre de programmation
1
ere
Approche de R
Quand vous lancez R, vous aurez l’invite > A la suite de l’invite, vous tapez vos commandes
1
ere
Approche de R
Dans R, on parle d’objets. Apprenons d’abord le premier objet : L’objet numérique : La commande >a=2 ou a<-2 ou 2–> a Veut dire que a est numérique et la valeur 2 lui est assignée
1
ere
Approche de R
La commande >a Donne [1] 2 Le symbole [1] indique qu’on a affaire à un nombre La commande >a+2 Donne [1] 4
1
ere
Approche de R
Exercice : Assignez 2 et 5 aux objets a et b et calculez a+b, a/b, ab, a puissance b >a=2 >b=5 >a+b [1] 7 >a*b [1] 10 >a/b [1] 0.4
1
ere
Approche de R
Exercice : suite >a^b # ou a**b Donne a puissance b
1 ere Approche de R Les différents objets Les vecteurs Les Matrices Les Listes Les fonctions Les data frame
1
ere
Approche de R
Objet Vecteur Assigner un vecteur : > x <- c(x 1 , x 2 , …, x n ) Ou >assign("x", c(x 1 , x 2 , …, x n )) Ou >c(x 1 , x 2 , …, x n ) –> X
1
ere
Approche de R
Objet Vecteur Exemples > x <- c(-1,1,0,4) > c(-1,1,0,4)->x > assign("x",c(-1,1,0,4))
1
ere
Approche de R
Objet Vecteur : Le ième élément de x est noté x[i] > x[1] =-1 > x[3] =0 > x[-2] -1 0 4 > x[c(1,3)] -1 0
1
ere
Approche de R
Objet Vecteur : >z <- c(x,y) Manipulations Soit x,y deux vecteurs Forme un vecteur composé des éléments de x puis ceux de y. >t <- c(x,0,y,1) Forme t en mettant les éléments de x, puis 0 puis ceux de y puis la valeur 1
1
ere
Approche de R
Objet Vecteur : Manipulations >m <-1/x met dans m les inverses des éléments de x.
>n <- x+2 met dans n les valeurs de x ajoutées de 2, etc..
1
ere
Approche de R
Objet Vecteur : Manipulations Si x et y ont même longueur, alors >b <-x+y met dans b la somme des éléments de x et y : b[i]=x[i]+y[i]
1
ere
Approche de R
Objet Vecteur : Manipulations Si les vecteurs ne sont pas de même longueur, le plus court est complété automatiquement > x =c(1:5) x : 1 2 3 4 5 1 2 3 4 5 y : 1 2 1 2 1 > y =c(1,2) 1 2 x+y : 2 4 4 6 6 > x+y 2 4 4 6 6
1
ere
Approche de R
Objet Vecteur : Formations de vecteurs >x <- seq(1, 30) Ou >x <- 1:30 Forme le vecteur 1,2,…,30 >x <- seq(30,1) Forme le vecteur 30, 29, …,1
1
ere
Approche de R
Objet Vecteur : de 2.
Manipulations >x <- seq(-5, 5, by=2) Crée la suite allant de -5 à 5 par pas > x<-seq(1,6,length=5) Crée la suite allant de 1 à 6 avec une longueur de 5 éléments.
1
ere
Approche de R
Objet Vecteur On peut remplacer >seq(2, 30, by=2) Par >2*1:15 On multiple les nombres de la séquence 1,…,15 par 2
1
ere
Approche de R
Objet Vecteur Formations de vecteurs >y <- rep(x, each=4) Forme y en prenant le premier élément de x 4 fois, puis le second 4 fois, etc.
Exemple : > y<-rep(c(2,7,9),each=2) > y<-rep(c(2,7,9),c(2,3,2))
1
ere
Approche de R
Nota bene : On peut aussi avoir des vecteurs de caractères. Les constantes de caractères sont données entre guillemets Exemple : > Z<-c("nom","prénom","age") > Letters ou LETTERS
1
ere
Approche de R
Objet Matrices Les matrices sont créées avec la fonction matrix() à partir d'un vecteur. On doit fixer le nombre de colonnes ncol de lignes nrow .
et/ou le ombre
1 ere Approche de R Objet Matrices Exemple >H <-matrix(1:20,nrow=4,ncol=5) Ça donne 1 2 6 10 14 18 3 7 11 15 19 4 5 9 13 17 8 12 16 20
1 ere Approche de R Objet Matrices : byrow=T Par défaut la matrice est remplie colonne par colonne. Pour remplir ligne par ligne, on ajoute l'argument >H<-matrix(1:20,nrow=4,ncol=5, byrow=T) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1
ere
Approche de R
Objet Matrices Exemple >H <- array(1:20 dim=c(4,5)) Ça donne 1 5 9 2 6 10 3 7 11 4 8 12 13 14 15 16 17 18 19 20
1
ere
Approche de R
Objet Matrices H[i,j] est l’élément à la ième ligne et jème colonne H[i,] est la ième ligne H[,j] est la jème colonne
1 ere Approche de R Objet Matrices Exemples > H[1,5] [1] 5 > H[2,] [1] 6 7 8 9 10 > H[,5] [1] 5 10 15 20
1 ere Approche de R Objet Matrices : Manipulation Les fonctions classiques calculent élément par élément.
Exemple > exp(H) : renvoie une matrice constituée des éléments exp(hi,j).
> A+B; A*B; A-B : somme, produit, soustraction élément par élement
1
ere
Approche de R
Objet Matrices > A%*%B : produit matriciel >solve(A) :donne l’inverse de A >solve(A,b) Donne la solution de l’équation Ax=b
Autour des probabilités
Fonctions de répartition Une fonction de répartition a un nom et des paramètres.
Exemple : norm(m,s) : loi normale de paramètres m (moyenne) et s (ecart type)
Autour des probabilités
Fonctions de répartition > r norm(n,m,s) : simulation de v.a iid suivant une loi normale de moyenne m et d’écart-type s
Autour des probabilités Fonctions de répartition En remplaçant r respectivement par d , p Les quantiles ou La densité La fonction de répartition q on obtient
Autour des probabilités
Fonctions de répartition Exemple > pnorm(0,0,1) #=1/2 > pnorm(1.96,0,1) #=0.957
> qnorm(0.75, 0,1) #=0.675
Autour des probabilités
Fonctions de répartition Echantillon de lois Student : t(n) Chi-deux : chisq(n) Binomiale : binomial(n,p) Binomiale négative : nbinom(k,p) Fisher : f(n,m) Exponentielle : exp(lamda)
Statistiques d’une série
Soit x une série de données numériques, on a prod(x) : produit des éléments de x length(x) : longueur de x mean(x) : moyenne de x Var(x) : variance empirique de x (division par n-1)
Statistiques d’une série
Ecart-type de x : sqrt(var(x)) ou sd(x) max(x) : maximun de x min(x) sort(x) : minimum de x : ordonne x which.min(x) which.max(x) : coordonnée du minimum : coordonnée du maximum
Statistiques d’une série quantile(x,p) : quantile de x d’ordre p median(x) =quantile(x,50%) First quartile : quantile(x,25%) 3 ième quartile : quantile(x,75%) Summary(x) moyenne, la variance, la médiane et les quartiles donne : le min, le max, la
Utilisations des Données
On peut créer directement le fichier de ses données avec la fonction >nom_données< edit(data.frame()) Un éditeur apparaît et vous mettez vos données.
Utilisations des Données
On transfère ces données dans R avec la fonction read.table
> getwd() # répertoire de travail > setwd(« chemin d’accès") Exemple : > base= read.table
("wsd2010bts1.txt",header=TRUE)
Utilisations des Données
Pour utiliser un fichier de R livré par R ou créé par nous, nous devons le rendre disponible par la commande >attach(base) Tout comme, on pourra l’évacuer avec >detach(base)
Utilisations des Données
Une fois attaché, on peut directement utiliser les variables de base : num, cor, geo, ang, dessin.
Exemple > mean(geo) > summary(ang), ect.
Utilisations des Données
En cas de conflit, on peut utiliser le nom complet des variables ainsi : base $ num base $ cor base $ geo base $ ang base $ dessin
Utilisations des Données
On peut aussi utiliser les index Ainsi base [[1]] représente la variable num base [[2]] représente la variable cor base [[3]] représente la variable geo base [[4]] représente la variable ang base [[5]] représente la variable dessin
Utilisations des Données
On peut aussi utiliser les index Ainsi > base ["geo"] représente la variable geo, etc.
Utilisations des Données Exemples > XA=mean( geo[cor=="A"] ) > SA=var( geo[cor=="A"] ) > SAET=sqrt(SA) > nA=length( geo[cor=="A"] ) > summary( geo[cor=="A"] )
Utilisations des Données
Enfin, vous pouvez aussi editer vos données, en utilisant >edit(base)
Graphiques Statistiques simples
La fonction plot plot(x) : représente une série chronologique plot(x,y) y : représente le nuage de point de x et Si f est une variable de facteurs, x numérique, Plot(f,x) : donne un diagramme en barre de x, selon les valeurs de f.
Graphiques Statistiques simples
La fonction curve curve(f(x), from=a, to=b) entre a et b.
Exemple : trace la courbe de f > curve(x^2+1/(x+1),2,4, col="blue",type="h")
Graphiques Statistiques simples
Comment faire plusieurs plot simultanément D’abord tracer la courbe de référence Plot(x,f(x)) Pour les autres, remplacer plot par la commande lines. Exemple: lines(x,g(x)) ou points(x,g(x)) lines(x,h(x)) Etc… Remarques : c’est le cadre de la fonction plot qui est la référence
Graphiques Statistiques simples Quelques arguments de la fonction plot type="p" (points) ou " l " (ligne) : pour tracer une ligne ou un nuage de points.
pch lty : type de points : type de lignes col : couleur ylim=c(1,10) et xlim=c(1,10) limites des axes.
: pour fixer les
Graphiques Statistiques simples
Autres fonctions graphiques > hist(x) : trace l’histogramme de x > pie(x) : diagramme en secteurs > barplot(x) : diagramme en barres verticales > boxplot(x) : diagramme en box > boxplot(X,Y,Z) : représente simultanément les diagrammes des séries X, Y et Z
Graphiques Statistiques simples Exemples > setwd("C:/Users/fleure/Desktop/WSD/") > don=read.table("wsd2010bts1.txt",header=TRUE) > attach(don) Histogramme > subd <- seq(0,20,by=2.5) > hist(geo,subd, main="Histogramme Géo“, col="green")
Graphiques Statistiques simples
Diagramme en box > boxplot(geo,main="Diagramme en boite de Géo", col="blue") Diagramme en barres verticales > barplot(geo,main="Diagramme en barres de Géo",col="blue")
Autour des Tests Echantillon gaussien Pour déterminer les paramètres d’un échantillon gaussien et les intervalles de confiances, on utilise t.test(X) Donne l’intervalle de confiance et fait le test pour mu=..
Exemple t.test(x, mu = 0, conf.level = 0.95, ...)
Autour des Tests
Test d’ajustage ks.test(X, "nom_loi", parametre1=… ) Effectue le test de kolmogorov pour l’ajustage de la serie X par rapport à la fonction de répartition indiquée, et la valeur des paramètres de la f.r
Autour des Tests
Comparer deux échantillons gaussiens var.test(X,Y,conf.level=0.9) : effectue le test de l’égalité de variance t.test(X,Y, var.equal=TRUE, conf.level=0.95) Effectue le test de conformité dans l’hypothèse de l’égalité des variances t.test(X,Y, var.equal=FALSE, conf.level=0.95) Effectue le test de conformité dans l’hypothèse de l’inégalité des variances