Transcript Logiciel R

Logiciel R

R est un logiciel libre de traitement statistiques des données disponible http://cran.ch.r-project.org/  Windows 95 et plus  Linux  Le programme de "base“  Des librairies complémentaires

Installation de R

Aller dans le site http://cran.ch.r-project.org/ Aller dans downlaod, télécharger le logiciel et la documentation

Installation de R

Une fois le fichier téléchargé, installez en cliquant sur le fichier et en prenant l’option «exécuter»

Logiciel R

Comment travaille R?

 Console de calcul  Fenêtre de programmation

1

ere

Approche de R

Quand vous lancez R, vous aurez l’invite > A la suite de l’invite, vous tapez vos commandes

1

ere

Approche de R

Dans R, on parle d’objets. Apprenons d’abord le premier objet : L’objet numérique : La commande >a=2 ou a<-2 ou 2–> a Veut dire que a est numérique et la valeur 2 lui est assignée

1

ere

Approche de R

La commande >a Donne [1] 2 Le symbole [1] indique qu’on a affaire à un nombre La commande >a+2 Donne [1] 4

1

ere

Approche de R

Exercice : Assignez 2 et 5 aux objets a et b et calculez a+b, a/b, ab, a puissance b >a=2 >b=5 >a+b [1] 7 >a*b [1] 10 >a/b [1] 0.4

1

ere

Approche de R

Exercice : suite >a^b # ou a**b Donne a puissance b

1 ere Approche de R Les différents objets  Les vecteurs  Les Matrices  Les Listes  Les fonctions  Les data frame

1

ere

Approche de R

Objet Vecteur Assigner un vecteur : > x <- c(x 1 , x 2 , …, x n ) Ou >assign("x", c(x 1 , x 2 , …, x n )) Ou >c(x 1 , x 2 , …, x n ) –> X

1

ere

Approche de R

Objet Vecteur Exemples > x <- c(-1,1,0,4) > c(-1,1,0,4)->x > assign("x",c(-1,1,0,4))

1

ere

Approche de R

Objet Vecteur : Le ième élément de x est noté x[i] > x[1] =-1 > x[3] =0 > x[-2] -1 0 4 > x[c(1,3)] -1 0

1

ere

Approche de R

Objet Vecteur : >z <- c(x,y) Manipulations Soit x,y deux vecteurs Forme un vecteur composé des éléments de x puis ceux de y. >t <- c(x,0,y,1) Forme t en mettant les éléments de x, puis 0 puis ceux de y puis la valeur 1

1

ere

Approche de R

Objet Vecteur : Manipulations >m <-1/x met dans m les inverses des éléments de x.

>n <- x+2 met dans n les valeurs de x ajoutées de 2, etc..

1

ere

Approche de R

Objet Vecteur : Manipulations Si x et y ont même longueur, alors >b <-x+y met dans b la somme des éléments de x et y : b[i]=x[i]+y[i]

1

ere

Approche de R

Objet Vecteur : Manipulations Si les vecteurs ne sont pas de même longueur, le plus court est complété automatiquement > x =c(1:5) x : 1 2 3 4 5 1 2 3 4 5 y : 1 2 1 2 1 > y =c(1,2) 1 2 x+y : 2 4 4 6 6 > x+y 2 4 4 6 6

1

ere

Approche de R

Objet Vecteur : Formations de vecteurs >x <- seq(1, 30) Ou >x <- 1:30 Forme le vecteur 1,2,…,30 >x <- seq(30,1) Forme le vecteur 30, 29, …,1

1

ere

Approche de R

Objet Vecteur : de 2.

Manipulations >x <- seq(-5, 5, by=2) Crée la suite allant de -5 à 5 par pas > x<-seq(1,6,length=5) Crée la suite allant de 1 à 6 avec une longueur de 5 éléments.

1

ere

Approche de R

Objet Vecteur On peut remplacer >seq(2, 30, by=2) Par >2*1:15 On multiple les nombres de la séquence 1,…,15 par 2

1

ere

Approche de R

Objet Vecteur Formations de vecteurs >y <- rep(x, each=4) Forme y en prenant le premier élément de x 4 fois, puis le second 4 fois, etc.

Exemple : > y<-rep(c(2,7,9),each=2) > y<-rep(c(2,7,9),c(2,3,2))

1

ere

Approche de R

Nota bene : On peut aussi avoir des vecteurs de caractères. Les constantes de caractères sont données entre guillemets Exemple : > Z<-c("nom","prénom","age") > Letters ou LETTERS

1

ere

Approche de R

Objet Matrices Les matrices sont créées avec la fonction matrix() à partir d'un vecteur. On doit fixer le nombre de colonnes ncol de lignes nrow .

et/ou le ombre

1 ere Approche de R Objet Matrices Exemple >H <-matrix(1:20,nrow=4,ncol=5) Ça donne 1 2 6 10 14 18 3 7 11 15 19 4 5 9 13 17 8 12 16 20

1 ere Approche de R Objet Matrices : byrow=T Par défaut la matrice est remplie colonne par colonne. Pour remplir ligne par ligne, on ajoute l'argument >H<-matrix(1:20,nrow=4,ncol=5, byrow=T) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

1

ere

Approche de R

Objet Matrices Exemple >H <- array(1:20 dim=c(4,5)) Ça donne 1 5 9 2 6 10 3 7 11 4 8 12 13 14 15 16 17 18 19 20

1

ere

Approche de R

Objet Matrices H[i,j] est l’élément à la ième ligne et jème colonne H[i,] est la ième ligne H[,j] est la jème colonne

1 ere Approche de R Objet Matrices Exemples > H[1,5] [1] 5 > H[2,] [1] 6 7 8 9 10 > H[,5] [1] 5 10 15 20

1 ere Approche de R Objet Matrices : Manipulation Les fonctions classiques calculent élément par élément.

Exemple > exp(H) : renvoie une matrice constituée des éléments exp(hi,j).

> A+B; A*B; A-B : somme, produit, soustraction élément par élement

1

ere

Approche de R

Objet Matrices > A%*%B : produit matriciel >solve(A) :donne l’inverse de A >solve(A,b) Donne la solution de l’équation Ax=b

Autour des probabilités

Fonctions de répartition Une fonction de répartition a un nom et des paramètres.

Exemple : norm(m,s) : loi normale de paramètres m (moyenne) et s (ecart type)

Autour des probabilités

Fonctions de répartition > r norm(n,m,s) : simulation de v.a iid suivant une loi normale de moyenne m et d’écart-type s

Autour des probabilités Fonctions de répartition En remplaçant r respectivement par d , p  Les quantiles ou  La densité  La fonction de répartition q on obtient

Autour des probabilités

Fonctions de répartition Exemple > pnorm(0,0,1) #=1/2 > pnorm(1.96,0,1) #=0.957

> qnorm(0.75, 0,1) #=0.675

Autour des probabilités

Fonctions de répartition Echantillon de lois Student : t(n) Chi-deux : chisq(n) Binomiale : binomial(n,p) Binomiale négative : nbinom(k,p) Fisher : f(n,m) Exponentielle : exp(lamda)

Statistiques d’une série

Soit x une série de données numériques, on a prod(x) : produit des éléments de x length(x) : longueur de x mean(x) : moyenne de x Var(x) : variance empirique de x (division par n-1)

Statistiques d’une série

Ecart-type de x : sqrt(var(x)) ou sd(x) max(x) : maximun de x min(x) sort(x) : minimum de x : ordonne x which.min(x) which.max(x) : coordonnée du minimum : coordonnée du maximum

Statistiques d’une série quantile(x,p) : quantile de x d’ordre p median(x) =quantile(x,50%) First quartile : quantile(x,25%) 3 ième quartile : quantile(x,75%) Summary(x) moyenne, la variance, la médiane et les quartiles donne : le min, le max, la

Utilisations des Données

On peut créer directement le fichier de ses données avec la fonction >nom_données< edit(data.frame()) Un éditeur apparaît et vous mettez vos données.

Utilisations des Données

On transfère ces données dans R avec la fonction read.table

> getwd() # répertoire de travail > setwd(« chemin d’accès") Exemple : > base= read.table

("wsd2010bts1.txt",header=TRUE)

Utilisations des Données

Pour utiliser un fichier de R livré par R ou créé par nous, nous devons le rendre disponible par la commande >attach(base) Tout comme, on pourra l’évacuer avec >detach(base)

Utilisations des Données

Une fois attaché, on peut directement utiliser les variables de base : num, cor, geo, ang, dessin.

Exemple > mean(geo) > summary(ang), ect.

Utilisations des Données

En cas de conflit, on peut utiliser le nom complet des variables ainsi : base $ num base $ cor base $ geo base $ ang base $ dessin

Utilisations des Données

On peut aussi utiliser les index Ainsi base [[1]] représente la variable num base [[2]] représente la variable cor base [[3]] représente la variable geo base [[4]] représente la variable ang base [[5]] représente la variable dessin

Utilisations des Données

On peut aussi utiliser les index Ainsi > base ["geo"] représente la variable geo, etc.

Utilisations des Données Exemples > XA=mean( geo[cor=="A"] ) > SA=var( geo[cor=="A"] ) > SAET=sqrt(SA) > nA=length( geo[cor=="A"] ) > summary( geo[cor=="A"] )

Utilisations des Données

Enfin, vous pouvez aussi editer vos données, en utilisant >edit(base)

Graphiques Statistiques simples

La fonction plot plot(x) : représente une série chronologique plot(x,y) y : représente le nuage de point de x et Si f est une variable de facteurs, x numérique, Plot(f,x) : donne un diagramme en barre de x, selon les valeurs de f.

Graphiques Statistiques simples

La fonction curve curve(f(x), from=a, to=b) entre a et b.

Exemple : trace la courbe de f > curve(x^2+1/(x+1),2,4, col="blue",type="h")

Graphiques Statistiques simples

Comment faire plusieurs plot simultanément D’abord tracer la courbe de référence Plot(x,f(x)) Pour les autres, remplacer plot par la commande lines. Exemple: lines(x,g(x)) ou points(x,g(x)) lines(x,h(x)) Etc… Remarques : c’est le cadre de la fonction plot qui est la référence

Graphiques Statistiques simples Quelques arguments de la fonction plot type="p" (points) ou " l " (ligne) : pour tracer une ligne ou un nuage de points.

pch lty : type de points : type de lignes col : couleur ylim=c(1,10) et xlim=c(1,10) limites des axes.

: pour fixer les

Graphiques Statistiques simples

Autres fonctions graphiques > hist(x) : trace l’histogramme de x > pie(x) : diagramme en secteurs > barplot(x) : diagramme en barres verticales > boxplot(x) : diagramme en box > boxplot(X,Y,Z) : représente simultanément les diagrammes des séries X, Y et Z

Graphiques Statistiques simples Exemples > setwd("C:/Users/fleure/Desktop/WSD/") > don=read.table("wsd2010bts1.txt",header=TRUE) > attach(don) Histogramme > subd <- seq(0,20,by=2.5) > hist(geo,subd, main="Histogramme Géo“, col="green")

Graphiques Statistiques simples

Diagramme en box > boxplot(geo,main="Diagramme en boite de Géo", col="blue") Diagramme en barres verticales > barplot(geo,main="Diagramme en barres de Géo",col="blue")

Autour des Tests Echantillon gaussien Pour déterminer les paramètres d’un échantillon gaussien et les intervalles de confiances, on utilise t.test(X) Donne l’intervalle de confiance et fait le test pour mu=..

Exemple t.test(x, mu = 0, conf.level = 0.95, ...)

Autour des Tests

Test d’ajustage ks.test(X, "nom_loi", parametre1=… ) Effectue le test de kolmogorov pour l’ajustage de la serie X par rapport à la fonction de répartition indiquée, et la valeur des paramètres de la f.r

Autour des Tests

Comparer deux échantillons gaussiens var.test(X,Y,conf.level=0.9) : effectue le test de l’égalité de variance t.test(X,Y, var.equal=TRUE, conf.level=0.95) Effectue le test de conformité dans l’hypothèse de l’égalité des variances t.test(X,Y, var.equal=FALSE, conf.level=0.95) Effectue le test de conformité dans l’hypothèse de l’inégalité des variances