Wizualizacja rozkładu zmiennej

Download Report

Transcript Wizualizacja rozkładu zmiennej

Wizualizacja
rozkładu zmiennej
z wykorzystaniem pakietu
Matlab 6.5
mgr inż. Anna Tomkowska
1/12
Cel pracy
Celem pracy jest przegląd podstawowych
sposobów wizualizacji rozkładu zmiennej
oraz ich implementacja w środowisku Matlab’a
2/12
Wykres kołowy i słupkowy [pie, bar]
Wykres kołowy zmiennej WYKSZTAŁCENIE
Rozkład częstości zmiennej WYKSZTAŁCENIE
wyksztalcenie={'ogólne','zawodowe','policealne','licencjat'};
liczebnosci=[8 8 7 7];
subplot(1,2,1)
wycinek = [0 0 1 1 ];
pie(liczebnosci,wycinek)
legend(wyksztalcenie,3);
wykształcenie licz. %
ogólne
8
27
zawodowe
8
27
policealne
7
23
licencjat
7
23
subplot(1,2,2)
bar(liczebnosci);
set(gca,'ylim',[0 9],'xticklabel',wyksztalcenie)
3/12
Histogram [hist]
(…)
dane=[55 34 72 28 55 72 … 34];
subplot(2,2,1)
hist(dane,50);
(…)
(…)
LUB subplot(2,2,1)
[Y,X]=hist(dane,50);
bar(X,Y);
(…)
4/12
Wykres gęstości
5/12
Wykres gęstości [ksdensity, plot]
h=0.1
h=0.5
h=0.25
h=1
dane=[55 34 72 28 55 72 … 34];
[Y,X] = hist(dane, 20);
(…)
subplot(2,2,1)
[Yksd,Xksd] = ksdensity(dane,'kernel','normal','width',0.1);
hold on
bar(X,Y,'b');
plot(Xksd,Yksd,'r');
hold off
(…)
6/12
Wykres skrzynkowy [boxplot]
(…)
dane=[55 34 72 28 55 72 … 34];
subplot(5,2,1)
boxplot(dane ,1,’o’,0)
(…)
7/12
Wykres kwantylowy (kwantyl-kwantyl) [qqplot]
(…)
dane=[55 34 72 28 55 72 … 34];
subplot(5,2,2)
qqplot(dane);
(…)
Wykres słupkowy zgrupowany
kategorie={'brak','1','2','3','4 i więcej'};
legenda ={'podstawowe', 'średnie', 'wyższe'};
a=[430 320 720 580 460];
b=[280 300 440 160 70];
c=[80 100 100 30 10];
d=[a' b' c'];
bar(d);
set(gca,'xticklabel',kategorie);
xlabel('liczba dzieci');
ylabel('wykształcenie');
legend(legenda);
Wykresy skrzynkowe zgrupowane
…
dane=[dane1' dane2' dane3'];
boxplot(dane,0,'o',1,1.2)
…
8/12
Wykres rozrzutu (korelacyjny) [lsline, smooth]
dopasowywana jest prosta
dopasowywana jest parabola
daneX=[55 34 72 28 55 72 … 34];
daneY=[4 6 2 5 3 1 … 7];
subplot(2,2,1)
hold on
plot(daneX,daneY,’o’)
lsline
hold off
subplot(2,2,2)
hold on
plot(daneX,daneY,’o’)
Y = smooth(daneX,daneY,0.5,’lowess’)
plot(daneX,Y,’r’,’linewidth’,2);
hold off
9/12
Podstawowe funkcje statystyczne
dane=[12 0 14 6 12 14 0 12 6 6 0 … 14];
srednia = mean(dane);
odchylenie = std(dane);
mediana = median(dane);
wsp_skosnosci = skewness(dane);
wsp_skupienia = kurtosis(dane);
Rozkład Weibulla
Rozkład Weibulla jest często stosowany w teorii niezawodności do
matematycznego modelowania rozkładu czasu bezawaryjnego
użytkowania obiektu.
Rozkład Weibulla w pakiecie Matlab
Generowanie próby losowej o rozkładzie Weibulla
probka = wblrnd(beta,alfa,m,n);
Graficzny test zgodności z rozkładem Weibulla
weibplot(probka);
Estymacja parametrów rozkładu Weibulla
[e, uf] = wblfit(probka,1-przedzial_ufnosci);
Estymacja parametrów rozkładu Weibulla
[m,v] = wblstat(beta,alfa);
funkcja gęstości prawdopodobieństwa
gesto = wblpdf(dziedzina, beta,alfa)
dziedzina=min(probka):range(probka)/n*m:max(probka);
dystrybuanta
dystryb = wblcdf(dziedzina,beta,alfa);
niezawodność
niezaw = 1 - dystryb;
Rozkład Weibulla w pakiecie Matlab
10/12
Pomocne toolbox’y w Matlab’ie

disttool (przegląd f-kcji gęstości i dystrybuant
popularnych rozkładów zmiennej),

cftool (analizowanie danych, wykres rozrzutu,
wygładzanie, dopasowywanie krzywych do danych),

polytool (dopasowanie do danych wielomianu różnego
stopnia ).
11/12
Podsumowanie
Możliwości graficznej analizy i prezentacji danych są bardzo duże.

wykres skrzynkowy i kwantylowy - dostarczają najwięcej
informacji przydatnych do analitycznego badania danych,

wykres słupkowy - jest niezawodny dla zmiennych o małej
liczbie kategorii,

histogram oraz wykres słupkowy – przydatny gdy chcemy
otrzymane przez nas wyniki pokazać osobom, które nie
zajmują się statystyką.
Pomoc jaką w tym zakresie oferuje pakiet Matlab’a pozwala na
pominięcie długotrwałych i żmudnych obliczeń, co oszczędza czas oraz
wyklucza błędy obliczeń.
12/12
Literatura

G. Wieczorkowska:
„Statystyka. Wprowadzenie do analizy danych
sondażowych i eksperymentalnych”
Sholar 2005

B. Mrozek, Z. Mrozek:
„Matlab 5.x. Simulink 2.x. Poradnik użytkownika”
PLJ 1998