Empiriniai skirstiniai. Aprasomoji statistika

Download Report

Transcript Empiriniai skirstiniai. Aprasomoji statistika

STATISTIKA
Matematikos mokslo šaka, nagrinėjanti
duomenų rinkimo, vaizdavimo ir analizavimo
būdus bei jų taikymą patikimos informacijos
gavimui apie objektų ar individų grupę iš
atrinktos jų imties.
POPULIACIJA IR IMTIS
POPULIACIJA IR IMTIS
Populiacija ir imtis
Kintamasis
KINTAMIEJI
Kiekybinis
Tolydusis:
Amžius
Pajamos
Pelnas
Ūgis
Temperatūra
Kokybinis
Diskretusis:
Šeimos dydis
Lytis
Darbuotojų skaičius
Tautybė
Kambarių skaičius
Tikėjimas
Išsimokslinimas
Šeimyninė padėtis
Aprašomosios statistikos tikslas – glaustas ir
vaizdus surinktų duomenų apibūdinimas
Skaičiais
• Dažniai, procentiniai
dažniai, vidurkis, moda,
mediana, standartinis
nuokrypis, ...
Vaizdais
• Stulpelinės diagramos,
histogramos, skritulinės
diagramos, stačiakampės
diagramos, ...
Empirinis skirstinys, jo
charakteristikos
Variacinė eilutė:
0;1;1;2;2;2;2;2;3;3.
Moda- dažniausiai
pasikartojanti reikšmė: 2
Imtis:
0;1;2;1;2;2;2;3;2;3.
Imties didumas n=10
Imties plotis : IP=3-0=3
Empirinis skirstinys, jo charakteristikos
Dažnių skirstinys
Santykinių dažnių skirstinys
xi
0
1
2
3
xi
0
1
2
3
mi
1
2
5
2
Wi
1/10
2/10
5/10
2/10
Imtis:
0;1;2;1;2;2;2;3;2;3.
Empirinė skirstinio funkcija
 0 ; kai x  0

0 ,1 kai 0  x  1

F ( x )   0 , 3 kai 1  x  2
 0 ,8 kai 2  x  3

1, kai x  3
.
Sukauptieji dažniai
xi
0
1
sum(Wi)
1/10 3/10
S
ukauptieji dažniai
2
3
8/10
10/10
Intervalinių dažnių skirstinys
• Intervalų skaičių rekomenduojama pasirinkti
artimą reikšmei 1+3,32lg(n)
• Skaičiuojant skaitines charakteristikas imamas
intervalo vidurio taškas
xi
[a0;a1]
(a1;a2]
[ar-1;ar]
Wi
W1
W2
Wn
Skaitinės charakteristikos
Skaitinės duomenų charakteristikos
PADĖTIES CHARAKTERISTIKOS
• Vidurkis
x 
1
n
x

n
i
i 1
• Moda – dažniausiai pasikartojanti imties
reikšmė
• Imties q-kvantilis dalija variacinę eilutę į
q*100 ir (1-q)*100 procentinių dalių (0<q<1).
Tai reiškia kad q*100 procentai imties reikšmių
yra nedidesnės už kvantilį ir (1-q)*100 – ne
mažesnės už kvantilį xq.
PADĖTIES CHARAKTERISTIKOS
• Mediana – imties 0,5 kvantilis. Tai- tokia imties
reikšmė, kai 50 % imties reikšmių yra už ją
nedidesnės ir 50 %nemažesnės.
• Mediana - variacinės eilutės vidurinis narys, arba
dviejų vidurinių narių aritmetinis vidurkis.
• Pirmasis kvartilis – apatinės pusės mediana
• Trečiasis kvartilis – viršutinės pusės mediana
Mediana dalija duomenis į dvi puses, o kvartiliai į ketvirčius.
PADĖTIES CHARAKTERISTIKOS
• Procentilis. Procentiliais vadinami skaičiai,
dalijantys variacinę eilutę į 100 maždaug
vienodų dalių.
• Pavyzdys: Kimtamasis – N įstaigos darbuotojų
atlyginimas. x85 = 1500 reiškia, kad 85
procento darbuotojų atlyginimai nemažesni
nei 1500 litų.
Sklaidos charakteristikos
• Imties plotis IP = xmax-xmin
• Kvartilinis plotis KP = x0.75-x0.25
mr 
• Imties centrinis momentas
• Imties dispersija
s 
2
i 1
x

n 1
1
x

n
n
i
x
i 1
• Standartinis nuokrypis
n
1
s
s
2

2
i
 x

r
Kitimo (variacijos koeficientas)
Asimetrijos koeficientas
Jis apibūdina empirinio skirstinio asimetriškumą.
Jeigu skirstinys simetriškas vidurkio atžvilgiu, tai As
lygus 0. Dešiniosios asimetrijos atveju As >0,
kairiosios – As <0. Normaliojo skirstinio atveju As = 0.
Asimetrijos koeficientas
Asimetrijos koeficientas
Eksceso koeficientas
Jis apibūdina empirinio skirstinio tankio (histogramos)
smailumą (Ek > 0) arba lėkštumą (Ek < 0). Normaliojo
skirstinio atveju Ek = 0.
Jeigu empirinio pasiskirstymo funkcijos maksimumas yra
aukščiau (žemiau) nei mormaliojo skirstinio, tai sakoma,
kad empirinis skirstinys turi teigiamą (neigiamą) ekscesą.
Eksceso koeficientas
Grafinis duomenų vaizdavimas:
HISTOGRAMA
Santykinio dažnio histograma
Stulpelinės diagramos
Skritulinės diagramos
Daugiakampis
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
a
b
c
d
e
f
Kumuliantė- tai sukauptųjų
santykinių dažnių daugiakampis
1.2
1
0.8
0.6
0.4
0.2
0
a
b
c
d
e
f
STAČIAKAMPĖ DIAGRAMA
STAČIAKAMPĖ DIAGRAMA
Kitos skaitinės charakteristikos