Transcript STATISTIKA3

STATISTIKA 3.
GRUPIRANJE, ANALIZA I GRAFIČKI PRIKAZ
KVANTITATIVNIH PODATAKA
GRUPIRANJE NUMERIČKIH PODATAKA
Numerički podaci grupiraju se tako da se jedinice koje imaju istu ili
sličnu vrijednost obilježja svrstavaju u istu grupu. Takve grupe
nazivamo razredima
Nužnost grupiranja kvantitativnih podataka
Broj grupa (razreda) i principi preglednosti i preciznosti
Princip preglednosti: podatke treba grupirati u što manje grupa čime
se povećava preglednost
Princip preciznosti: podatke treba grupirati u što više grupa kako se
ne bi smanjila preciznost
VRSTE NUMERIČKOG
OBILJEŽJA
Diskontinuirano
Kontinuirano
Svaki razred obuhvaća određeni raspon numeričkog obilježja ograničen
donjom L1i i gornjom granicom L2i, tako da je: L1i<xi≤L2i
Prvom razredu može nedostajati donja, a zadnjem razredu gornja granica.
U tom slučaju prilikom analize moramo procijeniti nedostajuće granice.
Ako su gornje granice prethodnog razreda za jedinicu manje od donjih
granica slijedećeg razreda moramo formirati prave ili precizne granice
ovisno o vrsti numeričkog obilježja.
Nominalne granice
Prave granice
Precizne granice
od
do
od
do
od
do
1000
4999
1000
5000
999,5
4999,5
5000
9999
5000
10000
4999,5
9999,5
10000
14999
10000
15000
9999,5
14999,5
15000
19999
15000
20000
14999,5
19999,5
Diskontinuirano obilježje Kontinuirano obilježje
L1i ≤ xi ≤ L2i
L1i ≤ xi <L2i
Veličina razreda je raspon vrijednosti obilježja obuhvaćen razredom a
izračunava se kao razlika između donje granice tog razreda i donje
granice prethodnog razreda: ii=L1i-L1i-1
Razredna sredina je prosjek donje i gornje granice razreda. Ona
predstavlja vrijednost obilježja cijelog razreda.
xi 
L1i  L2i
2
Prave granice
Razredna sredina
od
do
xi
1000
5000
3000
5000
10000
7500
10000
15000
12500
15000
20000
17500
VRSTE
FREKVENCIJA
APSOLUTNE
RELATIVNE
“MANJE OD”
KUMULATIVNE
“VIŠE OD”
Opseg statističkog skupa: broj jedinica statističkog skupa
Total: ukupna vrijednost obilježja
SREDNJE VRIJEDNOSTI
POTPUNE
(IZRAČUNATE)
POZICIONE
ARITMETIČKA
SREDINA
MEDIJAN
(KVARTILI)
GEOMETRIJSKA
SREDINA
MOD
HARMONIJSKA
SREDINA
ARITMETIČKA SREDINA
Aritmetička sredina je jednaki dio obilježja koji otpada na svaku
jedinicu statističkog skupa
x
total
opseg mase
Grupirani niz
Negrupirani niz
k
n
x
x
i 1
N
i
n
 Nx   xi
i 1
x
fx
i
i 1
k
f
i 1
i
k
k
i 1
i 1
 x  f i   f i xi
i
Osobine aritmetičke sredine:
1.xmin  x  xmax
1.xmin  x  xmax
3. ( xi  x )  min
3. f i ( xi  x ) 2  min
2. ( xi  x )  0
2
2. f i ( xi  x )  0
Osnovne operacije sa znakom Σ:
3
x
i 1
i
 x1  x2  x3
3
 a  a  a  a  3a
i 1
3
 ax  ax  ax
i 1
i
1
2
3
 ax3  a( x1  x2  x3 )  a xi
i 1
3
 (a  bx )  a  bx  a  bx
i
i 1
3
1
3
 (a  bx )   (a
2
i 1
i
i 1
2
3
 a  bx3  3a  b xi
i 1
3
2
 2abxi  b x )  3a  2ab xi b
2 2
i
2
i 1
3
2
x
i 1
2
i
Dokaz osobina aritmetičke sredine:
 (x  x)  0
 x  Nx   x   x
i
i
i
i
0

 ( x  a)   ( x  x )  ( x  a)   (x  x )  N ( x  a)  N ( x  a)
i
i
i
 ( x  x )  min
 ( x  a)   ( x  x )  ( x  a)   ( x  x )  2( x
  ( x  x )  2 ( x x  x  ax  ax ) N ( x  a ) 
  ( x  x )  2 x ( x  x )  a ( x  x )  N ( x  a ) 
  ( x  x )  2 ( x  x )(x  a )  N ( x  a ) 
  ( x  x )  2( x  a )  ( x  x )  N ( x  a )
 ( x  a )   ( x  x ) N ( x  a )
2
i
2
2
i
2
i
i
2
i
2
i
2
i
i
2
2
i
i
i
2
2
i
i
2
2
i
i
2
i
2
i
2

 x )(x  a )  ( x  a ) 2 
LINEARNA TRANSFORMACIJA OBILJEŽJA
xi  a
xi  a  bd i  d i 
b
(x  a)  N (x  a)
i
( x  a)

x a 
i
x a
N
xa
di

b
 x  ab
N
N
b
 f (x  a)   f (x  x)  (x  a)   f (x  x)  (x  a) f  (x  a) f
i
i
i
i
i
i
i
f ( x  a)
fd


x a 
 x  ab
f
f
i
i
i
i
i
i
 x  a  bd
i
Grafički prikažite slijedeće distribucije:
Broj
zaposle
xi
Broj trg.
Radnji
fi
1
2
3
4
5
Ukupno
20
10
30
25
15
100
Osobe koje traže zaposlenje u županiji "
Godine starosti
osobe
od
do
u tis.
15
20
46
20
25
347
25
40
237
40
50
64
50
60
24
MOD
Mod je vrijednost obilježja koja se najčešće pojavljuje, odnosno
vrijednost obilježja kojoj pripada najveća frekvencija
Broj
zaposlenih
Broj trg.
Radnji
Broj
neispravnih
proizvoda
xi
fi
1
20
od
do
fi
2
10
0
2
34
3
30
2
4
150
4
25
4
6
200
Ukupno
100
6
8
80
8
10
30
Broj
kutija
(b  a )
Mo  L1 
i
( b  a )  ( b  c)
Modalni razred je razred sa najvećom frekvencijom
Ako razredi nisu jednaki potrebno je korigirati fr.
L1-donja granica modalnog razreda
b - najveća frekvencija
a - frekvencija ispred modalnog razreda
c - frekvencija iza modalnog razreda
i - veličina modalnog razreda
500
Mo  4 
200  150
50
2  4
 2  4,59
200  150  200  80
170
Broj
neispravnih
proizvoda
Broj
kutija
od
do
fi
0
2
34
2
4
150
4
6
200
6
8
80
8
10
30
500
250
(L1; b)
200
(L1+i; b)
Y2  Y1
Y  Y1 
( X  X1 )
X 2  X1
(L1; a)
150
100
(L1+i; c)
50
0
0-2
2-4
Mo
4-6
6-8
8 - 10
c b
c b
ba
ba
AC ... Y  b 
( x  L1 )  Y  b 
( x  L1 ) BD... Y  a 
( x  L1 )  Y  a 
( x  L1 )
i
i
i
i
 c b ba 
( Mo  L1 )

  a b
i 
 i
ba
Mo  L1 
i
babc
c b
ba
b
( Mo  L1 )  a 
( Mo  L1 )
i
i
i


( Mo  L1 )  (a  b)

 c bb a 
KUMULATIVNI NIZOVI
Za slijedeću distribuciju frekvencija izračunajte oba
Kumulativna niza te objasnite njihovo značenje.
Nacrtajte odgovarajuće grafove.
Broj neispravnih
proizvoda
od
do
0
2
2
4
4
6
6
10
10
14
14
20
Broj
kutija
fi
34
150
200
80
30
6
500
MEDIJAN
Medijan je srednja vrijednost obilježja koja statiatički niz dijeli na dva
jednaka dijela; pola jedinica statističkog skupa ime vrijednost
obilježja manju ili jednaku medijanu, a pola jedinica veću ili jednaku
medijanu
Statistički niz sortirati po veličini:
Neparan broj jedinica:
 2
r  int N
Me  xr 1
Paran broj jedinica:
rN
2
xr  xr 1
Me 
2
Radni staž 9 radnika poduzeća "X"
23
13
5
10
12
15
7
9
2
a) Izračunajte medijan koristeći formulu
b) izračunajte medijan koristeći funkciju median
c) Objasnite značenje dobivenog rezultata
GRUPIRANI NIZOVI
Broj
neispravnih
proizvoda
Broj
kutija
F
N
 f
Me  L1  2
i
f med
od
do
fi
0
2
34
34
2
4
150
184
L1 - donja granica medijalnog (kvartilnog) razreda
4
6
200
384
∑f - kumulativna frekvencija ispred medijalnog (kvartilnog) razreda
6
8
80
464
fmed - originalna frekvencija medijalnog (kvartilnog) razreda
8
10
30
494
i - veličina medijalnog (kvartilnog) razreda
10
12
6
500
500
Medijalni (kvartilni) razred je onaj koji ima kumulativni frekvenciju
neposredno veću od N/2
250  184
66
Me  4 
2  4
 2  4  0,66  4,66
200
200
500
Broj
neispravnih
proizvoda
od
do
Broj
kutija
450
400
F
fi
B(L1+i; ∑f+fmed)
350
N/2
300
0
2
34
34
2
4
150
184
4
6
200
384
6
8
80
464
100
8
10
30
494
50
10
12
6
500
0
A(L1; ∑f)
250
200
150
0
500
2
4
Me
6
8
10
12

f  f   f


x  L   x  L   Y   f 
AB...Y   f 
med
i
1
N  f
Me  L1  2
i
f med
1
i 

 f med 
Kvartili
Q1 (donji kvartil)
N  f
Q1  L1  4
i
fq
Donji kvartil je srednja vrijednost koja niz dijeli
tako da 25% jedinica ima vrijednost obilježja
manju ili jednaku Q1 a 75% veću ili jednaku
Q3 (gornji kvartil) Gornji kvartil je srednja vrijednost koja niz
3N   f
4
Q3  L1 
i
fq
dijeli tako da 75% jedinica ima vrijednost
obilježja manju ili jednaku Q3 a 25% veću ili
jednaku
Za slijedeće podatke izračunajte: aritmetičku sredinu, mod, medijan i
kvartile
Studenti prema broju bodova na ispitu "X"
Broj bodova
od
do
Br.
studenata
0
10
18
10
20
46
20
30
59
30
40
113
40
50
135
50
60
88
60
70
34
70
100
7
500
MJERE DISPERZIJE
RASPON VARIJACIJE:
(Raspon između najveće i najmanje vrijednosti obilježja)
R  X max  X min
INTERKVARTIL
(Raspon srednjih 50% članova niza)
I Q  Q3  Q1
KOEFICIJENT KVARTILNE DEVIJACIJE
(Relativna mjera za interkvartil)
Q3  Q1
VQ 
0  VQ  1
Q3  Q1
VARIJANCA
(Prosječno kvadratno odstupanje od prosjeka)
2
2
2
2
2




x

x
x

2
x
x

x
x
x
N
x




i
i
i
i
i
2 


 2x

N
N
2 
2
x
i
N
 f  x  x 
N
 x2
2
2 
f
N

2
f

x

f
 x2
STANDARDNA DEVIJACIJA
(Prosječno odstupanje od prosjeka)
 
2
KOEFICIJENT VARIJACIJE
(Relativna mjera standardne devijacije)
V 

x
100
N
MOMENTI
CENTRALNI MOMENTI
MOMENTI OKO SREDINE
POMOĆNI MOMENTI
OKO “a”
OKO NULE
Centralni ili glavni momenti (momenti oko aritmetičke sredine)
Prosječno odstupanje od aritmetičke sredine na određenu potenciju
Za negrupirane podatke
 x  x 
r
Mr 
i
i
N
Za grupirane podatke
M0=1
M1=0
M2=δ2
Mr 

i
f i xi  x 
r
f
i
i
Pomoćni momenti oko nule
Prosječno odstupanje od nule
Za negrupirane podatke
mr 
r
x
 i
i
N
Za grupirane podatke
m0  1
m1  x
fx

f
r
i i
i
mr
i
i
Pomoćni momenti oko “a”
Prosječno odstupanje od “a”
Za negrupirane podatke
mˆ r 
r
d
 i
i
N
Za grupirane podatke
mˆ 0  1
mˆ 1  d
fd

f
i
mˆ r
i
i
i
r
i
Izračunavanje centralnih momenata preko pomoćnih
M 2  m2  m
2
1
M 3  m3  3m2 m1  2m
3
1
M 4  m4  4m3 m1  6m2 m12  3m14
ˆ2 m
ˆ 12 )
M 2  b 2 (m
ˆ 3  3m
ˆ 2m
ˆ 1  2m
ˆ 13 )
M 3  b 3 (m
2
4
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
M 4  b (m4  4m3 m1  6m2 m1  3m1 )
4
STANDARIZIRANO OBILJEŽJE
Standardizirano obilježje je oblik linearne transformacije obilježja i
pokazuje odstupanje obilježja od prosjeka izraženo u standardnim
devijacijama.
zi 
xi  x

 xi  x  zi  
Za standardizirano obilježje vrijedi:
z 0
z
 zi
N


xi  x

N
1

(x  x)


i
N
0
z 1
 xi  x 


2
2

(
z

z
)
z
1
 


i
i

2
z 


 2
N
N
N

2
 (x  x)
i
N
2

1

2

1
2
Simetrična
Desnostrana
Q1 Mo
0
Q1
Mo
Me
x
Q3
0
38
Me
Q3
x
Mo  Me  x
M e  Q1  Q3  M e
M e  Q1  Q3  M e
3 
M3

3
Pearsonove mjere asimetrije
Bowleyeva mjera asimetrije
Mo
x Me
Q3
0
38
x  Me  MO
Koeficijent α3
Ljevostrana
Q1
x  Me  Mo
Q3  M e  M e  Q1
 2  3  2
Sk 
S kq 
x  Mo

Sk 
Q3  Q1  2me
Q3  Q1
3( x  M e )

 3  Sk  3
1  Skq  1
38
ZAOBLJENOST
4 
Oštra
α4>3
M4

4
4  0
Normalna
α4=3
Tupa
1,8<α4<3
Za slijedeće distribucije ocjenite asimetriju i zaobljenost
Studenti prema broju bodova na ispitu "X"
Broj bodova
Br.
od
do
studenata
0
10
18
10
20
46
20
30
59
30
40
113
40
50
135
50
60
88
60
70
34
70
100
7
500
Pravokutna
α4=1,8
U distribucija
0<α4<1,8
Red. br. Površina
gospod.
(ha)
1
5
2
3
3
2
4
1
5
4
6
3
7
6
8
3
Zadaci za vježbu
1.
Za 5 poduzeća zadani su slijedeći podaci
Ukupna
Poduzeće
plaća
A
450000
B
C
750000
D
E
384000
Ukupno
2684000
Plaća po
radniku
3000
3500
Broj radnika
200
300
120
870
3200
Plaću po radniku prikažite grafički i izračunajte prosječnu plaču za sva poduzeća zajedno
2.
Akumulacija i udio akumulacije u neto proizvodu
Djelatnosti
Akumulacija
INDUSTRIJA
PROMET I VEZE
TRGOVINA
UGOST. I TURIZAM
OSTALO
849
689
841
73
395
Udio akumulacije u
neto proizvodu
0.567
0.579
0.756
0.553
0.508
a) Izračunajte prosječni udio akumulacije u neto proizvodu za sve djelatnosti zajedno
b) Grafički prikažite udio akumulacije u neto proizvodu po djelatnostima
3.
Struktura prometa tereta s inozemstvom u lukama Hrvatske i indeks
prometa TRANZIT=100 u Sloveniji
Promet tereta
% u Hrvatskoj
Indeks u Sloveniji
IZVOZ
13
80
UVOZ
65
320
TRANZIT
22
100
Ako je u uvozu promet u Hrvatskoj bio 13000, a u Sloveniji 1600 strukturnim polukrugovima
prikažite struktutu prometa u lukama slovenije i Hrvatske.
4.
Živorođeni u Republici Hrvatskoj prema starosti majke 1990.
starost majke
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - (54)
broj živorođenih
4 650
21 543
18 039
8 089
2 646
485
a) Izračunajte najčešću starost majki
b) Ocijenite asimetriju distribucije preko Pearsonovih mjera asimetrije