Prezentacija sa formulama

Download Report

Transcript Prezentacija sa formulama

DESKRIPTIVNA
STATISTIKA
PROGRAMSKI PAKETI… 2012
MERE
CENTRALNE TENDENCIJE
MERE CENTRALNE TENDENCIJE
dele se na IZRAČUNATE i POZICIONE
MERE CENTRALNE TENDENCIJE
dele se na IZRAČUNATE i POZICIONE
Izračunavaju se na osnovu svih podataka
statističke serije po određenom pravilu
(aritmetička sredina, geometrijska sredina,
harmonijska sredina)
MERE CENTRALNE TENDENCIJE
dele se na IZRAČUNATE i POZICIONE
Izračunavaju se na osnovu svih podataka statističke
serije po određenom pravilu (aritmetička sredina,
geometrijska sredina, harmonijska sredina)
Određuju se na osnovu pozicije podatka u seriji po određenom
pravilu (mod, medijana)
ARITMETIČKA SREDINA
najčešće korišćena MCT
prosečna vrednost koju dobijemo kada zbir
svih vrednosti obeležja podelimo sa njihovim
brojem
ARITMETIČKA SREDINA
najčešće korišćena MCT
prosečna vrednost koju dobijemo kada zbir svih
vrednosti obeležja podelimo sa njihovim brojem
aritmetička sredina za negrupisane podatke (prosta)
ARITMETIČKA SREDINA
 najčešće korišćena MCT
 prosečna vrednost koju dobijemo kada zbir svih
vrednosti obeležja podelimo sa njihovim brojem
aritmetička sredina za negrupisane podatke (prosta)
n
x
x1  x1  ... x n i1
x

n
n
xi-vrednosti obeležja iz serije
n-ukupan broj podataka

i
ARITMETIČKA SREDINA
najčešće korišćena MCT
prosečna vrednost koju dobijemo kada zbir svih vrednosti
obeležja podelimo sa njihovim brojem
aritmetička sredina za negrupisane podatke (prosta)
n
x1  x1  ... x n
x

n
xi-vrednosti obeležja iz serije
x
i
i1
n
n-ukupan broj podataka
MS Excel =AVERAGE(raspon podataka)

ARITMETIČKA SREDINA PRIMER
Broj prodatih automobila u toku 15 radnih dana na
jednom prodajnom mestu je
9 11 7 6 6 8 10 6 7 13 5 4 8 9 11.
Izračunati prosečan broj prodatih automobila na dan.
ARITMETIČKA SREDINA PRIMER
Broj prodatih automobila u toku 15 radnih dana na
jednom prodajnom mestu je
9 11 7 6 6 8 10 6 7 13 5 4 8 9 11.
Izračunati prosečan broj prodatih automobila na dan.
9 11 7  6  6  8 10 6  7 13 5  4  8  9 11
x
8
15
ARITMETIČKA SREDINA PRIMER
Broj prodatih automobila u toku 15 radnih dana na
jednom prodajnom mestu je
9 11 7 6 6 8 10 6 7 13 5 4 8 9 11.
Izračunati prosečan broj prodatih automobila na dan.
9 11 7  6  6  8 10 6  7 13 5  4  8  9 11
x
8
15
9
11
7
6
6
8
10
6
7
13
5
4
8
9
11
8
ARITMETIČKA SREDINA PRIMER
Broj prodatih automobila u toku 15 radnih dana na
jednom prodajnom mestu je
9 11 7 6 6 8 10 6 7 13 5 4 8 9 11.
Izračunati prosečan broj prodatih automobila na dan.
9 11 7  6  6  8 10 6  7 13 5  4  8  9 11
x
8
15
9
11
7
6
6
8
10
6
7
13
5
4
8
9
11
=AVERAGE(A1:O1)
8
ARITMETIČKA SREDINA
aritmetička sredina za grupisane podatke (ponderisana)
ARITMETIČKA SREDINA
aritmetička sredina za grupisane podatke (ponderisana)
k
x1 f1  x 2 f 2  ... x k f k
x

f1  f 2  ... f k
x f
i i
i1
k
f
i
i1
k-ukupan broj različitih podataka (varijeteta)

xi-vrednosti obeležja (varijeteti)
fi –frekvencije
ARITMETIČKA SREDINA PRIMER
Raspodela ocena iz PP za 200 studenata
ocena
5
6
7
8
9
10
Broj studenata
20
70
50
30
25
5
Odrediti prosečnu ocenu
ARITMETIČKA SREDINA PRIMER
Otvorimo novu radnu svesku u MS Excelu i
unesemo sledeće podatke:
ARITMETIČKA SREDINA PRIMER
zatim u novoj koloni računamo xf za svaki
varijetet
ARITMETIČKA SREDINA PRIMER
zatim u novoj koloni računamo xf za svaki
varijetet
=SUM(B2:B7)
ARITMETIČKA SREDINA PRIMER
zatim u novoj koloni računamo xf za svaki
varijetet
=SUM(B2:B7)
=SUM(C2:C7)
ARITMETIČKA SREDINA PRIMER
zatim u novoj koloni računamo xf za svaki
varijetet
=SUM(B2:B7)
=SUM(C2:C7)
=C8/B8
GEOMETRIJSKA SREDINA
 definiše se kao n-ti koren iz proizvoda n
brojeva
 u praksi se relativno retko koristi
GEOMETRIJSKA SREDINA
 definiše se kao n-ti koren iz proizvoda n brojeva
 u praksi se relativno retko koristi
geometrijska sredina za negrupisane podatke
G  n x1x2 ...xn
xi-vrednosti obeležja iz serije
n-ukupan broj podataka

GEOMETRIJSKA SREDINA
 definiše se kao n-ti koren iz proizvoda n brojeva
 u praksi se relativno retko koristi
geometrijska sredina za negrupisane podatke
G  n x1x2 ...xn
xi-vrednosti obeležja iz serije
n-ukupan broj podataka
MS Excel =GEOMEAN(raspon podataka)
HARMONIJSKA SREDINA
recipročna vrednost aritmetičke sredine
recipročnih vrednosti obeležja
koristi se kada su obeležja izražena u vidu
recipročnih pokazatelja
HARMONIJSKA SREDINA
 recipročna vrednost aritmetičke sredine recipročnih
vrednosti obeležja
 koristi se kada su obeležja izražena u vidu recipročnih
pokazatelja
harmonijska sredina za negrupisane podatke
H
n
1
1
 ...
x1
xn
xi-vrednosti obeležja iz serije
n-ukupan broj podataka
HARMONIJSKA SREDINA
 recipročna vrednost aritmetičke sredine recipročnih
vrednosti obeležja
 koristi se kada su obeležja izražena u vidu recipročnih
pokazatelja
harmonijska sredina za negrupisane podatke
H
n
1
1
 ...
x1
xn
xi-vrednosti obeležja iz serije n-ukupan broj podataka
MS Excel =HARMEAN(raspon podataka)

HARMONIJSKA SREDINA PRIMER
Četiri mašine proizvode istu vrstu proizvoda.
Mašina A proizvede jedan proizvod za 3
minuta, mašina B za 5 minuta, mašina C za 7
minuta, a mašina D za 6 minuta. Kolika je
prosečna produktivnost jedne mašine?
HARMONIJSKA SREDINA PRIMER
Četiri mašine proizvode istu vrstu proizvoda. Mašina A
proizvede jedan proizvod za 3 minuta, mašina B za 5
minuta, mašina C za 7 minuta, a mašina D za 6 minuta.
Kolika je prosečna produktivnost jedne mašine?
=HARMEAN(B2:B5)
HARMONIJSKA SREDINA PRIMER
Četiri mašine proizvode istu vrstu proizvoda. Mašina A
proizvede jedan proizvod za 3 minuta, mašina B za 5
minuta, mašina C za 7 minuta, a mašina D za 6 minuta.
Kolika je prosečna produktivnost jedne mašine?
=HARMEAN(B2:B5)
Prosečno vreme potrebno za proizvodnju jednog proizvoda
za četiri posmatrane mašine je 4,75 min (4 min 45 s)
MEDIJANA
je vrednost obeležja koja se nalazi u sredini
serije čiji su članovi poređani po veličini
deli statističku seriju na dva jednaka dela
(50% nalazi se levo, a 50% desno od medijane)
MEDIJANA
je vrednost obeležja koja se nalazi u sredini
serije čiji su članovi poređani po veličini
deli statističku seriju na dva jednaka dela
(50% nalazi se levo, a 50% desno od medijane)
medijana za negrupisane podatke
 prvo se podaci moraju urediti u rastućem redosledu
 odredi se srednji podatak i on predstavlja medijanu
 određivanje srednjeg podatka zavisi od broja podataka u
seriji (paran ili neparan broj)
MEDIJANA
je vrednost obeležja koja se nalazi u sredini serije
čiji su članovi poređani po veličini
deli statističku seriju na dva jednaka dela (50%
nalazi se levo, a 50% desno od medijane)
medijana za negrupisane podatke
 prvo se podaci moraju urediti u rastućem redosledu
 odredi se srednji podatak i on predstavlja medijanu
 određivanje srednjeg podatka zavisi od broja podataka u seriji
(paran ili neparan broj)
MS Excel =MEDIAN(raspon podataka)
MEDIJANA
za statističke serije sa neparnim brojem
podataka n=2k+1
Primer: Za statističke podatke o broju članova 7
porodica odrediti medijanu
2 3 2 5 1 4 3
MEDIJANA
za statističke serije sa neparnim brojem
podataka n=2k+1
Primer: Za statističke podatke o broju članova 7
porodica odrediti medijanu
2 3 2 5 1 4 3
MEDIJANA
za statističke serije sa neparnim brojem
podataka n=2k+1
Primer: Za statističke podatke o broju članova 7
porodica odrediti medijanu
2 3 2 5 1 4 3
MEDIJANA
za statističke serije sa neparnim brojem podataka n=2k+1
Primer: Za statističke podatke o broju članova 7 porodica
odrediti medijanu
2
32 5 1 4 3
Medijana je 3
=median(B2:H2)
MEDIJANA
 za statističke serije sa parnim brojem
podataka n=2k
Primer: Za statističke podatke o broju članova 8
porodica odrediti medijanu
2 3 4 5 1 4 3 5
MEDIJANA
 za statističke serije sa parnim brojem podataka n=2k
Primer: Za statističke podatke o broju članova 8 porodica
odrediti medijanu
2
3 4 5 1 4 3 5
Medijana je (x4+x5)/2=(3+4)/2=3,5.
=median(B2:I2)
MEDIJANA
medijana podatke grupisane u intervale







n
 K m1
M e  Lm  2
i
fm
n 1
 K m1
Me  Lm  2
i
fm
m - medijalni interval
Lm - donja granica medijalnog intervala
fm - frekvencija medijalnog intervala

Km-1 – kumulativna frekvencija intervala koji prethodi
medijalnom
n– broj podataka u seriji
i - dužina medijalnog intervala
MEDIJANA vs SREDINA
Glavni nedostatak aritmetičke sredine je
negativan uticaj ekstremnih vrednosti
obeležja na njenu reprezentativnost.
MEDIJANA vs SREDINA
Glavni nedostatak aritmetičke sredine je
negativan uticaj ekstremnih vrednosti
obeležja na njenu reprezentativnost.
Primer: Neka su prosečne mesečne plate 14
radnika preduzeća 960, 840, 720, 540, 510,
645, 5500, 615, 645, 640, 855, 510, 630, 915
EUR. Odrediti aritmetičku sredinu i medijanu
navedenih plata.
MEDIJANA vs SREDINA
Glavni nedostatak aritmetičke sredine je negativan uticaj
ekstremnih vrednosti obeležja na njenu
reprezentativnost.
Primer: Neka su prosečne mesečne plate 14 radnika
preduzeća 960, 840, 720, 540, 510, 645, 5500, 615,
645, 640, 855, 510, 630, 915 EUR. Odrediti
aritmetičku sredinu i medijanu navedenih plata.
MEDIJANA vs SREDINA
Glavni nedostatak aritmetičke sredine je negativan uticaj
ekstremnih vrednosti obeležja na njenu
reprezentativnost.
Primer: Neka su prosečne mesečne plate 14 radnika
preduzeća 960, 840, 720, 540, 510, 645, 5500, 615,
645, 640, 855, 510, 630, 915 EUR. Odrediti
aritmetičku sredinu i medijanu navedenih plata.
=average(A1:N1)
prosečna plata 14 radnika je 1038,64 EUR
MEDIJANA vs SREDINA
Glavni nedostatak aritmetičke sredine je negativan uticaj
ekstremnih vrednosti obeležja na njenu
reprezentativnost.
Primer: Neka su prosečne mesečne plate 14 radnika
preduzeća 960, 840, 720, 540, 510, 645, 5500, 615,
645, 640, 855, 510, 630, 915 EUR. Odrediti
aritmetičku sredinu i medijanu navedenih plata.
=average(A1:N1)
=median(A1:N1)
prosečna plata 14 radnika je 1038,64 EUR
50% radnika imalo je platu manju od 653 EUR
MOD
je vrednost obeležja koja se najčešće javlja u
seriji, tj. vrednost obeležja s najvećom
frekvencijom
ukoliko se svaki podatak u seriji javlja samo
jednom onda mod ne postoji
serije koje imaju jedan mod - unimodalne,
serije s dva moda - bimodalne i serije s više
modova polimodalne
 na mod ne utiču ostale vrednosti obeležja
MOD
 je vrednost obeležja koja se najčešće javlja u seriji, tj.
vrednost obeležja s najvećom frekvencijom
 ukoliko se svaki podatak u seriji javlja samo jednom
onda mod ne postoji
 serije koje imaju jedan mod - unimodalne, serije s dva
moda - bimodalne i serije s više modova polimodalne
 na mod ne utiču ostale vrednosti obeležja
MS Excel =MODE(raspon podataka)
MOD PRIMER
Na jednom imanju prinos šljiva (kg) po stablu iznosio je:
22
18
19
23
20
28
27
25
22
26
=mode(A1:K1)
22
22
MOD
podaci grupisani u intervale
f m  f m1
M o  Lm 
i
( f m  f m1 )  ( f m  f m1 )






m - modalni interval
Lm - donja granica modalnog intervala
fm - frekvencija modalnog intervala
fm-1 - frekvencija intervala koji prethodi modalnom
fm+1 - frekvencija intervala koji je iza modalnog
i - dužina modalnog intervala
PRVI KVARTIL (Q1)
 poziciona vrednost obeležja za koju je 25%
podataka manje, a 75% podataka iz serije veće od
te vrednosti, ako su podaci uređeni po veličini
 za intervalno date podatke
n
 K m1
Q1  Lm  4
i
fQ1
MS Excel =QUARTILE(raspon podataka;1)

TREĆI KVARTIL (Q3)
 poziciona vrednost obeležja za koju je 75%
podataka manje, a 25% podataka iz serije veće od
te vrednosti, ako su podaci uređeni po veličini
 za intervalno date podatke
3n
 K m1
Q3  Lm  4
i
f Q3
MS Excel =QUARTILE(raspon podataka;3)

MERE ODSTUPANJA
MERE ODSTUPANJA ILI DISPERZIJE
za utvrđivanje i merenje gustine grupisanja
odnosno odstupanja od srednje vrednosti
u zavisnosti od načina izračunavanja dele se
na APSOLUTNE i RELATIVNE
MERE ODSTUPANJA ILI DISPERZIJE
za utvrđivanje i merenje gustine grupisanja
odnosno odstupanja od srednje vrednosti
u zavisnosti od načina izračunavanja dele se
na APSOLUTNE i RELATIVNE
– apsolutne mere odstupanja se iskazuju u jedinicama mere
obeležja (interval varijacije, srednje apsolutno odstupanje,
varijansa, standardna devijacija ...)
MERE ODSTUPANJA ILI DISPERZIJE
za utvrđivanje i merenje gustine grupisanja
odnosno odstupanja od srednje vrednosti
u zavisnosti od načina izračunavanja dele se
na APSOLUTNE i RELATIVNE
– apsolutne mere odstupanja se iskazuju u jedinicama mere
obeležja (interval varijacije, srednje apsolutno odstupanje,
varijansa, standardna devijacija ...)
– relativne mere odstupanja su neimenovani pokazatelji
varijabiliteta (koeficijent varijacije, normalizovana z
vrednost,...) – izražavaju se u procentima ili decimalnim
brojevima
INTERVAL VARIJACIJE (R)
 razlika između minimalne i maksimalne
vrednosti obeležja
INTERVAL VARIJACIJE (R)
 razlika između minimalne i maksimalne
vrednosti obeležja
RI x x
max
min
xmax- maksimalna vrednost obeležja
xmin- minimalna vrednost obeležja
INTERVAL VARIJACIJE (R)
 razlika između minimalne i maksimalne vrednosti
obeležja
RI x x
max
min
xmax- maksimalna vrednost obeležja
xmin- minimalna vrednost obeležja
lako se izračunava
uzima u obzir samo dve ekstremne vrednosti i
zanemaruje ostale podatke serije
INTERVAL VARIJACIJE (R)
 razlika između minimalne i maksimalne vrednosti
obeležja
RI x x
max
min
xmax- maksimalna vrednost obeležja
xmin- minimalna vrednost obeležja
 lako se izračunava
 uzima u obzir samo dve ekstremne vrednosti i
zanemaruje ostale podatke serije
MS Excel =MAX(raspon podataka)-MIN(raspon podataka)
INTERKVARTILNA RAZLIKA (IQ)
 razlika izmedju trećeg i prvog kvartila
I q  Q3  Q1
INTERKVARTILNA RAZLIKA (IQ)
 razlika izmedju trećeg i prvog kvartila
I q  Q3  Q1
lako se izračunava
isključuje 25% podataka sa najnižim
vrednostima i 25% podataka sa najvišim
vrednostima
INTERKVARTILNA RAZLIKA (IQ)
 razlika izmedju trećeg i prvog kvartila
I q  Q3  Q1
lako se izračunava
isključuje 25% podataka sa najnižim vrednostima
i 25% podataka sa najvišim vrednostima
MS Excel
=QUARTILE(raspon podataka;3)- QUARTILE(raspon
podataka;1)
VARIJANSA (S2)
varijansa za negrupisane podatke
VARIJANSA (S2)
varijansa za negrupisane podatke
n
s2 

2
(x

x
)
 i
i1
n
n

2
x
 i
i1
n
 x2
VARIJANSA (S2)
varijansa za negrupisane podatke
n
s2 
2
(x

x
)
 i
i1
n
n

2
x
 i
i1
n
 x2
varijansa nije pogodna za interpretaciju jer je izražena u
kvadratima jedinice u kojoj su izraženi podaci

VARIJANSA (S2)
varijansa za grupisane podatke
VARIJANSA (S2)
varijansa za grupisane podatke
n
s2 

2
(x

x
)
fi
 i
i1
n
n

2
x
 i fi
i1
n
 x2
VARIJANSA (S2)
varijansa za grupisane podatke
n
s2 
2
(x

x
)
fi
 i
i1
n
n

n

f
i1
i
2
x
 i fi
i1
n
 x2
KORIGOVANA VARIJANSA (S2)
Korigovana varijansa za negrupisane podatke
n
s2 

2
(x

x
)
 i
i1
n 1
n

2
2
x

nx
 i
i1
n 1
KORIGOVANA VARIJANSA (S2)
Korigovana varijansa za negrupisane podatke
n
s2 
2
(x

x
)
 i
i1
n 1
n

2
2
x

nx
 i
i1
n 1
Korigovana varijansa za grupisane podatke
n

s2 
2
(x

x
)
fi
 i
i1
n 1
n

2
2
x
f

nx
 i i
i1
n 1
STANDARDNA DEVIJACIJA (S)
kvadratni koren iz varijanse
s s
2
STANDARDNA DEVIJACIJA (S)
kvadratni koren iz varijanse
s s
2
standardna devijacija za negrupisane podatke
MS Excel =STDEVP(raspon podataka)
KOEFICIJENT VARIJACIJE (V)
se izračunava kao količnik standardne
devijacije i aritmetičke sredine i izražava se u
procentima
KOEFICIJENT VARIJACIJE (V)
se izračunava kao količnik standardne
devijacije i aritmetičke sredine i izražava se u
procentima
s
V  100%
x
KOEFICIJENT VARIJACIJE (V)
se izračunava kao količnik standardne
devijacije i aritmetičke sredine i izražava se u
procentima
koristi se za poređenje varijabiliteta u
različitim statističkim serijama
s
V  100%
x
KOEFICIJENT VARIJACIJE (V)
 se izračunava kao količnik standardne devijacije i
aritmetičke sredine i izražava se u procentima
 koristi se za poređenje varijabiliteta u različitim
statističkim serijama
s
V  100%
x
 ne zavisi od jedinice mere obeležja
 omogućava poređenje varijabiliteta statističkih serija
koje su iskazane u različitim jedinicama mere
KOEFICIJENT VARIJACIJE PRIMER
U jednom preduzeću prosečna plata je 900 EUR
sa standardnom devijacijom 150, a prosečan
radni staž zaposlenih je 17 godina sa
varijansom 25. Uporediti varijabilitet plata i
radnog staža u ovom preduzeću.
KOEFICIJENT VARIJACIJE PRIMER
U jednom preduzeću prosečna plata je 900 EUR
sa standardnom devijacijom 150, a prosečan
radni staž zaposlenih je 17 godina sa
varijansom 25. Uporediti varijabilitet plata i
radnog staža u ovom preduzeću.
Koeficijent varijacije za platu je
s
150
V  100% 
100%  16,67%
x
900
KOEFICIJENT VARIJACIJE PRIMER
U jednom preduzeću prosečna plata je 900 EUR sa
standardnom devijacijom 150, a prosečan radni staž
zaposlenih je 17 godina sa varijansom 25. Uporediti
varijabilitet plata i radnog staža u ovom preduzeću.
Koeficijent varijacije za platu je
s
150
V  100% 
100% 16,67%
x
900
Koeficijent varijacije za radni staž je

s
5
V  100%  100%  29,41%
x
17
NORMALIZOVANO ODSTUPANJE (Z)
 za poređenje odstupanja pojedinih vrednosti obeležja od
aritmetičke sredine
NORMALIZOVANO ODSTUPANJE (Z)
 za poređenje odstupanja pojedinih vrednosti obeležja od
aritmetičke sredine
 relativna mera varijacije kojom se udaljenost pojedinih
vrednosti obeležja od aritmetičke sredine izražava u standardnim
devijacijama
NORMALIZOVANO ODSTUPANJE (Z)
 za poređenje odstupanja pojedinih vrednosti obeležja od
aritmetičke sredine
 relativna mera varijacije kojom se udaljenost pojedinih
vrednosti obeležja od aritmetičke sredine izražava u standardnim
devijacijama
xi  x
z
s
PRIMER
Radnik jednog preduzeća ima platu 720 RUR, a
radnik drugog preduzeća ima platu 840 EUR.
Uporediti odstupanje plata od proseka
preduzeća, ako se zna da je u prvom
preduzeću prosečna plata 480 EUR sa
standardnom devijacijom 80, a u drugom
600 EUR sa standardnom devijacijom 60.
PRIMER
Radnik jednog preduzeća ima platu 720 RUR, a radnik drugog
preduzeća ima platu 840 EUR. Uporediti odstupanje plata od
proseka preduzeća, ako se zna da je u prvom preduzeću
prosečna plata 480 EUR sa standardnom devijacijom 80, a u
drugom 600 EUR sa standardnom devijacijom 60.
Prvi radnik
xi  x 720  480
z

3
s
80
PRIMER
Radnik jednog preduzeća ima platu 720 RUR, a radnik drugog
preduzeća ima platu 840 EUR. Uporediti odstupanje plata od
proseka preduzeća, ako se zna da je u prvom preduzeću
prosečna plata 480 EUR sa standardnom devijacijom 80, a u
drugom 600 EUR sa standardnom devijacijom 60.
Prvi radnik
xi  x 720  480
z

3
s
80
Drugi radnik z 
xi  x 840  600

4
s
60
PRIMER
Radnik jednog preduzeća ima platu 720 RUR, a radnik drugog
preduzeća ima platu 840 EUR. Uporediti odstupanje plata od
proseka preduzeća, ako se zna da je u prvom preduzeću prosečna
plata 480 EUR sa standardnom devijacijom 80, a u drugom 600
EUR sa standardnom devijacijom 60.
xi  x 720  480
z

3
s
80
xi  x 840  600
Drugi radnik
z

4
s
60
Prvi radnik
Ako bismo uporedili apsolutna odstupanja plata od proseka, zaključili
bismo da oba radnika imaju za 240 EUR veću platu od proseka
svog preduzeća. Apsolutno odstupanje nije pravi pokazatel,j jer ne
uzima u obzir variranje podataka oko srednje vrednosti.