Prezentacija sa formulama
Download
Report
Transcript Prezentacija sa formulama
DESKRIPTIVNA
STATISTIKA
PROGRAMSKI PAKETI… 2012
MERE
CENTRALNE TENDENCIJE
MERE CENTRALNE TENDENCIJE
dele se na IZRAČUNATE i POZICIONE
MERE CENTRALNE TENDENCIJE
dele se na IZRAČUNATE i POZICIONE
Izračunavaju se na osnovu svih podataka
statističke serije po određenom pravilu
(aritmetička sredina, geometrijska sredina,
harmonijska sredina)
MERE CENTRALNE TENDENCIJE
dele se na IZRAČUNATE i POZICIONE
Izračunavaju se na osnovu svih podataka statističke
serije po određenom pravilu (aritmetička sredina,
geometrijska sredina, harmonijska sredina)
Određuju se na osnovu pozicije podatka u seriji po određenom
pravilu (mod, medijana)
ARITMETIČKA SREDINA
najčešće korišćena MCT
prosečna vrednost koju dobijemo kada zbir
svih vrednosti obeležja podelimo sa njihovim
brojem
ARITMETIČKA SREDINA
najčešće korišćena MCT
prosečna vrednost koju dobijemo kada zbir svih
vrednosti obeležja podelimo sa njihovim brojem
aritmetička sredina za negrupisane podatke (prosta)
ARITMETIČKA SREDINA
najčešće korišćena MCT
prosečna vrednost koju dobijemo kada zbir svih
vrednosti obeležja podelimo sa njihovim brojem
aritmetička sredina za negrupisane podatke (prosta)
n
x
x1 x1 ... x n i1
x
n
n
xi-vrednosti obeležja iz serije
n-ukupan broj podataka
i
ARITMETIČKA SREDINA
najčešće korišćena MCT
prosečna vrednost koju dobijemo kada zbir svih vrednosti
obeležja podelimo sa njihovim brojem
aritmetička sredina za negrupisane podatke (prosta)
n
x1 x1 ... x n
x
n
xi-vrednosti obeležja iz serije
x
i
i1
n
n-ukupan broj podataka
MS Excel =AVERAGE(raspon podataka)
ARITMETIČKA SREDINA PRIMER
Broj prodatih automobila u toku 15 radnih dana na
jednom prodajnom mestu je
9 11 7 6 6 8 10 6 7 13 5 4 8 9 11.
Izračunati prosečan broj prodatih automobila na dan.
ARITMETIČKA SREDINA PRIMER
Broj prodatih automobila u toku 15 radnih dana na
jednom prodajnom mestu je
9 11 7 6 6 8 10 6 7 13 5 4 8 9 11.
Izračunati prosečan broj prodatih automobila na dan.
9 11 7 6 6 8 10 6 7 13 5 4 8 9 11
x
8
15
ARITMETIČKA SREDINA PRIMER
Broj prodatih automobila u toku 15 radnih dana na
jednom prodajnom mestu je
9 11 7 6 6 8 10 6 7 13 5 4 8 9 11.
Izračunati prosečan broj prodatih automobila na dan.
9 11 7 6 6 8 10 6 7 13 5 4 8 9 11
x
8
15
9
11
7
6
6
8
10
6
7
13
5
4
8
9
11
8
ARITMETIČKA SREDINA PRIMER
Broj prodatih automobila u toku 15 radnih dana na
jednom prodajnom mestu je
9 11 7 6 6 8 10 6 7 13 5 4 8 9 11.
Izračunati prosečan broj prodatih automobila na dan.
9 11 7 6 6 8 10 6 7 13 5 4 8 9 11
x
8
15
9
11
7
6
6
8
10
6
7
13
5
4
8
9
11
=AVERAGE(A1:O1)
8
ARITMETIČKA SREDINA
aritmetička sredina za grupisane podatke (ponderisana)
ARITMETIČKA SREDINA
aritmetička sredina za grupisane podatke (ponderisana)
k
x1 f1 x 2 f 2 ... x k f k
x
f1 f 2 ... f k
x f
i i
i1
k
f
i
i1
k-ukupan broj različitih podataka (varijeteta)
xi-vrednosti obeležja (varijeteti)
fi –frekvencije
ARITMETIČKA SREDINA PRIMER
Raspodela ocena iz PP za 200 studenata
ocena
5
6
7
8
9
10
Broj studenata
20
70
50
30
25
5
Odrediti prosečnu ocenu
ARITMETIČKA SREDINA PRIMER
Otvorimo novu radnu svesku u MS Excelu i
unesemo sledeće podatke:
ARITMETIČKA SREDINA PRIMER
zatim u novoj koloni računamo xf za svaki
varijetet
ARITMETIČKA SREDINA PRIMER
zatim u novoj koloni računamo xf za svaki
varijetet
=SUM(B2:B7)
ARITMETIČKA SREDINA PRIMER
zatim u novoj koloni računamo xf za svaki
varijetet
=SUM(B2:B7)
=SUM(C2:C7)
ARITMETIČKA SREDINA PRIMER
zatim u novoj koloni računamo xf za svaki
varijetet
=SUM(B2:B7)
=SUM(C2:C7)
=C8/B8
GEOMETRIJSKA SREDINA
definiše se kao n-ti koren iz proizvoda n
brojeva
u praksi se relativno retko koristi
GEOMETRIJSKA SREDINA
definiše se kao n-ti koren iz proizvoda n brojeva
u praksi se relativno retko koristi
geometrijska sredina za negrupisane podatke
G n x1x2 ...xn
xi-vrednosti obeležja iz serije
n-ukupan broj podataka
GEOMETRIJSKA SREDINA
definiše se kao n-ti koren iz proizvoda n brojeva
u praksi se relativno retko koristi
geometrijska sredina za negrupisane podatke
G n x1x2 ...xn
xi-vrednosti obeležja iz serije
n-ukupan broj podataka
MS Excel =GEOMEAN(raspon podataka)
HARMONIJSKA SREDINA
recipročna vrednost aritmetičke sredine
recipročnih vrednosti obeležja
koristi se kada su obeležja izražena u vidu
recipročnih pokazatelja
HARMONIJSKA SREDINA
recipročna vrednost aritmetičke sredine recipročnih
vrednosti obeležja
koristi se kada su obeležja izražena u vidu recipročnih
pokazatelja
harmonijska sredina za negrupisane podatke
H
n
1
1
...
x1
xn
xi-vrednosti obeležja iz serije
n-ukupan broj podataka
HARMONIJSKA SREDINA
recipročna vrednost aritmetičke sredine recipročnih
vrednosti obeležja
koristi se kada su obeležja izražena u vidu recipročnih
pokazatelja
harmonijska sredina za negrupisane podatke
H
n
1
1
...
x1
xn
xi-vrednosti obeležja iz serije n-ukupan broj podataka
MS Excel =HARMEAN(raspon podataka)
HARMONIJSKA SREDINA PRIMER
Četiri mašine proizvode istu vrstu proizvoda.
Mašina A proizvede jedan proizvod za 3
minuta, mašina B za 5 minuta, mašina C za 7
minuta, a mašina D za 6 minuta. Kolika je
prosečna produktivnost jedne mašine?
HARMONIJSKA SREDINA PRIMER
Četiri mašine proizvode istu vrstu proizvoda. Mašina A
proizvede jedan proizvod za 3 minuta, mašina B za 5
minuta, mašina C za 7 minuta, a mašina D za 6 minuta.
Kolika je prosečna produktivnost jedne mašine?
=HARMEAN(B2:B5)
HARMONIJSKA SREDINA PRIMER
Četiri mašine proizvode istu vrstu proizvoda. Mašina A
proizvede jedan proizvod za 3 minuta, mašina B za 5
minuta, mašina C za 7 minuta, a mašina D za 6 minuta.
Kolika je prosečna produktivnost jedne mašine?
=HARMEAN(B2:B5)
Prosečno vreme potrebno za proizvodnju jednog proizvoda
za četiri posmatrane mašine je 4,75 min (4 min 45 s)
MEDIJANA
je vrednost obeležja koja se nalazi u sredini
serije čiji su članovi poređani po veličini
deli statističku seriju na dva jednaka dela
(50% nalazi se levo, a 50% desno od medijane)
MEDIJANA
je vrednost obeležja koja se nalazi u sredini
serije čiji su članovi poređani po veličini
deli statističku seriju na dva jednaka dela
(50% nalazi se levo, a 50% desno od medijane)
medijana za negrupisane podatke
prvo se podaci moraju urediti u rastućem redosledu
odredi se srednji podatak i on predstavlja medijanu
određivanje srednjeg podatka zavisi od broja podataka u
seriji (paran ili neparan broj)
MEDIJANA
je vrednost obeležja koja se nalazi u sredini serije
čiji su članovi poređani po veličini
deli statističku seriju na dva jednaka dela (50%
nalazi se levo, a 50% desno od medijane)
medijana za negrupisane podatke
prvo se podaci moraju urediti u rastućem redosledu
odredi se srednji podatak i on predstavlja medijanu
određivanje srednjeg podatka zavisi od broja podataka u seriji
(paran ili neparan broj)
MS Excel =MEDIAN(raspon podataka)
MEDIJANA
za statističke serije sa neparnim brojem
podataka n=2k+1
Primer: Za statističke podatke o broju članova 7
porodica odrediti medijanu
2 3 2 5 1 4 3
MEDIJANA
za statističke serije sa neparnim brojem
podataka n=2k+1
Primer: Za statističke podatke o broju članova 7
porodica odrediti medijanu
2 3 2 5 1 4 3
MEDIJANA
za statističke serije sa neparnim brojem
podataka n=2k+1
Primer: Za statističke podatke o broju članova 7
porodica odrediti medijanu
2 3 2 5 1 4 3
MEDIJANA
za statističke serije sa neparnim brojem podataka n=2k+1
Primer: Za statističke podatke o broju članova 7 porodica
odrediti medijanu
2
32 5 1 4 3
Medijana je 3
=median(B2:H2)
MEDIJANA
za statističke serije sa parnim brojem
podataka n=2k
Primer: Za statističke podatke o broju članova 8
porodica odrediti medijanu
2 3 4 5 1 4 3 5
MEDIJANA
za statističke serije sa parnim brojem podataka n=2k
Primer: Za statističke podatke o broju članova 8 porodica
odrediti medijanu
2
3 4 5 1 4 3 5
Medijana je (x4+x5)/2=(3+4)/2=3,5.
=median(B2:I2)
MEDIJANA
medijana podatke grupisane u intervale
n
K m1
M e Lm 2
i
fm
n 1
K m1
Me Lm 2
i
fm
m - medijalni interval
Lm - donja granica medijalnog intervala
fm - frekvencija medijalnog intervala
Km-1 – kumulativna frekvencija intervala koji prethodi
medijalnom
n– broj podataka u seriji
i - dužina medijalnog intervala
MEDIJANA vs SREDINA
Glavni nedostatak aritmetičke sredine je
negativan uticaj ekstremnih vrednosti
obeležja na njenu reprezentativnost.
MEDIJANA vs SREDINA
Glavni nedostatak aritmetičke sredine je
negativan uticaj ekstremnih vrednosti
obeležja na njenu reprezentativnost.
Primer: Neka su prosečne mesečne plate 14
radnika preduzeća 960, 840, 720, 540, 510,
645, 5500, 615, 645, 640, 855, 510, 630, 915
EUR. Odrediti aritmetičku sredinu i medijanu
navedenih plata.
MEDIJANA vs SREDINA
Glavni nedostatak aritmetičke sredine je negativan uticaj
ekstremnih vrednosti obeležja na njenu
reprezentativnost.
Primer: Neka su prosečne mesečne plate 14 radnika
preduzeća 960, 840, 720, 540, 510, 645, 5500, 615,
645, 640, 855, 510, 630, 915 EUR. Odrediti
aritmetičku sredinu i medijanu navedenih plata.
MEDIJANA vs SREDINA
Glavni nedostatak aritmetičke sredine je negativan uticaj
ekstremnih vrednosti obeležja na njenu
reprezentativnost.
Primer: Neka su prosečne mesečne plate 14 radnika
preduzeća 960, 840, 720, 540, 510, 645, 5500, 615,
645, 640, 855, 510, 630, 915 EUR. Odrediti
aritmetičku sredinu i medijanu navedenih plata.
=average(A1:N1)
prosečna plata 14 radnika je 1038,64 EUR
MEDIJANA vs SREDINA
Glavni nedostatak aritmetičke sredine je negativan uticaj
ekstremnih vrednosti obeležja na njenu
reprezentativnost.
Primer: Neka su prosečne mesečne plate 14 radnika
preduzeća 960, 840, 720, 540, 510, 645, 5500, 615,
645, 640, 855, 510, 630, 915 EUR. Odrediti
aritmetičku sredinu i medijanu navedenih plata.
=average(A1:N1)
=median(A1:N1)
prosečna plata 14 radnika je 1038,64 EUR
50% radnika imalo je platu manju od 653 EUR
MOD
je vrednost obeležja koja se najčešće javlja u
seriji, tj. vrednost obeležja s najvećom
frekvencijom
ukoliko se svaki podatak u seriji javlja samo
jednom onda mod ne postoji
serije koje imaju jedan mod - unimodalne,
serije s dva moda - bimodalne i serije s više
modova polimodalne
na mod ne utiču ostale vrednosti obeležja
MOD
je vrednost obeležja koja se najčešće javlja u seriji, tj.
vrednost obeležja s najvećom frekvencijom
ukoliko se svaki podatak u seriji javlja samo jednom
onda mod ne postoji
serije koje imaju jedan mod - unimodalne, serije s dva
moda - bimodalne i serije s više modova polimodalne
na mod ne utiču ostale vrednosti obeležja
MS Excel =MODE(raspon podataka)
MOD PRIMER
Na jednom imanju prinos šljiva (kg) po stablu iznosio je:
22
18
19
23
20
28
27
25
22
26
=mode(A1:K1)
22
22
MOD
podaci grupisani u intervale
f m f m1
M o Lm
i
( f m f m1 ) ( f m f m1 )
m - modalni interval
Lm - donja granica modalnog intervala
fm - frekvencija modalnog intervala
fm-1 - frekvencija intervala koji prethodi modalnom
fm+1 - frekvencija intervala koji je iza modalnog
i - dužina modalnog intervala
PRVI KVARTIL (Q1)
poziciona vrednost obeležja za koju je 25%
podataka manje, a 75% podataka iz serije veće od
te vrednosti, ako su podaci uređeni po veličini
za intervalno date podatke
n
K m1
Q1 Lm 4
i
fQ1
MS Excel =QUARTILE(raspon podataka;1)
TREĆI KVARTIL (Q3)
poziciona vrednost obeležja za koju je 75%
podataka manje, a 25% podataka iz serije veće od
te vrednosti, ako su podaci uređeni po veličini
za intervalno date podatke
3n
K m1
Q3 Lm 4
i
f Q3
MS Excel =QUARTILE(raspon podataka;3)
MERE ODSTUPANJA
MERE ODSTUPANJA ILI DISPERZIJE
za utvrđivanje i merenje gustine grupisanja
odnosno odstupanja od srednje vrednosti
u zavisnosti od načina izračunavanja dele se
na APSOLUTNE i RELATIVNE
MERE ODSTUPANJA ILI DISPERZIJE
za utvrđivanje i merenje gustine grupisanja
odnosno odstupanja od srednje vrednosti
u zavisnosti od načina izračunavanja dele se
na APSOLUTNE i RELATIVNE
– apsolutne mere odstupanja se iskazuju u jedinicama mere
obeležja (interval varijacije, srednje apsolutno odstupanje,
varijansa, standardna devijacija ...)
MERE ODSTUPANJA ILI DISPERZIJE
za utvrđivanje i merenje gustine grupisanja
odnosno odstupanja od srednje vrednosti
u zavisnosti od načina izračunavanja dele se
na APSOLUTNE i RELATIVNE
– apsolutne mere odstupanja se iskazuju u jedinicama mere
obeležja (interval varijacije, srednje apsolutno odstupanje,
varijansa, standardna devijacija ...)
– relativne mere odstupanja su neimenovani pokazatelji
varijabiliteta (koeficijent varijacije, normalizovana z
vrednost,...) – izražavaju se u procentima ili decimalnim
brojevima
INTERVAL VARIJACIJE (R)
razlika između minimalne i maksimalne
vrednosti obeležja
INTERVAL VARIJACIJE (R)
razlika između minimalne i maksimalne
vrednosti obeležja
RI x x
max
min
xmax- maksimalna vrednost obeležja
xmin- minimalna vrednost obeležja
INTERVAL VARIJACIJE (R)
razlika između minimalne i maksimalne vrednosti
obeležja
RI x x
max
min
xmax- maksimalna vrednost obeležja
xmin- minimalna vrednost obeležja
lako se izračunava
uzima u obzir samo dve ekstremne vrednosti i
zanemaruje ostale podatke serije
INTERVAL VARIJACIJE (R)
razlika između minimalne i maksimalne vrednosti
obeležja
RI x x
max
min
xmax- maksimalna vrednost obeležja
xmin- minimalna vrednost obeležja
lako se izračunava
uzima u obzir samo dve ekstremne vrednosti i
zanemaruje ostale podatke serije
MS Excel =MAX(raspon podataka)-MIN(raspon podataka)
INTERKVARTILNA RAZLIKA (IQ)
razlika izmedju trećeg i prvog kvartila
I q Q3 Q1
INTERKVARTILNA RAZLIKA (IQ)
razlika izmedju trećeg i prvog kvartila
I q Q3 Q1
lako se izračunava
isključuje 25% podataka sa najnižim
vrednostima i 25% podataka sa najvišim
vrednostima
INTERKVARTILNA RAZLIKA (IQ)
razlika izmedju trećeg i prvog kvartila
I q Q3 Q1
lako se izračunava
isključuje 25% podataka sa najnižim vrednostima
i 25% podataka sa najvišim vrednostima
MS Excel
=QUARTILE(raspon podataka;3)- QUARTILE(raspon
podataka;1)
VARIJANSA (S2)
varijansa za negrupisane podatke
VARIJANSA (S2)
varijansa za negrupisane podatke
n
s2
2
(x
x
)
i
i1
n
n
2
x
i
i1
n
x2
VARIJANSA (S2)
varijansa za negrupisane podatke
n
s2
2
(x
x
)
i
i1
n
n
2
x
i
i1
n
x2
varijansa nije pogodna za interpretaciju jer je izražena u
kvadratima jedinice u kojoj su izraženi podaci
VARIJANSA (S2)
varijansa za grupisane podatke
VARIJANSA (S2)
varijansa za grupisane podatke
n
s2
2
(x
x
)
fi
i
i1
n
n
2
x
i fi
i1
n
x2
VARIJANSA (S2)
varijansa za grupisane podatke
n
s2
2
(x
x
)
fi
i
i1
n
n
n
f
i1
i
2
x
i fi
i1
n
x2
KORIGOVANA VARIJANSA (S2)
Korigovana varijansa za negrupisane podatke
n
s2
2
(x
x
)
i
i1
n 1
n
2
2
x
nx
i
i1
n 1
KORIGOVANA VARIJANSA (S2)
Korigovana varijansa za negrupisane podatke
n
s2
2
(x
x
)
i
i1
n 1
n
2
2
x
nx
i
i1
n 1
Korigovana varijansa za grupisane podatke
n
s2
2
(x
x
)
fi
i
i1
n 1
n
2
2
x
f
nx
i i
i1
n 1
STANDARDNA DEVIJACIJA (S)
kvadratni koren iz varijanse
s s
2
STANDARDNA DEVIJACIJA (S)
kvadratni koren iz varijanse
s s
2
standardna devijacija za negrupisane podatke
MS Excel =STDEVP(raspon podataka)
KOEFICIJENT VARIJACIJE (V)
se izračunava kao količnik standardne
devijacije i aritmetičke sredine i izražava se u
procentima
KOEFICIJENT VARIJACIJE (V)
se izračunava kao količnik standardne
devijacije i aritmetičke sredine i izražava se u
procentima
s
V 100%
x
KOEFICIJENT VARIJACIJE (V)
se izračunava kao količnik standardne
devijacije i aritmetičke sredine i izražava se u
procentima
koristi se za poređenje varijabiliteta u
različitim statističkim serijama
s
V 100%
x
KOEFICIJENT VARIJACIJE (V)
se izračunava kao količnik standardne devijacije i
aritmetičke sredine i izražava se u procentima
koristi se za poređenje varijabiliteta u različitim
statističkim serijama
s
V 100%
x
ne zavisi od jedinice mere obeležja
omogućava poređenje varijabiliteta statističkih serija
koje su iskazane u različitim jedinicama mere
KOEFICIJENT VARIJACIJE PRIMER
U jednom preduzeću prosečna plata je 900 EUR
sa standardnom devijacijom 150, a prosečan
radni staž zaposlenih je 17 godina sa
varijansom 25. Uporediti varijabilitet plata i
radnog staža u ovom preduzeću.
KOEFICIJENT VARIJACIJE PRIMER
U jednom preduzeću prosečna plata je 900 EUR
sa standardnom devijacijom 150, a prosečan
radni staž zaposlenih je 17 godina sa
varijansom 25. Uporediti varijabilitet plata i
radnog staža u ovom preduzeću.
Koeficijent varijacije za platu je
s
150
V 100%
100% 16,67%
x
900
KOEFICIJENT VARIJACIJE PRIMER
U jednom preduzeću prosečna plata je 900 EUR sa
standardnom devijacijom 150, a prosečan radni staž
zaposlenih je 17 godina sa varijansom 25. Uporediti
varijabilitet plata i radnog staža u ovom preduzeću.
Koeficijent varijacije za platu je
s
150
V 100%
100% 16,67%
x
900
Koeficijent varijacije za radni staž je
s
5
V 100% 100% 29,41%
x
17
NORMALIZOVANO ODSTUPANJE (Z)
za poređenje odstupanja pojedinih vrednosti obeležja od
aritmetičke sredine
NORMALIZOVANO ODSTUPANJE (Z)
za poređenje odstupanja pojedinih vrednosti obeležja od
aritmetičke sredine
relativna mera varijacije kojom se udaljenost pojedinih
vrednosti obeležja od aritmetičke sredine izražava u standardnim
devijacijama
NORMALIZOVANO ODSTUPANJE (Z)
za poređenje odstupanja pojedinih vrednosti obeležja od
aritmetičke sredine
relativna mera varijacije kojom se udaljenost pojedinih
vrednosti obeležja od aritmetičke sredine izražava u standardnim
devijacijama
xi x
z
s
PRIMER
Radnik jednog preduzeća ima platu 720 RUR, a
radnik drugog preduzeća ima platu 840 EUR.
Uporediti odstupanje plata od proseka
preduzeća, ako se zna da je u prvom
preduzeću prosečna plata 480 EUR sa
standardnom devijacijom 80, a u drugom
600 EUR sa standardnom devijacijom 60.
PRIMER
Radnik jednog preduzeća ima platu 720 RUR, a radnik drugog
preduzeća ima platu 840 EUR. Uporediti odstupanje plata od
proseka preduzeća, ako se zna da je u prvom preduzeću
prosečna plata 480 EUR sa standardnom devijacijom 80, a u
drugom 600 EUR sa standardnom devijacijom 60.
Prvi radnik
xi x 720 480
z
3
s
80
PRIMER
Radnik jednog preduzeća ima platu 720 RUR, a radnik drugog
preduzeća ima platu 840 EUR. Uporediti odstupanje plata od
proseka preduzeća, ako se zna da je u prvom preduzeću
prosečna plata 480 EUR sa standardnom devijacijom 80, a u
drugom 600 EUR sa standardnom devijacijom 60.
Prvi radnik
xi x 720 480
z
3
s
80
Drugi radnik z
xi x 840 600
4
s
60
PRIMER
Radnik jednog preduzeća ima platu 720 RUR, a radnik drugog
preduzeća ima platu 840 EUR. Uporediti odstupanje plata od
proseka preduzeća, ako se zna da je u prvom preduzeću prosečna
plata 480 EUR sa standardnom devijacijom 80, a u drugom 600
EUR sa standardnom devijacijom 60.
xi x 720 480
z
3
s
80
xi x 840 600
Drugi radnik
z
4
s
60
Prvi radnik
Ako bismo uporedili apsolutna odstupanja plata od proseka, zaključili
bismo da oba radnika imaju za 240 EUR veću platu od proseka
svog preduzeća. Apsolutno odstupanje nije pravi pokazatel,j jer ne
uzima u obzir variranje podataka oko srednje vrednosti.