Transcript STATISTIKA3
STATISTIKA 3. GRUPIRANJE, ANALIZA I GRAFIČKI PRIKAZ KVANTITATIVNIH PODATAKA GRUPIRANJE NUMERIČKIH PODATAKA Numerički podaci grupiraju se tako da se jedinice koje imaju istu ili sličnu vrijednost obilježja svrstavaju u istu grupu. Takve grupe nazivamo razredima Nužnost grupiranja kvantitativnih podataka Broj grupa (razreda) i principi preglednosti i preciznosti Princip preglednosti: podatke treba grupirati u što manje grupa čime se povećava preglednost Princip preciznosti: podatke treba grupirati u što više grupa kako se ne bi smanjila preciznost VRSTE NUMERIČKOG OBILJEŽJA Diskontinuirano Kontinuirano Svaki razred obuhvaća određeni raspon numeričkog obilježja ograničen donjom L1i i gornjom granicom L2i, tako da je: L1i<xi≤L2i Prvom razredu može nedostajati donja, a zadnjem razredu gornja granica. U tom slučaju prilikom analize moramo procijeniti nedostajuće granice. Ako su gornje granice prethodnog razreda za jedinicu manje od donjih granica slijedećeg razreda moramo formirati prave ili precizne granice ovisno o vrsti numeričkog obilježja. Nominalne granice Prave granice Precizne granice od do od do od do 1000 4999 1000 5000 999,5 4999,5 5000 9999 5000 10000 4999,5 9999,5 10000 14999 10000 15000 9999,5 14999,5 15000 19999 15000 20000 14999,5 19999,5 Diskontinuirano obilježje Kontinuirano obilježje L1i ≤ xi ≤ L2i L1i ≤ xi <L2i Veličina razreda je raspon vrijednosti obilježja obuhvaćen razredom a izračunava se kao razlika između donje granice tog razreda i donje granice prethodnog razreda: ii=L1i-L1i-1 Razredna sredina je prosjek donje i gornje granice razreda. Ona predstavlja vrijednost obilježja cijelog razreda. xi L1i L2i 2 Prave granice Razredna sredina od do xi 1000 5000 3000 5000 10000 7500 10000 15000 12500 15000 20000 17500 VRSTE FREKVENCIJA APSOLUTNE RELATIVNE “MANJE OD” KUMULATIVNE “VIŠE OD” Opseg statističkog skupa: broj jedinica statističkog skupa Total: ukupna vrijednost obilježja SREDNJE VRIJEDNOSTI POTPUNE (IZRAČUNATE) POZICIONE ARITMETIČKA SREDINA MEDIJAN (KVARTILI) GEOMETRIJSKA SREDINA MOD HARMONIJSKA SREDINA ARITMETIČKA SREDINA Aritmetička sredina je jednaki dio obilježja koji otpada na svaku jedinicu statističkog skupa x total opseg mase Grupirani niz Negrupirani niz k n x x i 1 N i n Nx xi i 1 x fx i i 1 k f i 1 i k k i 1 i 1 x f i f i xi i Osobine aritmetičke sredine: 1.xmin x xmax 1.xmin x xmax 3. ( xi x ) min 3. f i ( xi x ) 2 min 2. ( xi x ) 0 2 2. f i ( xi x ) 0 Osnovne operacije sa znakom Σ: 3 x i 1 i x1 x2 x3 3 a a a a 3a i 1 3 ax ax ax i 1 i 1 2 3 ax3 a( x1 x2 x3 ) a xi i 1 3 (a bx ) a bx a bx i i 1 3 1 3 (a bx ) (a 2 i 1 i i 1 2 3 a bx3 3a b xi i 1 3 2 2abxi b x ) 3a 2ab xi b 2 2 i 2 i 1 3 2 x i 1 2 i Dokaz osobina aritmetičke sredine: (x x) 0 x Nx x x i i i i 0 ( x a) ( x x ) ( x a) (x x ) N ( x a) N ( x a) i i i ( x x ) min ( x a) ( x x ) ( x a) ( x x ) 2( x ( x x ) 2 ( x x x ax ax ) N ( x a ) ( x x ) 2 x ( x x ) a ( x x ) N ( x a ) ( x x ) 2 ( x x )(x a ) N ( x a ) ( x x ) 2( x a ) ( x x ) N ( x a ) ( x a ) ( x x ) N ( x a ) 2 i 2 2 i 2 i i 2 i 2 i 2 i i 2 2 i i i 2 2 i i 2 2 i i 2 i 2 i 2 x )(x a ) ( x a ) 2 LINEARNA TRANSFORMACIJA OBILJEŽJA xi a xi a bd i d i b (x a) N (x a) i ( x a) x a i x a N xa di b x ab N N b f (x a) f (x x) (x a) f (x x) (x a) f (x a) f i i i i i i i f ( x a) fd x a x ab f f i i i i i i x a bd i Grafički prikažite slijedeće distribucije: Broj zaposle xi Broj trg. Radnji fi 1 2 3 4 5 Ukupno 20 10 30 25 15 100 Osobe koje traže zaposlenje u županiji " Godine starosti osobe od do u tis. 15 20 46 20 25 347 25 40 237 40 50 64 50 60 24 MOD Mod je vrijednost obilježja koja se najčešće pojavljuje, odnosno vrijednost obilježja kojoj pripada najveća frekvencija Broj zaposlenih Broj trg. Radnji Broj neispravnih proizvoda xi fi 1 20 od do fi 2 10 0 2 34 3 30 2 4 150 4 25 4 6 200 Ukupno 100 6 8 80 8 10 30 Broj kutija (b a ) Mo L1 i ( b a ) ( b c) Modalni razred je razred sa najvećom frekvencijom Ako razredi nisu jednaki potrebno je korigirati fr. L1-donja granica modalnog razreda b - najveća frekvencija a - frekvencija ispred modalnog razreda c - frekvencija iza modalnog razreda i - veličina modalnog razreda 500 Mo 4 200 150 50 2 4 2 4,59 200 150 200 80 170 Broj neispravnih proizvoda Broj kutija od do fi 0 2 34 2 4 150 4 6 200 6 8 80 8 10 30 500 250 (L1; b) 200 (L1+i; b) Y2 Y1 Y Y1 ( X X1 ) X 2 X1 (L1; a) 150 100 (L1+i; c) 50 0 0-2 2-4 Mo 4-6 6-8 8 - 10 c b c b ba ba AC ... Y b ( x L1 ) Y b ( x L1 ) BD... Y a ( x L1 ) Y a ( x L1 ) i i i i c b ba ( Mo L1 ) a b i i ba Mo L1 i babc c b ba b ( Mo L1 ) a ( Mo L1 ) i i i ( Mo L1 ) (a b) c bb a KUMULATIVNI NIZOVI Za slijedeću distribuciju frekvencija izračunajte oba Kumulativna niza te objasnite njihovo značenje. Nacrtajte odgovarajuće grafove. Broj neispravnih proizvoda od do 0 2 2 4 4 6 6 10 10 14 14 20 Broj kutija fi 34 150 200 80 30 6 500 MEDIJAN Medijan je srednja vrijednost obilježja koja statiatički niz dijeli na dva jednaka dijela; pola jedinica statističkog skupa ime vrijednost obilježja manju ili jednaku medijanu, a pola jedinica veću ili jednaku medijanu Statistički niz sortirati po veličini: Neparan broj jedinica: 2 r int N Me xr 1 Paran broj jedinica: rN 2 xr xr 1 Me 2 Radni staž 9 radnika poduzeća "X" 23 13 5 10 12 15 7 9 2 a) Izračunajte medijan koristeći formulu b) izračunajte medijan koristeći funkciju median c) Objasnite značenje dobivenog rezultata GRUPIRANI NIZOVI Broj neispravnih proizvoda Broj kutija F N f Me L1 2 i f med od do fi 0 2 34 34 2 4 150 184 L1 - donja granica medijalnog (kvartilnog) razreda 4 6 200 384 ∑f - kumulativna frekvencija ispred medijalnog (kvartilnog) razreda 6 8 80 464 fmed - originalna frekvencija medijalnog (kvartilnog) razreda 8 10 30 494 i - veličina medijalnog (kvartilnog) razreda 10 12 6 500 500 Medijalni (kvartilni) razred je onaj koji ima kumulativni frekvenciju neposredno veću od N/2 250 184 66 Me 4 2 4 2 4 0,66 4,66 200 200 500 Broj neispravnih proizvoda od do Broj kutija 450 400 F fi B(L1+i; ∑f+fmed) 350 N/2 300 0 2 34 34 2 4 150 184 4 6 200 384 6 8 80 464 100 8 10 30 494 50 10 12 6 500 0 A(L1; ∑f) 250 200 150 0 500 2 4 Me 6 8 10 12 f f f x L x L Y f AB...Y f med i 1 N f Me L1 2 i f med 1 i f med Kvartili Q1 (donji kvartil) N f Q1 L1 4 i fq Donji kvartil je srednja vrijednost koja niz dijeli tako da 25% jedinica ima vrijednost obilježja manju ili jednaku Q1 a 75% veću ili jednaku Q3 (gornji kvartil) Gornji kvartil je srednja vrijednost koja niz 3N f 4 Q3 L1 i fq dijeli tako da 75% jedinica ima vrijednost obilježja manju ili jednaku Q3 a 25% veću ili jednaku Za slijedeće podatke izračunajte: aritmetičku sredinu, mod, medijan i kvartile Studenti prema broju bodova na ispitu "X" Broj bodova od do Br. studenata 0 10 18 10 20 46 20 30 59 30 40 113 40 50 135 50 60 88 60 70 34 70 100 7 500 MJERE DISPERZIJE RASPON VARIJACIJE: (Raspon između najveće i najmanje vrijednosti obilježja) R X max X min INTERKVARTIL (Raspon srednjih 50% članova niza) I Q Q3 Q1 KOEFICIJENT KVARTILNE DEVIJACIJE (Relativna mjera za interkvartil) Q3 Q1 VQ 0 VQ 1 Q3 Q1 VARIJANCA (Prosječno kvadratno odstupanje od prosjeka) 2 2 2 2 2 x x x 2 x x x x x N x i i i i i 2 2x N N 2 2 x i N f x x N x2 2 2 f N 2 f x f x2 STANDARDNA DEVIJACIJA (Prosječno odstupanje od prosjeka) 2 KOEFICIJENT VARIJACIJE (Relativna mjera standardne devijacije) V x 100 N MOMENTI CENTRALNI MOMENTI MOMENTI OKO SREDINE POMOĆNI MOMENTI OKO “a” OKO NULE Centralni ili glavni momenti (momenti oko aritmetičke sredine) Prosječno odstupanje od aritmetičke sredine na određenu potenciju Za negrupirane podatke x x r Mr i i N Za grupirane podatke M0=1 M1=0 M2=δ2 Mr i f i xi x r f i i Pomoćni momenti oko nule Prosječno odstupanje od nule Za negrupirane podatke mr r x i i N Za grupirane podatke m0 1 m1 x fx f r i i i mr i i Pomoćni momenti oko “a” Prosječno odstupanje od “a” Za negrupirane podatke mˆ r r d i i N Za grupirane podatke mˆ 0 1 mˆ 1 d fd f i mˆ r i i i r i Izračunavanje centralnih momenata preko pomoćnih M 2 m2 m 2 1 M 3 m3 3m2 m1 2m 3 1 M 4 m4 4m3 m1 6m2 m12 3m14 ˆ2 m ˆ 12 ) M 2 b 2 (m ˆ 3 3m ˆ 2m ˆ 1 2m ˆ 13 ) M 3 b 3 (m 2 4 ˆ ˆ ˆ ˆ ˆ ˆ M 4 b (m4 4m3 m1 6m2 m1 3m1 ) 4 STANDARIZIRANO OBILJEŽJE Standardizirano obilježje je oblik linearne transformacije obilježja i pokazuje odstupanje obilježja od prosjeka izraženo u standardnim devijacijama. zi xi x xi x zi Za standardizirano obilježje vrijedi: z 0 z zi N xi x N 1 (x x) i N 0 z 1 xi x 2 2 ( z z ) z 1 i i 2 z 2 N N N 2 (x x) i N 2 1 2 1 2 Simetrična Desnostrana Q1 Mo 0 Q1 Mo Me x Q3 0 38 Me Q3 x Mo Me x M e Q1 Q3 M e M e Q1 Q3 M e 3 M3 3 Pearsonove mjere asimetrije Bowleyeva mjera asimetrije Mo x Me Q3 0 38 x Me MO Koeficijent α3 Ljevostrana Q1 x Me Mo Q3 M e M e Q1 2 3 2 Sk S kq x Mo Sk Q3 Q1 2me Q3 Q1 3( x M e ) 3 Sk 3 1 Skq 1 38 ZAOBLJENOST 4 Oštra α4>3 M4 4 4 0 Normalna α4=3 Tupa 1,8<α4<3 Za slijedeće distribucije ocjenite asimetriju i zaobljenost Studenti prema broju bodova na ispitu "X" Broj bodova Br. od do studenata 0 10 18 10 20 46 20 30 59 30 40 113 40 50 135 50 60 88 60 70 34 70 100 7 500 Pravokutna α4=1,8 U distribucija 0<α4<1,8 Red. br. Površina gospod. (ha) 1 5 2 3 3 2 4 1 5 4 6 3 7 6 8 3 Zadaci za vježbu 1. Za 5 poduzeća zadani su slijedeći podaci Ukupna Poduzeće plaća A 450000 B C 750000 D E 384000 Ukupno 2684000 Plaća po radniku 3000 3500 Broj radnika 200 300 120 870 3200 Plaću po radniku prikažite grafički i izračunajte prosječnu plaču za sva poduzeća zajedno 2. Akumulacija i udio akumulacije u neto proizvodu Djelatnosti Akumulacija INDUSTRIJA PROMET I VEZE TRGOVINA UGOST. I TURIZAM OSTALO 849 689 841 73 395 Udio akumulacije u neto proizvodu 0.567 0.579 0.756 0.553 0.508 a) Izračunajte prosječni udio akumulacije u neto proizvodu za sve djelatnosti zajedno b) Grafički prikažite udio akumulacije u neto proizvodu po djelatnostima 3. Struktura prometa tereta s inozemstvom u lukama Hrvatske i indeks prometa TRANZIT=100 u Sloveniji Promet tereta % u Hrvatskoj Indeks u Sloveniji IZVOZ 13 80 UVOZ 65 320 TRANZIT 22 100 Ako je u uvozu promet u Hrvatskoj bio 13000, a u Sloveniji 1600 strukturnim polukrugovima prikažite struktutu prometa u lukama slovenije i Hrvatske. 4. Živorođeni u Republici Hrvatskoj prema starosti majke 1990. starost majke 15 - 19 20 - 24 25 - 29 30 - 34 35 - 39 40 - (54) broj živorođenih 4 650 21 543 18 039 8 089 2 646 485 a) Izračunajte najčešću starost majki b) Ocijenite asimetriju distribucije preko Pearsonovih mjera asimetrije