Prezentacija

Download Report

Transcript Prezentacija

STATISTIKA
Metoda uzoraka
Slučajna varijabla i distribucija
vjerojatnosti



Statističke zakonitosti se očituju kada je broj
mjerenja „dovoljno velik“, jer se tada relativne
frekvencije stabiliziraju oko fiksnih brojeva –
vjerojatnosti.
Pri izgradnji matematičkih modela statističkih
fenomena polazi se od pretpostavke da je broj
mjerenja beskonačno velik. U modelu se umjesto
relativnih frekvencija, veličina ovisnih o broju
mjerenja, koriste vjerojatnosti. Stoga se u
statističkoj teoriji koriste distribucije vjerojatnosti
umjesto distribucija (relativnih) frekvencija, što je
činjeno u deskriptivnoj statistici.
Numerička veličina čiji oblik distribucije se analizira
u deskriptivnoj statistici je statističko obilježje X, a u
statističkoj teoriji slučajna varijabla X.
Slučajna varijabla i distribucija
vjerojatnosti



Slučajna varijabla je kvantitativna
veličina, rezultat statističkog pokusa, koja
može poprimiti različite vrijednosti.
Statistički ili slučajni pokus predstavlja
proces promatranja ili prikupljanja
podataka koji se može ponavljati u
jednakim uvjetima, a rezultat se ne može
sa sigurnošću predvidjeti.
Vjerojatnost je brojčana mjera nastanka
slučajnih (neizvjesnih) događaja. Imaju
dvije vrste vjerojatnosti, objektivna i
subjektivna vjerojatnost.
Slučajna varijabla i distribucija
vjerojatnosti



Objektivna vjerojatnost se temelji na
slučajnom uzorku koji se može ponavljati
u jednakim uvjetima.
Postoje dva pristupa utvrđivanja
objektivnih vjerojatnosti, klasični pristup
ili a priori vjerojatnost i statistička ili a
posteriori vjerojatnost.
Subjektivna vjerojatnost se temelji na
osobnoj procjeni nastupanja slučajnog
događaja.
Slučajna varijabla i distribucija
vjerojatnosti



Slučajna varijabla može biti diskretna i
kontinuirana.
Diskretna varijabla poprima konačan broj
izoliranih (cjelobrojnih) vrijednosti ili
prebrojivo mnogo vrijednosti.
Kontinuirana (neprekidna) varijabla
poprima vrijednosti iz određenog
intervala. Broj vrijednosti koje može uzeti
kontinuirana varijabla je beskonačan.
Slučajna varijabla i distribucija
vjerojatnosti

Distribucija vjerojatnosti diskretne slučajne
varijable je skup uređenih parova vrijednosti, gdje
prvi podatak u paru označava moguće vrijednosti
slučajne varijable, a drugi podatak se odnosi na
pripadajuću vjerojatnost
xi , p( xi ), i  1,2,...,k

-
Svaka distribucija vjerojatnosti diskretne slučajne
varijable mora ispunjavati slijedeće uvjete:
Vjerojatnosti u distribuciji vjerojatnosti ne mogu biti
negativne,
Zbroj vjerojatnosti koje pripadaju svim vrijednostima
slučajne varijable X mora biti jednak 1.
Slučajna varijabla i distribucija
vjerojatnosti


Funkcija distribucije pokazuje kolika je
vjerojatnost da diskretna slučajna varijabla X
poprimi neku određenu vrijednost x i ili manju
od te vrijednosti.
Dobiva se kumuliranjem vjerojatnosti iz
distribucije vjerojatnosti, slično kao što se
kumulativne frekvencije dobivaju postupnim
zbrajanjem apsolutnih frekvencija.
F ( xi )   P( xi )
x xi
Slučajna varijabla i distribucija
vjerojatnosti




Funkcija distribucije ima sljedeća matematička
svojstva:
Za bilo koju vrijednost x i vrijedi; 0  F ( xi )  1
F ()  0 i F ()  1 ;
Za x1  x2 vrijedi da je F ( x1 )  F ( x2 ) , što znači da
je funkcija distribucije monotono neopadajuća
funkcija.
Slučajna varijabla i distribucija
vjerojatnosti

Očekivana vrijednost diskretne slučajne
varijable predstavlja ponderiranu aritmetičku
sredinu svih mogućih vrijednosti slučajne
varijable X, gdje su ponderi odgovarajuće
vjerojatnosti u distribuciji vjerojatnosti.
Izračunava se pomoću izraza:
k
E ( X )   xi p ( xi )
i 1

Očekivana vrijednost slučajne varijable ima ista
svojstva kao i aritmetička sredina numeričke
varijable.U statističkim istraživanjima pojam
očekivane vrijednosti slučajne varijable se
poistovjećuje s aritmetičkom sredinom
osnovnog skupa . E (x)  
Slučajna varijabla i distribucija
vjerojatnosti

Varijanca je mjera disperzije distribucije
vjerojatnosti slučajne varijable. Za diskretnu
varijablu X varijanca je dana izrazom:


k
E ( X   )     ( xi   ) p ( xi )
2
2
2
i 1


k
   xi2 p( xi )   2
2
i 1
Varijanca distribucije vjerojatnosti kao i
varijanca distribucije frekvencija izražena je u
kvadratnim mjernim jedinicama varijable X. Da
bi se disperzija mjerila u mjernim jedinicama
varijable X vadi se drugi korijen, tako se dolazi
do standardne devijacije slučajne varijable X.
Relativna mjera disperzije je koeficijent
varijacije, koji se dobiva kao omjer standardne
devijacije i očekivane vrijednosti pomnožen sa
100
Slučajna varijabla i distribucija
vjerojatnosti

Mjera asimetrije distribucije vjerojatnosti je
omjer trećeg momenta oko sredine i
standardne devijacije podignute na treću
potenciju.


k
E  X     M 3   ( xi   ) 3 p ( xi )

3
i 1

M3
3
Mjera zaobljenosti distribucije vjerojatnosti se
dobiva kao omjer četvrtog momenta oko
sredine i standardne devijacije podignute na
četvrtu potenciju.


k
E ( X   )  M 4   ( xi   ) 4 p ( xi )
4
i 1

M4
4
Modeli distribucije vjerojatnosti


Modeli distribucije vjerojatnosti su analitički izrazi
kojima se opisuju varijacije slučajne varijable.
Prikazuju se pomoću algebarskih izraza (formula)
kojima se predstavlja povezanost između
vrijednosti slučajne varijable i pripadajućih
vjerojatnosti. Modeli distribucije vjerojatnosti se
nazivaju teorijskim distribucijama vjerojatnosti
Od teorijskih distribucija diskretne slučajne
varijable u primijenjenoj statistici najčešće se
koriste binomna i Poissonova distribucija.
(r  N ,0  p  1)
Modeli distribucije vjerojatnosti

Kaže se da diskretna slučajna varijabla X
ima binomnu razdiobu (distribuciju) s
parametrima r i p i piše se X~B (r, p) , ako
je njezin skup vrijednosti A  0,1,2,...,r ,
a
pripadne vjerojatnosti mogu se odrediti
pomoću formule:
 r  x rx
p( x)  P( X  x)    p q
 x
Modeli distribucije vjerojatnosti



Binomna distribucija je određena sa dva
parametra, a to su broj r koji predstavlja
broj pokusa i p – vjerojatnost uspjeha u
svakom pokusu.
Pokus prema komu je definirana binomna
distribucija naziva se Bernoullijev pokus,
prema J. Bernoulli (1654.-1705.)
Slučajna varijabla X predstavlja broj
uspjeha u nizu od r pokusa. Može uzeti
cjelobrojne vrijednosti od nula (nijedan
uspjeh u nizu od r pokusa) do r (uspjeh u
svakom pokusu).
Modeli distribucije vjerojatnosti

Najvažniji pokazatelji oblika binomne
distribucije mogu se odrediti pomoću
formula:
Očekivana vrijednost: E ( X )    rp

Varijanca:



 2  rpq
q p
Koeficijent asimetrije:

Koeficijent zaobljenosti:
  3
rpq
1  6 pq
rpq
Modeli distribucije vjerojatnosti



Poissonova distribucija je granični oblik
binomne distribucije.
Kada se broj pokusa u Bernoullijevu procesu
povećava, javlja se problem izračunavanja
vjerojatnosti da varijabla X uzme određenu
vrijednost prema formuli za binomnu
distribuciju.
Francuski matematičar S.D. Poisson je 1837.
godine razvio formulu prema kojoj se sa
zadovoljavajućom točnosti može aproksimirati
vjerojatnost iz binomne formule. Poissonova
formula je:
e  x
p( x) 
x!
Modeli distribucije vjerojatnosti



Za binomnu distribuciju vjerojatnosti se
mogu aproksimirati navedenom formulom
ako je vjerojatnost mala ( p  0,05)i ako je r
veliko (r  50) .
S obzirom da je p malo, kaže se da se
radi o rijetkim događajima.
Slučajnu varijablu X se definira kao broj
koliko puta se javio neki događaj u
jedinici vremena ili prostora.
Modeli distribucije vjerojatnosti

Kažemo da slučajna varijabla X ima
Poissonovu distribuciju (piše se X ~ Po( ))
ako je njezin skup vrijednosti A  0,1,2,..., a
pripadne vjerojatnosti dane su formulom
e  x
p( x) 
x!

Poissonova distribucija ima samo jedan
parametar, a to je  . Brojčano 
predstavlja prosječan broj pojavljivanja
nekog događaja u jedinici prostora ili
vremena
Modeli distribucije vjerojatnosti

Najvažniji pokazatelji Poissonove
distribucije mogu se odrediti pomoću
formula:
Očekivana vrijednost: E (X )    

Varijanca:



2 
Koeficijent asimetrije:

1

Koeficijent zaobljenosti:   3 
1

Distribucija vjerojatnosti kontinuirane
slučajne varijable



Distribucija vjerojatnosti
kontinuirane slučajne varijable
opisuje razdiobu vjerojatnosti na interval
vrijednosti slučajne varijable.
Kod kontinuirane slučajne varijable broj
mogućih vrijednosti je beskonačan, pa
nema smisla govoriti o vjerojatnosti da
slučajna varijabla X poprimi neku
određenu vrijednost .
Za kontinuiranu slučajnu varijablu može
se odrediti vjerojatnost da ona poprimi
vrijednosti iz određenog intervala.
Distribucija vjerojatnosti
kontinuirane slučajne varijable



Distribucija vjerojatnosti kontinuirane
varijable određena je matematičkom
funkcijom f (x) koja ima slijedeća svojstva:
Matematička funkcija kojom je određena
distribucija nije nikada negativna, tj.
f ( x)  0
Ukupna površina ispod krivulje navedene
funkcije uvijek je jednaka 1,
 f ( x)dx  1
D
Distribucija vjerojatnosti
kontinuirane slučajne varijable

Funkcija distribucije F (x) kontinuirane varijable
kao i kod diskretne varijable označava
vjerojatnost da slučajna varijabla poprimi
određenu vrijednost ili manju od te vrijednosti.
Izračunava se prema izrazu:
x
F ( x) 
 f ( x)dx


Vjerojatnost da slučajna varijabla bude iz
intervala ( x1 , x2 ) može se izračunati pomoću
izraza: P( x  X  x )  F ( x )  F ( x )
1
2
2
1
Distribucija vjerojatnosti
kontinuirane slučajne varijable
Očekivana
vrijednost se određuje pomoću izraza:

E (x)  
E( X )   xf ( x)dx



Disperzija
se mjeri varijancom i standardnom
devijacijom
kao drugim korijenom iz varijance.

 2   ( x   ) 2 f ( x)dx



Koeficijent asimetrije M 3   ( x   ) 3 f ( x)dx


Koeficijent zaobljenosti

M 4   ( x   ) 4 f ( x)dx


M4
4

M3
3
Modeli distribucije vjerojatnosti
kontinuirane varijable



Najvažniji model teorijske distribucije vjerojatnosti
uopće je normalna ili Gausssova distribucija.
Značenje ovog oblika distribucije u statističkoj teoriji i
statističkim istraživanjima se ogleda u tomu što se
mnoge empirijske pojave modeliraju normalnom
distribucijom.
Normalni raspored je prvi otkrio 1733. godine A. de
Moivre kao granični oblik binomne distribucije, tj.
promatrajući što se događa sa binomnom distribucijom
kada broj pokusa raste u beskonačnost. U drugoj
polovici XVIII. stoljeća ovaj oblik distribucije je
proučavao i P. Laplace. Godine 1809. C. Gauss i P.
Laplace su potpuno opisali ovaj oblik distribucije i izveli
matematičku funkciju normalne distribucije. Ovaj oblik
distribucije je poznat kao Gaussova ili GaussLaplaceova distribucija.
Modeli distribucije vjerojatnosti
kontinuirane varijable

Za kontinuiranu slučajnu varijablu X kaže
se da ima normalnu distribuciju s
2
2
parametrima  i  (piše se X~N (, ) ),
ako je njezina funkcija vjerojatnosti zadana
formulom:
f ( x) 
1
 2
e
1  x 
 

2  
2
Modeli distribucije vjerojatnosti
kontinuirane varijable


U navedenoj formuli veličine e i  su
konstante, što znači da je normalna
distribucija određena parametrima - 
očekivana vrijednost ili aritmetička sredina i
2
-  očekivana disperzija ili varijanca.
Oblik i svojstva normalne distribucije, zbog
složenosti njezine funkcije, mogu se bolje
uočiti iz grafičkog prikaza.
Grafički prikaz normalne distribucije
f(x)
0,5
0,4
2
N(μ ,σ )
0,3
0,2
0,1
x
0
μ
Normalna distribucija





Najvažnija svojstva normalne distribucije su:
Normalna kriva je zvonolikog oblika, unimodalna
je i simetrična u odnosu na pravac x   .
Aritmetička sredina, mod i medijan imaju istu
vrijednost.
Definirana je od   do   , asimptotski se
približava x-osi, pa je njezin raspon varijacija
beskonačan.
Relativna mjera asimetrije  je nula, a relativna
mjera zaobljenosti  ima vrijednost tri.
Normalna distribucija


Ukupna površina ispod krive je jednaka
jedan, kao kod svake funkcije distribucije.
Vjerojatnost da slučajna varijabla, koja
ima normalan oblik distribucije, poprimi
vrijednost iz intervala ( x1, x2) jednaka je:
P( x1  X  x2 )  F ( x2 )  F ( x1 )
x
gdje je F ( x) 
 f ( x)dx

.
Metoda uzoraka



Metoda uzoraka je dio statistike kojoj je glavni
zadatak da na temelju konačnog niza podataka
otkriva statističke zakonitosti i pripadne
parametre promatranih statističkih fenomena.
Metoda uzoraka polazi od proučavanja odnosa
između konačnog niza podataka (uzorka) i
modela distribucije vjerojatnosti slučajne
varijable.
Zaključci doneseni na temelju uzorka nemaju
apsolutnu sigurnost, već se govori o određenoj
pouzdanosti izvedenog zaključka.
Metoda uzoraka



Osnovne zadaće statističkog zaključivanja
pomoću metode uzoraka se odnose na
procjenjivanje nepoznatih parametara
osnovnog skupa (populacije) i na ispitivanje
pretpostavki (testiranje hipoteza) o
parametrima.
Da bi zaključci o karakteristikama osnovnog
skupa doneseni na temelju uzorka bili valjani,
uzorak mora biti reprezentativan.
Reprezentativnost uzorka se postiže odabirom
odgovarajućeg načina izbora elemenata u
uzorak.
Metoda uzoraka



S obzirom na način izbora jedinica,
razlikuju se slučajni i namjerni uzorci.
Namjerni uzorak se dobiva izborom
jedinica za koje istraživač, prema svom
osobnom uvjerenju, smatra da su tipične i
reprezentativne za dani osnovni skup.
Za slučajni uzorak imamo slučajan izbor
jedinica, nekom od metoda slučajnog
izbora
Metoda uzoraka




Reprezentativnost uzorka izabranog na temelju
prosudbe istraživača zavisi isključivo od
njegove osobne prosudbe i stručnosti.
U namjerne uzorke pored uzoraka koje
istraživač bira isključivo prema subjektivnoj
prosudbi, spadaju prigodni i kvotni uzorak.
Prigodni uzorak se bira ispitivanjem
jednostavno dostupnih članova osnovnog
skupa.
Kod kvotnog uzorka izbor jedinica određuju
istraživači (anketari), ali u sklopu dodijeljene
kvote.
Metoda uzoraka



Reprezentativnost uzorka se postiže
slučajnim izborom jedinica.
Za slučajne uzorke u statističkoj teoriji su
razvijene metode za statističko
zaključivanje o osnovnom skupu uz
objektivnu procjenu prihvatljivosti takvih
zaključaka.
Među slučajnim uzorcima najpoznatiji je
jednostavan slučajan uzorak, a još se
koriste stratificirani uzorak i uzorak
skupina.
Metoda uzoraka



Ako se iz osnovnog skupa veličine N izabire n
elemenata (n  N ) u uzorak tako da svaki
mogući uzorak ima jednaku vjerojatnost da
bude izabran, onda se takav uzorak naziva
jednostavan slučajan uzorak. Jednostavan
slučajan uzorak može biti uzorak s
ponavljanjem ili bez ponavljanja.
Izbor jedinica u uzorak iz konačnog skupa
provodi se pomoću tablice slučajnih brojeva.
Tablica slučajnih brojeva predstavlja niz
znamenki (ili skupina znamenki) u kojem svaka
znamenka ima jednaku vjerojatnost
pojavljivanja.
Metoda uzoraka


Kod slučajnog izbora jedinica u uzorak
može se primijeniti sistemski izbor. Za
sistemski izbor mora postojati uređen
popis svih statističkih jedinica.
U tablici slučajnih brojeva bira se samo
početak izbora, a dalje se biraju jedinice
prema koraku izbora. Ako se iz skupa
od N elemenata bira uzorak veličine n
članova, korak izbora predstavlja odnos
N/n.
Metoda uzoraka



Slučajan izbor jedinica u uzorak se koristi kada su
jedinice osnovnog skupa relativno homogene s
obzirom na karakteristike koje su predmet
istraživanja.
Ako postoji značajna varijabilnost elemenata
statističkog skupa, koristi se stratificirani uzorak.
Prvo se osnovni skup podijeli na homogene
skupine elemenata koji se nazivaju stratumi. Iz
svakog stratuma se slučajnim izborom bira
određeni broj jedinica u uzorak, proporcionalno
veličini stratuma.
Metoda uzoraka


Kada je osnovni skup velik i ne raspolaže
se popisom svih jedinica, može se koristiti
uzorak skupina.
Osnovni skup se podijeli na skupine koje
na neki način predstavljaju cjeline.
Skupine se obično razlikuju po veličini, a
sadrže heterogene jedinice čiji varijabilitet
je sličan onom u osnovnom skupu. U
uzorak se bira određeni broj skupina i to
slučajnim izborom.
Sampling distribucije


Deskriptivne mjere koje se izračunavaju pomoću
vrijednosti obilježja kod svih jedinica osnovnog
skupa nazivaju se parametri skupa. Najčešće
korišteni parametri su aritmetička sredina (  ) ,
standardna devijacija ( )i proporcija ( ) dijela
statističkih jedinica koje imaju određeno svojstvo.
Deskriptivne mjere koje se izračunavaju pomoću
podataka u uzorku se nazivaju statistika
uzorka. S obzirom da služe za procjenu
parametara osnovnog skupa nazivaju se
procjenitelj.
Sampling distribucije



Statistika uzorka je varijabla koja se
naziva sampling-varijabla.
Najznačajnije sampling-varijable su
aritmetička sredina uzoraka (X ) ,
standardna devijacija uzoraka (S) i
proporcija uzoraka (P).
Kod procjene parametara osnovnog skupa
pomoću uzorka bitno je poznavanje oblika
distribucije vjerojatnosti samplingvarijable ili kraće sampling-distribucije.

Sampling distribucije


Za sampling-distribuciju aritmetičkih
sredina uzoraka vrijede pravila:
Ako je slučajni uzorak veličine n izabran iz
normalno distribuiranog osnovnog skupa s
aritmetičkom sredinom  i standardnom
devijacijom , aritmetička sredina uzoraka
je slučajna varijabla X s normalnim
zakonom distribucije i parametrima 
(očekivana vrijednost) i  x (standardna
devijacija ili standardna greška procjene
aritmetičke sredine.

Sampling distribucije

Ako je slučajni uzorak dovoljno velik (n  30)
i izabran iz osnovnog skupa bilo kojeg
oblika distribucije promatranog obilježja s
aritmetičkom sredinom  i standardnom
devijacijom  , aritmetička sredina
uzoraka X teži normalnom obliku
distribucije sa parametrima  (očekivana
vrijednost) i  x (standardna devijacija ili
standardna greška procjene aritmetičke
sredine).
Sampling distribucije

Ako se napravi k mogućih uzoraka veličine
n iz osnovnog skupa od N elemenata, zatim
se izračuna aritmetička sredina za svaki
uzorak čije vrijednosti su x1 , x2 ,...,xk ,
onda je aritmetička sredina aritmetičkih
sredina svih mogućih uzoraka jednaka
aritmetičkoj sredini osnovnog skupa:
k
x
x
i 1
k
i

Sampling distribucije

Za odnos standardne devijacije osnovnog skupa i
standardne devijacije sampling-distribucije vrijedi
izraz:

x 


n
Navedena relacija o odnosu standardne devijacije
sampling-distribucije i standardne devijacije
osnovnog skupa vrijedi za beskonačne osnovne
skupove i za konačne skupove s ponavljanjem.
Izraz za standardnu grešku procjene aritmetičke
sredine za konačne skupove je:

N n
x 

N 1
n
Sampling distribucije


Drugi važan pokazatelj osnovnog skupa je
proporcija elemenata koji imaju određeno
svojstvo.
Proporcija elemenata osnovnog skupa s
određenim svojstvom se označava sa  i
predstavlja relativnu frekvenciju. Ako se elementi
osnovnog skupa razvrstaju na one koji imaju
traženo svojstvo i preostale elemente, onda se
proporcija izračunava prema izrazu   M N , gdje
je N ukupan broj elemenata osnovnog skupa, a M
broj elemenata sa zadanim svojstvom.
Sampling distribucije


Proporcija osnovnog skupa se procjenjuje
pomoću uzorka. Procjenitelj je proporcija
uzorka.
Proporcije uzoraka se razlikuju i predstavljaju
slučajnu varijablu koja se označava sa Pr . Za
korištenje proporcije uzorka kao procjenitelja
proporcije osnovnog skupa nužno je
poznavanje oblika distribucije slučajne varijable
Pr
Sampling distribucije


Sampling-distribucija proporcija za dovoljno
velike uzorke približno je normalnog oblika, s
očekivanom vrijednosti koja je jednaka
proporciji osnovnog skupa, tj. E ( Pr )   , i
standardnom devijacijom 
.
Pr
Standardna devijacija sampling-distribucije
proporcija se određuje pomoću izraza:
P 
  (1   )
n
Sampling distribucije


Sampling-distribuciju proporcija
uzorka opravdano je aproksimirati
normalnom distribucijom za velike
uzorke.
Praktično pravilo za definiciju
velikog uzorka je ispunjavanje
uvjeta:n    5 i n  (1   )  5.
Procjena parametara osnovnog skupa



Procjenjivanje nepoznatih parametara osnovnog
skupa temelji se na podacima koji predstavljaju
slučajan uzorak i na izračunu odgovarajuće
statistike uzorka ili procjenitelja.
Parametri se mogu procijeniti brojem i
intervalom.
Izračunata vrijednost statistike uzorka je procjena
parametra brojem, a procjena intervalom se
sastoji u određivanju granica raspona varijacije u
kojem se prema nekom kriteriju očekuje da će biti
vrijednost nepoznatog parametra.
Procjena parametara osnovnog skupa



Interval procjene aritmetičke sredine se
određuje kao interval vrijednosti oko
aritmetičke sredine uzorka.
Širina ovog intervala zavisi od
pouzdanosti procjene i oblika sampling
distribucije aritmetičkih sredina uzoraka.
Sampling-distribucija aritmetičkih sredina
uzoraka određene veličine ima normalan
oblik.
Px  z1 2   x    x  z1 2   x   1   
Procjena parametara osnovnog skupa



Standardna greška procjene aritmetičke sredine
je funkcija veličine uzorka. Za poznatu
vrijednost standardne devijacije osnovnog
skupa iznosi  x   n.
Međutim u praksi uglavnom nije poznata
standardna devijacija osnovnog skupa, već se
ona procjenjuje pomoću standardne devijacije
uzorka.
Izraz za nepristranu procjenu varijance je:
n
S2 
2


x

x
 i
i 1
n 1
Procjena parametara osnovnog skupa

Procijenjena vrijednost standardne greške je
Sx  S


n
x
t
Standardizirana varijabla T
S x ima oblik
tzv. Studentove ili T-distribucije sa stupnjeva
slobode (n  1)
Za velike uzorke sampling distribucija se može
aproksimirati normalnom distribucijom
P( x  z1 2  S x    x  z1 2  S x )  (1   )
P( x  t( 2;n1)  S x    x  t ( 2;n1)  S x )  (1   )
Procjena totala

Total T je zbroj vrijednosti numeričke varijable
N
konačnog osnovnog skupa,
T   xi
i 1



Total se može prikazati kao umnožak
aritmetičke sredine i broja jedinica u
statističkom skupu, T  N   .
Postupak procjenjivanja totala osnovnog skupa
pomoću uzorka temelji se na istim pravilima
kao i procjena aritmetičke sredine.
Procjena totala brojem dobiva se množenjem
broja jedinica osnovnog skupa i aritmetičke
sredine uzorka, ˆ
T  Nx
Procjena totala

Intervalna procjena totala uz pouzdanost se
dobiva pomoću izraza:


P Tˆ  z1 2 ST  T  Tˆ  z1 2 ST  1   

Standardna greška procjene totala se dobiva
kao umnožak standardne greške procjene
aritmetičke sredine i opsega osnovnog skupa,
ST  S x  N

Tˆ  N  x
Za male uzorke interval procjene je


P Tˆ  t ( 2;n1) ST  T  Tˆ  t ( 2;n1) ST  1   
Procjena proporcije

Proporcija konačnog osnovnog skupa je
odnos broja članova skupa koji imaju
određeno svojstvo M i ukupnog broja
članova skupa N,
 M N


Proporcija osnovnog skupa na temelju
podataka iz uzorka procjenjuje se brojem i
intervalom.
Procjena brojem se dobiva kao omjer broja
statističkih jedinica u uzorku koje imaju
traženo svojstvo m i veličine uzorka n,
pm n
Procjena proporcije



Za intervalnu procjenu proporcije nužno
je poznavanje oblika distribucije
proporcije uzoraka Pr .
Sampling distribucija proporcija može se
aproksimirati normalnom distribucijom
ako je uzorak dovoljno velik.
Kao praktično pravilo koristi se da je
aproksimacija zadovoljavajuća ako je
n  5
n(1   )  5
Procjena proporcije

Koristeći svojstva normalne distribucije
interval procjene proporcije osnovnog
skupa pomoću proporcije uzorka je:
P p  z1 / 2 P    p  z1 / 2 P   1   

Standardna greška proporcije je jednaka:
P 
 (1   )
n
Procjena proporcije

Vrijednost standardne greške se ne može
izračunati jer nije poznata proporcija osnovnog
skupa , pa se vrši njezina procjena na temelju
uzorka. Procijenjena standardna greška je:
SP 

p(1  p)
n 1
Navedeni izraz vrijedi za uzorke s frakcijom
izbora manjom od 5%, a za frakciju izbora veću
od 5% koristi se faktor korekcije, pa je izraz za
procijenjenu standardnu grešku:
SP 
p(1  p) N  n

n 1 N 1
Procjena proporcije


Zamjenom standardne greške proporcije
njezinom procijenjenom vrijednosti dobiva
se interval procjene proporcije osnovnog
skupa uz pouzdanost 1    .
Interval je:
P p  z1 / 2 S P    p  z1 / 2 S P   1   
Procjena ukupnog broja jedinica koje
imaju traženo svojstvo


Procjena ukupnog broja jedinica koje imaju
traženo svojstvo pomoću proporcije uzorka
je Mˆ  pN .
Procjena intervala u kojem će se kretati
ukupan broj jedinica s traženim svojstvom
uz pouzdanost 1    je:


ˆ z
ˆ
PM
1 / 2 S M  M  M  z1 / 2 S M  1   
Mˆ  p  N
SM  SP  N
Testiranje hipoteza







Postupak testiranja hipoteza o vrijednosti nekog
parametra osnovnog skupa provodi se prema
precizno definiranoj proceduri. Koraci u tom
postupku su:
formulacija statističke hipoteze;
izbor statistike testa i određivanje njezina oblika
distribucije;
određivanje razine značajnosti testa;
definiranje pravila na osnovu kojeg se odlučuje o
prihvaćanju ili odbacivanju hipoteze;
izbor slučajnog uzorka određene veličine i
izračunavanje statistike testa;
donošenje odluke o prihvaćanju ili odbacivanju
hipoteze.
Testiranje hipoteza



Statistička hipoteza se uvijek formulira kao
nulta i alternativna.
Nulta i alternativna hipoteza predstavljaju
dvije precizne, međusobno isključive tvrdnje o
vrijednosti nekog parametra osnovnog skupa.
dvosmjerni test
H 0 :   0
H1 :   0

jednosmjerni, test na gornju granicu

jednosmjerni, test na donju granicu
H 0 :   0
H 0 :   0
H1 :   0
H1 :   0
Testiranje hipoteza




Statistika testa ili test-statistika je kriterij
na osnovu kojeg se provodi testiranje.
Kod testiranja pretpostavki o vrijednosti
parametara osnovnog skupa  , statistika
testa je nepristrana procjena parametra 
ili neka transformacija te procjene.
Statistika testa je slučajna varijabla koja
poprima određeni oblik distribucije
vjerojatnosti.
Za primjer sampling-varijable aritmetičke
sredine vrijedi pravilo o normalnom obliku
2
distribucije ~ N, 0 , x 
Testiranje hipoteza

Njezina standardizirana vrijednost Z  X   0
x
za velike uzorke ima oblik jedinične normalne
distribucije Z ~ N 0,1, a za male uzorke
standardizirana varijabla
X  0
T
x
ima oblik T-distribucije za (n  1) stupnjeva
slobode.
Testiranje hipoteza


Kod testiranja pretpostavki o proporciji
osnovnog skupa, koristi se sampling-varijabla
proporcija Pr
i to za velike uzorke kada su ispunjeni uvjeti o
približno normalnom obliku distribucije, Pr
približno N  0 ,  . Njezina standardizirana
Pr   0
varijabla
Z

aproksimira se jediničnom normalnom
distribucijom Z ~ N 0,1.
Testiranje hipoteza


Vjerojatnost da se odbaci istinita nulta
hipoteza naziva se razina značajnosti
testa ili razina signifikantnosti testa i
obilježava se sa  .
Veličina 1    se naziva snaga testa i
izračunava se za susjedne vrijednosti
testiranog parametra  0 , za sve veće i
manje vrijednosti dok postoji preklapanje
površina ispod normalne krive.
Testiranje hipoteza


Kad se definira oblik distribucije statistike testa i
odredi razina značajnosti testa, može se odrediti
područje prihvaćanja nulte hipoteze.
Područje prihvaćanja nulte hipoteze može se odrediti
u jedinicama obilježja X (u istim jedinicama je i
sampling-varijabla), ili u standardiziranim
jedinicama. Kod dvostranih testova o vrijednosti
parametra gdje statistika testa ima normalni oblik,
kritične granice prihvaćanja nulte hipoteze izražene
u jedinicama obilježja i standardnim jedinicama su:
c1   0  z1 / 2   
c2   0  z1 / 2   
c1   z1 / 2
c2   z1 / 2
Testiranje hipoteza
Z ~ N (0,1)
(1 - α )
α/2
-z
Područje odbacivanja
0
Područje prihvaćanja
α/2
+z
Područje odbacivanja
Testiranje hipoteza
Z ~ N (0 , 1)
Z ~ N (0 , 1)
1-α
1-α
α
α
-z
Područje odbacivanja
0
0
Područje prihvaćanja
Područje prihvaćanja
z
Područje odbacivanja
Testiranje hipoteza


Naredni korak kod testiranja hipoteze jest
izbor slučajnog uzorka odgovarajuće
veličine. Za uzorak se vrše potrebni
obračuni i izračunava vrijednost statistike
testa.
Donošenje odluke - Ako je statistika testa
iz područja prihvaćanja nulte hipoteze,
nulta hipoteza se prihvaća kao moguća, a
alternativna hipoteza se odbacuje. U
protivnom, kada je vrijednost statistike
testa iz područja odbacivanja hipoteze,
prihvatit će se alternativna hipoteza.
Testiranje hipoteza o aritmetičkoj
sredini osnovnog skupa



Testiranje hipoteze o pretpostavljenoj vrijednosti
aritmetičke sredine osnovnog skupa provodi se na
osnovu slučajnog uzorka veličine n jedinica.
Statistika testa je aritmetička sredina uzoraka
koja predstavlja slučajnu varijablu. Samplingvarijable aritmetičkih sredina uzoraka, odnosno
njezina standardizirana vrijednost, može imati
oblik normalne distribucije ili T-distribucije. U
zavisnosti od oblika sampling-distribucije
testiranje hipoteza o aritmetičkoj sredini
osnovnog skupa provodi se pomoću z-testa ili ttesta.
Postupak testiranja hipoteze počinje
postavljanjem nulte i alternativne hipoteze.
Testiranje hipoteza o aritmetičkoj
sredini osnovnog skupa

Postavka hipoteze za dvosmjerni test
H 0 :   0

H1 :   0
Postavka hipoteze za jednosmjerni test na
gornju granicu
H 0 :   0

H1 :   0
Postavka hipoteze za jednosmjerni test na
donju granicu
H 0 :   0
H1 :   0
Testiranje hipoteza o aritmetičkoj
sredini osnovnog skupa


Statistika testa ili test veličina je samplingvarijabla aritmetičkih sredina koja ima normalni
2
zakon distribucije, X~ N( 0 , x ), ili
X  0
Z

standardizirana sampling-varijabla
x
koja ima jedinični normalni oblik distribucije,
Z ~ N (0,1) .
Pravilo odlučivanja o prihvaćanju ili odbacivanju
nulte hipoteze se postavlja u zavisnosti od
oblika hipoteze i razine značajnosti testa  .
Testiranje hipoteza o aritmetičkoj
sredini osnovnog skupa




Pravila odlučivanja kada je područje prihvaćanja
nulte hipoteze dano u mjernim jedinicama obilježja
su:
Kod dvostranog testa nulta hipoteza se prihvaća, na
razini značajnosti  , ako je aritmetička sredina
uzorka x iz intervala c1 , c2  , gdje je
c1  0  z1 / 2  S x c2  0  z1 / 2  S x
Kod jednostranog testa na gornju granicu nulta
hipoteza se prihvaća kada je aritmetička sredina
uzorka iz intervala  , c2 , gdje je c2  0  z1 S x
Kod jednostranog testa na donju granicu nulta
hipoteza se prihvaća kada je aritmetička sredina
uzorka iz intervala c , , gdje je c    z S
1
1
0
1 x
Testiranje hipoteza o aritmetičkoj
sredini osnovnog skupa


Pravila odlučivanja o prihvaćanju ili odbacivanju
nulte hipoteze kada je područje prihvaćanja dano
u standardiziranim jedinicama su:
Kod dvostranog testa nulta hipoteza se prihvaća,
na razini značajnosti  ,kada je empirijski zomjer po apsolutnoj vrijednosti manji od tablične
z vrijednosti za vrijednost funkcije distribucije
1   / 2
z  z1 / 2

Nulta hipoteza kod jednostranih testova na gornju
granicu se prihvaća kada je
zz
1

Nulta hipoteza kod jednostranih testova na donju
granicu se prihvaća kada je . z  z
1
Testiranje hipoteza o proporciji jedinica
osnovnog skupa koje imaju određeno svojstvo



Hipoteza o proporciji jedinica osnovnog
skupa koje imaju određeno svojstvo se
testira na osnovu slučajnog uzorka
veličine n statističkih jedinica.
Testiranje se provodi uobičajenim
postupkom koji počinje postavljanjem
hipoteza, nulte i alternativne.
Formulacija hipoteza zavisi od oblika testa
koji odgovara polaznoj pretpostavci o
proporciji osnovnog skupa.
Testiranje hipoteza o proporciji jedinica
osnovnog skupa koje imaju određeno svojstvo

Dvosmjerni
H0 :    0


H1 :    0
Jednosmjerni, test na gornju granicu
H0 :    0
H1 :    0
Jednosmjerni, test na donju granicu
H0 :    0
H1 :    0
Testiranje hipoteza o proporciji jedinica
osnovnog skupa koje imaju određeno svojstvo



Kod testiranja hipoteze o proporciji osnovnog
skupa, odgovarajuća statistika testa je proporcija
uzorka. Proporcija uzorka Pr je slučajna varijabla
čiji oblik distribucije je potrebno poznavati.
Kod testiranja hipoteza koristi se standardizirana
vrijednost sampling varijable Pr , koja se dobiva
pomoću izraza:
P 0
Z r
SP
Statistika Z, pod uvjetom da je H 0 istinita, ima
jedinični normalni oblik distribucije, Z ~ N 0,1 .
Znači, kada se radi o velikom uzorku, hipoteza o
proporciji se testira pomoću Z-testa.
Testiranje hipoteza o proporciji jedinica
osnovnog skupa koje imaju određeno svojstvo


Postupak testiranja se provodi izborom
slučajnog uzorka veličine n statističkih
jedinica. Za izabrani uzorak izračunava se
proporcija uzorka kao omjer broja
jedinica koje imaju određeno svojstvo i
veličine uzorka, p  m n .
U narednom koraku se u zavisnosti od
prihvaćene razine značajnosti testa
određuje područje prihvaćanja nulte
hipoteze. Područje prihvaćanja nulte
hipoteze je:
Testiranje hipoteza o proporciji jedinica
osnovnog skupa koje imaju određeno svojstvo

kod dvostranog testa interval c1 ,c2  , gdje je
c1   0  z1 / 2 S P

c2   0  z1 / 2 S P
kod jednostranog testa na gornju granicu
interval  , c2  , gdje je
c2   0  z1 S P

kod jednostranog testa na donju granicu
interval
c1   0  z1 S P
c1 ,
, gdje
je