EKO_ Modeli_binarnog..

Download Report

Transcript EKO_ Modeli_binarnog..

Ekonometrija 1D
Ekonometrija, Doktorske studije
Predavač: Aleksandra Nojković
Beograd, školska 2012/13
Napomena: U izradi prezentacija korišćena je literatura predviđena
IP predmeta i materijali prof. Zorice Mladenović.
Struktura predavanja


Veštačke promenljive u KLRM
Nelinearni modeli binarnog izbora
Veštačke promenljive


Koriste se da opišu uticaj kvantitativno
nemerljivih faktora na kretanje izabrane
zavisne promenljive
 U podacima preseka: potrošnja može
zavisiti od starosnih, polnih, regionalnih,
verskih i drugih razlika.
 U podacima vremenskih serija: efekti
intervencija i strukturnog loma.
Definišu se tako da uzimaju vrednost 1 za
jedan modalitet i 0 za drugi modalitet.
Veštačke promenljive (primena)


Najčešće obuhvataju uticaje neekonomske
prirode: kvalitataivne faktore (pol, bračno stanje,
zanimanje, pripadnost određenoj rasi, religijske i
kulturne razlike) ili privremene efekte (promene u
institucionalnom i političkom okruženju, ratni i
mirnodopski periodi, sezonski efekti, asimetrični
efekti).
Međutim, mogu obuhvatati i šire grupe kvantitativnih
efekata (dohodak ili godine starosti, kada je dovoljno
odabrati nekoliko karakterističnih, širih grupa: npr.
potrošači do i preko 35 godina ili oni sa dohotkom do
20000 din, između 20000-40000 din. i preko 40000
din.).
Promena nivoa osnovne inflacije u
Srbiji nakon uvođenja PDV
16
osnovna inflacija
14
12
10
8
6
4
0
1
2
3
4
5
6
stopa rasta nepljoprivrednog BDP
7
8
Načini uvođenja u model
Ispitujemo zavisnost potrošnje datog
proizvoda (Y) od dohotka (X1) prema
uzorku koji se sastoji od gradskih i
seoskih domaćinstava):

Yi = β0 + β1X1i + ui, i =1, 2, ..., n
Razlika se može ispoljiti u promeni:
1.
2.
3.
vrednosti odsečka – slobodnog člana (β0)
vrednost nagiba – marginalne sklonosti ka potrošnji
(β1) i
vrednost odsečka i nagiba (β0 i β1).
Promena vrednosti odsečka (β0)


Model koji obuhvata regionalne razlike u nivou
potrošnje uključuje veštačku promenljivu V,
definisanu kao:
0 , za seoskadom.
V
1, za gradska dom.
Polazni model postaje:
Yi = β0 + β1X1i + β2V + ui, i =1, 2, ..., n
Odnosno model postaje:
- za V = 0 (seoska dom.): Yi=β0+β1X1i+ui.
- za V = 1 (gradska dom.): Yi = (β0 +β2)+ β1X1i+ ui.

Grafički prikaz promene vrednosti
odsečka (β0)
Promena vrednosti nagiba (β1)

Ako pretpostavimo da postoji značajna razlika u
marginalnoj slonosti ka potrošnji gradskih i seoskih
domaćinstava, veštačka promenljiva se uvodi kao:
Yi = β0 + β1X1i + β3VX1i + ui, i =1, 2, ..., n

Ovom relacijom obuhvaćena su dva modela:
Yi=β0+β1X1i+ui.
- za V = 1 (gradska dom.): Yi=β0+(β1+β3)X1i+ui.
- za V = 0 (seoska dom.):
Grafički prikaz promene vrednosti
nagiba (β1)
Promena vrednosti odsečka i nagiba
(β0 i β1)

Polaznu funkciju proširujemo sa dve
promenljive V i VXi i model postaje:
Yi = β0 + β1X1i + β2V + β3VX1i + ui.

Jednačinu je moguće raščlaniti na dve funkcije:
Yi = β0 + β1X1i + ui, za seoska domać.
Yi = (β0+β2) + (β1+β3)X1i+ ui, za gradska domać.
Grafički prikaz promene vrednosti
odsečka (β0) i nagiba (β1)
Interakcija različitih faktora


Za istarživanje interakcije različitih faktora formiraju se
nove veštačke promenljive kao proizvodi već definisanih
veštačkih promenljivih.
Ako pretpostavimo da se ocenjuje uticaj pola i dve
kategorije domaćinstava (gradska i seoska) na potrošnju
nekog proizvoda, onda model postaje:
Yi = β0 + β1X1i + β2V1 + β3V2 + β4V3 + ui,
gde su veštačke promenljive definisane kao:
0 , za seoskadom.
V1  
1, za gradska dom.
i
dok je interakcija V3=V1V2=
0 , za muškarce
V2  
za žene
1,
1, za žene u gradskim dom.

0 , za ostale kategorijes tan.
Pravila ocenjivanja modela sa
veštačkim promenljivima



Dodeljivanje vrednosti 0 i 1 za pojedine
modalitete potpuno je proizvoljno i ne
menja konačne zaključke.
Broj veštačkih promenljivih uvedenih u
model uvek je za jedan MANJI od broja
modeliteta (izbegavamo “ zamku veštačke
promenljive “).
Identični rezultati dobijaju se ocenjivanjem
dve odvojene regresije, kada raspolažemo
dovoljnim brojem podataka.
Testiranje sezonskih efekata


Izražena sezonska priroda pojedinih ekonomskih
promenljivih modelira se uvođenjem sezonskih
veštačkih promenljivih.
Na primer, potrošnja sladoleda pre capita (Y) zavisi od
realnog dohotka (X1), relativne cene (X2) i godišnjeg
doba, što predstavljamo modelom:
Yi = β0 + β1X1 + β2X2 + β3S1 + β4S2 + β5S3 + ui,
gde smo sa S1, S2 i S3 označili sezonske veštačke
promenljive definisane kao:
1, za opservacije i  tog k var tala i  1, 2 ili 3
Si  
u ostalim k var ta lim a
0 ,

Dovoljne su TRI veštačke promenljive za obuhvatanje
ČETIRI modaliteta !
Sezonski karakter vremenskih serija
srpske i crnogorske privrede privrede
Mesečni podaci
Kvartalni podaci
Broj nocenja turista u CG (log)
Indeks industrijske proizvodnje
5.0
15
4.8
14
4.6
13
4.4
12
4.2
11
4.0
10
3.8
9
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2001
2002
2003
2004
2005
2006
2007
2008
Sta kada je zavisna
promenljiva veštačka?
Mikroekonometrijski modeli
kvalitativene (diskretne) zavisne
promenljive: LMV, probit i logit.
Struktura predavanja
•
•

-
.
Uvodna razmatranja o modelima
specifične zavisne promenljive
Modeli diskretnog izbora
Modeli binarnog izbora
Specifikacija
Ocenjivanje
Zaključivanje
Primena modela specifične
zavisne promenljive



Predstavljaju standardni metodološki okvir
mikroekonometrijske analize, odnosno analize odluka
koje donose pojedinci, domaćinstva ili preduzeća.
Intenzivno se primenjuju u analizi uporednih podataka i
najveću primenu nalaze u istraživanjima tržišta rada,
ponašanju potrošača i ekonomiji saobraćaja.
U novim ekonometrijskim istraživanjima otvoreno je
pitanje primene ekonometrijskih metoda modela
specifične zavisne promenljive u analizi strukturnih
odnosa makroekonomskih vremenskih serija i podataka
panela.
Modeli specifične zavisne
promenljive

1)
Dve klase ekonometrijskih modela čije su
zavisne promenljive specifične:
Modeli kvalitativne/prekidne zavisne promeljive
(engl. qualitative respones models ili models for
discrete choice)
2) Modeli zavisne promenljive sa ograničenjim
(engl. limited dependent variable models)
Modeli prekidne zavisne
promenljive
-
Modeli binarnog izbora (engl. models for
binary choice)
-
Modeli višestrukog izbora (engl.
multionominal-choice models)
-
Modeli prebrojivih događaja (engl. count
data models)
Modeli zavisne promenljive
promenljive sa ograničenjem
-
Modeli odsečene raspodele zavisne
promenljive (engl. models for truncated
distributions)
-
Modeli cenzurisane zavisne promenljive
(engl. censored data models)
-
Modeli korekcije uzoračkog izbora
-
Modeli trajanja (engl. duration models)
Modeli diskretnog izbora



Modeli diskretnog izbora su modeli u kojima zavisna
promenljiva uzima dva ili više modlaiteta, a još ih nazivamo
i modelima kvalitativnog odgovora/ishoda.
Modeli ove grupe mogu biti modeli binarnog i modeli
višestrukog izbora (engl. binominal and multinomial
models), u zavisnosti da li izbor vrši između dve ili više
mogućih alternativa.
Modeli višestrukog izbora se dalje dele na modele
nepoređanog i modele poređanog izbora, kao i modele
prebrojivih podataka/događaja (zavisna promenljiva uzima
cele, nenegativne vrednosti).
Literatura

Preporučena udžbenička literatura iz ove
oblasti: Maddala (1986), Amemiya
(1985), Wooldridge (2010) and Greene
(2011)
Primeri promenljivih diskretnog izbora


Broj nedozvoljenih minusa koje je vlasnik kreditne kartice
ostvario u određenom periodu, broj poseta lekaru, broj
avionskih/pomorskih nesreća i slično: y = 0,1, 2, ….Ovo su
primeri prebrojivih događaja (preovlađuje broj ishoda
nula, a zavisna promenljiva uzima diskretne vrednosti)
Odluka pojedinaca o učešću u radnoj snazi ili članstvu u
sindikatu: y uzima vrednost 1 ako je pojedinac zaposlen
(član sindikata), a 0 u suprotnom slučaju. Postoji i drugi
primeri izbora između dve alternative. Šta opredeljuje
pojedinca da kupi automobili ili prestane da puši? Koji
faktori utiču na odluku o rađanju dece ili odluku banke da
odobri stambeni kredit? Koje determinante opredeljuju
međunarodne fin. institucije da uđu u kreditni aranžman ili
odobre pomoć nekoj zemlji?
Primeri promenljivih diskretnog
izbora (nastavak)


Stav pojedinaca u istraživanjima javnog mnjenja
(npr. 0 – neslaganje u potpunosti do 4 – slaganja u
potpunosti), istraživanje zaposlenosti (pojedinac
može biti nezaposlen, zaposlen sa nepunim ili punim
radnim vremenom), nivo obrazovanja ili
preferencije potrošača su primeri poređanih
alternativa (rang dodeljen zavisnoj promenljivoj je
ordinalnog karaktera)
Izbor zanimanja (npr. 1-nekvalifikovan radnik do 5stručnjak), izbor načina plaćanja (gotovina ili
različite vrste platnih kartica) ili izbor prevoznog
sredstava (npr. 1-automobil, 2-autobus i 3-voz), su
primeri izbora između nepoređanih alternativa. Ovi
vrednosti zavisne promeljive ne predstavljaju ni
prebrojive podatke ni dodeljene rangove.
Modeli binarnog izbora


Analiziramo model kojim se opisuje odluka banke da
prihvati ili odbije zahtev za odobravanje stambenog
kredita (y=1 ako je zahtev odbijen, odnosno 0 pri
surotnoj odluci).
Linearni model verovatnoće, LMV (engl. Linear
probability model, LPM)) je specijalan slučaj
višestrukog linearnog regresionog modela sa 0/1
zavisnom promenljivom:
yi = β’xi + εi ,
pri čemu je x vektor objašnjavajućih promenljivih,
dok je β vektor nepoznatih parametara kojima se
opisuje uticaj na verovatnoću realizacije ishoda y=1
do koje dovodi promena objašnjavajućih
promenljivih za jednu jedinicu.
Nedostaci LMV:
1. Prisutna heteroskedastičnost:
var (εi) = β’xi (1- β’xi).
2. Ne možemo ograničiti β’xi u intervalu [0, 1].
Ovi modeli često predviđaju nelogične
verovatnoće (negativne vrednosti i vrednosti
veće od 1), kao i negativne varijanse.
3. Verovatnoća ishoda 1 raste linearno sa rastom
X (βi promena verovatnoće Y=1 sa rastom Xi
za jednu jedinicu).
Rešenje prvog nedostatka
(neefikasnih ocena LMV)


1.
Asimptotski efikasan metod ocenjivanja su ponderisani
najmanji kvadrati (engl.Weighted least sqears).
Postupak se sprovodi u dva koraka:
Prvo se jednačina LMV oceni metodom običnih najmanjih
kvadrata, a zatim se izračunaju vrednosti pondera:
w i  yˆ i 1  yˆ i  1 / 2.
2.
Ponovnom primenom običnih najmanjih kvadrata oceni
regresija yi /wi na xi /wi.
-
Mogu se dobiti negativne vrednosti pondera wi (mala
verovatnoća u velikim uzorcima).
Problemi koji ostaju u LMV
-
Kako vrednosti zavisne promenljive nisu normalno
raspodeljene, ni jedan metod ocenjivanja linearan po y u
opštem slučaju nije efikasan.
-
R2 u ovim modelima su daleko ispod vrednosti 1 i u većini
praktičnih istraživanja se kreću od 0.2 do 0.6.
-
Izračunata verovatnoća se u praksi često nalazi izvan
granica intervala (0, 1). Kao moguće rešenje predlaže
se pripisivanje vrednosti 0 i 1, za dobijene negativne
vrednosti, odnosno vrednosti zavisne promenljive veće od
jedan, redom.
-
Najveći nedostatak ovih modela sadržan u pretpostavci da
rast x dovodi do linearnog rasta y.
Novi pristup modeliranju binarnog izbora

Potrebno je obezbediti da se ocenjena verovatnoća nađe unutar
intervala 0-1 (prikazano isprekidanom linijom).
Nelinearni modeli binarnog izbora


Odgovarajuće funkcije raspodele koje se najčešće
koriste su: normalna funkcija raspodele (engl.
cumulative normal function) i logistička
funkcija raspodele (engl. logistic function).
Pored toga što ovi modeli obezbeđuju da se
predviđene verovatnoće nađu u intervalu 0-1,
uticaj jedinične promene objašnjavajuće
promenljive na verovatnoću pozitivnog ishoda
nije linearan, već zavisi od stepena strmosti
funkcije raspodele za date vrednosti x
(verovatnoća se približava nuli, kao i jedinici po
sve sporijoj stopi).
Primer 1: Odluka banke o
odobrenju kredita



Izvor: J. Stock and M. Watson, Introduction to
Econometrics, Addison Wesley, Pearson
International Edition, 2003.
HMDA data (Home Mortgage Disclosure Act) su
podaci koji se odnose na zahteve za odobravanje
hipoteka podnetih u oblasti Bostona
(Massachusetts) tokom 1990 godine.
28% prijava koje su podneli afro-amerikanci je
odbijeno, dok je to slučaj sa samo 9% prijava
podnetih od strane belaca. Dokaz rasne
diskriminacije?
Primer 1 (nastavak): Osnovni modeli

LMV: Pr ( Y=1| X1, X2, …, Xk) = β0 + β1X1 + β2X2 +…+ βkXk.

Probit Model: Pr ( Y=1| X) = Φ(β0 + β1X1 + β2X2 +…+ βkXk).

Logit Model: Pr ( Y=1| X) = Λ(β0 + β1X1 + β2X2 +…+ βkXk) =

1
1 e
 (  0  1 x1 ...  k xk )
.
Nelinearni modeli

Model uslovne verovatnoće definisan je kao:
E [y | x] = 0 [1- F (β’x)] + 1 [ F (β’x)] = F (β’x)

Opredeljenje za ma koju funkciju raspodele
verovatnoće ne obezbeđuje da ocenjeni parametri
modela predastavljaju marginalne efekte koje
interpretiramo na način uobičajen za linearne modele.
Marginalni efekti se u opštem slučaju izračunavaju kao:
 E y x 
x
 dF ' x 

  f  ' x   ,
 d  ' x  
gde je ƒ(.) funkcija gustine koja odgovara funkciji
raspodele F(.).
Izračunavanje marginalnih
efekata




Za slučaj normalne funkcije raspodele marginalni
efekti se izračunavaju kao: [Φ (β’x) β ], dok je za
slučaj logit modela: [ Λ(β’x) (1- Λ(β’x)) β].
Znak koeficijenta zaista odgovara smeru
promene verovatnoće.
Uobičajeno je da se marginalni efekti izračunavaju
za vrednosti aritmetičkih sredina vektora x (pri
čemu veštačke objašnjavajuće promeljive uzimaju
vrednost 0) ili pak za neku drugu vrednost x od
interesa.
Marginalni efekat se može dobiti i kao aritmetička
sredina marginalnih efekata izračunatih za vrednost
svake pojedinačne opservacije u uzorku.
Nelinearni modeli – alternativni pristup

Zasniva se na primeni modela indeksne funkcije β’xi (engl. index
function models). U model uvodimo pojam latentne promenljive yi*
koja definisana kao:
yi* = β’xi + εi .
Ova promenjiva se ne opaža u praksi, a ono što opažamo je
veštačka/indikator promenljiva y koja je definisana na sledeći
način:
yi = 1 if yi* > 0 i yi = 0 if yi* ≤ 0.

U ovoj formulaciji modela, F(β’xi) nije E (yi /xi) kao u LMV, već je
E(yi* / xi).
 Sada je verovatnoća da je Y =1 :
E [yi* | x] = Pr [yi =1 | x]
Pr (Yi = 1) = Prob (εi > - β’xi) = 1 – F (-β’xi) ,
gde je F odgovarajuće funkcija raspodele slučajne greške ε.
Logit i probit modeli

Ukoliko pretpostavimo logističku funkciju raspodele za
slučajnu grešku εi , dolazimo do specifikacije logit modela:
Prob (Y = 1) = eβ’x / (1+ eβ'x) = Λ (β’x),
pri je Λ (.) oznaka logističke funkcije raspodle.

U probit modelu (još se naziva i normit model)
pretpostavljamo normalnu standardizovanu funkciju raspodle
slučajne greške (εi : N (0,1)) iz čega sledi:
Prob Y  1 
 'x


  
1
exp  t 2 2 dt 
2
 'x
  t dt   ' x

gde je Φ (.) uobičajena notacija za standardizovanu normalnu
raspodelu.
Logit ili Probit model?

Osim što je matematički jednostavniji za ocenjivanje, logit model
rešavanjem po β’x daje sledeću relaciju:
 P 
 'x

e


  1  P 
gde je Pi verovatnoća realizacije pozitivnog ishoda, y=1, dok je (1-Pi)
verovatnoća realizacije suprotnog događaja, y=0. Količnik [Pi / (1-Pi)]
je poznat “odds ratio” (odnos verovatnoća prvog i drugog izbora).
Prirodni logaritam odnosa ovih verovatnoća je:
ln [ P / (1-P)] = β’x,
iz čega se uočava veoma jednostvana interpretacija da zavisna
promenljiva uzima pozitivnu vrednost ako je verovatniji prvi izbor, a
negativnu vrednost u suprotnom slučaju.

Dve raspodele veoma bliske, osim na krajevima, gde logistička
funkcija raspodele ima “teže” repove (logistička raspodela je
zapravo bliža t raspodeli sa sedam stepeni slobode).
Funkcije raspodele logit i probit
modela
p
1
Probit
Logit
0
Ocenjivanje modela binarnog izbora


Sa izuzetkom LMV, modeli binarnog izbora se ocenjuju metodom
maksimalne verodostojnosti (MV).
Svaka opservacija se tretira kao jedno izvlačenje iz Bernoulli-eve
raspodele sa verovatnoćom pozitivnog odgovora F(β’xi), tada se
združena funkcija verodostojnosti nezavisnih opservacija definiše kao:
Pr ob (Y1  y1, Y 2  y2,...,Yn  yn ) 
 1  F( ' x )  F( ' x ),
i
yi0
i
yi1
Odnosno, L(x; β) = Π [F(β’xi )]yi [1 – F( β’xi )]1-yi , gde je i = 1, …, n.

Na osnovu principa maksimalne verodostojnosti za ocenu parametra β
se uzima ona statistika za koju L(x; β), pri fiksiranom x, dostiže svoju

najveću vrednost, tj. za koju je: L(x;  ) = sup L( x;  )
 
kada supremum postoji pri bilo kojoj dopustivoj vrednosti β iz prostora B.
Ocenjivanje modela binarnog izbora
(nastavak)


Za ocene maksimalne verodostojnosti uzimamo one
vrednosti β za koje se postiže apsolutni maksimum.
Kako logaritam funkcije verodostojnosti dostiže ekstremne
vrednosti za iste vrednosti β za koje to postiže i funkcija L,
uslov za pronalaženje maksimuma log L dat je kao:
∂logL (β) / ∂β = 0

i
∂2logL (β) / ∂β ∂β’ < 0.
Uslov prvog reda za malsimiziranje log L je jednačina
verodostojnosti Sn(β) poznata i kao funkcija ostvarenih
pogodaka (engl. score function):
 log Ln
S n ( ) 
 0,

Ocenjivanje modela binarnog izbora (nastavak)





Jednačine verodostojnosti logit i probit modela su nelinearne
po β, što zahteva primenu nekog od poznatih iterativnih
metoda optimizacije.
Najčešće se primenjuje Newton-Raphson-ov metod, pri čemu
se za oba modela jednostavno pokazuje da je ispunjen uslov
globalne konkavnosti (Hessian matrica je uvek negativno
definitna: Hn(β) =∂2log Ln (β) / ∂β ∂β’ <0).
Asimtotske ocene kovarijante matrice ocena MV moguće je
izračunati na više načina, pri čemu se najčešće koriste oni
zasnovani na:
1. Matrici analitičkih drugih izvoda logL (vrednosti inverzne
negativne Hesian matrice izračunate za ocene MV).
2.Berndt, Hall, Hall, and Hausman (BHHH) oceneni (koristeći
prve izvode).
Zaključivanje u modelima binarnog izbora

Ocene MV su konzistentne i poseduju asimptotski
normalnu raspodelu

Testiranje hipoteza:
-
Za testiranje ograničenja na pojedinačne parametre modela
koriste se kritične vrednosti standardizovane normalne raspodele
(z).
-
Testiranje složenijih hipoteza, kojima se zahteva da koeficijenti u
ocenjenom modelu zadovoljavaju izvesna linearna ili nelinearna
ograničenja, sprovodi se primenom sledećih, asimptotski
međusobno ekvivalentnih testova: Wald-ovog (W), testa
količnika verodostojnosti (engl. likelihood ratio, LR) i testa
Lagrange-ovog multiplikatora (LM). Pod pretpostavkom da
je tačna nulta hipoteza sve tri test - statistike su asimptotski
ekvivalentne i imaju X2 raspodelu, sa brojem stepeni slobode
koji je jednak broju ograničenja.
-
Analiza stabilnosti parametara sprovodi se primenom testa koji
odgovara Chow testu u klasičnom linearnom regresionom
modelu.
Poređenje ocena LMV, probit and logit modela

Logistička raspodela ima varijansu π2/3, tako da ocene za β
dobijene u logit modelu množenjem sa 31/2/ π postaju
uporedive sa ocenama dobijenim u probit modelu. Amemiya
(1981) je kao predložio sledeću vezu:
βprobit ≈ 0.625 βlogit ,
Dakle, potrebno je ocene iz logit modela podeliti sa 1.6
(umesto sa π / 31/2 = 1.8) čime se postiže bolja
aprosksimacija ocena dobijenih iz ova dva modela.

Isti autor je predložio i sledeću vezu sa ocenama dobijenim u
LMV (LPM):
β
β
LMV
LMV
≈ 0.25 β logit (osim za konstantu)
≈ 0.25 β logit + 0.5 (za konstantu).
Pokazatelji kvaliteta modela binarnog izbora

Pseudo – R2 ili McFadden-ov indeks količnika
verodostojnosti (engl. McFadden’s likelihood ratio
verodostojnosti u ocenjenog m index), koji poredi
vrednost logaritma funkcijeodela (L) i modela u kome
je prisutna samo konstanta (isključene su sve
objašnjavajuće promenljive iz modela, L0):
pseudo-R2 = LRI = 1 – (lnL / lnL0).
Vrednost ovog pokazatelja se kreće u intervalu od 0 do
1, podseća na koeficijent determinacije linearnih modela
ali nema tako direktnu interpretaciju.
Pokazatelji kvaliteta modela binarnog
izbora (nastavak)

Procenat tačnih predviđanja modela (engl.
Expectation-Prediction Evaluation), koji je
predstavljen tabelom pogodaka i promašaja dimenzija
2x2 u slučaju binarnog modela, a kao pravilo
predviđanja koristi se:
y = 1 if F > F* i 0 u suprotnom slučaju.
Najčešće se kao granica predviđanja koristi F* = 0.5 (u
tom slučaju model predviđa ishod 1 ako je verovatnoća
realizavije ovog ishoda veća). Problem ovog pokazatelja
uočljiv u nebalansiranim uzorcima (mali broj ishoda 1 u
uzorku).
Greške specifikacije modela binarnog izbora
Najčešće greške specifikacije su: izostavljanje relevantne
objašnjavajuće promenljive i prisustvo heteroskedastičnosti u
modelu.


1)
Posledice navedenih grešaka specifikacije u probit i logit modelima
su:
Izostavljanjem X2 iz modela u koji je opravdano uključiti X1 i X2
(odnosno, ako je β2 ≠ 0), ocena maksimalne verodostojnosti
postaje asimptotski pristrasna:
plim c1β1 + c2β2,
gde su c1 i c2 komplikovane funkcije nepoznatih parametara, što
ima za posledicu nekonzistentnost ocene parametra β1, čak i
slučaju nezavisnosti promenljivih X1 i X2.
2) Posledice prisustva heteroskedastičnosti u modelu su:
nekonzistentnost ocena maksimalne verodostojnosti i
nepouzdana asimptotska ocena kovarijantne matrice.
Heteroskedastičnost se veoma često javlja u mikroekonometrijskim
podacima.
Greške specifikacije modela binarnog izbora
(nastavak)


Za potrebe analize specifikacije modela moguće je
koristiti sve tri test statistike: W, LR i LM.
Ostale greške specifikacije: neispunjenost
pretpostavke o normalnom rasporedu slučajne
greške, autokorelacija, pristrasnost u izboru
uzorka...
Primer 2. Efekat nove metode učenja (PSI)
na rezultat ispita iz makroekonomije

Izvor: L. Spector and M. Mazzeo, “Probit Analysis and Economic
Education”, Journal of Economic Education, vol.11, 1980, pp.37-44.

LPM:
Yi = β1+ β2GPAi + β3TUCE + β4PSI + ui ,
gde je Y=1 ukoliko je na završnom ispitu dobijena ocena A, a Y=0 ukoliko
je ocena B ili C, GPA – ukupna prosečna ocena studenta, TUCE – ocena na
preliminarnom testiranju na početku semestra i PSI – binarna promeljiva,
koja uzima vrednost 1 ako je student učio po novoj metodi, a 0 u
suprotnom slučaju.

Problem se može predstaviti sledećim modelom binarnog izbora:
P(Y=1 | GPA, TUCE, PSI) = pi = β1+ β2GPAi + β3TUCE + β4PSI + ui,
pri čemu je P oznaka za verovatnoću.
Estimation results on study program effectivnes,
32 observation
Primer 3. Učešće žena na tržištu rada u Srbiji


2002 ARS, 1528 zaposlenih žena od ukupno 4376 žena
uzrasta od 18 do 65 godina u uzorku
Zavisna promenljiva Y je binarna, uzima vrednosti 1/0
za odgovore žena da/ne, na pitanje da li su zaposlene ili
ne.
Objašnjavajuće promeljive :
age = godine starosti
m_stat1 = bračni status; binarna promenljiva, uzima
vrednost 1 za neudate žene, a 0 u suprotnom slučaju

educ =godine školovanja žene, ili
sc1 = završena osnovna škola
sc2 = završena srednja škola
sc3 = završena viša škola
sc4 = završen fakultet ili više (magistri i doktori nauka).
Rezultati ocenjivana ponude ženske
radne snage (I varijanta probit modela)
has job
dF/dx
0.1157
-0.0014
0.0579
0.0820
age
age2
m_stat1
educ
st.dev.
0.00461
0.00006
0.01912
0.00314
z
23.270
-22.880
3.070
25.000
Predicted
Y=0
Actual
Y=1
Total
Y=0
2434
85.46%
457
29.91%
2891
66.06%
Y=1
414
14.54%
1071
70.09%
1485
33.94%
Total
2848
100%
1528
100%
4376
100%
P>|z|
0.000
0.000
0.002
0.000
Rezultati ocenjivana ponude ženske
radne snage (II varijanta probit modela)
has job
age
age2
m_stat1
school1
school2
school3
school4
dF/dx
0.1170
-0.0139
0.0579
0.2077
0.5144
0.6928
0.7478
st. dev.
0.0047
0.0001
0.0192
0.0446
0.0313
0.0255
0.0173
z
23.110
-22.670
3.050
4.770
13.610
13.710
16.360
P>|z|
0.000
0.000
0.002
0.000
0.000
0.000
0.000
Predicted
Total
Y=0
Actual
Y=1
Total
Y=0
2430
85.32%
455
29.78%
2885
65.93%
Y=1
418
14.68%
1073
70.22%
1491
34.07%
2848
100%
1528
100%
4376
100%