Logitmodeller – så här funkar det

Download Report

Transcript Logitmodeller – så här funkar det

Logitmodeller – så
här funkar det
Kollektivtrafikens
konkurrenskraft
Hässleholm 2 mars 2011
2011-03-02
Vad är en (logit)modell?
En modell ÄR
Ett systematiskt sätt att beskriva
övergripande samband
En modell är INTE
En beskrivning av naturlagar
Ett smart sätt att kombinera
förförståelse och data
En ”sanning”
Ett sätt att skapa överblick över
kaos
EN sanning
Det överlägset mest effektiva sättet
att utnyttja observationernas
informationsinnehåll
Enda chansen att göra
kvantifierade förutsägelser
Hur är det möjligt?
En parallell: Målerifirmans offert
Längd
(m)
Höjd
(m)
Kulör
Färgtyp
Åtgång (l)
50
2,2
Blå
Olja
19
Lillg 3
100
1,5
Grön
Olja
20
Kyrkog 7
500
1
Blå
Vatten
löslig
86
Hamng 2
150
1,6
Röd
Bets
34
Storg 4
L= 200 m H= 1,3 m Blå bets. Åtgång?
Vad lär vi oss av måleri-exemplet?
Data är nödvändiga
…men
Det är bara med hjälp av en ”teori” som vi kan göra förutsägelser
Modellen är också ett verktyg för att sätta ord på vår ”kvalitativa” förståelse
Med ord och koncept tänker vi faktiskt bättre!
Arbetsprocessen: att utveckla och tillämpa modeller
POLICY ALTERNATIV
Nya
INDATA
Observerade
DATA
Prognos
TEORI
Modell
Modell SPECI
FORM FIKA
TION
Antaganden
Skattning
PARAMETRAR
MODELL
Den binära logitmodellen
V ( Xi )
Pi
e
V ( Xi )
1 e
”Kvalitetsskillnad”
mellan alternativen
Ett ”intuitivt” argument för logitmodell-formen
Pi
1
Zi
Z
0,9
Andel som reser med tåg
0,8
Z (=dragningskraft)
Beror på T. Hur?
0,7
0,6
Z=1/T+C
0,5
Z=exp(-KT)
0,4
0,3
Begränsningar:
andel>0
Z ökar när T minskar
0,2
Två förslag
0,1
0
0
20
40
Restid tåg
60
80
Z= 1/T+C
Z= e-KT
Ett annat sätt… – Mc Fadden
U ind
U0
Med ”vissa antaganden” om kan man visa att
Diagramrubrik
U0 ( Xi )
1 e
1
U0 ( Xi )
0,9
0,8
beror på slumpmässigheten
Väldigt slumpmässigt=litet
Andel som reser med tåg
Pi
e
0,7
0,6
Z=exp(-0,08T)
0,5
Z=exp(-0,03T)
0,4
0,3
0,2
0,1
0
0
20
40
Restid tåg
Men hur kan vi ta reda på/ beräkna
och U0 ?
60
80
Hur beräknas nyttoskillnaden V?
I typfallet
gissar vilka variabler (X) som spelar roll
antar att en linjär form fungerar
U0
restid
* ( X restid ,koll
X restid ,bil )
pris
* ( X pris ,koll
X pris ,bil )
turtäthet
* ( X turtäthet
0) ....
X= verkliga egenskaper för alternativesn ex 25 minuter/30SEK/10 turer
= ”växelkurs” mellan olika egenskaper (”minuter per krona”)
• skatta parametrar från (resvane-)data
• beräkna prognos-nyttan mha
•skattade (=samma samband)
•nya X (=nya indata)
Skattning av parametrar: en liknelse
200
Y=KX+L
150
Välj K, L så att
modellen beräknar Yvärden
så nära de observerade
Y som möjligt
100
50
0
0
-50
-100
20
40
60
80
100
120
Vad behövs?
Ett ”datamaterial” med ett antal verkliga resor:
Alla viktiga egenskaper hos kollektivresealternativet
Alla viktiga egenskaper hos bilresealternativet
Information om hur personen valde: koll eller bil?
Vilka egenskaper skall med?
alla de egenskaper som vi vill förstå betydelsen av (manipulera)
Alla de andra faktorer som också spelar roll för valet, och som kan störa
analysen
Exemplet gångavstånd och turtäthet
Hur väljer man vilka faktorer som skall ingå?
Så enkel som möjligt…men inte enklare än så
Så specifik som möjligt…men inte mer specifik än så
Tror vi att variabeln spelar roll?
Tror vi att effekten skiljer sig mellan färdmedel, resärenden, kön…
Ju fler variabler -> desto osäkrare resultat
Räcker noggrannheten?
» ”Rätt” tecken?
» ”Signifikans ”<0.05?
Arbetsprocessen: att utveckla och tillämpa modeller
POLICY ALTERNATIV
TEORI
Skattning
PARAMETRAR
MODELL
Prognos
Ofta
Nya
Svagaste
INDATA
Punkten!!
Observerade
DATA
Modell
Modell SPECI
FORM FIKA
TION
Antaganden