niespójność czasowa decyzji

Transcript niespójność czasowa decyzji

Metody analizy decyzji
Wykład 10 – niespójność czasowa decyzji
Eksperyment motywujący
Czy wolałbyś/łabyś?
A) 15 minut masażu teraz
czy
B) 20 minut masażu za godzinę
Czy wolałbyś/łabyś?
A) 15 minut masażu za tydzień
czy
B) 20 minut masażu za tydzień i jedną godzinę
Read i van Leeuwen (1998)
Wybór dzisiaj
Jeśli decydowałbyś/łabyś
dzisiaj,
co wybrałbyś/łabyś owoce
czy czekoladę
na następny tydzień?
Konsumpcja za tydzień
Czas
Cierpliwe wybory na następny tydzień
Wybór dzisiaj
Dzisiaj ludzie często
decydują się na owoce na
następny tydzień?
Konsumpcja za tydzień
74%
wybrało
owoce
Czas
Niecierpliwe wybory na dzisiaj
Wybór i
konsumpcja
jednocześnie
Czas
Jeśli
decydowałbyś/ł
abyś dzisiaj,
co
wybrałbyś/łabyś
owoce czy
czekoladę
na dzisiaj?
Preferencje niespójne czasowo
Wybór i
konsumpcja
jednocześnie
Czas
70%
wybiera
czekoladę
Read, Loewenstein & Kalyanaraman (1999)
Wybierz spośród 24 filmów video:
• Niektóre lekkie i mniej ambitne: Four Weddings and a
Funeral
• Niektóre nieco cięższe I bardziej ambitne : Schindler’s List
• Wybór na dzisiaj: 66% badanych wybiera lekkie
• Wybór na następną środę: 37% badanych wybiera lekkie.
• Wybór na jeszcze następną środę: 29% wybiera lekkie.
Dzisiaj chcę się zabawić…
w następnym tygodniu chcę rzeczy, które są dobre dla mnie
Bardzo spragnieni respondenci
McClure, Ericson, Laibson, Loewenstein i Cohen (2007)
• Wybór pomiędzy wypiciem,
sok teraz
lub 2x sok za 5 minut
60% badanych wybrało pierwszą opcję.
• Wybór pomiędzy wypiciem
sok za 20 minut
lub 2x sok za 25 minut
30% badanych wybrało pierwszą opcję
• Autorzy estymują, że 5-minutowy współczynnik dyskontujący
to 50%, a długo-terminowy współczynnik dyskontujący to 0%
• Ramsey (1930s), Strotz (1950s), & Herrnstein (1960s) byli
pierwsi, którzy zrozumieli, że współczynniki dyskontujące są
wyższe w krótkim okresie niż w długim.
Teoretyczne wprowadzenie
• Klasyczna forma funkcyjna – funkcja wykładnicza
D(t) = dt
D(t) = 1, d, d2, d3, ...
Ut = ut + d ut+1 + d2 ut+2 + d3 ut+3 + ...
• Ale funkcja wykładnicza nie jest w stanie opisać
efektu natychmiastowego bonusa (instant
gratification effect)
• Funkcja dyskontująca maleje w stałym tempie.
• Funkcja dyskontująca nie maleje szybciej w krótkim
okresie niż w długim.
Funkcja wykładnicza
1
Zdyskontowana wartość
przyszłego przychodu
Stała stopa spadku
0
1
11
21
31
Tygodnie (Czas=t)
-D'(t)/D(t) = stopa spadku funkcji
41
51
Funkcje dyskontujące
Niska stopa
spadku w
długim okresie
1
Wysoka
stopa spadku
w krótkim
okresie
0
1
11
21
Wykładnicza
31
41
Hiperboliczna
51
Paradoks dyskontowania wykładniczego.
Załóżmy, że ludzie dyskontują przynajmniej 1% pomiędzy
dzisiaj a jutro.
Załóżmy, że ich funkcje dyskontujące są wykładnicze.
Wówczas 100 za t lat jest warte 100*e(-0.01)*365*t dzisiaj.
•
•
•
•
Ile jest dzisiaj warte 100 dzisiaj?
Ile jest dzisiaj warte 100 za rok?
Ile jest dzisiaj warte 100 za dwa lata?
Ile jest dzisiaj warte 100 za trzy lata?
100.00
2.55
0.07
0.00
Alternatywna forma funkcyjna
Dyskontowanie QUASI-HIPERBOLICZNE
(Phelps and Pollak 1968, Laibson 1997)
D(t) = 1, bd, bd2, bd3, ...
Ut = ut + bdut+1 + bd2ut+2 + bd3ut+3 + ...
Ut = ut + b [dut+1 + d2ut+2 + d3ut+3 + ...]
b Dyskontuje jednakowo wszystkie przyszłe okresy.
d Dyskontuje wykładniczo wszystkie przyszłe okresy
W czasie ciągłym: patrz Barro (2001), Luttmer i Marriotti (2003),
oraz Harris i Laibson (2009)
Intuicja
• Załóżmy, że b = ½ oraz d = 1.
• Zdyskontowana funkcja użyteczności:
Ut = ut + ½ [ut+1 + ut+2 + ut+3 + ...]
• Zdyskontowana funkcja użyteczności z perspektywy czasu
t+1.
Ut+1 =
ut+1 + ½ [ut+2 + ut+3 + ...]
• Funkcja dyskontująca odzwierciedla dynamiczną
niespójność: preferencje w czasie t nie zgadzają się z
preferencjami w czasie t+1.
Zastosowanie dla masaży
b = ½ oraz d = 1
NPV w
minutach bieżących
A 15 minut teraz
B 20 minut za 1 godzinę
15 minut teraz
10 minut teraz
C 15 minut za 1 tydzień
D 20 minut za 1 tydzień i 1 godzinę
7.5 minut teraz
10 minut teraz
Zastosowanie dla masaży
b = ½ oraz d = 1
NPV w
minutach bieżących
A 15 minut teraz
B 20 minut za 1 godzinę
15 minut teraz
10 minut teraz
C 15 minut za 1 tydzień
D 20 minut za 1 tydzień i 1 godzinę
7.5 minut teraz
10 minut teraz
Ćwiczenia
• Załóżmy, że b = ½ oraz d = 1.
• Załóżmy, że ćwiczenia (wysiłek bieżący 6) generują przyszłe
korzyści (poprawa stanu zdrowia 8).
• Czy chcesz ćwiczyć?
• Ćwiczyć teraz:
• Ćwiczyć jutro:
-6 + ½ [8] = -2
0 + ½ [-6 + 8] = +1
• Czyli decydent chciałby wypoczywać dzisiaj i ćwiczyć jutro.
• Ale nie jest stanie tego zrealizować bez poczynienia
zobowiązania.
Osądy na temat przyszłości?
• Wysofistykowani decydenci: wiedzą, że ich plany, aby być
cierpliwym jutro nie wypalą (Strotz, 1957).
– “Nie rzucę palenia w następnym tygodniu, chociażbym
tego chciał.”
• Naiwni: wierzą mylnie, że ich plany, aby być cierpliwym
powiodą się (Strotz, 1957). Myślą, że β=1 w przyszłości.
– “Rzucę palenie w następnym tygodniu, chociaż nie
udawało mi się to przez wszystkie tygodnie ostatnich 5
lat.”
• Częściowo naiwni: mylnie wierzą, że β=β* w przyszłości,
gdzie β < β* < 1 (O’Donoghue and Rabin, 2001).
Cele dzisiejszego wykładu
• Uwzględnienie sekwencyjności problemu –
analiza możliwości reewaluacji problemu
• Analiza dyskontowania przyszłości
• Niespójność czasowa decyzji
Dyskontowanie – kilka pytań
• Co wolisz:
– 100 PLN dziś?
– 100 PLN za miesiąc?
• Czemu dyskontujemy?
– niecierpliwość
– niepewność
– możliwość lokowania (przyczyna czy skutek?)
• Wartość bieżąca strumienia wypłat vt dla czynnika
dyskontującego 0<d<1
T
t
PV   d v t
t0
Klasyczne dyskontowanie – własności
(d=0,9)
v Ad
t+k
v Ad
k
t
0
1
2
3
4
5
6
7
vt
0
0
0
0
0
0
85
0
dt
1
0,9
0,81
0,729
0,656
0,59
0,531
0,478
t
0
1
2
3
4
5
6
7
vt
0
0
0
0
0
0
0
100
dt
1
0,9
0,81
0,729
0,656
0,59
0,531
0,478
t
0
1
vt
85
0
dt
1
0,9
t
0
1
vt
0
100
dt
1
0,9
 v Bd 
 v Bd
t
0
Jakub i Ezaw
Czy zjesz ptasie mleczko? Eksperyment
w Stanford
• http://www.ted.com/index.php/talks/joachim_de_p
osada_says_don_t_eat_the_marshmallow_yet.html
23
Dyskontowanie – dalsze pytania
• Co wolisz:
– 1000 PLN dziś?
– 1050 PLN za miesiąc?
• Co wolisz:
– 1000 PLN za rok?
– 1050 PLN za rok i miesiąc?
• Czy stopa dyskontowa jest stała w czasie?
– eksperymenty wskazują, że ludzie przywiązują dużą wartość do
teraźniejszości (rozróżnienie między dwoma okresami w przyszłości
jest mniej ważne)
– podobne wyniki dla zwierząt!
Dyskontowanie hiperboliczne
• Czynnik dyskontujący dla momentu t>0
wynosi bdt, gdzie 0<b<1 i 0<d<1
– b reprezentuje dodatkowy nacisk na teraźniejszość
(krótkowzroczność, myopia)
Dyskontowanie hiperboliczne –
własności (b=0,9; d=0,9)
v A bd
t+k
v A bd
k
t
0
1
2
3
4
5
6
7
vt
0
0
0
0
0
0
85
0
bdt
1
0,81
0,729
0,656
0,59
0,531
0,478
0,43
t
0
1
2
3
4
5
6
7
vt
0
0
0
0
0
0
0
100
bdt
1
0,81
0,729
0,656
0,59
0,531
0,478
0,43
t
0
1
vt
85
0
bdt
1
0,81
t
0
1
vt
0
100
bdt
1
0,81
 v B bd , ale
< v Bd
t
0
Niespójność czasowa decyzji
• Rozwiązaniem poniższego problemu jest wariant „dolny”
• Reewaluacja problemu w chwili t=6 spowoduje zmianę
rozwiązania na „górny” (mimo braku zmiany parametrów
problemu)
• Taka zmiana decyzji to niespójność czasowa decyzji
t
0
1
2
3
4
5
6
7
vt
0
0
0
0
0
0
85
0
bdt
1
0,81
0,729
0,656
0,59
0,531
0,478
0,43
t
0
1
2
3
4
5
6
7
vt
0
0
0
0
0
0
0
100
bdt
1
0,81
0,729
0,656
0,59
0,531
0,478
0,43
Scenariusze decydowania
• W warunkach niespójności czasowej decyzji możliwe trzy scenariusze
decydowania:
– scenariusz optymalizacji globalnej (spójny czasowo) – jednokrotne
rozwiązanie problemu oryginalnego i wdrożenie wybranego rozwiązania bez
reeweluacji
– scenariusz optymalizacji sekwencyjnej (naiwny) – ciągłe reewaluowanie
problemów zredukowanych i wdrażanie kolejno uzyskiwanych rozwiązań
– scenariusz optymalizacji wstecznej (wyszukany) – (rekurencyjne)
przewidywanie przyszłych zachowań i dobieranie bieżącego zachowania tak,
aby było optymalne (na moment bieżący) w połączeniu z przyszłym
przewidywanym zachowaniem
• Nie zawsze decydent ma możliwość wybrania scenariusza decyzji:
– rozproszone decyzje
– brak silnej woli
Przykład (na podstawie O’Donoghue
i Rabin, AER 1999)
•
Michał chodzi do kina w soboty. W lokalnym kinie grafik premier na najbliższe
cztery weekendy jest następujący:
–
–
–
–
sobota w tym tygodniu: ** (wypłata 3 za obejrzenie);
kolejna sobota:
*** (wypłata 5);
kolejna sobota:
**** (wypłata 8);
kolejna sobota:
***** (wypłata 13).
•
W ciągu miesiąca Michał musi przygotować się do sesji – musi zrezygnować z
jednego filmu (i stracić wypłatę)
•
Przyszłość (tj. przyszłe straty wypłat) dyskontuje wg funkcji quasi-hiperbolicznej z
parametrami:
– b=½ (czyli odróżnia teraźniejszość od przyszłości);
– d=1 (czyli nie odróżnia bliższej i dalszej przyszłości).
•
Samodzielnie zastanów się, z którego filmu Michał zrezygnuje w poszczególnych
scenariuszach decyzyjnych
Scenariusz optymalizacji globalnej
(time consistent)
t=0
-3/2
-5/2
-8/2
-13/2
t=1
**
t=2
***
t=3
****
t=4
*****
-3
-5
-8
-13
Scenariusz optymalizacji sekwencyjnej
(naїve)
t=0
t=1
**
t=2
***
t=3
****
t=4
*****
-3
-5
-8
-13
-5/2
-8/2
-13/2
-3/2
-5/2
-8/2
-13/2
-8/2
-13/2
-13/2
Scenariusz optymalizacji wstecznej
(sophisticated)
t=1
**
t=2
***
t=3
****
t=4
*****
-3
-5
-8
-13
-13/2
-13/2
-5/2
Przykład – zachowanie wg różnych
scenariuszy
t=0
t=1
**
t=2
***
t=3
****
t=4
*****
-3
-5
-8
-13
Scenariusz optymalizacji globalnej (spójny czasowo):
t=0) porównuje-3/2; -5/2; -8/2; -13/2
 rezygnuje z ** filmu
Scenariusz optymalizacji sekwencyjnej (naiwny):
t=0) porównuje -3/2; -5/2; -8/2; -13/2
 planuje zrezygnowanie z ** filmu
t=1) porównuje -3; -5/2; -8/2; -13/2
 planuje zrezygnowanie z *** filmu
t=2) porównuje -5; -8/2; -13/2
 planuje zrezygnowanie z **** filmu
t=3) porównuje -8; -13/2
 rezygnuje z ***** filmu
Scenariusz optymalizacji wstecznej (wyszukany):
t=3) porównuje -8; -13/2
 zrezygnowałby z ***** filmu
t=2) porównuje -5; -13/2
 zrezygnowałby z *** filmu
t=1) porównuje -3; -5/2
 rezygnuje z *** filmu
Niespójność czasowa decyzji
a wartość opcji
• W scenariuszu optymalizacji wstecznej decydent przewiduje swoje
przyszłe zachowania choć nie ma na nie wpływu
• Decydent może woleć mieć w przyszłości mniej opcji, żeby nie być
narażony na pokusy – jest zdolny oprzeć się pokusom dziś redukując
przyszłą liczbę alternatyw:
– Michał wolałby w momencie t=0 kupić bilet na film *** w t=2, wtedy
straciłby film **
• Przykłady ograniczania własnych opcji:
– ustawianie budzika daleko od łóżka
– uczestnictwo w Klubach Świątecznych
– zobowiązywanie się do przyszłych działań (np. zgłaszanie się do udziału
w projektach, konferencjach, …)
Niespójność czasowa decyzji
a wartość informacji (b=0,5; d=1)
t=1
t=0
-15
t=1
t=0
-15
50%
50%
-10
50%
-100
-100
50%
-10
-10
Unikanie niespójności czasowej decyzji
• Z perspektywy problemu oryginalnego:
– ograniczenie zbioru wariantów – np.Odyseusz,
Christmas clubs
– wybór rozwiązań suboptymalnych
(optymalnych w scenariuszu optymalizacji wstecznej)
• Z perspektywy problemu zredukowanego:
– silna wola – koordynacja z „wcześniejszym ja”
– odrzucenie konsekwencjonalizmu – myślenie o całej
ścieżce działań (także przeszłości), a nie jedynie
o przyszłych konsekwencjach działań
http://www.stickk.com/
37
Niespójność czasowa decyzji a zachowania
konsumentów (Shui i Ausubel, 2005)
•
Badanie:
– decyzje konsumentów dotyczące wyboru karty kredytowej (oprocentowanie w okresie
promocyjnym i potem)
– późniejsze decyzje zakupowe (czy wybrany profil oprocentowania optymalny a
posteriori)
•
Dane:
– 600 tys. konsumentów objętych próbną kampanią w 1995 r.
– 6 profili oprocentowania
– 24 miesiące obserwacji po decyzji
•
Wyniki:
– preferencja niższego oprocentowania na początku, kosztem wyższego później
– pozostawanie na ścieżce wysokiego zadłużania się, pomimo wzrostu oprocentowania
– współczynnik preferencji teraźniejszości b=0,8
Uproszczony model wyboru profilu
oprocentowania i konsumpcji
• Wybór w dwóch okresach:
– profil oprocentowania (do spłaty w kolejnym okresie)
• 10% i 10%
• 5% i 20%
– konsumpcja na kredyt:
• 10 i 0
• 10 i 10
• Parametry dyskontowania b=d=0,9
• Wybór profilu oprocentowania i ścieżki konsumpcji
w pierwszym okresie
• W drugim okresie możliwość reewaluacji ścieżki konsumpcji
Ilustracja (b=0,9; d=0,9)
wybór konsumpcji
wybór
oprocentowania
wybór konsumpcji
t
0
1
2
%
10%
10%
10%
c
10
0
0
u
10
-11
0
t
0
1
2
%
10%
10%
10%
c
10
10
0
u
10
10-11
-11
t
0
1
2
%
5%
20%
20%
c
10
0
0
u
10
-10,5
0
t
0
1
2
%
5%
20%
20%
c
10
10
0
u
10
10-10,5
-12
PV=10-11*0,81
=1,09
PV=
=10-1*0,81-11*0,729
=1,171
PV=
=10-10,5*0,81
=1,495
PV=
=10-0,5*0,81-12*0,729
=0,847
Ilustracja (b=0,9; d=0,9)
wybór konsumpcji
t
1
2
%
20%
20%
c
0
0
u
-10,5
0
t
1
2
%
20%
20%
c
10
0
u
10-10,5
-12
PV=-10,5
PV=
=-0,5-12*0,81
=-10,22
Ilustracja (b=0,9; d=0,9)
wybór konsumpcji
wybór
oprocentowania
wybór konsumpcji
t
0
1
2
%
10%
10%
10%
c
10
0
0
u
10
-11
0
t
0
1
2
%
10%
10%
10%
c
10
10
0
u
10
10-11
-11
t
0
1
2
%
5%
20%
20%
c
10
0
0
u
10
-10,5
0
t
0
1
2
%
5%
20%
20%
c
10
10
0
u
10
10-10,5
-12
PV=10-11*0,81
=1,09
PV=
=10-1*0,81-11*0,729
=1,171
PV=
=10-10,5*0,81
=1,495
PV=
=10-0,5*0,81-12*0,729
=0,847
Podsumowanie
• Badania eksperymentalne wykazują, że bardziej adekwatny
jest model z dyskontowaniem hiperbolicznym
• Takie dyskontowania powoduje zachowania niespójne
czasowo (zmianę decyzji w wyniku upływu czasu, bez
zmiany parametrów problemu)
• W sytuacjach z NCD można zdefiniować kilka scenariuszy
postępowania
• NCD powoduje zaskakujące efekty: chęć ograniczania
własnych opcji, ujemną wartość informacji
Materiały
• T. O’Donoghue, M. Rabin (1999): „Doing it Now or
Later”, The American Economic Review, ss. 103-124
• G. Akerlof (1991): „Procrastination and Obedience”,
The American Economic Review, 81(2), ss. 1-19
• H. Shui, L. Ausubel (2005): „Time Inconsistency in the
Credit Card Market”
Dziękuję!
45

niespójność czasowa decyzji

Transcript niespójność czasowa decyzji

Directory