D. Cio*ek Wyk*ad 1

Download Report

Transcript D. Cio*ek Wyk*ad 1

D. Ciołek
Wykład 1
Jak właściwie przeprowadzić badanie
ekonometryczne?
1. Sformułować cel badania:
 decyzja jakiego obszaru ekonomii lub innych nauk społecznych
będzie dotyczyć badanie,
 wybór odpowiedniej, jednoznacznie zdefiniowanej hipotezy
badawczej,
 wybór odpowiedniego modelu, który będzie narzędziem
właściwym do weryfikacji postawionej hipotezy.
bez tego:
o nie wiemy, od czego zacząć analizę,
o nie wiemy, jakich informacji i danych statystycznych powinniśmy
szukać, dla jakiej zbiorowości, czy dla jakiego okresu.
1
D. Ciołek
Wykład 1
Na przykład:
 Analizując rynek pracy – możemy podjąć próbę znalezienia
czynników wyjaśniające zróżnicowanie płac w polskich
powiatach.
 W makroekonomii – możemy być zainteresowani zbadaniem
relacji pomiędzy różnymi zagregowanymi zmiennymi:
- powiązanie między wzrostem PKB i wzrostem
inwestycji,
- wpływ zmian podatków na stopę procentową.
2
D. Ciołek
Wykład 1
Decydując o obszarze nauki, którego dotyczyć ma badanie,
można sprawdzić jakie tematy poruszane są w literaturze
światowej.
Journal of Economic Literature (JEL) prezentuje
szczegółową klasyfikację obszarów badawczych w dziedzinie
ekonomii przyporządkowując im odpowiedni kody, które
jednoznacznie przyporządkowują poszczególne artykuły i
opracowania do odpowiednich kategorii.
JEL zawiera również listy artykułów publikowanych w wielu
najważniejszych czasopismach ekonomicznych wraz ze
streszczeniami niektórych z nich.
3
D. Ciołek
Wykład 1
2. Przegląd literatury
„Drzwi najprawdopodobniej zostały już otwarte …”
Przegląd literatury powinien być podstawą do napisanie
pierwszej, teoretycznej części pracy dyplomowej, która powinna
zwierać:
 jednoznaczne sformułowanie hipotezy badawczej,
 opis najważniejszych pojęć dotyczących tematu,
 opis badań, które zostały do tej pory przeprowadzone,
 wskazanie, czym proponowana analiza różni się od
dotychczas prowadzonych,
Przegląd literatury:
 pomaga wybrać odpowiednią specyfikację modelu
ekonometrycznego będącego narzędziem weryfikacji
postawionych hipotez,
 pozwala na myślenie o przyszłych wynikach i interpretacjach,
 jest bezwarunkowo konieczny w pracy dyplomowej ;-)
4
D. Ciołek
Wykład 1
3. Zebranie danych statystycznych
Po pierwsze należy zdecydować o rodzaju danych, które będą
niezbędne do znalezienia odpowiedzi na postawione pytania.
Dane przekrojowe (xi
Szeregi czasowe (xt
Dane panelowe (xit
i=1,2,…,N)
t=1,2,…,T)
i=1,2,…,N; t=1,2,…,T)
5
D. Ciołek
Wykład 1
Bazy danych dostępne on-line:
 Główny Urząd Statystyczny:
http://www.stat.gov.pl/gus/index_ENG_HTML.htm
 Portal www.money.pl
 World Development Indicators:
http://data.worldbank.org/data-catalog/world-development-indicators
 Eurostat:
http://epp.eurostat.ec.europa.eu/portal/page/portal/statistics
 Penn World Table:
http://pwt.econ.upenn.edu/
6
D. Ciołek
Wykład 1
4. Wprowadzenie i opracowanie danych
 Należy wprowadzić dane w odpowiednio uporządkowany
sposób – każdej obserwacji odpowiada odpowiedni rząd,
kolejne kolumny reprezentują zmienne.
 Dla danych panelowych konieczne jest zdefiniowanie dwóch
zmiennych identyfikujących obserwacje: zmiennej id – dla
jednostek i zmiennej time (year) dla poszczególnych
okresów.
7
D. Ciołek
Wykład 1
5. Szczegółowa analiza zmiennych




Które zmienne są zmiennymi binarnymi?
Które zmienne są zmiennymi porządkowymi (np. rankingi)?
W jakich jednostkach mierzone są zmienne?
Czy zmienne określają stopę wzrostu, procent, czy proporcje?
Dla szeregów czasowych:
 Czy zmienne pieniężne wyrażone są w nominalnie (ceny
bieżące), czy realnie (ceny stałe).
 Jeżeli zmienna wyrażona jest w cenach stałych to, który rok
jest rokiem bazowym?
8
D. Ciołek
Wykład 1
Wskazanie ewentualnych błędów w zbiorze danych jest bardzo
istotne z punktu widzenia wiarygodności uzyskanych wyników.
Wskazane jest znalezienie obserwacji nietypowych (outliers) i
wyjaśnienie, czy ta „nietypowość” jest uzasadniona
ekonomicznie, czy może to wynik błędu pomiaru lub pomyłka.
Użyteczne jest policzenie dla każdej zmiennej wartości min,
max, średniej, odchylenia standardowego, a dla najbardziej
istotnych zmiennych współczynników korelacji pomiędzy nimi.
9
D. Ciołek
Wykład 1
6. Modelowanie ekonometryczne najważniejsze zasady
6.1) Oceń, czy zmienne objaśniające nie są skorelowanie
ze składnikiem losowym modelu w sytuacji idealnej proponowany model powinien
zawierać wszystkie zmienne ekonomiczne determinujące
zmienność zmiennej endogenicznej, aby jak najmniej
elementów zawartych było w składniku zakłócających.
6.2) Wybierz postać analityczną modelu:
 Czy zmienne w poziomach, czy w logarytmach?
 Czy niektóre zmienne powinny wystąpić również w postaci
kwadratów dla odzwierciedlenia malejących efektów?
 Jak wprowadzić czynniki jakościowe? Czy wystarczą zmienne
zero-jedynkowe?
 Czy powinno się uwzględnić interakcje zmiennych?
10
D. Ciołek
Wykład 1
Logarytmy, czy poziomy zmiennych?
logarytmy zmiennych, gdy:
 zmienna wyrażona jest w jednostkach pieniężnych (o
wartościach dodatnich) – wynagrodzenie, sprzedaż firmy,
wartość rynkowa firmy, Produkt Krajowy Brutto;
 zmienne o wysokich wartościach: wielkość populacji,
całkowita liczba pracowników, współczynnik skolaryzacji,
liczba kilometrów;
poziomy zmiennych, gdy:
 zmienna wyrażona w liczbie lat: liczba lat edukacji lub
doświadczenia, wiek;
 zmienna przyjmuje niewysokie wartości całkowite: liczba
pokoi w domu, liczba osób w gospodarstwie domowym,
liczba samochodów w gosp. domowym;
 zmienne sztuczne (zero-jedynkowe) reprezentujące
zmienne jakościowe: płeć, poziom wykształcenia,
przynależność do organizacji, położenie geograficzne.
11
D. Ciołek
Wykład 1
Logarytmy, czy poziomy zmiennych?
 Zmienne, które są proporcjami lub udziałami
procentowymi: stopa bezrobocia, procent studentów, którzy
zdali egzamin, stopień wykrywalności przestępstw
kryminalnych – mogą występować albo w postaci
poziomów, albo w logarytmach, chociaż częściej używa się
poziomów.
Uwaga: Przy interpretacji uważamy z procentami:
Jeżeli bezrobocie wzrasta z 8 do 9 procent, oznacza to wzrost o jeden
punkt procentowy, ale przyrost o 12,5 procent w stosunku do
wartości początkowej.
12
D. Ciołek
Wykład 1
Logarytmy, czy poziomy zmiennych?
Jedno ograniczenie:
Logarytm zmiennej nie może być użyty jeżeli zmienna
przyjmuje wartości ujemne lub jest równa zero. Dla zmiennej
przyjmującej wartości zero rozwiązaniem może być
zastosowanie log(1+y).
(!) Używając zlogarytmowanej zmiennej musimy pamiętać, że
wartości teoretyczne tego modelu są wartościami log(y) a nie y.
(!) Nie można porównywać R-kwadrat wyznaczonych dla
modeli, w których mamy różne zmienne objaśniające: log(y) i y.
13
D. Ciołek
Wykład 1
6.3) Analiza szeregów czasowych wymaga dodatkowej
analizy:
 Czy model ma być szacowany na poziomach, czy na
przyrostach?
 Jeżeli na poziomach, czy uwzględniamy trend
deterministyczny lub stochastyczny?
 W przypadku danych kwartalnych lub miesięcznych należy
zbadać, czy nie mamy do czynienia z sezonowością.
 Jeżeli badamy zależności dynamiczna, np. model z
rozłożonymi opóźnieniami, to ile opóźnień należy uwzględnić?
14
D. Ciołek
Wykład 1
6.4) Wskazanie obserwacji nietypowych
Jeżeli niektóre obserwacje znacząco różnią się od całej próby –
powiedzmy, że mamy kilka firm, które są dużo większe od
pozostałych – sprawdzamy, czy nasze wyniki różnią się dużo
jeżeli te obserwacje zostaną usunięte z próby.
Jeżeli tak, może należałoby zmienić postać funkcyjną modelu
uwzględniając te obserwacje nietypowe lub wykazać, że dane
jednostki powinny być objaśniane przez zupełnie inny model
(np. wprowadzamy zmienne sztuczne).
6.5) Analiza wrażliwości
Należy oszacować pierwotny model, następnie dokonując
pewnych modyfikacji sprawdzamy, czy wnioski płynące z
uzyskanych wyników znacząco się zmieniają.
15
D. Ciołek
Wykład 1
6.6) Wybierz do interpretacji najlepszy spośród
oszacowanych modeli
 Badanie empiryczne nie polega na oszacowaniu i interpretacji
jednego z góry określonego modelu. To proces, w którym
wykorzystujemy różne specyfikacje modelu, różne metody
szacowania parametrów, czy różne podpróby danych, aż do
uzyskania rezultatów, które w najlepszy sposób odzwierciedlają
analizowany proces.
 Zdaniem badacza jest ocena różnych modeli, aż do
znalezienia tego modelu „best”.
6.7) Napisz podsumowanie, przedstawienia i
interpretacje wyników ;-)
16