Mikroekonometria 2 Mikołaj Czajkowski Wiktor Budziński
Klasyczny Model Regresji Liniowej (KMRL) Postać modelu regresji liniowej: yi = Xiβ + εi Modelujemy liniową zależność y od zmiennych objaśniających Parametry modelu β są nieznane, ale możemy je oszacować za pomocą posiadanych danych y, X Domyślnie szacujemy parametry skupiając się na średnich y względem X, ale można też skupiać się na medianie lub innych kwantylach Estymator reguła stosowana w celu znalezienia oszacowania jakiejś wielkości na podstawie danych Estymacja parametrów Metoda Najmniejszych Kwadratów (MNK) Metoda szukania parametrów β, polegająca na tym, żeby nasza liniowa funkcja dawała jak najmniejsze kwadraty różnic między przewidywanymi a obserwowanymi wartościami Wizualizacja X
Metoda Najmniejszych Kwadratów (MNK) Jeśli spełnione są określone założenia (wymogi) to estymator MNK 1. Nieobciążony (wartość oczekiwana szacowanych parametrów będzie równa prawdziwej wartości) 2. Zgodny (im większa próba, tym szacowane parametry będą bliższe prawdziwej wartości) 3. Efektywny (estymator jest efektywny gdy ma najmniejszą wariancję ze wszystkich estymatorów)
Założenia (wymogi) KMRL 1. Liniowa postać funkcji jest faktycznie prawidłowa Jeśli tak nie jest Można estymować model nieliniowy (innymi metodami estymacji niż MNK) Można spróbować dokonać jakiejś transformacji zmiennych objaśnianej lub objaśniających (np. logarytm, kwadrat), która da zależność bliższą liniowej
Zadanie 1. Nieliniowa postać funkcyjna 1. Wygeneruj sztuczne dane, w których zmienna objaśniana zależy nieliniowo od jakiejś zmiennej objaśniającej 2. Sprawdź czy stosując KMRL i zakładając liniową specyfikację można odzyskać parametry założonego PGD 3. Zastosuj KMRL uwzględniający odpowiednią transformację
Założenia (wymogi) KMRL 2. Zmienne objaśniające są liniowo niezależne Żadnej ze zmiennych objaśniających nie da się wyrazić za pomocą liniowej kombinacji pozostałych Zwykle zakłada się także, że ich średnie i wariancje są skończone Jeśli jakieś zmienne objaśniające są współliniowe nie da się dla nich określić jednoznacznych parametrów
Zadanie 2. Współliniowe zmienne objaśniające 1. Wygeneruj sztuczne dane, w których zmienna objaśniana zależy od jakiejś zmiennej objaśniającej rozkodowanej na zmienne zerojedynkowe (w zależności od jej wartości) 2. Sprawdź co się stanie, jeśli w modelu uwzględnić wszystkie zmienne zerojedynkowe. 1. Co się stanie jeśli pominąć jedną lub więcej zmiennych? 2. Co się stanie jeśli pominąć stałą?
Założenia (wymogi) KMRL 3. Błędy są sferyczne Brak autokorelacji var 2 ( ε X) = σ E εε i j X = 0 czyli cov ε, ε i j = 0 i j Błędy pomiędzy obserwacjami są nieskorelowane Może być niespełnione np. dla szeregów czasowych, danych panelowych itp. Jeśli tak nie jest estymator MNK nadal jest nieobciążony i zgodny, ale jest nie już efektywny Można zastosować np. Uogólnioną MNK Homoskedastyczność Składnik losowy ma tę samą wariancję dla wszystkich obserwacji I n ( ) ( ) ( ) E εi X Jeśli tak nie jest estymator MNK nadal jest nieobciążony i zgodny, ale jest nie już efektywny Można zastosować np. Ważoną MNK lub odporne macierze kowariancji 2 2 Czasem zakłada się dodatkowo normalność składnika losowego Nie jest niezbędne, ale jest potrzebne do dowodów własności testów dla skończonych prób Jeśli błędy są normalne to estymator MNK jest ekwiwalentny do estymatora Metody Największej Wiarygodności (MNW) = σ
Zadanie 3. Heteroskedastyczność 1. Wygeneruj sztuczne dane, w których wariancja błędu losowego zależy od wartości zmiennej objaśniającej 2. Sprawdź, czy KMRL nadal prawidłowo odzyskuje parametry PGD
Założenia (wymogi) KMRL 4. Zmienne objaśniające są egzogeniczne Są znane z pewnością, nie trzeba traktować ich jak zmienne losowe (np. z powodu błędów pomiaru) Nie są skorelowane z błędem losowym Czyli (m.in.) błędy losowe mają średnią 0 E ( ε X) = 0 Jeśli tak nie jest (są endogeniczne, czyli korelacja y i X jest możliwa naturalnie, bez zależności przyczynowo-skutkowej) estymator MNK przestaje być zgodny Można zastosować metodę zmiennych instrumentalnych (znaleźć zmienne, które wpływają na X, ale nie mają wpływu na y) Można zastosować metodę analizy wielomianowej (ang. multivariate analysis), w której dowolna zmienna może być traktowana jako objaśniana
Zadanie 4. Endogeniczność 1. Wygeneruj model z dwiema zmiennymi objaśniającymi, które są ze sobą skorelowane 2. Sprawdź, czy KMRL prawidłowo odzyskuje parametry PGD, kiedy nie uwzględnimy jednej z tych zmiennych w modelu
Metoda Ceny Hedonicznej Ekonomiści i politycy są często zainteresowani wartością, jaką ludzie przypisują do różnych cech dóbr, np. Braku smogu w danej okolicy Kontrolowanej apelacji wina Ryzyka śmierci w jakimś zawodzie Taka informacja pozwala na podejmowanie efektywnych społecznie decyzji dotyczących dóbr publicznych Jednym ze sposobów uzyskiwania informacji na temat tych wartości jest tzw. Metoda Ceny Hedonicznej W jaki sposób posiadanie danej cechy wpływa na cenę dobra (ceteris paribus)? Np. rynek nieruchomości, rynek pracy
Metoda Ceny Hedonicznej Przykład ceny domów Dwa identyczne domy, w okolicy pierwszego domu jest park, a w okolicy drugiego nie Jeśli pierwszy dom jest droższy o 10 000 zł to znaczy, że rynek wycenia bliskość parku na 10 000 zł Sumując wzrost ceny wszystkich domów w okolicy parku można oszacować jego wartość W praktyce trudno znaleźć 2 identyczne domy, ale jeśli mamy dużo danych, to można kontrolować różnice cen spowodowane wszystkimi obserwowalnymi cechami Np. liczba pokoi, metraż, wiek budynku, odległość do centrum, I zaobserwować statystyczny wzrost ceny spowodowany bliskością parku (brakiem hałasu, brakiem smogu, bliskością metra itp.)
Metoda Ceny Hedonicznej Formalnie metoda bazuje na teorii mikroekonomii Konsumenci mają pewną funkcję użyteczności oraz ograniczenie budżetowe Optymalizują wybór dóbr maksymalizując użyteczność W praktyce, nie obserwujemy funkcji użyteczności, ale możemy bezpośrednio modelować funkcję ceny hedonicznej Założyć jakąś postać funkcyjną i próbować oszacować jej parametry Gotowość do zapłaty za daną cechę: Zmiana dyskretna Zmiana krańcowa * ( z ) ( z) WTP = h h h( z) WTPc = z c p= h( z)
Liczba artykułów naukowych indeksowanych przez Google Scholar odwołujących się do różnych metod wyceny Hedonic Price Travel Cost Contingent Valuation Choice Experiment 4500 4000 3500 3000 2500 2000 1500 1000 500 0 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016
Case study wpływ emisji substancji biogennych (azotu) na ceny domów Rolnictwo może generować różne efekty zewnętrzne Przekształcanie terenu w pola uprawne Wytwarzanie zanieczyszczeń, np. emisja azotu przy chowie zwierząt Jaka jest wartość kosztów zewnętrznych dla społeczeństwa? Bontemps, C., Simioni, M., and Surry, Y., 2008. Semiparametric hedonic price models: assessing the effects of agricultural nonpoint source pollution. Journal of Applied Econometrics, 23(6):825-842. Dane dotyczące cen i charakterystyk domów we Francji (Brytania) z lat 1996 i 1997
Zadanie 5. Wykorzystując dane me.hedonic.dta przygotuj model oszacowujący wartość kosztów zewnętrznych rolnictwa 1. Przeprowadź regresję objaśniającą ceny domów przez (m.in.) emisje azotu i przekształcenie terenu w pola uprawne 1. Zacznij od prostego modelu regresji liniowej Czy założenia KMRL są spełnione? 2. Dodaj do modelu efekty nieliniowe
Praca domowa ME.2 1. Za tydzień wejściówka 2018-03-08 12:57:10