Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 4 Mikołaj Czajkowski Wiktor Budziński

Regresja kwantylowa W standardowej Metodzie Najmniejszych Kwadratów modelujemy warunkową średnią zmiennej objaśnianej: E( yi Xi) = μ ( Xi) Pokazaliśmy, że można modelować równocześnie również jej drugi 2 moment, to jest warunkową wariancję: var y Z = σ Z ( ) ( ) i i i W przypadku rozkładu normalnego, te dwa momenty w sposób jednoznaczny definiują rozkład zmiennej objaśnianej W praktyce, zmienne ciągłe mogą mieć inny rozkład Czasem chcielibyśmy modelować więcej charakterystyk rozkładu, aby lepiej zrozumieć co się dzieje w danych Rozwiązanie regresja kwantylowa

Regresja kwantylowa Kwantylem rzędu τ nazywamy taką wartość λτ, dla której zachodzi: F ( λ τ ) = τ 1 Kwantyl można policzyć korzystając ze wzoru: λτ = F ( τ) W regresji kwantylowej chcemy zobaczyć, jak różne kwantyle zależą od wybranych zmiennych objaśniających 1 Definiuje się tzw. kwantyle warunkowe: Q ( y X ) = F ( τ X ) i i y i Zazwyczaj, analogicznie jak w regresji liniowej, zakłada się zależność liniową: Q τ ( y i Xi) = Xβ i τ Uwaga: w tej notacji parametry mogą być różne dla każdego kwantyla τ i

Regresja kwantylowa estymacja Najprostszym wariantem regresji kwantylowej tzw. regresja na medianie Staramy się znaleźć postać funkcyjną warunkowej mediany Parametry znajdujemy minimalizując następującą funkcję celu: Q ( β ) N 0,5 = 0,5 y i 1 i Xβ = i 0,5 W literaturze model ten jest również nazywany estymatorem LAD (Least Absolute Deviations) Bardziej ogólnie, aby oszacować parametry dowolnego kwantyla minimalizujemy funkcję: Do optymalizacji używa się metod programowania liniowego (metoda simpleks) ( ) τ ( 1 τ) Q β = y Xβ + y Xβ τ i i τ i i τ iy : Xβ iy : Xβ i i τ i i τ

Regresja kwantylowa w NLOGIT 1. Wczytaj zbiór danych me.medexp.lpj 2. Policz regresję liniową, w której wydatki gospodarstw domowych na leczenie objaśniane są przez wszystkie inne dostępne zmienne 3. Przeprowadź regresję kwantylową. Czy wyniki się różnią? QREG polecenie wywołujące regresję kwantylową ; lhs = var1 analogicznie jak w MNK definiujemy zmienną objaśnianą ; rhs = var2, var3 - definiujemy zmienne objaśniające $ Domyślnie NLOGIT liczy regresję na medianie 4. Policz regresje dla kwantyli innych rzędów np. 0,1; 0, 25; 0,75; 0,9 ; Quantile = tau1, tau2 - dodanie opcji do polecenia QREG policzy regresje kwantylowe dla wybranych kwantyli rzędu tau1, tau2

Zalety regresji kwantylowej Brak założeń na temat rozkładu zmiennej zależnej Można modelować cały rozkład zmiennej, a nie tylko wybrane momenty Łatwość wykrycia heteroskedastyczności Bardziej odporna na występowanie outlierów niż MNK Kwantyl zmiennej przekształconej przy pomocy ściśle rosnącej funkcji g( x) jest równy przekształconemu kwantylowi oryginalnej zmiennej: Qτ ( g( yi) Xi) = g( Qτ ( y i Xi) )

Wady regresji kwantylowej Wzory analityczne na macierz kowariancji estymatora regresji kwantylowej są skomplikowane, a przez to rzadko stosowane W praktyce stosuje się metody symulacyjne np. bootstrap, przez co model liczy się dłużej niż np. regresja liniowa Współcześnie nie jest to duży problem

Metoda Bootstrap Bootstrap to metoda symulacyjna, która pozwala na przeprowadzenie wnioskowania statystycznego kiedy nie znamy teoretycznych właściwości danej statystyki/estymatora Uzasadnienie: Mając D prób z pewnej populacji, dla każdej z nich można policzyć określoną statystykę i w efekcie otrzymać jej D oszacowań Średnią z tych D oszacowań moglibyśmy traktować jako jej najlepsze oszacowanie, a wariancję jako miarę niepewności Wykorzystując te charakterystyki moglibyśmy przeprowadzić wnioskowanie statystyczne Wykorzystanie w praktyce: Zazwyczaj mamy tylko jedną próbę, a nie D Z próby wielkości N losujemy ze zwracaniem B 'sztucznych' prób, również o wielkości N Dla każdej z wylosowych prób 'sztucznych' liczymy szukaną statystykę/estymator Wnioskowanie statystyczne przeprowadzamy analizując rozkład B oszacowań tej statystyki/estymatora

Metoda Bootstrap 1. Sprawdź czy zmiana liczby wylosowanych prób zmienia oszacowania w regresji kwantylowej. Wypróbuj 20, 50, 100 i 200 prób ; nbt = B - dodanie opcji do polecenia QREG policzy regresję kwantylową przy użyciu B 'sztucznych' prób 2. Sprawdź czy istnieje istotna korelacja między wiekiem a logarytmem wydatków medycznych używając bootstrapu. Wypróbuj 100 i 300 `sztucznych prób PROC $ CALC ; c = cor(lhhex12m,age) $ ENDPROC $ EXECUTE ; N = 100 ; bootstrap = c ; histogram $ PROC $ - początek kodu, który ma zostać powtórzony ENDPROC $ - koniec kodu EXECUTE ; N = 100 $ - wykonuje 100 razy kod znajdujący się między PROC i ENDPROC ; bootstrap bootstrapuje macierz AVC zadanej statystyki

Regresja kwantylowa a heteroskedastyczność Przeprowadzimy symulację, aby zobaczyć jak heteroskedastyczność wpływa na oszacowania regresji kwantylowej 1. Wygeneruj dane, bez heteroskedastyczności, z jedną zmienną objaśniającą X 2. Policz regresję liniową ze stałą i X jako zmiennymi objaśniającymi. Przeprowadź test Breusha-Pagana. 3. Policz analogiczną regresję kwantylową dla kwantyli rzędu: 0,1; 0,25; 0,5 ; 0,75 ; 0,9. Czy istnieje jakaś zależność? RESET $ SAMP; 1-1000 $ CREA; X = rnn(0,1) $ CREA; Y = X + rnn(0,1) $

Regresja kwantylowa a heteroskedastyczność 1. Wygeneruj drugą zmienną objaśnianą Y2, tym razem z heteroskedastycznością CREA; SIG = exp(1 + 0.5*X) $ CREA; Y2 = X + SIG*rnn(0,1) $ 2. Policz regresję liniową ze stałą i X jako zmiennymi objaśniającymi. Przeprowadź test Breusha-Pagana 3. Policz analogiczną regresję kwantylową dla kwantyli rzędu: 0,1; 0, 25; 0,5; 0,75; 0,9. Czy coś się zmieniło w porównaniu z zadaniem z poprzedniego slajdu?

Praca domowa ME.4 1. W ekonomii finansowej jednym z centralnych zagadnień jest w jaki sposób rynek wycenia akcje firm. Teoretycznie ich cena powinna zależeć od przewidywań inwestorów odnośnie przyszłych zysków firmy. W praktyce nie obserwujemy ocen inwestorów, a jedynie ceny akcji oraz różne charakterystyki firmy. Wykorzystując zbiór me.equity.lpj oraz regresję kwantylową odpowiedz na następujące pytania: 1. Jakie charakterystyki firm wpływają na cenę ich nowych akcji? 2. W literaturze sugeruje się, że nowe akcje firm, które po raz pierwszy wchodzą na rynek finansowy (IPO Initial Public Offering) są niedocenione w porównaniu z firmami, które już mają w obrocie jakieś swoje akcje (SEO seasoned equity offering). Czy faktycznie tak jest? 3. Czy wnioski różnią się dla różnych kwantyli rozkładu? Porównaj różne formy funkcyjne Praca w grupach dwuosobowych (innych niż do tej pory) 19.10.2015 22:56:43