Mikroekonometria 9 Mikołaj Czajkowski Wiktor Budziński
Wielomianowy model logitowy Użyteczność konsumenta i z wyboru alternatywy j spośród J i alternatyw X wektor cech (atrybutów) danej alternatywy Z wektor cech (charakterystyk) konsumenta ε składnik losowy (np. nieobserwowalne skłonności konsumenta) Parametry atrybutów zwykle są generyczne Takie same dla każdej alternatywy, brak indeksu j Jeśli X zawiera stałe (specyficzne dla alternatywy) nie może ich być więcej niż J i 1 Uij = Xβ ij j + Zγ i j +ε ij Jedna z alternatyw poziomem referencyjnym Zmiana użyteczności wynikająca z wyboru innej alternatywy, związana z czynnikami niekontrolowanymi przez inne atrybuty Parametry charakterystyk respondentów muszą być specyficzne dla alternatywy Inaczej ich wpływ się znosi, ponieważ Z nie różnią się pomiędzy alternatywami Z nie może zawierać stałej Jedna z alternatyw poziomem referencyjnym (parametry ustalone na poziomie 0) Wpływ charakterystyk respondenta na prawdopodobieństwo wyboru innej alternatywy
Wielomianowy model logitowy ε ij niezależne składniki losowe o jednakowych rozkładach (ang. independent, identically distributed, IID) Jeśli ε ij mają rozkład wartości ekstremalnych I rodzaju to ( j) P Y i = = ( Xβ ij j ) ( Xβ ij j ) Zmienna objaśniana przyjmuje wartość 1 dla wybranej alternatywy i 0 wpp (d ij ) lnl J i exp j= 1 N Ji = dij Ji i= 1 j= 1 j= 1 Gradient i Hesjan są stosunkowo proste estymacja przebiega standardowo exp exp exp ( Xβ ij j ) ( Xβ ij j )
Wielomianowy model logitowy Ponieważ składniki losowe IID, a parametry takie same dla każdego respondenta panelowa struktura danych nie ma znaczenia Miary dopasowania te same problemy co dla modeli wyboru binarnego Wyniki (parametry) wymagają uważnej interpretacji Osadzenie w ramach modelu użyteczności losowej pozwala na wygodną interpretację miar zmian dobrobytu Gotowość do zapłaty (ang. willingness to pay, WTP) Np. krańcowe stopy substytucji, zmiana kompensująca
Przykład wybór sposobu wędkowania 1. Wczytaj zbiór danych me.fishmode.lpj 2. Skonstruuj model wyjaśniający wybór sposobu wędkowania za pomocą charakterystyk respondentów (stałej i dochodu) MLOGIT ;... $ MLOGIT wielomianowy model logitowy (nie warunkowy - dla danych specyficznych dla respondenta) 1 wiersz = 1 respondent Zmienna objaśniana wartości od 0 do J-1 3. Zinterpretuj wyniki
Przykład wybór sposobu wędkowania 4. Wczytaj zbiór danych me.fishmode2.lpj 5. Skonstruuj model wyjaśniający wybór sposobu wędkowania za pomocą atrybutów wyboru (stałych specyficznych dla alternatyw, ceny czarteru i oczekiwanej wielkości połowu) NLOGIT... ; choices =... ; lhs =... ; rhs =... $? lub ; model:? U(alt1) =... /? U(alt2) =...? (lub U(*) =...) NLOGIT wielomianowy model logitowy dla danych specyficznych dla alternatywy 1 wiersz = 1 alternatywa Zmienna objaśniana wartości 0 lub 1
Przykład wybór sposobu wędkowania 6. Uzupełnij powyższy model o charakterystyki respondentów 7. Zinterpretuj uzyskane wyniki
Efekty cząstkowe Efekty cząstkowe definiuje się inaczej niż w pozostałych modelach. Polecenie PARTIALS nie działa. ; effects: var1 [alt1,alt2, ] / var2 [alt1,alt2, ] liczy efekty cząstkowe ; full dodatkowy output (elastyczności, istotność) ; means liczy efekty cząstkowe dla średnich wartości zmiennych 8. Policz efekty cząstkowe dla ceny czarteru i oczekiwanej wielkości połowu 9. Policz efekt cząstkowy dla dochodu 10. Spróbuj uwzględnić w modelu logarytm dochodu, a policzyć efekt cząstkowy dochodu (dochodu, nie logarytmu dochodu!)
Niezależność od niewybranych alternatyw Wielomianowy model logitowy jest prosty, ale narzuca dość restrykcyjne założenia Składniki losowe IID Użyteczność z wyboru różnych alternatyw nieskorelowana Iloraz prawdopodobieństw wyboru 2 alternatyw nie zależy od atrybutów pozostałych alternatyw (ang. independence from irrrelevant alternatives, IIA) Jeśli dwie alternatywy podobne, to spodziewamy się, że składnik losowy dla nich będzie skorelowany Przykład wybór między autobusem, czerwonym samochodem i czarnym samochodem Spodziewamy się, że możliwość wyboru czarnego samochodu nie zmieni znacząco wyboru autobusu, a zmniejszy częstość wyboru czerwonego samochodu Założenia MNL oznaczają, że wpływ na wybór każdej alternatywy będzie jednakowy
Niezależność od niewybranych alternatyw Test IIA test Hausmana i McFaddena Jeśli jakiś podzbiór alternatyw faktycznie nie ma znaczenia dla wyborów, to po ich usunięciu ze zbioru nie zmieni systematycznie oszacowań parametrów Jeśli założenia spełnione pomijanie alternatyw jest nieefektywne, ale nie powinno powodować niezgodności Statystyka testu 1 ( r f ) ( r f ) ( r f ) H = β β V V β β r estymator dla ograniczonego zbioru wyborów f estymator dla pełnego zbioru wyborów Statystyka ma rozkład chi-kwadrat z liczbą stopni swobody równą liczbie parametrów
Niezależność od niewybranych alternatyw 1. Wykorzystaj me.fishmode2.lpj do przetestowania właściwości IIA modelu MNL NLOGIT ;... $ NLOGIT ;... ; ias = <lista nazw alternatyw do pominięcia> $ Ręcznie: W części ; choices umieść nazwy alternatyw w nawiasach Test może nie działać dla modeli ze stałymi specyficznymi dla alternatyw (modele muszą mieć tyle samo parametrów) Zautomatyzowany test może nie działać dla niektórych alternatyw (problemy numeryczne) Duża wartość statystyki - małe prawdopodobieństwo (p-value) popełnienia błędu odrzucając hipotezę zerową (o IIA)
Case study segregacja odpadów Badanie DCE z 2011 roku, mieszkańcy Podkowy Leśnej Kontekst wprowadzenie ustawy śmieciowej Jakie czynniki mają znaczenie dla wyboru optymalnego kontraktu wywozu odpadów? Liczba kategorii sortowania Częstotliwość odbioru Koszt
Case study segregacja odpadów Przykładowa sytuacja wyboru 311 gospodarstw domowych 6 sytuacji wyboru na respondenta
Case study segregacja odpadów 1. Wczytaj zbiór danych me.recycling.lpj 2. Skonstruuj model wyjaśniający jakie czynniki mają znaczenie przy wyborze optymalnego kontraktu Co oznaczają 'złe obserwacje' Czy model powinien zawierać stałe specyficzne dla alternatywy? Przetestuj czy założenie o stałych krańcowych użytecznościach atrybutów jest uzasadnione Przetestuj założenie o IIA Oblicz gotowości do zapłaty za poszczególne poziomy atrybutów
Wielomianowe modele logitowe Większość poznanych wcześniej narzędzi można stosować także w przypadku modelu MNL Testy statystyczne Wprowadzanie restrykcji Przechowywanie rezultatów Kontrolowanie outputu
Praca domowa ME.9 (grupy 2 lub 3-osobowe) 1. Wczytaj zbiór danych me.modechoice.lpj 2. Policz prosty model wyjaśniający wybór środka podróży czasem oczekiwania (TTME), kosztem podróży (INVC) oraz czasem podróży (INVT) 1. Przetestuj założenie o IIA 2. Zinterpretuj wyniki wykorzystując WTP Jakie jest WTP za jednostkę czasu oczekiwania? Jakie jest WTP za jednostkę czasu podróży? 3. Zinterpretuj wyniki wykorzystując efekty cząstkowe 3. Dodaj do modelu zmienne socjodemograficzne (PSIZE i HINC) oraz stałe specyficzne dla alternatywy 1. Zinterpretuj wyniki wykorzystując efekty cząstkowe 2. Czy wnioski się zmieniły? 2015-11-25 21:19:10