Zawansowane modele wyborów dyskretnych

Podobne dokumenty
Uogolnione modele liniowe

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Modele zapisane w przestrzeni stanów

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

Stanisław Cichocki. Natalia Nehrebecka

Metoda Monte Carlo. Jerzy Mycielski. grudzien Jerzy Mycielski () Metoda Monte Carlo grudzien / 10

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka

Ważne rozkłady i twierdzenia c.d.

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka

Metoda największej wiarogodności

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

Analiza przeżycia. Wprowadzenie

Komputerowa Analiza Danych Doświadczalnych

Modele długości trwania

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Losowe zmienne objaśniające. Rozszerzenia KMRL. Rozszerzenia KMRL

Weryfikacja hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Natalia Neherbecka. 11 czerwca 2010

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Prawdopodobieństwo i statystyka r.

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka

O ŚREDNIEJ STATYSTYCZNEJ

L.Kowalski zadania z rachunku prawdopodobieństwa-zestaw 4 ZADANIA - ZESTAW 4

Stanisław Cichocki. Natalia Neherebecka. Zajęcia 15-17

Mikroekonometria 2. Mikołaj Czajkowski Wiktor Budziński

Matematyka ubezpieczeń majątkowych r.

Stanisław Cichocki. Natalia Nehrebecka

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

1 Gaussowskie zmienne losowe

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej

Metoda największej wiarygodności

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

Mikroekonometria 9. Mikołaj Czajkowski Wiktor Budziński

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Funkcje charakterystyczne zmiennych losowych, linie regresji 1-go i 2-go rodzaju

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

Kolokwium ze statystyki matematycznej

Egzamin z ekonometrii IiE

Rachunek prawdopodobieństwa i statystyka

Binarne zmienne zależne

Prawdopodobieństwo i statystyka

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Mikroekonometria 2. Mikołaj Czajkowski Wiktor Budziński

Statystyka i eksploracja danych

Prawdopodobieństwo i statystyka r.

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

Testowanie hipotez statystycznych

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16

Wstęp do Rachunku Prawdopodobieństwa, IIr. WMS

JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Redukcja wariancji w metodach Monte-Carlo

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

3. Optymalizacja portfela inwestycyjnego Model Markowitza Model jednowskaźnikowy Sharpe a Model wyceny aktywów kapitałowych CAPM

Metody probabilistyczne

Uogólniona Metoda Momentów

Stosowana Analiza Regresji

Podstawowe modele probabilistyczne

Testowanie hipotez statystycznych

Metody systemowe i decyzyjne w informatyce

dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Komputerowa analiza danych doświadczalnych

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

Propensity score matching (PSM)

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Prawdopodobieństwo i statystyka

Spis treści 3 SPIS TREŚCI

Parametr Λ w populacji ubezpieczonych ma rozkład dany na półosi dodatniej gęstością: 3 f

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Matematyka ubezpieczeń majątkowych r.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

WYKŁAD 8 ANALIZA REGRESJI

Metody systemowe i decyzyjne w informatyce

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Analizowane modele. Dwa modele: y = X 1 β 1 + u (1) y = X 1 β 1 + X 2 β 2 + ε (2) Będziemy analizować dwie sytuacje:

Transkrypt:

Zawansowane modele wyborów dyskretnych Jerzy Mycielski Uniwersytet Warszawski grudzien 2013 Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 1 / 16

Model efektów nieobserwowalych dla prób panelowych Zmienna ukryta y i = x it β+ c i + u it Zmienna obserwowalna { 1 dla y y i = i 0 0 dla yi < 0 Kluczowe założenie: c i zależne od x it = model efektów stałych c i niezależne od x it = model efektów losowych Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 2 / 16

Estymator efektów stałych - problem parametrów pobocznych Warunkowa funkcja prawdopodobieństwa: Pr (y i = 1 c i ) = Pr (x it β+ c i + u it 0) = F (x it β+ c i ) Czy można w tym przypadku zastosować estymator analogiczny do estymatora LSDV i oszacować model z dodatkowymi zmiennymi zerojedynkowymi dla każdej jednostki? Niestety estymator taki będzie zgodny tylko dla T i N, dla T ustalonego nie będzie zgodny Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 3 / 16

Estymator efektów stałych - problem parametrów pobocznych c.d. Estymator LSDV w liniowym modelu efektów nieobserwowalnych jest o tyle wyjątkowy, że można dla niego pokazać β FE p β dla N i T ustalonego mimo, że ĉ nie jest zgodny (ĉ p c dla N i T ustalonego) co wynika z asymptotycznej niezależności obu estymatorów Wynik ten generalnie nie jest prawdziwy w przypadku modeli nieliniowych problem parametrów pobocznych (incidental parameters problem) Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 4 / 16

Model logitowy z efektami stałymi Okazuje się, że w przypadku modelu logitowegoprawdopodobieństwa warunkowego względem ilości sukcesów n i dla jednostki i, nie zależy od c i Na przykład dla T = 2 Pr (y i2 = 1 x i, c i, n i = 1) = Pr (y i2 = 1, n i = 1 x i, c i ) Pr (n i = 1 x i, c i ) Pr (y i2 = 1 x i, c i ) Pr (y i1 = 0 x i, c i ) = Pr (y i1 = 0, y i2 = 1 x i, c i ) + Pr (y i1 = 1, y i2 = 0 x i, c i ) Λ (x i2 β + c i ) [1 Λ (x i1 β + c i )] = [1 Λ (x i1 β + c i )] Λ (x i2 β + c i ) + Λ (x i1 β + c i ) [1 Λ (x i2 β + c i )] = Λ [(x i2 x i1 ) β] Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 5 / 16

Model logitowy z efektami stałymi c.d. Ogólnie Pr (y i x i, c i, n i = n) = ( ) exp T i=1 y it x it β exp ( a Ri a t y it x it β ) } where R i R T oraz R i = {a : a t {0, 1}, T i=1 a i = n i Funkcję wiarygodności budujemy przy użyciu tej prawdopodobieństwa Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 6 / 16

Model probitowy z efektami losowymi Obserwacje dla poszczególnych jednostek nie są niezależne Obserwacje dla różnych jednostek są od siebie niezależne zgodnym ale nieefektywnym estymatorem jest w takim przypadku estymator pseudo ML (identyczny w sensie obliczeniowym do estymatora ML). macierz wariancji dla oszacowań powinniśmy w tym przypadku uzyskać za pomocą estymatora warstwowego (cluster ) Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 7 / 16

Model probitowy z efektami losowymi Estymator ML Warunkowa funkcja prawdopodobieństwa dla obserwacji dla jednostki i: Pr (y i c i ) = T t=1 [Φ (x it β+ c i )] y it [1 Φ (x it β+ c i )] 1 y it Załóżmy, że efekty losowe są pochodzą z wielowymiarowego rozkładu normalnego i są niezależne: c N ( 0, σ 2 ui ) Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 8 / 16

Model probitowy z efektami losowymi Estymator ML c.d. Bezwarunkowa funkcja prawdopodbieństwa ma więc następującą postać: Pr (y i ) = T t=1 ( ci 1 σ c φ [Φ (x it β+ c i )] y it [1 Φ (x it β+ c i )] 1 y it σ c ) dc i Tego rodzaju całki nie da się policzyć analitycznie - zamiast tego stosujemy metody numeryczne (kwadratury) W modelu probitowym z efektami losowymi obserwacje są niezależne pomiędzy jednostkami, więc funkcja wiarygodności ma standardową postać: N l (β) = ln Pr (y i ) i=1 Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 9 / 16

Kwadratury Kwadratura polega na zastąpieniu całki sumą policzoną dla pewnego zbioru punktów. W najprostszym przypadku: b a f (x) dx gdzie d = a b S, x i = a + (i + 0.5) d S 1 f (xi ) d s=0 Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 10 / 16

Model probitowy i logitowy na estymowane rangach charakterystyka danych mamy K alternatyw dysponujemy uszeregowaniem alternatyw pod względem ich atrakcyjności y ki > y ki >... > y ki uszeregowanie nie musi być kompletne Metoda szacowania: oparta na estymatorze dla modelu proporcjonalnego hazardu Cox-a Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 11 / 16

Model probitowy z endogenicznymi zmiennymi objaśniającymi c.d. Model yi1 = y 2i β + x 1i γ + u 1i = z i δ + u 1i y 2i = x 1i α 1 +x 2i α 2 + u 2i = x i α + u 2i Zmienna y 2i jest bezpośrednio obserwowalna i endogeniczna w równaniu dla zmiennej ukrytej y i1, ponieważ Cov (u 1i, u 2i ) = 0. Zakładamy, że wektor błędów losowych u i N (0, Σ) przy czym przyjmujemy założenie identyfikujące parametry, że Σ 11 = 1 Powyższy model ma strukturę rekursywną y 2i pojawia się w równaniu dla yi1 ale y i1 nie pojawia się w równaniu dla y 2i. Równanie dla y 2i może być traktowane jako forma zredukowana Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 12 / 16

Zmienna obserwowalna { 1 dla y y 1i = i 0 0 dla yi < 0 Funkcja prawdopodobieństwa dla zdarzenia i f (y 1i, y 2i x 1i, x 2i ) = Pr (y 1i y 2i, x 1i, x 2i ) f (y 2i x 1i, x 2i ) ( ) = [Φ (m i )] y 1i [1 Φ (m i )] 1 y 1 1i σ φ y2i x 1i α σ gdzie m i = z i δ+ ρ (y 2i x i α) (1 ρ 2 ) 1 2 a ρ jest współczynikiem korelacji między u 1i i u 2i Z użyciem tej funkcji prawdopodbieństwa możemy stworzyć funkcję wiarygodności Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 13 / 16

Załóżenie o symetrii rozkładu Asymetryczny logit (skewed logit) Założenie o symetrii rozkładu w mówi, że F (z) = 1 F (z) Założenie to implikuje, że efekt cząstkowy jest najwyższy dla F (x i β) = 1 2 Istotnie efekt cząstkowy E (y i x i ) x i = f (x i β) β k a dla rozkładu symetrycznego wartość modalna jest zawsze równa medianie Jeśli chcemy to zzałożenie uchylić powinniśmy użyć modelu o niesymetrycznym rozkładzie błędu loswego dla zmiennej ukrytej Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 14 / 16

Załóżenie o symetrii rozkładu Asymetryczny logit (skewed logit) Model: prawdopodbieństwo sukcesu dla F (z) = 1 Dla α = 1 otrzymujemy logita Pr (y i = 1) = F (x i β) 1 [1 + exp (x)] α, α > 0 W innych przypadkach rozkład zmiennej losowej jest niesymetryczny Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 15 / 16

Załóżenie o symetrii rozkładu loglog model Model: prawdopodbieństwo sukcesu Pr (y i = 1) = F (x i β) dla F (z) = 1 exp [ exp (z)] W tym przypadku dystrybuanta jest także niesymetryczna Model ten używamy gdy liczba sukcesów (bądź porażek jest mała) Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 16 / 16