Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Podobne dokumenty
Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 2. Mikołaj Czajkowski Wiktor Budziński

Monte Carlo, bootstrap, jacknife

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Natalia Neherbecka. 11 czerwca 2010

Pobieranie prób i rozkład z próby

Stanisław Cichocki. Natalia Nehrebecka

Mikroekonometria 14. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 2. Mikołaj Czajkowski Wiktor Budziński

Egzamin z ekonometrii wersja IiE, MSEMAT

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

METODY STATYSTYCZNE W BIOLOGII

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

Ekonometria Ćwiczenia 19/01/05

Własności statystyczne regresji liniowej. Wykład 4

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

STATYSTYKA MATEMATYCZNA

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Kolokwium ze statystyki matematycznej

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Oszacowanie i rozkład t

Wykład 9 Wnioskowanie o średnich

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

1. Symulacje komputerowe Idea symulacji Przykład. 2. Metody próbkowania Jackknife Bootstrap. 3. Łańcuchy Markova. 4. Próbkowanie Gibbsa

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Testowanie hipotez statystycznych

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Testowanie hipotez statystycznych

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Egzamin z ekonometrii - wersja ogólna

Regresja i Korelacja

Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Ekonometria. Robert Pietrzykowski.

Estymacja parametrów rozkładu cechy

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Podstawy opracowania wyników pomiarów z elementami analizy niepewności statystycznych

Przedziały ufności. Poziom istotności = α (zwykle 0.05) Poziom ufności = 1 α Przedział ufności dla parametru μ = taki przedział [a,b], dla którego

Wprowadzenie do analizy korelacji i regresji

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

STATYSTYKA MATEMATYCZNA

Testowanie hipotez statystycznych.

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

Zadania ze statystyki, cz.6

Estymacja parametrów w modelu normalnym

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

PDF created with FinePrint pdffactory Pro trial version

Komputerowa Analiza Danych Doświadczalnych

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

Statystyka w przykładach

BIOINFORMATYKA. Copyright 2011, Joanna Szyda

Stanisław Cichocki. Natalia Nehrebecka

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Właściwości testu Jarque-Bera gdy w danych występuje obserwacja nietypowa.

Ważne rozkłady i twierdzenia c.d.

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

Rozdział 8. Regresja. Definiowanie modelu

Sterowanie wielkością zamówienia w Excelu - cz. 3

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Wnioskowanie statystyczne. Statystyka w 5

Zagadnienia na egzamin magisterski na kierunku Informatyka i Ekonometria (2 stopień studiów)

e) Oszacuj parametry modelu za pomocą MNK. Zapisz postać modelu po oszacowaniu wraz z błędami szacunku.

Estymacja parametrów, przedziały ufności etc

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

Rozkłady statystyk z próby

Ilustracja metody MONTE CARLO. obliczania całek podwójnych

Testowanie hipotez statystycznych. Wprowadzenie

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Ekonometryczne modele nieliniowe

Weryfikacja hipotez statystycznych

Transkrypt:

Mikroekonometria 5 Mikołaj Czajkowski Wiktor Budziński

Zadanie 1. Wykorzystując dane me.medexp3.dta przygotuj model regresji kwantylowej 1. Przygotuj model regresji kwantylowej w którym logarytm wydatków na leki jest objaśniany przez to, czy ktoś posiada dodatkowe ubezpieczenie od pracodawcy (hi_empun), liczbę chorób przewlekłych (totchr), wiek (age), płeć (female), kolor skóry (blhisp) oraz logarytm dochodu (linc) Domyślnie Stata liczy regresję na medianie Policz model regresji kwantylowej dla kwantyli innych rzędów np. 0,25 i 0,75

Przykładowa zmiana kształtu rozkładu

Zalety regresji kwantylowej Brak założeń na temat rozkładu zmiennej zależnej Można modelować cały rozkład zmiennej, a nie tylko wybrane momenty Łatwość wykrycia heteroskedastyczności Bardziej odporna na występowanie outlierów niż KMRL dla średniej Kwantyl zmiennej przekształconej przy pomocy ściśle rosnącej funkcji g x jest równy przekształconemu kwantylowi oryginalnej zmiennej: i Xi y i Xi Q g y g Q

Wady regresji kwantylowej Wzory analityczne na macierz kowariancji estymatora regresji kwantylowej są skomplikowane, a przez to rzadko stosowane W praktyce stosuje się metody symulacyjne np. bootstrap, przez co model liczy się dłużej niż np. regresja liniowa Współcześnie nie jest to duży problem

Regresja kwantylowa a heteroskedastyczność Regresja kwantylowa może zostać wykorzystana do analizy heteroskedastyczności Parametry różniące się między kwantylami wskazują na istotną heteroskedastyczność 2. Policz regresję kwantylową dla kwantyli rzędu 0.1, 0.25, 0.5, 0.75, 0.9 wykorzystując polecenie sqreg 3. Przetestuj czy w analizowanych danych występuje heteroskedastyczność 4. Przeanalizuj graficznie, czy parametry zmieniają się między kwantylami

Metody symulacyjne Monte Carlo Metoda Monte-Carlo Wykorzystanie mocy obliczeniowej komputerów, aby poznać charakterystyki zmiennych losowych poprzez wielokrotne próbkowanie (zamiast rozwiązań analitycznych) Jak w kasynie wielokrotnie gramy i obserwujemy nasze wyniki, żeby ocenić np. jaka jest wartość oczekiwana jakiegoś zagrania Np. w celu szacowania wartości skomplikowanych całek

Metody symulacyjne symulowane dane Wykorzystanie symulowanych danych Zakładamy istnienie jakiegoś procesu generującego dane (DGP, data generating process) Takie dane pozwalają testować m.in.: Czy model ekonometryczny działa prawidłowo? Może programista się pomylił? Konsekwencje odstępstw od przyjętych założeń (np. dla KMRL) Zachowanie modelu dla małych prób Zaletą jest to, że dokładnie wiemy, jaki jest DGP Odpowiedź na powyższe pytania nie zawsze jest możliwa przy pomocy narzędzi analitycznych Proces może być zaimplementowany jako symulacja Monte Carlo, aby obserwować wariancję oszacowań

Testowanie działania modeli ekonometrycznych Algorytm symulacji Monte Carlo może wyglądać w następujący sposób 1. Określ DGP (specyfikację, wartości parametrów) 2. Wygeneruj wartości zmiennych objaśniających i błędy losowe Wykorzystaj odpowiednie rozkłady 3. Wygeneruj wartości zmiennej objaśnianej 4. Dokonaj estymacji modeli 5. Zapisz wyniki 6. Powtórz punkty 2-5 dużą liczbę razy 7. Przeprowadź analizę zapisanych wyników Średnia jako wartość oczekiwana Odchylenie standardowe jako błąd standardowy

Zadanie 2. Testowanie działania modeli ekonometrycznych 1. Sprawdź czy regresja liniowa jest w Stacie prawidłowo zaprogramowana 2. Sprawdź jakie są konsekwencje pominięcia kwadratowej zależności w modelu regresji liniowej 3. Sprawdź czy endogeniczność obciąża oszacowania regresji liniowej 4. Sprawdź czy model 2MNK rozwiązuje problem endogeniczności 5. Sprawdź czy zależność schodkowa może zostać przybliżona zależnością kwadratową? (Problem analizowany na zajęciach 3.)

Całkowanie przy pomocy metody Monte Carlo

Całkowanie przy pomocy metody Monte Carlo Załóżmy, że chcemy policzyć całkę Jeżeli potrafimy zapisać f y h y g y, gdzie g y to gęstość znanego ciągłego rozkładu, to możemy ją przybliżyć jako: Gdzie r y a b a b f y dy 1 f y dy h y r1 R R r jest wylosowane z rozkładu o gęstości g y

Zadanie 3. Całkowanie przy pomocy metody Monte Carlo Oszacuj używając metody Monte Carlo: 1. 1 0 1 exp 2 y 2 2 dy 1 2 exp exp y exp y 2dy 2 2.

Bootstrap Bootstrap to metoda symulacyjna, wykorzystująca podpróby posiadanej próby, zamiast wielu prób z populacji Może być wykorzystywana np. do wnioskowania statystycznego kiedy nie znamy teoretycznych właściwości danej statystyki/estymatora Jeśli mielibyśmy 1000 prób z pewnej populacji, to dla każdej z nich moglibyśmy policzyć daną statystykę i w efekcie otrzymać jej 1000 oszacowań Średnią z tych 1000 oszacowań moglibyśmy traktować jako jej najlepsze oszacowanie, a wariancję jako miarę niepewności Wykorzystując te charakterystyki moglibyśmy przeprowadzić wnioskowanie statystyczne

Bootstrap Z próby wielkości N losujemy ze zwracaniem B sztucznych prób również o długości N Przykładowo, mamy próbę 5 obserwacji: Sztuczne próby wyglądałyby np. tak: X1, X1, X 3, X 4, X 4 Albo X1, X 2, X 3, X 3, X 3 X1, X 2, X 3, X 4, X 5 Dla każdej z wylosowanych prób sztucznych obliczamy wartość interesującej nas statystyki/estymatora Wnioskowanie statystyczne przeprowadzamy analizując rozkład B oszacowań tej statystyki/estymatora

Zadanie 4. Bootstrap i Jackknife Jackknife Podobna (wcześniejsza) metoda, polegająca na doborze obserwacji opierającym się na pominięciu (jednej lub więcej) obserwacji z próby Np. przeprowadzamy regresję n razy, za każdym razem pomijając kolejną z n obserwacji 1. Wygeneruj sztuczne dane dla regresji z heteroskedastycznością 2. Porównaj błędy standardowe z KMRL, macierzy White a, bootstrapu oraz jackknife

Praca domowa ME.5 1. Przeanalizuj, wykorzystując metodę Monte Carlo, działanie testu Breusha-Pagana (na heteroskedastyczność), kiedy model ma niepoprawną formę funkcyjną 1. W pierwszym kroku przeprowadź symulację, w której model MNK ma poprawną formę funkcyjną oraz nie ma heteroskedastyczności 1. Jaki rozkład ma p-value testu B-P? W jakim procencie wygenerowanych zbiorów danych test dał zły wynik (np. p-value mniejsze niż 5%)? 2. W drugim kroku przeprowadź symulację, w której model MNK ma niepoprawną formę funkcyjną oraz nie ma heteroskedastyczności 1. Jaki rozkład ma p-value testu B-P? W jakim procencie wygenerowanych zbiorów danych test dał zły wynik (np. p-value mniejsze niż 5%)? 2. Porównaj wyniki z wynikami z pierwszego kroku 3. Co na podstawie przeprowadzonych symulacji można powiedzieć o działaniu testu B-P kiedy założenie o liniowej formie funkcyjnej jest niespełnione? Do przygotowania w grupach trzyosobowych 2018-04-08 21:27:39