Materiał dla studentów Metoda zmiennych instrumentalnych Nazwa przedmiotu: metody ekonometryczne, ekonometria stosowana Kierunek studiów: Metody Ilościowe w ekonomii i systemy informacyjne Studia I stopnia/studia II stopnia Opracował/a: mgr Monika Bazyl, Kolegium Analiz Ekonomicznych Warszawa, kwiecień 1
I. Informacje wstępne W kaŝdym modelu ekonometrycznym naleŝy ustalić, które zmienne są endogeniczne (wyjaśniane przez model), a które są egzogeniczne (pełniące rolę zmiennych wyjaśniających). W praktyce nie zawsze łatwo jest to ustalić, które zmienne są prawdziwie egzogeniczne. Budując zwykłą regresję liniową zakładamy, Ŝe jest jedna zmienna endogeniczna po lewej stronie równania, a wszystkie zmienne po prawej stronie równania są egzogeniczne. To załoŝenie nie jest spełnione, gdy pominiemy w modelu waŝną zmienną, która moŝe wpływać na jedną ze zmiennych objaśniających lub kiedy zmienna objaśniana w znacznym stopniu wpływa na jedną ze zmiennych objaśniających. Wyniki otrzymane klasyczną metodą najmniejszych kwadratów są wtedy obciąŝone. Jednym ze sposobów rozwiązania problemu jest zastosowanie metody zmiennych instrumentalnych. Studium przypadku ma pomóc studentom poznać bliŝej problem endogeniczności zmiennych objaśniających i metodę zmiennych instrumentalnych. Będzie ono obejmować analizę kilku przykładów opisanych w literaturze naukowej, analizę danych zebranych w ramach badania Diagnoza Społeczna oraz samodzielną budowę modelu z wykorzystaniem zmiennych instrumentalnych. Analiza przypadków z literatury ma pomóc w zrozumieniu, które zmienne naleŝy podejrzewać o endogeniczność oraz jakich instrumentów dla nich naleŝy szukać. Studenci powinni takŝe nauczyć się ocenić jakość wybranych instrumentów oraz zasadność stosowania instrumentów na podstawie wyników testów. II. Harmonogram/scenariusz realizacji/kolejność działań Etap 1 Opowiedz, czego dotyczy model w artykule, który otrzymałeś. Podaj interpretację parametrów modelu. Porównaj wyniki otrzymane KMNK i metodą zmiennych instrumentalnych. Które zmienne objaśniające zostały uznane za endogeniczne, dlaczego, jakich instrumentów uŝyto dla tych zmiennych, czy są to dobre instrumenty? (Przykładowa interpretacja modelu z Artykułu 1 jest poniŝej). Etap Na podstawie dostępnych danych zaproponuj własny model. Ustal, jaką zaleŝność chcesz sprawdzić za pomocą modelu. Wybierz zmienną objaśnianą i zmienne objaśniające. WskaŜ zmienną objaśniającą, którą podejrzewasz o endogeniczność, uzasadnij dlaczego. WskaŜ zmienne, które uŝyjesz jako instrumenty dla zmiennej endogenicznej. Uzasadnij, dlaczego uwaŝasz, Ŝe są to dobre instrumenty. (Przykładowy model omówiony jest poniŝej). Grupa z numerem wyŝszym komentuje propozycje grupy z numerem niŝszym. Czyli grupa nr komentuje propozycję grupy 1, grupa 3 komentuje grupę itd., a grupa nr 1 komentuje ostatnią grupę) Etap 3 Oszacuj zaproponowany przez Ciebie model w Gretlu. Najpierw oszacuj model klasyczną metodą najmniejszych kwadratów traktując wszystkie zmienne objaśniające jako egzogeniczne. Następnie oszacuj model podwójną metodą najmniejszych kwadratów wprowadzając instrumenty. Oceń jakość instrumentów oraz zasadność wprowadzania
instrumentów. Przedstaw wyniki, które otrzymałeś. (Prowadzący pokaŝe sposób szacowania na przykładzie) III. Opis przypadku/sytuacji 1). Interpretacja modelu z artykułu. Przykładowa interpretacja artykułu nr 1 (omówi prowadzący): Model wyjaśnia wpływ edukacji wyŝszej oraz doświadczenia na zarobki absolwenta uczelni. Model 1 został oszacowany KMNK, natomiast w modelu zastosowano zmienne instrumentalne, tzn. zmienna EDUC została potraktowana jako zmienna endogeniczna i jako instrumenty wykorzystano m.in. zawód ojca, edukację matki oraz zmienną określającą płeć absolwenta. Osoba moŝe skrócić swój czas edukacji na uczelni wyŝszej (np. uzyskać jedynie licencjat, nie starać się o tytuł magistra lub doktora) poniewaŝ ma moŝliwość wysokich zarobków w firmie. Stąd zmienna EDUC jest po części skutkiem zmiennej zaleŝnej w modelu LN_NHWAGE, zatem naleŝy ją traktować jako zmienną endogeniczną. W modelu oszacowanym klasyczną MNK wpływ edukacji jest niedoszacowany: wzrost liczby lat edukacji o 1 rok powoduje wzrost zarobków (na godzinę) w przybliŝeniu o 7,75%. Natomiast według modelu zawierającego zmienne instrumentalne (szacowanego podwójną MNK) wzrost liczby lat edukacji o 1 rok powoduje wzrost zarobków w przybliŝeniu o 13,7%. Dobre instrumenty to są takie zmienne, które są mocno skorelowane ze zmienną endogeniczną (EDUC), ale jednocześnie jak najsłabiej skorelowane ze składnikiem losowym modelu. Tu zawód ojca jest traktowany jako proxy (wskaźnik) dochodu rodziny. Jeśli ojciec absolwenta zajmuje kierownicze stanowisko, to jest w stanie sfinansować edukację dziecka o kilka lat dłuŝej (parametr przy zmiennej OCCUFA jest dodatni= 3.78E-1), natomiast zakłada się, Ŝe nie powinno to bezpośrednio wpływać na zarobki dziecka. Liczba lat edukacji matki równieŝ istotnie (dodatnio) wpływa na liczbę lat edukacji dziecka. ). A. Propozycja modelu Zestaw danych w pliku case_dane.xls jest fragmentem bazy danych Diagnoza Społeczna (dostępna na stronie internetowej http://www.diagnoza.com). Dane opisują sytuację społeczno-ekonomiczną gospodarstw domowych w Polsce oraz ich opinie i postawy. Plik obejmuje jedynie województwo Mazowieckie i tylko osoby, które są głowami gospodarstwa domowego. Opis zmiennych znajduje się w pliku case_dane.xls w zakładkach opis zmiennych i wartosci zmiennych. Na podstawie dostępnych danych zaproponowano model : + βwykszt Model zakłada, Ŝe na poziom oszczędności w gospodarstwie domowym wpływa wiek i wykształcenie respondenta oraz dochód w gospodarstwie domowym. Zmienna dochód (dl) moŝe być endogeniczna w modelu, poniewaŝ pewne nie obserwowane cechy, które wpływają na skłonność do oszczędzania, mogą teŝ wpływać na umiejętność osiągania wysokich zarobków (pracowitość, troska o sytuację finansową rodziny). Stąd warto zastosować metodę zmiennych instrumentalnych. Jako instrumenty do zmiennej dochód (dl) proponowane są: 3
znajomość języków obcych oraz zmienna binarna wskazującą, czy osoba pracuje na pełny etat. Model ma wtedy postać: + βwykszt dochod = λ + λ1wiek + λwykszt + λ3 jezyk _ obcy + λ4etat + µ Rozbijamy w ten sposób zmienną dochód na dwie części: kombinację liniową czterech zmiennych (która z załoŝenia jest nieskorelowana z ε ) oraz na składnik losowy µ (który prawdopodobnie jest skorelowany z ε ). B. Estymacja modelu Najpierw oszacujemy model klasyczną metodą najmniejszych kwadratów (KMNK) + βwykszt gdzie oszcz=df wiek=7-(19+dc8) (zmienna dc8 zawiera dwie ostanie cyfry roku urodzenia) wykszt= (1 jeśli respondent ma co najmniej stopień licencjata, w pozostałych przypadkach) Opcia Definiowanie nowej zmiennej: wykszt=(dc11=1 dc11=11 dc11=1)), gdzie jest oznacza lub dochod=dl Oszacowania modelu za pomocą KMNK pokazują, Ŝe dochód ma istotny dodatni wpływ na poziom oszczędności. Pozostałe dwie zmienne w modelu są nieistotne. Następnie oszacujemy model podwójną MNK: + βwykszt dochod = λ + λ1wiek + λwykszt + λ3 jezyk _ obcy + λ4etat + µ gdzie jezyk obcy= (1, gdy respondent zna czynnie jeden z języków: ang, niem, franc lub hiszp) Opcja Definiowanie nowej zmienne:j jezyk_obcy=(dc18=1 dc19=1 dc=1 dc=1) etat=(dd6=1) (1, gdy respondent pracuje na pełny etat, w pozostałych przypadkach) Początkowo zmienna dd6 przyjmowała wartości 1(tak), (nie) > ctrl+f -> dd6 w zakładce wartosci_zmiennych Wyniki oszacowane MNK (wprowadzając instrumenty) pokazały, Ŝe dochód stracił na istotności. (Menu gretl: model/inne liniowe modele/podwójna metoda najmniejszych kwadratów-jako zmienne objaśniające wybieramy wiek, wyzsze, dl, a jako instrumenty wiek, wyzsze, jezyk_obcy i etat) 4
NaleŜy sprawdzić czy instrumenty uŝyte w modelu są dobrej jakości, są waŝne i czy naleŝało je wprowadzać. SłuŜą do tego wyniki testów pokazane poniŝej modelu szacowanego MNK. Test Hausmana sprawdza hipotezę zerową: stosowanie zmiennych instrumentalnych nie jest potrzebne (zmienna dochod [dl] nie jest endogeniczna lub inaczej µ nie jest skorelowane z ε). Test ten porównuje oszacowania otrzymane za pomocą KMNK i MNK. Jeśli róŝnice są nieistotne, to stosowanie MNK nie było potrzebne. W naszym przypadku statystyka testu wyniosła 34 z wartością p bliską, zatem naleŝy odrzucić hipotezę zerową. Stosowanie zmiennych instrumentalnych wniosło istotne róŝnice do modelu. Test Sargana (nadmiernej identyfikacji) sprawdza hipotezę zerową: wszystkie instrumenty w modelu są waŝne czyli egzogeniczne (nieskorelowane ze składnikiem losowym modelu ε ). Test moŝe być przeprowadzony tylko, jeśli uŝyjemy co najmniej dwóch instrumentów do naszej zmiennej endogenicznej. Test polega na oszacowaniu dodatkowego modelu, w którym zmienną zaleŝną są reszty modelu MNK a objaśniającymi wszystkie instrumenty (jezyk_obcy, etat, wiek, wykszt, gdzie wykszt i wiek są traktowane jako instrumenty same dla siebie). Współczynnik determinacji pomocniczego modelu powinien być niski. Statystyka TR =,4 ma rozkład χ ( k ), gdzie k=1=-1 jest liczbą nadmiernych identyfikacji ( instrumenty jezyk_obcy i etat minus 1 zmienna endogeniczna dochod) Wartość p dla statystyki wynosi,5, co oznacza, Ŝe nie odrzucamy hipotezy zerowej. Instrumenty w modelu są waŝne (nieskorelowane ze składnikiem losowym głównego modelu ε ). Statystyka testu F bada jakość naszych instrumentów. Sprawdza łączną istotność dwóch zmiennych jezyk_obcy i etat w modelu z 1 kroku czyli dochod = λ + λ1wiek + λwykszt + λ3 jezyk _ obcy + λ4etat + µ Wartość statystyki F=1,65 jest znacznie niŝsza niŝ 1, zatem niestety uŝyte instrumenty są słabe w wyjaśnianiu dochodu respondenta. Słabe instrumenty mogą powodować duŝe błędy standardowe parametrów modelu MNK. Dlatego nasza zmienna dochód mogła stracić na istotności. Współczynnik determinacji modelu szacowanego MNK (równy,1) jest obliczany ze e wzoru: R = 1. Nie jest to najlepsza odmiana R, poniewaŝ moŝe przyjąć wartości y ujemne jeśli e > y. Twoim zadaniem jest zaproponowanie i oszacowanie własnego modelu na podstawie otrzymanych danych z wykorzystaniem metody zmiennych instrumentalnych. Oceń następnie jakość i zasadność stosowania instrumentów. 5
IV. Wymagane rezultaty pracy i ich forma Etap 1: Ustnie wytłumaczenie innym grupom, czego dotyczy model z artykułu, jak naleŝy interpretować parametry modelu, dlaczego jedna ze zmiennych jest podejrzewana o endogeniczność, dlaczego, jakie instrumenty zostały wykorzystane, czy są to dobre instrumenty. Etap : Ustnie przedstawienie innym grupom swego pomysłu na model. Wskazać, która zmienna objaśniające jest podejrzewana o endogeniczność, dlaczego, jakie są proponowane instrumenty (oraz dlaczego instrumenty wydają się dobre). Etap 3: Oszacowany model, wyniki testów i ustne wyjaśnienie rezultatów. 6