Metodologia budowy modelu

Podobne dokumenty
Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18

Budowa modelu i testowanie hipotez

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Stanisław Cichocki Natalia Neherbecka

Stanisław Cihcocki. Natalia Nehrebecka

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Stanisław Cichocki Natalia Nehrebecka. Wykład 1

166 Wstęp do statystyki matematycznej

Statystyka matematyczna dla leśników

Egzamin z ekonometrii wersja IiE, MSEMAT

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Testowanie hipotez statystycznych

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

1 Modele ADL - interpretacja współczynników

Testowanie hipotez statystycznych

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Testowanie hipotez statystycznych.

Metoda największej wiarogodności

Wprowadzenie do analizy korelacji i regresji

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych

Prawdopodobieństwo i statystyka

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12

Ekonometria Ćwiczenia 19/01/05

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Własności statystyczne regresji liniowej. Wykład 4

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Natalia Nehrebecka Stanisław Cichocki. Wykład 13

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Zmienne zależne i niezależne

Proces modelowania zjawiska handlu zagranicznego towarami

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Zawansowane modele wyborów dyskretnych

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Egzamin z ekonometrii - wersja ogólna

Stanisław Cichocki. Natalia Nehrebecka

Natalia Neherbecka. 11 czerwca 2010

Prawdopodobieństwo i rozkład normalny cd.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

EKONOMETRIA. Prof. dr hab. Eugeniusz Gatnar.

Metoda najmniejszych kwadratów

Testowanie hipotez statystycznych. Wprowadzenie

Hipotezy statystyczne

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Hipotezy statystyczne

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Statystyka Matematyczna Anna Janicka

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Stanisław Cichocki. Natalia Nehrebecka

Weryfikacja hipotez statystycznych

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Analizowane modele. Dwa modele: y = X 1 β 1 + u (1) y = X 1 β 1 + X 2 β 2 + ε (2) Będziemy analizować dwie sytuacje:

Regresja liniowa wprowadzenie

Ekonometria. Zajęcia

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Egzamin z ekonometrii wersja ogolna

MODELE LINIOWE. Dr Wioleta Drobik

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Statystyka Matematyczna Anna Janicka

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Transkrypt:

Rozdział 1 Metodologia budowy modelu W tym rozdziale omówimy problem metodologicznie poprawnego testowania hipotez i wyboru prawidłowej liczby zmiennych do modelu. Prawidłowy metodologicznie sposób ma kluczowe znaczenie przy ustalaniu zbioru zmiennych, które wpływają na zmienną zależną oraz przy narzucaniu dodatkowych ograniczeń na model. 1.1 Obciażenie Lovella Zaczniemy nasze rozważania od przypadeku testowania hipotezy złożonej o nieistotności wszystkich K zmiennych w modelu. Hipotezę tę można zapisać jako H 0 : β 1 =... = β K = 0 i przetestować jako hipotezę łączną przy poziomie istotności α. Wydawałoby się jednak, że prościej jest przetestować analizowaną hipotezę złożoną testując K hipotez prostych H 1 0 : β 1 = 0;... ; H K 0 : β K = 0, przy czym hipotezę o łącznej nieistotności wszytkich zmiennych odrzucimy, gdy odrzucona zostaje choć jedna z tych hipotez prostych. Okazuje się jednak, że testowanie kilku hipotez prostych nie jest równoważne testowi łącznemu dla wszystkich tych hipotez. Powodem tego jest różnica między założonym a rzeczywistym poziomu istotności w przypadku oddzielnego testowania kilku hipotez prostych. Załóżmy, że statystyki testowe dla każdej z hipotez prostych są od siebie niezależne. Poziomu istotności jest on równy prawdopodobieństwu błędu I rodzaju. Błąd I rodzaju popełniamy odrzucając prawdziwą H 0. W przypadku testowania hipotezy złożonej za pomocą testowania hipotez prostych popełnimy błąd I rodzaju, jeśli odrzucimy H 0 dla jakiejkolwiek z hipotez prostych, ponieważ odrzucimy wtedy także hipotezę złożoną o tym, że wszystkie zmienne są nieistotne. Prawdopodobieństwo, że nie popełnimy błędu I rodzaju jest więc równe prawdopodobieństwu, że żadna z prawdziwych hipotez nie zostanie odrzucona. Dla przypadku niezależnych statystyk testowych prawdopodobieństwo to jest równe (1 α) K. W konsekwencji prawdopodobieństwo popełnienia błędu pierwszego rodzaju jest równe: α = 1 (1 α) K Copyright c 2008 by Jerzy Mycielski 5

6 ROZDZIAŁ 1. METODOLOGIA BUDOWY MODELU Różnicę między założonym poziomem istotności α i prawdopodobieństwem α nazywamy obciążeniem Lovella. Zauważmy teraz, że lim K α = 1. Oznacza to, że dla dużej liczby testowanych hipotez prostych prawdopodobieństwo popełnienia błędu pierwszego rodzaju zbliża się do 1. Problem obciążenia Lovella związany jest z tak zwanym przekopywaniem danych (data mining). Przekopywanie danych służy znajdowaniu tych zmiennych, które są istotne przy wyjaśnianiu zmienności zmiennej zależnej. Z przeporwadzonych powyżej rozważań wynika, że jeśli wyjdziemy od wystarczająco dużego zbioru zmiennych wyjściowych i badać będziemy kolejno istotność zmiennych, to prawie zawsze znajdziemy pewne zmienne o istotnych statystykach t, nawet wtedy, gdy wszystkie zmienne w danym zbiorze są w rzeczywistości nieistotne. PRZYKŁAD 1.1 Grupa socjologów postanowiła przetestować hipotezę, że fakt urodzenia się pod konkretnym znakiem Zodiaku ma wpływ na losy respondentów. Do tego celu przeanalizowano bazę danych zawierającą datę urodzenia respondenta i jego prestiż jego zawodu w skali Treimana. Data urodzenia posłużyła do stworzenia 12 zmiennych zerojedynkowych determinujących znak Zodiaku, pod którym urodził się respondent. Zmienną zależną był prestiż wykonywanego zawodu, które stanowić miały miarę sukcesu życiowego. Uzyskano następujące wyniki estymacji: TABELA 1.1: Regresja prestiżu zawodu na znaku zodiaku Współczynnik Bład Std. t Pr ( t > t ) zodiak2-1.186 1.189-1.00 0.319 zodiak3-1.163 1.215-0.96 0.338 zodiak4-1.944 1.225-1.59 0.113 zodiak5-0.844 1.232-0.69 0.493 zodiak6 0.490 1.249 0.39 0.695 zodiak7-1.736 1.233-1.41 0.159 zodiak8-2.517 1.255-2.01 0.045 zodiak9-1.772 1.303-1.36 0.174 zodiak10-1.710 1.208-1.42 0.157 zodiak11-0.063 1.216-0.05 0.959 zodiak12-0.446 1.186-0.38 0.707 stała 39.486 0.866 45.60 0.000 Na poziomie istotności α = 0, 05 stwierdzono, że znaki Zodiaku mają istotny w wpływ na kariery zawodowe respondentów, ponieważ istotna okazała się zmienna zerojedynkowa związana z 8 znakiem zodiaku. Uzyskany wynik jest najprawdopodobniej rezultatem błędnej procedury testowania. Prawdziwy poziom istotności (przy założeniu niezależności wielkości statystyk testowych) wynosi α = 1 (0.9) 11 0, 44. Oznacza to, że dla prawdziwej hipotezy zerowej o nieistotności wszystkich współczynników w 44% przypadków uzyskujemy co najmniej jedną statystycznie istotną statystykę t. Prawidłowa procedura testowania istotności zbioru zmiennych polega na przetestowaniu, łącznej hipotezy o nieistotności wszystkich zmiennych zerojedynkowych. Wartość statystyki testowej dla tej hipotezy wynosi F (11, 2106) = 1.08, a policzony poziom istotności 0.38. Przy prawidłowym sposobie testowania hipotezy zero-

1.2. UPRASZCZANIE MODELU 7 wej, że nie ma podstaw do odrzucenia H 0, że znaki zodiaku nie wpływają istotnie na karierę zawodową. Testowanie hipotez prostych zamiast testowania hipotezy łącznej nie zawsze musi prowadzić do wyższego prawdopodobieństwa odrzucenia hipotezy zerowej. Dobrym przykładem jest tu model, w którym występuje współliniowość między x 1 i x 2. W takim przypadku statystyki t dla x 1 i x 2 mogą być niskie ponieważ wariancje estymatorów b 1 i b 2 są wysokie. Jednak spadek sumy kwadratów reszt w przypadku usunięcia zmiennych x 1 i x 2 może być duży pod warunkiem, że obie te zmienne są silnie skorelowane z y. W takim przypadku może się zdarzyć, że nie będzie podstaw do odrzucenia odrzucenia H 1 0 : β 1 = 0 i H 2 0 : β 2 = 0 na poziomie istotności α, ale odrzucimy, na tym samym poziomie istotności, hipotezę H 0 : β 1 = β 2 = 0. Podsumowując, przy testowaniu hipotez łącznych należy unikać wielokrotnego testowania hipotez prostych zamiast testowania hipotez złożonych. Przekonamy się jednak, że wielokrotnego testowania hipotez jest w praktyce trudno uniknąć. Można jednak te testy przeprowadzić tak, by przy zastosowany poziom istotności był bliski rzeczywistemu. PYTANIA: 1. Wyjaśnić co rozumiemy przez obciążenie Lovella. 1.2 Upraszczanie modelu Standardowo, gdy zaczynamy badanie ekonometryczne, dysponujemy pewnym zbiorem zmiennych, które potencjalnie mogą się okazać istotne dla wyjaśnienia zmiennej zależnej. Pojawia się pytanie w jaki sposób powinniśmy ustalić listę istotnych zmiennych. Poza hipotezą H 0 : β 1 =... = β K = 0 interesują nas więc też hipotezy dotyczące poszczególnych współczynników H 1 0 : β 1 = 0;... ; H K 0 : β K = 0. Jest więc dla nas ważne nie tylko to, czy którakolwiek zmienne w modelu jest istotna ale także to, które z nich są istotne. PRZYKŁAD 1.2 Rozważmy następujący model dynamiczny dla funkcji konsumpcji: kons t = µ + β 0 pkb t + β 1 pkb t 1 +... + β p pkb t p + ε t W modelu tym obecna konsumpcja zależy nie tylko od dochodu w obecnym okresie, ale także od dochodu z poprzednich okresów. Problemem przy specyfikacji tego modelu jest nie tylko to, że nieznane są wielkości parametrów α 1,..., α p ale nieznana jest także liczba opóźnień p, które powinniśmy umieścić w modelu. Szukanie prawidłowej specyfikacji modelu można rozumieć jako szukanie takiej specyfikacji, która przy możliwe małej liczbie parametrów dobrze opisuje analizowany zbiór danych. Obecnie uważa się, że właściwą metodą szukania specyfikacji modelu jest metoda od ogólnego do szczegółowego (general to specific). Wybór prawidłowego modelu w ramach tej metody można dokonać za pomocą klasycznych statystyk testowych, ale także za pomocą tak zwanych kryteriów informacyjnych.

8 ROZDZIAŁ 1. METODOLOGIA BUDOWY MODELU 1.3 Metoda od ogólnego do szczegółowego Nieusystematyzowane przeszukiwanie przeszukiwanie zbioru danych w celu znalezienia istotnych zmiennych niezależnych może nas doprowadzić do uznania przypadkowych zmiennych za zmienne istotne. Szczególnie łatwo może się tak stać w przypadku, gdy liczba obserwacji jest stosunkowo niewielka. Kluczowe dla osiągnięcia sukcesu przy przekopywaniu danych jest właściwe ustrukturyzowanie poszukiwań. Popularnym rozwiązaniem problemu szukania prawidłowej specyfikacji jest metodologia od ogólnego do szczegółowego. Polega ona na stopniowym upraszczaniu możliwie najogólniejszego modelu początkowego poprzez narzucanie na niego coraz bardziej rozbudowanych ograniczeń. Modele, które powstają po narzuceniu tych ograniczeń są zagnieżdżone w modelu ogólnym w tym sensie, że stanowią szczególne przypadki tego modelu. Ograniczenia narzucane na model definiowane są przez hipotezy, których prawdziwość testujemy. O hipotezach tych mówimy, że są w sobie zagnieżdżone, jeśli można je uszeregować tak, że H0 K zawiera najwięcej ograniczeń (daje najprostszy model), H0 K 1 podzbiór ograniczeń zawartych w H0 K i tak dalej aż do H0 1 zawierającej najmniej ograniczeń. Sytuację taką zapisujemy jako HK 0 H0 K 1... H0 1. PRZYKŁAD 1.3 Rozpatrzmy następujące modele y i = x 1i β 1 + x i2 β 2 + x 3i β 3 + ε i (1.1) y i = x 1i β 1 + x i2 β 2 + ε i (1.2) y i = x 1i β 1 + ε i (1.3) y i = x i2 β 2 + ε i (1.4) Model ogólnym jest w tym przypadku model (1.1). Model (1.2) jest szczególnym przypadkiem modelu ogólnego (jest w nim zagnieżdżony), który zachodzi, gdy prawdziwa jest hipoteza H 1 0 : β 3 = 0. Model (1.3) jest szczególnym przypadkiem modelu (1.1) przy H 2 0 : β 2 = β 3 = 0 a także w modelu (1.2). Wynika z tego, że H 2 0 H 1 0. Zauważmy jednak, że model (1.4) jest szczególnym przypadkiem modelu (1.1) dla hipotezy H 3 0 : β 1 = β 3 = 0, ale nie jest szczególnym przypadkiem modelu (1.2), a więc H 3 0 nie jest zagnieżdżona w H 1 0. Metoda od ogólnego do szczegółowego polega na sekwencyjnym testowaniu hipotez od H0 1 aż do momentu, kiedy hipoteza Hi 0 zostanie odrzucona. Przy testowaniu kolejnych hipotez zerowych hipotezą alternatywną jest zawsze model ogólny. PRZYKŁAD 1.4 c.d. 1.2 Przypuśćmy, że modelujemy poziom dochodu gospodarstwa domowego na podstawie następujących charakterystyk demograficzno-społecznych: miejsce zamieszkania (miasto, wieś, płeć głowy gospodarstwa (mężczyzna, kobieta) oraz poziomu wykształcenia głowy (podstawowe, średnie, wyższe). Łącznie w takim modelu będziemy mieć 4 zmiennych zerojedynkowych. Załóżmy, że interesują nas następujące hipotezy: H 1 0 : dla poziomu dochodu gospodarstwa nie ma znaczenia płeć głowy gospodarstwa. H 2 0 : dla poziomu dochodu gospodarstwa nie ma znaczenia płeć głowy gospodarstwa i miejsce zamieszkania. H 3 0 : dla poziomu dochodu gospodarstwa nie mają znaczenia żadna z charakterystyk. W modelu tym H 1 0 H 2 0 H 3 0. Stosując metodologię od ogólnego do szczegółowego powinniśmy najpierw przetestować hipotezę łączną, że zmienna zero-jedynkowe związana

1.4. MODELE NIEZAGNIEŻDŻONE - TESTY OBEJMOWANIA 9 z płcią są nieistotne. W przypadku braku podstaw do odrzucenia tej hipotezy testujemy hipotezę łączną, że 2 zmienne zero-jedynkowe związane z miejscem zamieszkania i płcią są nieistotne. Jeśli nie ma podstaw do odrzucenia tej hipotezy, to powinniśmy przetestować hipotezę o łącznej nieistotności wszystkich zmiennych. PRZYKŁAD 1.5 Ustalamy postać funkcji konsumpcji dla Polski na podstawie danych kwartalnych z lat 1995.1 do 2005.2. Testujemy najpierw szereg hipotez zagnieżdżonych związanych z istotnością opóźnień. Dodatkowo do przetestowanych hipotez dołączamy hipotezę o nieistotności nieopóźnionej wielkości dochodu w modelu oraz o nieistotności stałej. Uwzględnimy więc w modelu maksymalnie 5 opóźnień. Model jest na zmiennych zlogarytmowanych. Pierwsza specyfikacja daje nam następujące oszacowania: kons t = 0.446 0.177pkb t + 0.119pkb t 1 + 0.317pkb t 2 + 0.232pkb t 3 (0.331) (0.145 (0.137) (0.040) (0.042) 0.142 pkb t 4 + 0.227pkb t 5 (0.152) (0.137) Test dla hipotezy, że parametr przy pkb t 5 jest równy zeru daje policzony poziom istotności α = 0.11. Test hipotezy, że parametry przy pkb t 5 i pkb t 4 są równe zeru daje α = 0.24. Test dla hipotezy, że parametry przy pkb t 5, pkb t 4 i pkb t 3 są równe zeru daje α = 0.000.Wynika z tego, że powinniśmy w modelu uwzględnić 3 opóźnienia. Z kolei test hipotezy, że parametry przy pkb t, pkb t 4, pkb t 5 są równe zeru daje α = 0.22. Test hipotezy łącznej, że stała oraz współczynniki przy pkb t, pkb t 4 i pkb t 5 są równe zeru daje α = 0.09. Ostateczna forma modelu, jest więc następująca: kons t = 0.374 (0.039) pkb t 1 + 0.349 (0.038) pkb t 2 + 0.243 (0.041) pkb t 3 Gdy przekopujemy duże ilości zmiennych, przebadanie łącznej łącznej istotności wszystkich zmiennych jest niemożliwe z powodu zbyt małej ilości stopni swobody. Należy więc zaczynać od zbioru danych, których ewentualna przydatność w objaśnianiu danego zjawiska da się teoretycznie lub intuicyjnie uzasadnić. Sposób uszeregowania hipotez zagnieżdżonych może także mieć istotny wpływ na wynik testowania. Uszeregowanie hipotez powinno więc mieć jakieś uzasadnienie teoretyczne. PYTANIA: 1. Opisać procedurę od ogólnego do szczegółowego na przykładzie doboru liczby opóźnień w modelu. 1.4 Modele niezagnieżdżone - testy obejmowania W badaniach ekonometrycznych często stykamy się z przypadkami, kiedy konkurencyjne modele nie są w sobie zagnieżdżone. W tych przypadkach do wyboru modelu posługujemy się tak zwanymi testami obejmowania. O modelu A mówimy, że jest obejmuje (encompasses) model B, jeśli to, co można wyjaśnić za pomocą modelu B, może być także wyjaśnione za pomocą modelu A ale są elementy, które można wyjaśnić za pomocą modelu A, których nie da się wyjaśnić za pomocą modelu B. Pojęcie obejmowania można najłatwiej wyjaśnić na przykładzie.

10 ROZDZIAŁ 1. METODOLOGIA BUDOWY MODELU PRZYKŁAD 1.6 Zastanówmy się nad wzajemną relacją między mechaniką klasyczną i mechaniką relatywistyczną. Mechanika klasyczna nie jest szczególnym przypadkiem mechaniki relatywistycznej, jednak można powiedzieć, że mechanika relatywistyczna obejmuje mechanikę klasyczną w tym sensie, że wszystkie obserwacje, które można wyjaśnić za pomocą mechaniki klasycznej, można także wyjaśnić za pomocą mechaniki relatywistycznej. Są też jednak pewne obserwacje (takie jak wynik klasycznego eksperymentu Michelsona-Morley a dotyczącego pomiaru szybkości światła, czy istnienie czarnych dziur), które można wyjaśnić za pomocą mechaniki relatywistycznej ale nie dadzą się wyjaśnić za pomocą mechaniki klasycznej. Analizę obejmowania rozpoczniemy przykładem porównywania dwóch modeli o różnych zbiorach zmiennych objaśniających. H 0 : y = X A β B +ε 1 H 1 : y = X A β B +ε 1 (A) (B) Załóżmy, że zbiór zmiennych objaśniających z modelu A nie zawiera się w zbiorze zmiennych dla modelu B (X A X B ), oraz zbiór zmiennych dla modelu B nie zawiera się w zbiorze zmiennych dla modelu A (X B X A ). Przy takich założeniach ani model A nie jest zagnieżdżony w modelu B ani model B nie jest zagnieżdżony w modelu A. Pierwszy możliwy sposób testowania polega na znalezieniu modelu ogólnego, którego szczególnymi przypadkami są modele A i B. Model ten można zapisać w sposób następujący: y = X A β A + X B β B +W δ + ε gdzie X A jest macierzą zmiennych, które należą do X A, ale nie należą do X B, X B jest macierzą zmiennych, które należą do X B, ale nie należą do X A a W jest macierzą zmiennych, które należą do X A i X B. Model A może obejmować model B jedynie wtedy, gdy β B = 0. Gdyby β B 0, to za pomocą X B można by wyjaśnić zmienność y, której nie da się wyjaśnić za pomocą zmiennych zawartych w modelu A. Hipotezę o obejmowaniu przez model A modelu B, można zweryfikować testując hipotezę H 0 : β B = 0. Niestety nie wyczerpuje to całości zagadnienia. Zauważmy, że definicja obejmowania składa się z dwóch członów: po pierwsze model A ma wyjaśniać wszystko to co wyjaśnia model B, z drugiej strony powinny istnieć elementy, które wyjaśnia model A, a nie da się ich wyjaśnić za pomocą modelu B. Powinniśmy więc także pokazać, że istnieją zmienność y, którą można wyjaśnić wyłącznie za pomocą zmiennych pojawiających się w modelu A. Będzie to prawdą jeśli β A 0. Hipotezę o obejmowaniu B przez model A weryfikujemy testując dwie hipotezy : H0 : β B = 0 oraz H0 : β A = 0. Jeśli H0 nie zostanie odrzucona, a H 0 zostanie odrzucona, to model A obejmuje model B. Ponieważ przeprowadzamy dwa testy, więc możliwe są w sumie cztery przypadki. Poza omówionym przypadkiem, gdy model A obejmuje B, możemy uzyskać wynik, że B obejmuje A (H0 odrzucona, H 0 nie odrzucona), żaden model nie obejmuje drugiego (odrzucone H0 i H 0 ) oraz przypadek,

1.5. KRYTERIA INFORMACYJNE (SELEKCJA MODELU) 11 gdy nie da się ustalić, który model obejmuje który (nie odrzucone H 0 i H 0 ). Poza omówioną powyżej procedurą testowania istnieje jeszcze inny sposób testowania obejmowania, który omówimy poniżej. 1.4.1 Test J Test J oparty jest o inny sposób sformułowania ogólnego modelu, którego szczególnymi przypadkami są modele A i B. Model ten formułujemy w następujący sposób: y = (1 λ) X A β A + λx B β B +ε Łatwo się przekonać, że jeśli prawdziwa jest hipoteza o tym, że model A obejmuje model B, to prawdziwa musi być hipoteza H0 : λ = 0. Podobnie, jeśli model model B obejmuje model A, to prawdziwa musi być hipoteza H0 : λ = 1. Niestety sformułowanego powyżej modelu nie da się oszacować za pomocą zwykłym MNK, ponieważ jest to model nieliniowy. Można go jednak oszacować w dwóch krokach: 1. przeprowadzamy regresję y na X B uzyskujemy wartości dopasowane ŷ B = X B b B 2. przeprowadzamy regresję y na X A i ŷ B Test obejmowania przeprowadzamy testując istotność współczynnika przy ŷ B. Intuicyjnie, opisana procedura testowania opiera się na następującym przybliżeniu: y = (1 λ) X A β A + λx B β B +ε a (1 λ) X A β A + λx B b B + ε = (1 λ) X A β A + λŷ B + ε W przypadku testu J, podobnie jak w przypadku procedury opisanej wcześniej, może się okazać, że żaden model nie obejmuje drugiego (odrzucana zarówno hipoteza H0 jak i H 0 ) lub, że nie jesteśmy w stanie powiedzieć, który model obejmuje który (nie ma podstaw do odrzucenia H0 jak i H 0 ). PYTANIA: 1. Wyjaśnić, co to znaczy, że model A obejmuje model B. W jaki sposób testujemy obejmowanie? 1.5 Kryteria informacyjne (selekcja modelu) W poprzednim rozdziale pokazaliśmy w jaki sposób metoda od ogólnego do szczegółowego może być wykorzystana do znalezienia właściwej specyfikacji modelu przy użyciu klasycznych testów statystycznych. Metody tej często używa się stosując zamiast klasycznych testów statystycznych, tak zwane kryteria informacyjne.

12 ROZDZIAŁ 1. METODOLOGIA BUDOWY MODELU W trakcie omawiania MNK zdefiniowaliśmy R 2, która pozwalają porównać jakość modeli opisujących zmienność danej zmiennej zależnej. Niestety miarę tę można zdefiniować jedynie w kontekście M N K. W przypadku ogólniejszej klasy modeli szacowanych za pomocą Metody Największej Wiarygodności (M N W ) definiujemy tak zwane kryteria informacyjne, które podobnie jak R 2, pozwalają nam porównywać różne modele dla tej samej zmiennej zależnej. W przeciwieństwie do R 2, w przypadku kryteriów informacyjnych przyjęta została konwencja, że najlepszym modelem jest model, dla którego wartość kryterium informacyjnego jest najniższa. Najpopularniejszymi kryteriami informacyjnymi jest kryterium informacyjne Akaike AIC (Akaike Information Criterion) oraz Bayesowskie kryterium informacyjne Schwartza BIC (Bayes Information Criterion) 1. Wzory na te kryteria można sformułować ogólnie w kategoriach logarytmu funkcji wiarogodności, lub też dla przypadku MNK w kategoriach sumy kwadratów reszt e e. Odpowiednie wzory są następujące: 2l ( θ BIC = N 2l ( θ AIC = N ) ) ( K log (N) e ) e K log (N) + = log + N 2 N + 2K ( e ) N = log e + 2K 2 N ) gdzie l ( θ jest logarytmem funkcji wiarygodności dla oszacowanego M N W wektora parametrów, a K jest liczbą parametrów modelu a N liczbą obserwacji. Spróbujmy przeanalizować wzory na kryteria informacyjne pod kątem ogólnych zasad, które powinny obowiązywać przy wyborze modeli. Dobry model powinien spełniać dwa podstawowe warunki: powinien być dobrze dopasowany i możliwie jak najprostszy. Prostotę modelu można mierzyć za pomocą liczby parametrów, które się w nim pojawiają. Jeśli przeanalizujemy teraz kryteria informacyjne w wersji dla M N K, to przekonamy ( się, że ) rosną one wraz z pogarszaniem się jakości dopasowania mierzoną przez log e e 2 oraz wraz ze wzrostem liczby parametrów. Różnica między kryterium AIC i BIC polega na innym ważeniu jakości dopasowania i prostoty modelu. Drugi element sumy we wzorach na kryteria informacyjne mierzy prostotę modelu. W obu przypadkach element ten rośnie wraz ze wzrostem liczby parametrów i wzrost ten jest tym większy im mniejsza jest liczba obserwacji. Takie zdefiniowanie kryterium informacyjnych związane jest z faktem, że prostota modelu jest szczególnie ważna w przypadku modeli szacowanych na małych próbach. Jakkolwiek asymptotycznie oba kryteria wybierać będą prawidłowy model, to jednak w małych próbach ich wskazania mogą się znacząco różnić. W literaturze sugeruje się, że kryterium AIC ma tendencję do wybierania modelu o zbyt dużej liczbie parametrów. Należy także pamiętać o tym, że kryteriami informacyjnymi można się posługi- 1 W przypadku Bayesowskieo kryterium informacyjnego Szwartza spotyka się też skróty SC, SBC, SIC

1.5. KRYTERIA INFORMACYJNE (SELEKCJA MODELU) 13 TABELA 1.2: Kryteria informacyjne w modelu konsumpcji model AIC BIC pełen model -192.3156-181.0392 H 0 : β 5 = 0-191.2822-181.6167 H 0 : β 5 = β 4 = 0-185.5504-177.4958 H 0 : β 5 = β 4 = β 3 = 0-162.1931-155.7494 H 0 : β 5 = β 4 = β 1 = 0-161.2049-156.3722 H 0 : β 5 = β 4 = β 1 = µ = 0-161.9610-158.7392 wać tylko w przypadku, gdy konkurencyjne modele zostały oszacowane na tej samej próbie. PRZYKŁAD 1.7 c.d. 1.5 W modelu dla funkcji konsumpcji model najlepszy można znaleźć na postawie wielkości kryteriów informacyjnych dla różnych specyfikacji: Na podstawie kryterium informacyjnego Akaike wybieramy jako najlepszy model ze wszystkimi zmiennymi objaśniającymi a na podstawie kryterium Bayesowskiego, model ze stałą i 4 opóźnieniami. Tak jak już wspomniano, AIC wybiera z reguły większe modele. Obie wybrane specyfikacje różnią się od tych które zostały wybrane na podstawie wyników testów istotności. PYTANIA: 1. Wymienić kryteria informacyjne i opisać w jaki sposób używa się ich do wyboru najlepszego modelu.